-`instructions/plantilla_individual.pdf` - Official template with required format
-`instructions/plantilla_individual.pdf` - Official template preview
**IMPORTANT:** When styling elements (tables, figures, notes, quotes), ALWAYS check `plantilla_individual.htm` for existing Word/CSS classes (e.g., `MsoQuote`, `MsoCaption`, `Piedefoto-tabla`). Use these classes instead of custom inline styles.
3.**Validate each documentation file** checking:
@@ -49,6 +53,7 @@ Review and validate the documentation for this Master's Thesis project.
```
- Colors: `#0098CD` (UNIR blue for borders/lines), `#E6F4F9` (light blue background)
- All diagrams must have a descriptive `title:` in YAML frontmatter
- Titles MUST be quoted: `title: "Descriptive Title"` (not `title: Descriptive Title`)
- Titles should describe the diagram content, not generic "Diagrama N"
- Verify theme is applied to all diagrams in `docs/*.md`
@@ -272,7 +272,7 @@ Esta arquitectura containerizada permite ejecutar cada componente en su entorno
```mermaid
---
title: Arquitectura de ejecución con Docker Compose
title: "Arquitectura de ejecución con Docker Compose"
config:
theme: base
themeVariables:
@@ -340,7 +340,7 @@ La infraestructura del proyecto se basa en contenedores Docker para garantizar r
```mermaid
---
title: Arquitectura de microservicios para optimización OCR
title: "Arquitectura de microservicios para optimización OCR"
config:
theme: base
themeVariables:
@@ -425,7 +425,7 @@ El proyecto incluye múltiples archivos Docker Compose para diferentes escenario
*Fuente: Elaboración propia.*
> **\* Nota:** EasyOCR y PaddleOCR utilizan el mismo puerto (8002). Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez durante los experimentos. Por esta razón, EasyOCR tiene su propio archivo Docker Compose separado.
> **Nota:** EasyOCR y PaddleOCR utilizan el mismo puerto (8002). Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez durante los experimentos. Por esta razón, EasyOCR tiene su propio archivo Docker Compose separado.
@@ -4566,7 +4566,7 @@ mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span styl
<h2style="mso-list:l22 level2 lfo18"><spanlang="ES"style="text-transform:none">Planteamiento del trabajo</span></h2>
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">Formulación del problema</span></h3>
<pclass="MsoNormal"><spanlang="ES">El problema central que aborda este trabajo puede formularse de la siguiente manera:</span></p>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES">¿Es posible mejorar significativamente el rendimiento de modelos OCR preentrenados para documentos en español mediante la optimización sistemática de hiperparámetros, sin requerir fine-tuning ni recursos GPU?</span></i></p>
<pclass="MsoQuote"><i><spanlang="ES">¿Es posible mejorar significativamente el rendimiento de modelos OCR preentrenados para documentos en español mediante la optimización sistemática de hiperparámetros, sin requerir fine-tuning ni recursos GPU?</span></i></p>
<pclass="MsoNormal"><spanlang="ES">Este planteamiento parte de una observación fundamental: los sistemas OCR modernos exponen múltiples parámetros configurables que afectan su comportamiento durante la inferencia. Estos parámetros incluyen umbrales de detección, opciones de preprocesamiento, y filtros de calidad. En la práctica habitual, estos parámetros se dejan en sus valores por defecto, asumiendo que fueron optimizados por los desarrolladores del modelo. Sin embargo, los valores por defecto representan compromisos generales que pueden no ser óptimos para dominios específicos.</span></p>
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">Preguntas de investigación</span></h3>
<pclass="MsoNormal"><spanlang="ES">Este planteamiento se descompone en las siguientes cuestiones específicas:</span></p>
concretos y metodología de trabajo</span></span></a></span></span><spanstyle="mso-bookmark:_Toc14106979"><spanstyle="mso-bookmark:_Toc437515557"><spanlang="ES"style="text-transform:none"><o:p></o:p></span></span></span></h1><pclass="MsoNormal"><spanlang="ES">Este capítulo establece los objetivos del trabajo siguiendo la metodología SMART (Doran, 1981) y describe la metodología experimental empleada para alcanzarlos. Se define un objetivo general y cinco objetivos específicos, todos ellos medibles y verificables.</span></p>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Optimizar el rendimiento de PaddleOCR para documentos académicos en español mediante ajuste de hiperparámetros, alcanzando un CER inferior al 2% sin requerir fine-tuning del modelo.</b></span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Optimizar el rendimiento de PaddleOCR para documentos académicos en español mediante ajuste de hiperparámetros, alcanzando un CER inferior al 2% sin requerir fine-tuning del modelo.</b></span></i></p>
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">Justificación SMART del Objetivo General</span></h3>
<aname="_Ref_Tab13"></a><pclass="MsoCaption"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->13<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Justificación SMART del objetivo general.</span></i></p>
<divalign="center"><tablealign="center"border="1"cellpadding="0"cellspacing="0"class="MsoTableGrid"style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><tdstyle="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><b><spanlang="ES">Criterio</span></b></p></td><tdstyle="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><b><spanlang="ES">Cumplimiento</span></b></p></td></tr><tr><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES"><b>Específico (S)</b></span></p></td><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">Se define claramente qué se quiere lograr: optimizar PaddleOCR mediante ajuste de hiperparámetros para documentos en español</span></p></td></tr><tr><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES"><b>Medible (M)</b></span></p></td><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">Se establece una métrica cuantificable: CER < 2%</span></p></td></tr><tr><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES"><b>Alcanzable (A)</b></span></p></td><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">Es viable dado que: (1) PaddleOCR permite configuración de hiperparámetros, (2) Ray Tune posibilita búsqueda automatizada, (3) Aceleración GPU disponible para experimentación eficiente</span></p></td></tr><tr><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES"><b>Relevante (R)</b></span></p></td><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">El impacto es demostrable: mejora la extracción de texto en documentos académicos sin costes adicionales de infraestructura</span></p></td></tr><tr><tdstyle="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES"><b>Temporal (T)</b></span></p></td><tdstyle="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">El plazo es un cuatrimestre, correspondiente al TFM</span></p></td></tr></table></div>
@@ -4946,15 +4946,15 @@ concretos y metodología de trabajo</span></span></a></span></span><span style="
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">OE1: Comparar soluciones OCR de código abierto</span></h3>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Evaluar el rendimiento base de EasyOCR, PaddleOCR y DocTR en documentos académicos en español, utilizando CER y WER como métricas, para seleccionar el modelo más prometedor.</b></span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Evaluar el rendimiento base de EasyOCR, PaddleOCR y DocTR en documentos académicos en español, utilizando CER y WER como métricas, para seleccionar el modelo más prometedor.</b></span></i></p>
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">OE2: Preparar un dataset de evaluación</span></h3>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Construir un dataset estructurado de imágenes de documentos académicos en español con su texto de referencia (ground truth) extraído del PDF original.</b></span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Construir un dataset estructurado de imágenes de documentos académicos en español con su texto de referencia (ground truth) extraído del PDF original.</b></span></i></p>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Analizar la correlación entre los hiperparámetros de PaddleOCR y las métricas de error para identificar los parámetros con mayor impacto en el rendimiento.</b></span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Analizar la correlación entre los hiperparámetros de PaddleOCR y las métricas de error para identificar los parámetros con mayor impacto en el rendimiento.</b></span></i></p>
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">OE4: Optimizar hiperparámetros con Ray Tune</span></h3>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Ejecutar una búsqueda automatizada de hiperparámetros utilizando Ray Tune con Optuna, evaluando al menos 50 configuraciones diferentes.</b></span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Ejecutar una búsqueda automatizada de hiperparámetros utilizando Ray Tune con Optuna, evaluando al menos 50 configuraciones diferentes.</b></span></i></p>
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">OE5: Validar la configuración optimizada</span></h3>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Comparar el rendimiento de la configuración baseline versus la configuración optimizada sobre el dataset completo, documentando la mejora obtenida.</b></span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Comparar el rendimiento de la configuración baseline versus la configuración optimizada sobre el dataset completo, documentando la mejora obtenida.</b></span></i></p>
<h2style="mso-list:l22 level2 lfo18"><spanlang="ES"style="text-transform:none">Metodología del trabajo</span></h2>
<pclass="MsoNormal"><spanlang="ES"><b>Ejemplo de predicción de PaddleOCR para una página:</b></span></p>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES">"Escribe siempre al menos un párrafo de introducción en cada capítulo o apartado, explicando de qué vas a tratar en esa sección. Evita que aparezcan dos encabezados de nivel consecutivos sin ningún texto entre medias. [...] En esta titulacióon se cita de acuerdo con la normativa Apa."</span></i></p>
<pclass="MsoQuote"><i><spanlang="ES">"Escribe siempre al menos un párrafo de introducción en cada capítulo o apartado, explicando de qué vas a tratar en esa sección. Evita que aparezcan dos encabezados de nivel consecutivos sin ningún texto entre medias. [...] En esta titulacióon se cita de acuerdo con la normativa Apa."</span></i></p>
<pclass="MsoNormal"><spanlang="ES"><b>Errores identificados en este ejemplo:</b></span></p>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES"style="font-family:Symbol">·</span><spanlang="ES"style="font-size:7pt"></span><spanlang="ES"><spanstyle="font-family:Consolas;font-size:10pt">titulacióon</span> en lugar de <spanstyle="font-family:Consolas;font-size:10pt">titulación</span> (carácter duplicado)</span></p>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES"style="font-family:Symbol">·</span><spanlang="ES"style="font-size:7pt"></span><spanlang="ES"><spanstyle="font-family:Consolas;font-size:10pt">Apa</span> en lugar de <spanstyle="font-family:Consolas;font-size:10pt">APA</span> (capitalización)</span></p>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES">*<i>\</i> Nota:** EasyOCR y PaddleOCR utilizan el mismo puerto (8002). Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez durante los experimentos. Por esta razón, EasyOCR tiene su propio archivo Docker Compose separado.</span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Nota:</b> EasyOCR y PaddleOCR utilizan el mismo puerto (8002). Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez durante los experimentos. Por esta razón, EasyOCR tiene su propio archivo Docker Compose separado.</span></i></p>
<h4><spanlang="ES">Gestión de Volúmenes</span></h4>
<pclass="MsoNormal"><spanlang="ES">Se utilizan volúmenes Docker nombrados para persistir los modelos descargados entre ejecuciones:</span></p>
<aname="_Ref_Tab28"></a><pclass="MsoCaption"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->28<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Volúmenes Docker para caché de modelos.</span></i></p>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Nota sobre generalización:</b> El mejor trial individual (5 páginas) alcanzó un CER de 0.79%, cumpliendo el objetivo de CER < 2%. Sin embargo, al aplicar la configuración al dataset completo de 45 páginas, el CER aumentó a 7.72%, evidenciando sobreajuste al subconjunto de entrenamiento. Esta diferencia es un hallazgo importante que se discute en la sección de análisis.</span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Nota sobre generalización:</b> El mejor trial individual (5 páginas) alcanzó un CER de 0.79%, cumpliendo el objetivo de CER < 2%. Sin embargo, al aplicar la configuración al dataset completo de 45 páginas, el CER aumentó a 7.72%, evidenciando sobreajuste al subconjunto de entrenamiento. Esta diferencia es un hallazgo importante que se discute en la sección de análisis.</span></i></p>
<h4><spanlang="ES">Métricas de Mejora</span></h4>
<aname="_Ref_Tab41"></a><pclass="MsoCaption"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->41<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Análisis cuantitativo de la mejora.</span></i></p>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES">"La optimización de hiperparámetros logró una mejora del 12.8% en el CER sobre el dataset completo de 45 páginas. Aunque esta mejora es más modesta que la observada en los trials individuales (donde se alcanzó 0.79% CER), demuestra el valor de la optimización sistemática. La diferencia entre el mejor trial (0.79%) y el resultado en dataset completo (7.72%) revela un fenómeno de sobreajuste al subconjunto de 5 páginas usado para evaluación."</span></i></p>
<pclass="MsoQuote"><i><spanlang="ES">"La optimización de hiperparámetros logró una mejora del 12.8% en el CER sobre el dataset completo de 45 páginas. Aunque esta mejora es más modesta que la observada en los trials individuales (donde se alcanzó 0.79% CER), demuestra el valor de la optimización sistemática. La diferencia entre el mejor trial (0.79%) y el resultado en dataset completo (7.72%) revela un fenómeno de sobreajuste al subconjunto de 5 páginas usado para evaluación."</span></i></p>
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">Tiempo de Ejecución</span></h3>
<aname="_Ref_Tab43"></a><pclass="MsoCaption"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->43<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Métricas de tiempo del experimento (GPU).</span></i></p>
<divalign="center"><tablealign="center"border="1"cellpadding="0"cellspacing="0"class="MsoTableGrid"style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><tdstyle="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><b><spanlang="ES">Métrica</span></b></p></td><tdstyle="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><b><spanlang="ES">Valor</span></b></p></td></tr><tr><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">Tiempo total del experimento</span></p></td><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">~1.5 horas</span></p></td></tr><tr><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">Tiempo medio por trial</span></p></td><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">~4.2 segundos</span></p></td></tr><tr><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">Tiempo medio por página</span></p></td><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">0.84 segundos</span></p></td></tr><tr><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">Variabilidad (std)</span></p></td><tdstyle="border:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">0.53 segundos/página</span></p></td></tr><tr><tdstyle="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">Páginas procesadas totales</span></p></td><tdstyle="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><pclass="MsoNormal"style="margin:0;text-align:center"><spanlang="ES">320</span></p></td></tr></table></div>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Análisis del cumplimiento:</b> El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%), demostrando que la optimización de hiperparámetros puede alcanzar la precisión objetivo. Sin embargo, la validación sobre el dataset completo (7.72%) muestra que la generalización requiere trabajo adicional, como un subconjunto de optimización más representativo o técnicas de regularización.</span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Análisis del cumplimiento:</b> El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%), demostrando que la optimización de hiperparámetros puede alcanzar la precisión objetivo. Sin embargo, la validación sobre el dataset completo (7.72%) muestra que la generalización requiere trabajo adicional, como un subconjunto de optimización más representativo o técnicas de regularización.</span></i></p>
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">Análisis Detallado de Hiperparámetros</span></h3>
<h4><spanlang="ES">Jerarquía de Importancia</span></h4>
<pclass="MsoNormal"><spanlang="ES">Basándose en el análisis de los resultados de optimización:</span></p>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Nota sobre OE5:</b> El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%). La validación sobre el dataset completo (7.72%) muestra que la generalización requiere mayor trabajo, identificándose como línea de trabajo futuro.</span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Nota sobre OE5:</b> El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%). La validación sobre el dataset completo (7.72%) muestra que la generalización requiere mayor trabajo, identificándose como línea de trabajo futuro.</span></i></p>
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">Limitaciones del Estudio</span></h3>
<h4><spanlang="ES">Limitaciones de Generalización</span></h4>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES">1.<spanstyle="font-size:7pt"></span><b>Tipo de documento único</b>: Solo se evaluaron documentos académicos de UNIR. La configuración óptima puede no ser transferible a otros tipos de documentos (facturas, formularios, contratos).</span></p>
@@ -5657,7 +5657,7 @@ y trabajo futuro</span></a></h1><p class="MsoNormal"><span lang="ES">Este capít
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Nota:</b> El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%, 5 páginas). La validación sobre el conjunto de datos completo (45 páginas) muestra un CER de 7.72%, evidenciando sobreajuste al subconjunto de optimización. Esta diferencia se analiza en detalle en el Capítulo 4.</span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Nota:</b> El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%, 5 páginas). La validación sobre el conjunto de datos completo (45 páginas) muestra un CER de 7.72%, evidenciando sobreajuste al subconjunto de optimización. Esta diferencia se analiza en detalle en el Capítulo 4.</span></i></p>
<pclass="MsoNormal"><spanlang="ES"><b>Respecto a OE1 (Comparativa de soluciones OCR)</b>:</span></p>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES"style="font-family:Symbol">·</span><spanlang="ES"style="font-size:7pt"></span><spanlang="ES">Se evaluaron tres soluciones OCR de código abierto: EasyOCR, PaddleOCR (PP-OCRv5) y DocTR</span></p>
@@ -5792,7 +5792,7 @@ docker compose -f docker-compose.cpu-registry.yml up -d</pre></span></p>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Nota:</b> EasyOCR utiliza el mismo puerto (8002) que PaddleOCR. No se pueden ejecutar simultáneamente. Por esta razón, existe un archivo docker-compose separado para EasyOCR.</span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Nota:</b> EasyOCR utiliza el mismo puerto (8002) que PaddleOCR. No se pueden ejecutar simultáneamente. Por esta razón, existe un archivo docker-compose separado para EasyOCR.</span></i></p>
<pclass="MsoNormal"style="margin-left:2cm;margin-right:1cm"><i><spanlang="ES"><b>Nota:</b> Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez. PaddleOCR y EasyOCR comparten el puerto 8002. Para cambiar de servicio, detener el actual con <spanstyle="font-family:Consolas;font-size:10pt">docker compose down</span>.</span></i></p>
<pclass="MsoQuote"><i><spanlang="ES"><b>Nota:</b> Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez. PaddleOCR y EasyOCR comparten el puerto 8002. Para cambiar de servicio, detener el actual con <spanstyle="font-family:Consolas;font-size:10pt">docker compose down</span>.</span></i></p>
<h2style="mso-list:l22 level2 lfo18"><spanlang="ES"style="text-transform:none">A.7 Métricas de Rendimiento</span></h2>
<pclass="MsoNormal"><spanlang="ES">Los resultados detallados de las evaluaciones y ajustes de hiperparámetros se encuentran en:</span></p>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES"style="font-family:Symbol">·</span><spanlang="ES"style="font-size:7pt"></span><spanlang="ES"><ahref="metrics/metrics.md">Métricas Generales</a> - Comparativa de los tres servicios</span></p>
Reference in New Issue
Block a user
Blocking a user prevents them from interacting with repositories, such as opening or commenting on pull requests or issues. Learn more about blocking a user.