@@ -17,6 +17,23 @@ Review and validate the documentation for this Master's Thesis project.
**IMPORTANT:** When styling elements (tables, figures, notes, quotes), ALWAYS check `plantilla_individual.htm` for existing Word/CSS classes (e.g., `MsoQuote`, `MsoCaption`, `Piedefoto-tabla`). Use these classes instead of custom inline styles.
### UNIR Color Palette (from plantilla_individual.htm)
<h3style="mso-list:l22 level3 lfo18"><spanlang="ES"style="text-transform:none">Pipeline Moderno de OCR</span></h3>
<pclass="MsoNormal"><spanlang="ES">Los sistemas OCR modernos siguen típicamente un pipeline de dos etapas principales, precedidas opcionalmente por una fase de preprocesamiento:</span></p>
<aname="_Ref_Fig1"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->1<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Pipeline de un sistema OCR moderno</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Pipeline de un sistema OCR moderno"src="figures/figura_1.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Pipeline de un sistema OCR moderno"src="figures/figura_1.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<h4><spanlang="ES">Etapa de Preprocesamiento</span></h4>
@@ -4880,7 +4880,7 @@ Configuraciones con alta probabilidad bajo <math display="inline" xmlns="http://
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES">3.<spanstyle="font-size:7pt"></span>Beneficiarse de la infraestructura de Ray para distribución</span></p>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES">4.<spanstyle="font-size:7pt"></span>Acceder a las visualizaciones de Optuna</span></p>
<aname="_Ref_Fig2"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->2<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Ciclo de optimización con Ray Tune y Optuna</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Ciclo de optimización con Ray Tune y Optuna"src="figures/figura_2.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Ciclo de optimización con Ray Tune y Optuna"src="figures/figura_2.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<aname="_Ref_Fig3"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->3<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Fases de la metodología experimental</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Fases de la metodología experimental"src="figures/figura_3.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Fases de la metodología experimental"src="figures/figura_3.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<pclass="MsoNormal"><spanlang="ES"><b>Descripción de las fases:</b></span></p>
@@ -4978,7 +4978,7 @@ concretos y metodología de trabajo</span></span></a></span></span><span style="
<pclass="MsoNormal"><spanlang="ES"> - Método: <spanstyle="font-family:Consolas;font-size:10pt">page.get_text("dict")</span> de PyMuPDF - Preservación de estructura de líneas - Tratamiento de texto vertical/marginal - Normalización de espacios y saltos de línea</span></p>
<h4><spanlang="ES">Estructura del Dataset</span></h4>
<aname="_Ref_Fig4"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->4<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Estructura del dataset de evaluación</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Estructura del dataset de evaluación"src="figures/figura_4.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Estructura del dataset de evaluación"src="figures/figura_4.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES"style="font-family:Symbol">·</span><spanlang="ES"style="font-size:7pt"></span><spanlang="ES"><b>Aislamiento de Ray Tune</b>: Ray Tune tiene sus propias dependencias que pueden entrar en conflicto con las librerías de inferencia OCR</span></p>
<pclass="MsoNormal"><spanlang="ES">Esta arquitectura containerizada permite ejecutar cada componente en su entorno aislado óptimo, comunicándose via API REST:</span></p>
<aname="_Ref_Fig5"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->5<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Arquitectura de ejecución con Docker Compose</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Arquitectura de ejecución con Docker Compose"src="figures/figura_5.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Arquitectura de ejecución con Docker Compose"src="figures/figura_5.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<h4><spanlang="ES">Arquitectura de Microservicios</span></h4>
<aname="_Ref_Fig6"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->6<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Arquitectura de microservicios para optimización OCR</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Arquitectura de microservicios para optimización OCR"src="figures/figura_6.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Arquitectura de microservicios para optimización OCR"src="figures/figura_6.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<h4><spanlang="ES">Estrategia de Build Multi-Stage</span></h4>
<pclass="MsoNormal"><spanlang="ES">Los Dockerfiles utilizan una estrategia de build multi-stage para optimizar tiempos de construcción y tamaño de imágenes:</span></p>
<aname="_Ref_Fig7"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->7<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Estrategia de build multi-stage</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Estrategia de build multi-stage"src="figures/figura_7.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Estrategia de build multi-stage"src="figures/figura_7.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES"style="font-family:Symbol">·</span><spanlang="ES"style="font-size:7pt"></span><spanlang="ES"><b>DocTR</b>: 180 segundos (modelos ResNet más pesados)</span></p>
<h4><spanlang="ES">Flujo de Ejecución Completo</span></h4>
<aname="_Ref_Fig8"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->8<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Flujo de ejecución de optimización con Ray Tune</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Flujo de ejecución de optimización con Ray Tune"src="figures/figura_8.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Flujo de ejecución de optimización con Ray Tune"src="figures/figura_8.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES">1.<spanstyle="font-size:7pt"></span><b>Menor varianza</b>: La desviación estándar también se reduce significativamente (7.12% vs 14.93%), indicando resultados más consistentes.</span></p>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES">1.<spanstyle="font-size:7pt"></span><b>Reducción del CER</b>: 69.7% cuando se habilita la clasificación de orientación de línea.</span></p>
<aname="_Ref_Fig9"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->9<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Impacto de textline_orientation en CER</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Impacto de textline_orientation en CER"src="figures/figura_9.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Impacto de textline_orientation en CER"src="figures/figura_9.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<aname="_Ref_Fig10"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->10<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Reducción de errores: Baseline vs Optimizado (45 páginas)</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Reducción de errores: Baseline vs Optimizado (45 páginas)"src="figures/figura_10.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Reducción de errores: Baseline vs Optimizado (45 páginas)"src="figures/figura_10.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<pclass="MsoNormal"><spanlang="ES"><i>Leyenda: CER = Character Error Rate, WER = Word Error Rate. Baseline = configuración por defecto de PaddleOCR. Optimizado = configuración encontrada por Ray Tune. Los valores corresponden al dataset completo de 45 páginas.</i></span></p>
<pclass="MsoListParagraphCxSpMiddle"style="margin-left:36pt;text-indent:-18pt"><spanlang="ES"style="font-family:Symbol">·</span><spanlang="ES"style="font-size:7pt"></span><spanlang="ES"><b>Resultados</b>: Archivos CSV con los resultados de los 64 trials por servicio</span></p>
<h2style="mso-list:l22 level2 lfo18"><spanlang="ES"style="text-transform:none">A.2 Estructura del Repositorio</span></h2>
<aname="_Ref_Fig11"></a><pclass="MsoCaption"style="text-align:center"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->11<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Estructura del repositorio MastersThesis</span></i></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Estructura del repositorio MastersThesis"src="figures/figura_11.png"style="width:16cm;display:block;margin:0 auto"width="604"/></span></p>
<pclass="MsoNormal"style="text-align:center"><spanlang="ES"><imgalt="Estructura del repositorio MastersThesis"src="figures/figura_11.png"style="max-width:16cm;height:auto;display:block;margin:0 auto"/></span></p>
<aname="_Ref_Tab56"></a><pclass="MsoCaption"><b><spanlang="ES"style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->56<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><spanlang="ES"style="font-size:12.0pt;line-height:150%"></span><i><spanlang="ES"style="font-size:12.0pt;line-height:150%">Descripción de directorios principales.</span></i></p>
Reference in New Issue
Block a user
Blocking a user prevents them from interacting with repositories, such as opening or commenting on pull requests or issues. Learn more about blocking a user.