From b91e31e17350be3d496ff2883a756c3af9be16ab Mon Sep 17 00:00:00 2001
From: sergio <sergiojj932@gmail.com>
Date: Wed, 4 Feb 2026 21:07:27 +0100
Subject: [PATCH] LaTex ecuations

---
 apply_content.py                       |  22 +++--
 content_handlers.py                    |  59 +++++++----
 docs/01_introduccion.md                |  12 +--
 docs/03_objetivos_metodologia.md       |   2 +-
 docs/04_desarrollo_especifico.md       |   6 +-
 docs/05_conclusiones_trabajo_futuro.md |   2 +-
 docs/07_anexo_a.md                     |   4 +-
 markdown_utils.py                      |  26 +++--
 thesis_output/plantilla_individual.htm | 132 +++++++++++++++----------
 9 files changed, 157 insertions(+), 108 deletions(-)

diff --git a/apply_content.py b/apply_content.py
index 0a33254..99ec597 100644
--- a/apply_content.py
+++ b/apply_content.py
@@ -404,30 +404,36 @@ def main():
             print("    ✓ Removed template table example")
             break
 
-    # Define chapters
+    # Define chapters with their number for bookmark creation
     chapters = [
-        ('Introducción', 'intro', 'Contexto'),
-        ('Contexto', 'contexto', 'Objetivos'),
-        ('Objetivos', 'objetivos', 'Desarrollo'),
-        ('Desarrollo', 'desarrollo', 'Conclusiones'),
-        ('Conclusiones', 'conclusiones', 'Referencias'),
+        ('Introducción', 'intro', 'Contexto', 1),
+        ('Contexto', 'contexto', 'Objetivos', 2),
+        ('Objetivos', 'objetivos', 'Desarrollo', 3),
+        ('Desarrollo', 'desarrollo', 'Conclusiones', 4),
+        ('Conclusiones', 'conclusiones', 'Referencias', 5),
     ]
 
     print("Replacing chapter contents...")
-    for chapter_keyword, doc_key, next_keyword in chapters:
+    for chapter_keyword, doc_key, next_keyword, chapter_num in chapters:
         print(f"  Processing: {chapter_keyword}")
 
         start_elem = find_section_element(soup, chapter_keyword)
         end_elem = find_section_element(soup, next_keyword)
 
         if start_elem and end_elem:
+            # Add bookmark anchor for chapter cross-references (e.g., _Ref_Sec2 for Chapter 2)
+            bookmark_id = f"_Ref_Sec{chapter_num}"
+            bookmark_anchor = soup.new_tag('a')
+            bookmark_anchor['name'] = bookmark_id
+            start_elem.insert(0, bookmark_anchor)
+
             remove_elements_between(start_elem, end_elem)
             new_content_html, counters = extract_section_content(docs[doc_key], counters=counters)
             new_soup = BeautifulSoup(new_content_html, 'html.parser')
             insert_point = start_elem
             for new_elem in reversed(list(new_soup.children)):
                 insert_point.insert_after(new_elem)
-            print(f"    ✓ Replaced content")
+            print(f"    ✓ Replaced content (bookmark: {bookmark_id})")
         else:
             if not start_elem:
                 print(f"    Warning: Could not find start element for {chapter_keyword}")
diff --git a/content_handlers.py b/content_handlers.py
index 71aaa4f..2665a43 100644
--- a/content_handlers.py
+++ b/content_handlers.py
@@ -403,7 +403,7 @@ def handle_bullet_list(lines, i):
 
 
 def handle_numbered_list(lines, i):
-    """Handle numbered list (1., 2., etc).
+    """Handle numbered list (1., 2., etc) with nested bullet sub-lists.
 
     Args:
         lines: List of markdown lines
@@ -413,6 +413,8 @@ def handle_numbered_list(lines, i):
         Tuple of (html_blocks, new_index)
     """
     html_blocks = []
+    # Each item is a tuple: (main_text, nested_bullets)
+    # where nested_bullets is a list of bullet point strings
     numbered_items = []
 
     while i < len(lines):
@@ -423,8 +425,8 @@ def handle_numbered_list(lines, i):
         if i < len(lines) and re.match(r'^\d+\.\s', lines[i]):
             item_text = re.sub(r'^\d+\.\s*', '', lines[i]).strip()
             i += 1
-            # Collect any nested/indented content
-            nested_lines = []
+            # Collect any nested/indented content (bullet points)
+            nested_bullets = []
             while i < len(lines):
                 current = lines[i]
                 # Stop conditions
@@ -436,34 +438,53 @@ def handle_numbered_list(lines, i):
                     break
                 if current.startswith('**Tabla') or current.startswith('**Figura'):
                     break
-                if current.strip() and not current.startswith(' ') and not current.startswith('\t') and not current.startswith('-'):
-                    if nested_lines or not current.strip():
-                        break
-                if current.strip():
-                    cleaned = current.strip()
-                    if cleaned.startswith('- '):
-                        cleaned = cleaned[2:]
-                    nested_lines.append(cleaned)
+                # Check for non-indented, non-bullet content (end of nested)
+                stripped = current.strip()
+                if stripped and not current.startswith(' ') and not current.startswith('\t') and not stripped.startswith('-'):
+                    break
+                # Collect indented bullet points
+                if stripped.startswith('- '):
+                    bullet_text = stripped[2:].strip()
+                    nested_bullets.append(bullet_text)
                 i += 1
-            # Combine item with nested content
-            if nested_lines:
-                item_text = item_text + '<br/>' + '<br/>'.join(nested_lines)
+
             item_text = convert_latex_formulas(item_text)
-            numbered_items.append(md_to_html_para(item_text))
+            numbered_items.append((md_to_html_para(item_text), nested_bullets))
         else:
             break
 
-    # Output with proper First/Middle/Last classes
-    for idx, item in enumerate(numbered_items):
+    # Output numbered items with nested bullet lists
+    for idx, (item_text, nested_bullets) in enumerate(numbered_items):
         num = idx + 1
         if len(numbered_items) == 1:
             cls = 'MsoListParagraph'
         elif idx == 0:
             cls = 'MsoListParagraphCxSpFirst'
-        elif idx == len(numbered_items) - 1:
+        elif idx == len(numbered_items) - 1 and not nested_bullets:
             cls = 'MsoListParagraphCxSpLast'
         else:
             cls = 'MsoListParagraphCxSpMiddle'
-        html_blocks.append(f'<p class={cls} style="margin-left:36pt;text-indent:-18pt"><span lang=ES>{num}.<span style="font-size:7pt">&nbsp;&nbsp;&nbsp;</span>{item}</span></p>')
+
+        # Main numbered item
+        html_blocks.append(f'<p class={cls} style="margin-left:36pt;text-indent:-18pt"><span lang=ES>{num}.<span style="font-size:7pt">&nbsp;&nbsp;&nbsp;</span>{item_text}</span></p>')
+
+        # Nested bullet sub-list (indented further)
+        if nested_bullets:
+            for bullet_idx, bullet_text in enumerate(nested_bullets):
+                bullet_text = convert_latex_formulas(bullet_text)
+                bullet_html = md_to_html_para(bullet_text)
+                # Determine class for sub-list items
+                if bullet_idx == 0:
+                    sub_cls = 'MsoListParagraphCxSpFirst'
+                elif bullet_idx == len(nested_bullets) - 1:
+                    # If this is the last bullet of the last numbered item, use Last
+                    if idx == len(numbered_items) - 1:
+                        sub_cls = 'MsoListParagraphCxSpLast'
+                    else:
+                        sub_cls = 'MsoListParagraphCxSpLast'
+                else:
+                    sub_cls = 'MsoListParagraphCxSpMiddle'
+                # Nested bullets at 54pt margin (36pt + 18pt)
+                html_blocks.append(f'<p class={sub_cls} style="margin-left:54pt;text-indent:-18pt"><span lang=ES style="font-family:Symbol">·</span><span lang=ES style="font-size:7pt">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;</span><span lang=ES>{bullet_html}</span></p>')
 
     return html_blocks, i
diff --git a/docs/01_introduccion.md b/docs/01_introduccion.md
index 2092d72..04d0c7b 100644
--- a/docs/01_introduccion.md
+++ b/docs/01_introduccion.md
@@ -16,7 +16,7 @@ El OCR actúa como puente entre el mundo físico del documento impreso y el mund
 
 El procesamiento de documentos en español presenta particularidades que complican el reconocimiento automático de texto. Los caracteres especiales propios del idioma (la letra ñ, las vocales acentuadas á, é, í, ó, ú, la diéresis ü, y los signos de puntuación invertidos ¿, ¡) no están presentes en muchos conjuntos de entrenamiento internacionales, lo que puede degradar el rendimiento de modelos preentrenados predominantemente en inglés.
 
-La Tabla 1 resume los principales desafíos lingüísticos del OCR en español:
+La [Tabla 1](#tabla-1) resume los principales desafíos lingüísticos del OCR en español:
 
 **Tabla 1.** *Desafíos lingüísticos específicos del OCR en español.*
 
@@ -37,7 +37,7 @@ Los modelos OCR basados en redes neuronales profundas, como los empleados en Pad
 
 La adaptación de modelos preentrenados a dominios específicos típicamente requiere fine-tuning con datos etiquetados del dominio objetivo y recursos computacionales significativos. Esta barrera técnica y económica excluye a muchos investigadores y organizaciones de beneficiarse plenamente de estas tecnologías.
 
-La Tabla 2 ilustra los requisitos típicos para diferentes estrategias de mejora de OCR:
+La [Tabla 2](#tabla-2) ilustra los requisitos típicos para diferentes estrategias de mejora de OCR:
 
 **Tabla 2.** *Comparación de estrategias de mejora de modelos OCR.*
 
@@ -118,10 +118,10 @@ La relevancia de este problema radica en su aplicabilidad inmediata. Una metodol
 
 ## Estructura del trabajo
 
-El documento sigue una estructura que refleja el proceso investigador. Tras esta introducción, el **Capítulo 2** sitúa el trabajo en su contexto técnico y revisa las tecnologías OCR basadas en aprendizaje profundo. Se describen las arquitecturas de detección, los modelos de reconocimiento y los trabajos previos en optimización de estos sistemas.
+El documento sigue una estructura que refleja el proceso investigador. Tras esta introducción, el [Capítulo 2](#capitulo-2) sitúa el trabajo en su contexto técnico y revisa las tecnologías OCR basadas en aprendizaje profundo. Se describen las arquitecturas de detección, los modelos de reconocimiento y los trabajos previos en optimización de estos sistemas.
 
-El **Capítulo 3** traduce las preguntas de investigación en objetivos concretos, siguiendo la metodología SMART. Además, describe con detalle el enfoque experimental: preparación del dataset, métricas de evaluación y configuración del proceso de optimización con Ray Tune y Optuna.
+El [Capítulo 3](#capitulo-3) traduce las preguntas de investigación en objetivos concretos, siguiendo la metodología SMART. Además, describe con detalle el enfoque experimental: preparación del dataset, métricas de evaluación y configuración del proceso de optimización con Ray Tune y Optuna.
 
-El núcleo del trabajo se desarrolla en el **Capítulo 4**, que presenta el estudio comparativo y la optimización de hiperparámetros en tres fases: planteamiento de la comparativa con evaluación de EasyOCR, PaddleOCR y DocTR; desarrollo de la optimización mediante 64 trials con Ray Tune; y análisis crítico de los resultados obtenidos.
+El núcleo del trabajo se desarrolla en el [Capítulo 4](#capitulo-4), que presenta el estudio comparativo y la optimización de hiperparámetros en tres fases: planteamiento de la comparativa con evaluación de EasyOCR, PaddleOCR y DocTR; desarrollo de la optimización mediante 64 trials con Ray Tune; y análisis crítico de los resultados obtenidos.
 
-Finalmente, el **Capítulo 5** sintetiza las contribuciones, evalúa el grado de cumplimiento de los objetivos y propone líneas de trabajo futuro. Los **Anexos** proporcionan acceso al repositorio de código fuente y datos, así como tablas detalladas de resultados experimentales.
+Finalmente, el [Capítulo 5](#capitulo-5) sintetiza las contribuciones, evalúa el grado de cumplimiento de los objetivos y propone líneas de trabajo futuro. Los Anexos proporcionan acceso al repositorio de código fuente y datos, así como tablas detalladas de resultados experimentales.
diff --git a/docs/03_objetivos_metodologia.md b/docs/03_objetivos_metodologia.md
index 61f11a5..d5cfec1 100644
--- a/docs/03_objetivos_metodologia.md
+++ b/docs/03_objetivos_metodologia.md
@@ -171,7 +171,7 @@ El espacio de búsqueda se definió utilizando `tune.choice()` para parámetros
 
 #### Arquitectura de Ejecución
 
-Se implementó una arquitectura basada en contenedores Docker para aislar los servicios OCR y facilitar la reproducibilidad (ver sección 4.2.3 para detalles de la arquitectura).
+Se implementó una arquitectura basada en contenedores Docker para aislar los servicios OCR y facilitar la reproducibilidad (ver Desarrollo de la comparativa en el [Capítulo 4](#capitulo-4) para detalles de la arquitectura).
 
 #### Ejecución con Docker Compose
 
diff --git a/docs/04_desarrollo_especifico.md b/docs/04_desarrollo_especifico.md
index 08e8b61..6c2326c 100644
--- a/docs/04_desarrollo_especifico.md
+++ b/docs/04_desarrollo_especifico.md
@@ -1130,7 +1130,7 @@ Para documentos académicos en español similares a los evaluados:
 
 **Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
-#### Cuándo Aplicar Esta Metodología
+#### ¿Cuándo aplicar esta metodología?
 
 La optimización de hiperparámetros es recomendable cuando:
 
@@ -1144,7 +1144,7 @@ La optimización de hiperparámetros es recomendable cuando:
 
 5. **Sin datos de entrenamiento**: No se dispone de datasets etiquetados para fine-tuning.
 
-#### Cuándo NO Aplicar Esta Metodología
+#### ¿Cuándo no aplicar esta metodología?
 
 La optimización de hiperparámetros puede ser insuficiente cuando:
 
@@ -1262,4 +1262,4 @@ PaddleOCR ofrece dos variantes de modelos: Mobile (optimizados para dispositivos
 
 Los modelos Server, a pesar de ofrecer potencialmente mayor precisión, resultan inviables en hardware con VRAM limitada (≤6 GB) debido a errores de memoria (Out of Memory). Los modelos Mobile, con un consumo de memoria 88 veces menor, funcionan de manera estable y ofrecen rendimiento suficiente para el caso de uso evaluado.
 
-La validación con aceleración GPU demuestra que la configuración optimizada mediante Ray Tune mejora la precisión (CER: 8.85% → 7.72% en dataset completo, 0.79% en mejor trial individual) y, combinada con la aceleración de 82x proporcionada por GPU, resulta prácticamente aplicable en escenarios de producción real. Las conclusiones derivadas de esta validación se presentan en el Capítulo 5.
+La validación con aceleración GPU demuestra que la configuración optimizada mediante Ray Tune mejora la precisión (CER: 8.85% → 7.72% en dataset completo, 0.79% en mejor trial individual) y, combinada con la aceleración de 82x proporcionada por GPU, resulta prácticamente aplicable en escenarios de producción real. Las conclusiones derivadas de esta validación se presentan en el [Capítulo 5](#capitulo-5).
diff --git a/docs/05_conclusiones_trabajo_futuro.md b/docs/05_conclusiones_trabajo_futuro.md
index 0d14f77..1904419 100644
--- a/docs/05_conclusiones_trabajo_futuro.md
+++ b/docs/05_conclusiones_trabajo_futuro.md
@@ -14,7 +14,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
 
 **Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md).
 
-> **Nota:** El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%, 5 páginas). La validación sobre el conjunto de datos completo (45 páginas) muestra un CER de 7.72%, evidenciando sobreajuste al subconjunto de optimización. Esta diferencia se analiza en detalle en el Capítulo 4.
+> **Nota:** El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%, 5 páginas). La validación sobre el conjunto de datos completo (45 páginas) muestra un CER de 7.72%, evidenciando sobreajuste al subconjunto de optimización. Esta diferencia se analiza en detalle en el [Capítulo 4](#capitulo-4).
 
 ### Cumplimiento de los Objetivos Específicos
 
diff --git a/docs/07_anexo_a.md b/docs/07_anexo_a.md
index 92c1bc0..19d6d4f 100644
--- a/docs/07_anexo_a.md
+++ b/docs/07_anexo_a.md
@@ -247,7 +247,7 @@ Se ejecutaron 64 trials por servicio utilizando Ray Tune con Optuna sobre las p
 
 **Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
-> **Nota:** Ver [Figura 15](#figura-15) en el Capítulo 4 para la representación gráfica de esta distribución.
+> **Nota:** Ver [Figura 15](#figura-15) en el [Capítulo 4](#capitulo-4) para la representación gráfica de esta distribución.
 
 ### Configuración Óptima PaddleOCR
 
@@ -282,7 +282,7 @@ La siguiente configuración logró el mejor rendimiento en el ajuste de hiperpar
 
 **Fuente:** Datos de tiempo CPU de [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv) y tiempos de GPU en trials de ajuste. Elaboración propia.
 
-> **Nota:** Ver [Figura 20](#figura-20) en el Capítulo 4 para la representación gráfica de esta comparación.
+> **Nota:** Ver [Figura 20](#figura-20) en el [Capítulo 4](#capitulo-4) para la representación gráfica de esta comparación.
 
 ### Análisis de Errores por Servicio
 
diff --git a/markdown_utils.py b/markdown_utils.py
index 426cfc6..2166ca1 100644
--- a/markdown_utils.py
+++ b/markdown_utils.py
@@ -92,25 +92,23 @@ def md_to_html_para(text):
 
 
 def convert_latex_formulas(text):
-    """Convert LaTeX formulas to MathML for Word compatibility."""
-    # Block formulas $$...$$
+    """Convert LaTeX formulas to styled text for easy copy-paste into Word equation editor.
+
+    Word's equation editor accepts LaTeX directly, so we preserve the LaTeX code
+    in a visually distinct format that users can copy and paste.
+    """
+    # Block formulas $$...$$ - center and style as equation placeholder
     def convert_block(match):
-        latex = match.group(1)
-        try:
-            mathml = latex_to_mathml(latex, display="block")
-            return f'<p class=MsoNormal style="text-align:center">{mathml}</p>'
-        except:
-            return match.group(0)  # Keep original if conversion fails
+        latex = match.group(1).strip()
+        # Style as centered, monospace text that's easy to identify and copy
+        return f'<p class=MsoNormal style="text-align:center;background:#f5f5f5;padding:8pt;margin:6pt 40pt;font-family:Consolas;font-size:10pt"><span lang=ES>{latex}</span></p>'
 
     text = re.sub(r'\$\$([^$]+)\$\$', convert_block, text)
 
-    # Inline formulas $...$
+    # Inline formulas $...$ - style as inline code
     def convert_inline(match):
-        latex = match.group(1)
-        try:
-            return latex_to_mathml(latex, display="inline")
-        except:
-            return match.group(0)
+        latex = match.group(1).strip()
+        return f'<span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">{latex}</span>'
 
     text = re.sub(r'\$([^$]+)\$', convert_inline, text)
     return text
diff --git a/thesis_output/plantilla_individual.htm b/thesis_output/plantilla_individual.htm
index a8d6cc9..557afae 100644
--- a/thesis_output/plantilla_individual.htm
+++ b/thesis_output/plantilla_individual.htm
@@ -4152,7 +4152,7 @@ EN-US;mso-bidi-language:AR-SA'><br clear="all" style="page-break-before:always"/
 <p class="Ttulondices"><span lang="ES">Resumen </span></p><p class="MsoNormal"><span lang="ES">El presente Trabajo Fin de Máster aborda la optimización de sistemas de Reconocimiento Óptico de Caracteres (OCR) basados en inteligencia artificial para documentos en español. El objetivo principal es identificar una configuración de hiperparámetros que maximice la precisión del reconocimiento de texto sin requerir fine-tuning de los modelos base.</span></p>
 <p class="MsoNormal"><span lang="ES">La metodología combina un benchmark comparativo de tres soluciones de código abierto (EasyOCR, PaddleOCR y DocTR) con un ajuste sistemático de hiperparámetros mediante Ray Tune y Optuna, evaluando 64 configuraciones con aceleración GPU sobre un corpus de 45 páginas. Las métricas de evaluación utilizadas fueron CER y WER.</span></p>
 <p class="MsoNormal"><span lang="ES">Los resultados muestran mejoras significativas en el mejor trial (CER 0.79%) y una mejora del 12.8% en CER en la validación sobre el dataset completo (de 8.85% a 7.72%). El parámetro <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> destacó como factor crítico, mientras que <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> mostró correlación positiva moderada con el error.</span></p>
-<p class="MsoNormal"><span lang="ES">Se concluye que la optimización de hiperparámetros es una alternativa viable al fine-tuning en documentos académicos en español, aunque la generalización depende del tamaño del subconjunto de ajuste. La infraestructura dockerizada facilita la reproducibilidad y la evaluación sistemática de configuraciones OCR.</span></p>
+<p class="MsoNormal"><span lang="ES">Se concluye que la optimización de hiperparámetros es una alternativa viable al fine-tuning en documentos académicos en español, aunque la generalización depende del tamaño del subconjunto de ajuste. En conclusión, la infraestructura dockerizada facilita la reproducibilidad y la evaluación sistemática de configuraciones OCR.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Fuente:</b> <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">metrics_paddle.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">paddle_correlations.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><b><span lang="ES">Palabras clave:</span></b><span lang="ES"> OCR, PaddleOCR, Optimización de hiperparámetros, Ray Tune, Documentos académicos</span></p>
@@ -4170,7 +4170,7 @@ EN-US;mso-bidi-language:AR-SA'><br clear="all" style="page-break-before:always"/
 <p class="Ttulondices"><span style="mso-bookmark:_Toc437509152"><span class="SpellE"><span lang="ES">Abstract</span></span></span></p><p class="MsoNormal"><span lang="EN-US">This Master's Thesis addresses the optimization of AI-based Optical Character Recognition (OCR) systems for Spanish academic documents. The main objective is to identify a hyperparameter configuration that maximizes recognition accuracy without fine-tuning the base models.</span></p>
 <p class="MsoNormal"><span lang="EN-US">The methodology combines a comparative benchmark of three open-source OCR engines (EasyOCR, PaddleOCR, and DocTR) with a systematic hyperparameter search using Ray Tune and Optuna. Sixty-four configurations were evaluated with GPU acceleration on a 45-page corpus, using CER and WER as evaluation metrics.</span></p>
 <p class="MsoNormal"><span lang="EN-US">Results show significant gains in the best trial (CER 0.79%) and a 12.8% CER improvement on the full dataset (from 8.85% to 7.72%). The <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> parameter had the strongest impact, while <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> showed a moderate positive correlation with error.</span></p>
-<p class="MsoNormal"><span lang="EN-US">The study concludes that hyperparameter optimization is a viable alternative to fine-tuning for Spanish academic documents, although generalization depends on the size of the tuning subset. The dockerized infrastructure supports reproducibility and systematic evaluation of OCR configurations.</span></p>
+<p class="MsoNormal"><span lang="EN-US">The study concludes that hyperparameter optimization is a viable alternative to fine-tuning for Spanish academic documents, although generalization depends on the size of the tuning subset. In conclusion, the dockerized infrastructure supports reproducibility and systematic evaluation of OCR configurations.</span></p>
 <p class="MsoNormal"><span lang="EN-US">Sources: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">metrics_paddle.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">paddle_correlations.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
 <p class="MsoNormal"><b><span lang="EN-US">Keywords:</span></b><span lang="EN-US"> OCR, PaddleOCR, Hyperparameter optimization, Ray Tune, Academic documents</span></p>
@@ -4531,7 +4531,7 @@ mso-hansi-theme-font:major-latin;mso-bidi-font-family:Arial;color:#0098CD;
 mso-ansi-language:ES;mso-fareast-language:EN-US;mso-bidi-language:AR-SA'><br clear="all" style="page-break-before:always;mso-break-type:section-break"/>
 </span>
 <div class="WordSection2">
-<h1 style="mso-list:l22 level1 lfo18"><a name="_Toc437515557"></a><a name="_Toc14106979"></a><a name="_Toc147741191"></a><a name="_Toc160619805"><span style="mso-bookmark:_Toc147741191"><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:major-latin;
+<h1 style="mso-list:l22 level1 lfo18"><a name="_Ref_Sec1"></a><a name="_Toc437515557"></a><a name="_Toc14106979"></a><a name="_Toc147741191"></a><a name="_Toc160619805"><span style="mso-bookmark:_Toc147741191"><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:major-latin;
 mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span style="mso-list:Ignore">1.<span style='font:7.0pt "Times New Roman"'>  
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Introducción</span></span></span></span></a><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="text-transform:none"> </span></span></span></h1><p class="MsoNormal"><span lang="ES">¿Es posible mejorar significativamente un sistema OCR sin reentrenarlo? Esta pregunta, aparentemente simple, encierra un desafío práctico que afecta a investigadores, instituciones educativas y empresas que necesitan digitalizar documentos pero carecen de los recursos para realizar fine-tuning de modelos neuronales.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Motivación</span></h2>
@@ -4541,7 +4541,7 @@ mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span styl
 <p class="MsoNormal"><span lang="ES">El OCR actúa como puente entre el mundo físico del documento impreso y el mundo digital del texto procesable. Su precisión determina directamente la calidad de los procesos downstream. Un error de reconocimiento en un nombre propio puede invalidar una búsqueda; un dígito mal reconocido en una factura puede causar discrepancias contables. Una palabra mal interpretada en un contrato puede alterar su significado legal.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Desafíos específicos del español</span></h3>
 <p class="MsoNormal"><span lang="ES">El procesamiento de documentos en español presenta particularidades que complican el reconocimiento automático de texto. Los caracteres especiales propios del idioma (la letra ñ, las vocales acentuadas á, é, í, ó, ú, la diéresis ü, y los signos de puntuación invertidos ¿, ¡) no están presentes en muchos conjuntos de entrenamiento internacionales, lo que puede degradar el rendimiento de modelos preentrenados predominantemente en inglés.</span></p>
-<p class="MsoNormal"><span lang="ES">La Tabla 1 resume los principales desafíos lingüísticos del OCR en español:</span></p>
+<p class="MsoNormal"><span lang="ES">La <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Tab1 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Tab1">Tabla 1</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> resume los principales desafíos lingüísticos del OCR en español:</span></p>
 <a name="_Ref_Tab1"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->1<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Desafíos lingüísticos específicos del OCR en español.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Desafío</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Descripción</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Impacto en OCR</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Caracteres especiales</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">ñ, á, é, í, ó, ú, ü, ¿, ¡</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Confusión con caracteres similares (n/ñ, a/á)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Palabras largas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Español permite compuestos largos</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mayor probabilidad de error por carácter</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Abreviaturas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Dr., Sra., Ud., etc.</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Puntos internos confunden segmentación</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Nombres propios</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tildes en apellidos (García, Martínez)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Bases de datos sin soporte Unicode</span></p></td></tr></table></div>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
@@ -4550,7 +4550,7 @@ mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span styl
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">La brecha entre investigación y práctica</span></h3>
 <p class="MsoNormal"><span lang="ES">Los modelos OCR basados en redes neuronales profundas, como los empleados en PaddleOCR, EasyOCR o DocTR, ofrecen un rendimiento competitivo en benchmarks estándar. No obstante, estos resultados en condiciones controladas no siempre se trasladan a documentos del mundo real.</span></p>
 <p class="MsoNormal"><span lang="ES">La adaptación de modelos preentrenados a dominios específicos típicamente requiere fine-tuning con datos etiquetados del dominio objetivo y recursos computacionales significativos. Esta barrera técnica y económica excluye a muchos investigadores y organizaciones de beneficiarse plenamente de estas tecnologías.</span></p>
-<p class="MsoNormal"><span lang="ES">La Tabla 2 ilustra los requisitos típicos para diferentes estrategias de mejora de OCR:</span></p>
+<p class="MsoNormal"><span lang="ES">La <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Tab2 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Tab2">Tabla 2</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> ilustra los requisitos típicos para diferentes estrategias de mejora de OCR:</span></p>
 <a name="_Ref_Tab2"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->2<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparación de estrategias de mejora de modelos OCR.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Estrategia</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Datos requeridos</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Hardware</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tiempo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Expertise</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fine-tuning completo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Miles de imágenes etiquetadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU de alta memoria</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Días o semanas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fine-tuning parcial</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Cientos o miles de imágenes etiquetadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU dedicada</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Horas o días</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio-Alto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Transfer learning</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Centenas de imágenes etiquetadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU dedicada</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Horas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Optimización de hiperparámetros</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Subconjunto de validación</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>CPU o GPU (CUDA 12.2+ en Docker DocTR)</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Horas</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Bajo-Medio</b></span></p></td></tr></table></div>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/07_anexo_a.md"><span style="font-family:Consolas;font-size:10pt">docs/07_anexo_a.md</span></a>, sección A.9.</span></p>
@@ -4558,7 +4558,7 @@ mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span styl
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">La oportunidad: optimización sin fine-tuning</span></h3>
 <p class="MsoNormal"><span lang="ES">La presente investigación surge de una necesidad práctica: optimizar un sistema OCR para documentos académicos en español sin disponer de infraestructura de entrenamiento dedicada para fine-tuning. Esta restricción, lejos de ser una limitación excepcional, representa la realidad de muchos entornos académicos y empresariales donde el acceso a cómputo avanzado es limitado.</span></p>
 <p class="MsoNormal"><span lang="ES">La hipótesis central de este trabajo es que los modelos OCR preentrenados contienen capacidades latentes que pueden activarse mediante la configuración adecuada de sus hiperparámetros de inferencia. Parámetros como los umbrales de detección de texto, las opciones de preprocesamiento de imagen, y los filtros de confianza de reconocimiento pueden tener un impacto significativo en el rendimiento final. Su optimización sistemática puede aproximarse a los beneficios del fine-tuning sin sus costes asociados.</span></p>
-<p class="MsoNormal"><span lang="ES">Esta oportunidad se ve reforzada por la disponibilidad de frameworks modernos de optimización de hiperparámetros como Ray Tune (Liaw et al., 2018) y algoritmos de búsqueda eficientes como Optuna (Akiba et al., 2019), que permiten explorar espacios de configuración de manera sistemática y eficiente.</span></p>
+<p class="MsoNormal"><span lang="ES">Esta oportunidad se ve reforzada por la disponibilidad de frameworks modernos de optimización de hiperparámetros como Ray Tune y algoritmos de búsqueda eficientes como Optuna, que permiten explorar espacios de configuración de manera sistemática y eficiente.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Planteamiento del trabajo</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Formulación del problema</span></h3>
 <p class="MsoNormal"><span lang="ES">Las observaciones anteriores conducen a formular el problema central de este trabajo:</span></p>
@@ -4587,10 +4587,10 @@ mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span styl
 <p class="MsoNormal"><span lang="ES"><b>Pequeñas y medianas empresas</b>: Organizaciones que automatizan flujos documentales (facturas, contratos, correspondencia) sin presupuesto para soluciones enterprise o infraestructura GPU.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Desarrolladores de software</b>: Quienes integran OCR en aplicaciones con restricciones de recursos, como dispositivos móviles o servidores compartidos, y necesitan maximizar el rendimiento sin costes adicionales de hardware.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Estructura del trabajo</span></h2>
-<p class="MsoNormal"><span lang="ES">El documento sigue una estructura que refleja el proceso investigador. Tras esta introducción, el <b>Capítulo 2</b> sitúa el trabajo en su contexto técnico y revisa las tecnologías OCR basadas en aprendizaje profundo. Se describen las arquitecturas de detección, los modelos de reconocimiento y los trabajos previos en optimización de estos sistemas.</span></p>
-<p class="MsoNormal"><span lang="ES">El <b>Capítulo 3</b> traduce las preguntas de investigación en objetivos concretos, siguiendo la metodología SMART. Además, describe con detalle el enfoque experimental: preparación del dataset, métricas de evaluación y configuración del proceso de optimización con Ray Tune y Optuna.</span></p>
-<p class="MsoNormal"><span lang="ES">El núcleo del trabajo se desarrolla en el <b>Capítulo 4</b>, que presenta el estudio comparativo y la optimización de hiperparámetros en tres fases: planteamiento de la comparativa con evaluación de EasyOCR, PaddleOCR y DocTR; desarrollo de la optimización mediante 64 trials con Ray Tune; y análisis crítico de los resultados obtenidos.</span></p>
-<p class="MsoNormal"><span lang="ES">Finalmente, el <b>Capítulo 5</b> sintetiza las contribuciones, evalúa el grado de cumplimiento de los objetivos y propone líneas de trabajo futuro. Los <b>Anexos</b> proporcionan acceso al repositorio de código fuente y datos, así como tablas detalladas de resultados experimentales.</span></p><h1 style="mso-list:l22 level1 lfo18"><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><a name="_Toc147741195"></a><a name="_Toc160619809"><span style="mso-bookmark:_Toc147741195"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
+<p class="MsoNormal"><span lang="ES">El documento sigue una estructura que refleja el proceso investigador. Tras esta introducción, el <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Sec2 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Sec2">Capítulo 2</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> sitúa el trabajo en su contexto técnico y revisa las tecnologías OCR basadas en aprendizaje profundo. Se describen las arquitecturas de detección, los modelos de reconocimiento y los trabajos previos en optimización de estos sistemas.</span></p>
+<p class="MsoNormal"><span lang="ES">El <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Sec3 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Sec3">Capítulo 3</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> traduce las preguntas de investigación en objetivos concretos, siguiendo la metodología SMART. Además, describe con detalle el enfoque experimental: preparación del dataset, métricas de evaluación y configuración del proceso de optimización con Ray Tune y Optuna.</span></p>
+<p class="MsoNormal"><span lang="ES">El núcleo del trabajo se desarrolla en el <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Sec4 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Sec4">Capítulo 4</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->, que presenta el estudio comparativo y la optimización de hiperparámetros en tres fases: planteamiento de la comparativa con evaluación de EasyOCR, PaddleOCR y DocTR; desarrollo de la optimización mediante 64 trials con Ray Tune; y análisis crítico de los resultados obtenidos.</span></p>
+<p class="MsoNormal"><span lang="ES">Finalmente, el <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Sec5 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Sec5">Capítulo 5</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> sintetiza las contribuciones, evalúa el grado de cumplimiento de los objetivos y propone líneas de trabajo futuro. Los Anexos proporcionan acceso al repositorio de código fuente y datos, así como tablas detalladas de resultados experimentales.</span></p><h1 style="mso-list:l22 level1 lfo18"><a name="_Ref_Sec2"></a><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><a name="_Toc147741195"></a><a name="_Toc160619809"><span style="mso-bookmark:_Toc147741195"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
 major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin;
 text-transform:none'><span style="mso-list:Ignore">2.<span style='font:7.0pt "Times New Roman"'>  
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Contexto
@@ -4661,7 +4661,8 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoNormal"><span lang="ES">La arquitectura CRNN consta de tres componentes:</span></p>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Capas convolucionales</b>: Extraen características visuales de la imagen de entrada</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Capas recurrentes</b>: Modelan las dependencias secuenciales entre características</span></p>
-<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Capa de transcripción</b>: Convierte las predicciones de la RNN en secuencias de caracteres mediante CTC<br/><b>SVTR (Scene-Text Visual Transformer Recognition)</b>: Desarrollado por Du et al. (2022), SVTR aplica la arquitectura Transformer al reconocimiento de texto, utilizando parches de imagen como tokens de entrada. Esta aproximación elimina la necesidad de RNN y permite capturar dependencias globales de manera más eficiente.</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Capa de transcripción</b>: Convierte las predicciones de la RNN en secuencias de caracteres mediante CTC</span></p>
+<p class="MsoNormal"><span lang="ES"><b>SVTR (Scene-Text Visual Transformer Recognition)</b>: Desarrollado por Du et al. (2022), SVTR aplica la arquitectura Transformer al reconocimiento de texto, utilizando parches de imagen como tokens de entrada. Esta aproximación elimina la necesidad de RNN y permite capturar dependencias globales de manera más eficiente.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Arquitecturas con Atención</b>: Los modelos encoder-decoder con mecanismos de atención (Bahdanau et al., 2015) permiten al decodificador "enfocarse" en diferentes partes de la imagen mientras genera cada carácter. Esto es especialmente útil para texto largo o con layouts complejos.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>TrOCR (Transformer-based OCR)</b>: Propuesto por Li et al. (2023), TrOCR utiliza un Vision Transformer (ViT) como encoder y un Transformer de lenguaje como decoder, logrando resultados estado del arte en múltiples benchmarks.</span></p>
 <a name="_Ref_Tab5"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->5<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de arquitecturas de reconocimiento de texto.</span></i></p>
@@ -4672,11 +4673,11 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoNormal"><span lang="ES">La evaluación rigurosa de sistemas OCR requiere métricas estandarizadas que permitan comparaciones objetivas. Las métricas fundamentales se basan en la distancia de edición de Levenshtein.</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Distancia de Levenshtein</span></b></h4>
 <p class="MsoNormal"><span lang="ES">La distancia de Levenshtein (Levenshtein, 1966) entre dos cadenas es el número mínimo de operaciones de edición (inserción, eliminación, sustitución) necesarias para transformar una cadena en otra. Formalmente, para dos cadenas <i>a</i> y <i>b</i>:</span></p>
-<p class="MsoNormal" style="text-align:center"><math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>d</mi><mo stretchy="false">(</mo><mi>a</mi><mo>,</mo><mi>b</mi><mo stretchy="false">)</mo><mo>=</mo><mo>min</mo><mo stretchy="false">(</mo><mtext>inserciones</mtext><mo>+</mo><mtext>eliminaciones</mtext><mo>+</mo><mtext>sustituciones</mtext><mo stretchy="false">)</mo></mrow></math></p>
+<p class="MsoNormal"><span lang="ES"><p class="MsoNormal" style="text-align:center;background:#f5f5f5;padding:8pt;margin:6pt 40pt;font-family:Consolas;font-size:10pt"><span lang="ES">d(a,b) = \min(\text{inserciones} + \text{eliminaciones} + \text{sustituciones})</span></p></span></p>
 <p class="MsoNormal"><span lang="ES">Esta métrica es fundamental para calcular tanto CER como WER.</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Character Error Rate (CER)</span></b></h4>
 <p class="MsoNormal"><span lang="ES">El CER mide el error a nivel de carácter y se calcula como:</span></p>
-<p class="MsoNormal" style="text-align:center"><math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>C</mi><mi>E</mi><mi>R</mi><mo>=</mo><mfrac><mrow><mi>S</mi><mo>+</mo><mi>D</mi><mo>+</mo><mi>I</mi></mrow><mrow><mi>N</mi></mrow></mfrac></mrow></math></p>
+<p class="MsoNormal"><span lang="ES"><p class="MsoNormal" style="text-align:center;background:#f5f5f5;padding:8pt;margin:6pt 40pt;font-family:Consolas;font-size:10pt"><span lang="ES">CER = \frac{S + D + I}{N}</span></p></span></p>
 <p class="MsoNormal"><span lang="ES">Donde:</span></p>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">S = número de sustituciones de caracteres</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">D = número de eliminaciones de caracteres</span></p>
@@ -4685,7 +4686,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoNormal"><span lang="ES">Un CER bajo indica que el sistema comete pocos errores a nivel de carácter. Para aplicaciones críticas se requiere un nivel de error muy reducido, mientras que en tareas de búsqueda o archivo pueden aceptarse errores mayores.</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Word Error Rate (WER)</span></b></h4>
 <p class="MsoNormal"><span lang="ES">El WER mide el error a nivel de palabra, utilizando la misma fórmula pero considerando palabras como unidades:</span></p>
-<p class="MsoNormal" style="text-align:center"><math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>W</mi><mi>E</mi><mi>R</mi><mo>=</mo><mfrac><mrow><msub><mi>S</mi><mi>w</mi></msub><mo>+</mo><msub><mi>D</mi><mi>w</mi></msub><mo>+</mo><msub><mi>I</mi><mi>w</mi></msub></mrow><mrow><msub><mi>N</mi><mi>w</mi></msub></mrow></mfrac></mrow></math></p>
+<p class="MsoNormal"><span lang="ES"><p class="MsoNormal" style="text-align:center;background:#f5f5f5;padding:8pt;margin:6pt 40pt;font-family:Consolas;font-size:10pt"><span lang="ES">WER = \frac{S_w + D_w + I_w}{N_w}</span></p></span></p>
 <p class="MsoNormal"><span lang="ES">El WER es generalmente mayor que el CER, ya que un solo error de carácter puede invalidar una palabra completa. Esta diferencia es relevante cuando se comparan sistemas que preservan caracteres pero pierden palabras completas.</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Otras Métricas Complementarias</span></b></h4>
 <p class="MsoNormal"><span lang="ES"><b>Precisión y Recall a nivel de palabra</b>: Útiles cuando se evalúa la capacidad del sistema para detectar palabras específicas.</span></p>
@@ -4715,7 +4716,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Soluciones OCR de Código Abierto</span></h3>
 <p class="MsoNormal"><span lang="ES">En los últimos años han surgido varias soluciones OCR de código abierto que democratizan el acceso a esta tecnología. A continuación se analizan en detalle las tres principales alternativas evaluadas en este trabajo.</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">EasyOCR</span></b></h4>
-<p class="MsoNormal"><span lang="ES">EasyOCR es una biblioteca de OCR desarrollada por JaidedAI (2020) con el objetivo de proporcionar una solución de fácil uso que soporte múltiples idiomas. Actualmente soporta más de 80 idiomas, incluyendo español.</span></p>
+<p class="MsoNormal"><span lang="ES">EasyOCR es una librería de OCR desarrollada por JaidedAI (2020) con el objetivo de proporcionar una solución de fácil uso que soporte múltiples idiomas. Actualmente soporta más de 80 idiomas, incluyendo español.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Arquitectura técnica</b>:</span></p>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Detector</b>: CRAFT (Character Region Awareness for Text Detection)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Reconocedor</b>: CRNN con backbone ResNet/VGG + BiLSTM + CTC</span></p>
@@ -4735,9 +4736,19 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoNormal"><span lang="ES">PaddleOCR es el sistema OCR desarrollado por Baidu como parte del ecosistema PaddlePaddle (2024). Representa una de las soluciones más completas y activamente mantenidas en el ecosistema de código abierto. Su evolución incluye PP-OCR (Du et al., 2020) y PP-OCRv4 (Du et al., 2023); la versión PP-OCRv5, utilizada en este trabajo, incorpora avances recientes en precisión y eficiencia.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Arquitectura técnica</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">El pipeline de PaddleOCR consta de tres módulos principales:</span></p>
-<p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Detector de texto (DB - Differentiable Binarization)</b>:<br/>Backbone: ResNet18/ResNet50<br/>Neck: FPN (Feature Pyramid Network)<br/>Head: Segmentación con binarización diferenciable<br/>Salida: Polígonos que encierran regiones de texto</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Clasificador de orientación</b>:<br/>Determina si el texto está rotado 0° o 180°<br/>Permite corrección automática de texto invertido<br/>Opcional pero recomendado para documentos escaneados</span></p>
-<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Reconocedor de texto (SVTR)</b>:<br/>Encoder: Vision Transformer modificado<br/>Decoder: CTC o Attention-based<br/>Vocabulario: Configurable por idioma</span></p>
+<p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Detector de texto (DB - Differentiable Binarization)</b>:</span></p>
+<p class="MsoListParagraphCxSpFirst" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Backbone: ResNet18/ResNet50</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Neck: FPN (Feature Pyramid Network)</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Head: Segmentación con binarización diferenciable</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Salida: Polígonos que encierran regiones de texto</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Clasificador de orientación</b>:</span></p>
+<p class="MsoListParagraphCxSpFirst" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Determina si el texto está rotado 0° o 180°</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Permite corrección automática de texto invertido</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Opcional pero recomendado para documentos escaneados</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Reconocedor de texto (SVTR)</b>:</span></p>
+<p class="MsoListParagraphCxSpFirst" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Encoder: Vision Transformer modificado</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Decoder: CTC o Attention-based</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Vocabulario: Configurable por idioma</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Hiperparámetros configurables</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">PaddleOCR expone numerosos hiperparámetros que permiten ajustar el comportamiento del sistema. Los más relevantes para este trabajo son:</span></p>
 <a name="_Ref_Tab6"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->6<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Hiperparámetros de detección de PaddleOCR.</span></i></p>
@@ -4796,18 +4807,16 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Parámetros de regularización (dropout, weight decay)</span></p>
 <p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Umbrales de decisión en tiempo de inferencia</b> (relevante para este trabajo)</span></p>
 <p class="MsoNormal"><span lang="ES">El problema de HPO puede formalizarse como:</span></p>
-<p class="MsoNormal" style="text-align:center"><math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><msup><mi>λ</mi><mo>*</mo></msup><mo>=</mo><msub><mo>argmin</mo><mrow><mi>λ</mi><mo>∈</mo><mi>Λ</mi></mrow></msub><mi>ℒ</mi><mo stretchy="false">(</mo><msub><mi>M</mi><mi>λ</mi></msub><mo>,</mo><msub><mi>D</mi><mrow><mi>v</mi><mi>a</mi><mi>l</mi></mrow></msub><mo stretchy="false">)</mo></mrow></math></p>
+<p class="MsoNormal"><span lang="ES"><p class="MsoNormal" style="text-align:center;background:#f5f5f5;padding:8pt;margin:6pt 40pt;font-family:Consolas;font-size:10pt"><span lang="ES">\lambda^* = \operatorname{argmin}_{\lambda \in \Lambda} \mathcal{L}(M_\lambda, D_{val})</span></p></span></p>
 <p class="MsoNormal"><span lang="ES">Donde:</span></p>
-<p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>λ</mi></mrow></math> es un vector de hiperparámetros</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>Λ</mi></mrow></math> es el espacio de búsqueda</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><msub><mi>M</mi><mi>λ</mi></msub></mrow></math> es el modelo configurado con <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>λ</mi></mrow></math></span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>ℒ</mi></mrow></math> es la función de pérdida</span></p>
-<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><msub><mi>D</mi><mrow><mi>v</mi><mi>a</mi><mi>l</mi></mrow></msub></mrow></math> es el conjunto de validación</span></p>
+<p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">\lambda</span> es un vector de hiperparámetros</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">\Lambda</span> es el espacio de búsqueda</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">M_\lambda</span> es el modelo configurado con <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">\lambda</span></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">\mathcal{L}</span> es la función de pérdida</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">D_{val}</span> es el conjunto de validación</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Métodos de Optimización</span></b></h4>
 <p class="MsoNormal"><span lang="ES"><b>Grid Search (Búsqueda en rejilla)</b>:</span></p>
-
-El método más simple consiste en evaluar todas las combinaciones posibles de valores discretizados de los hiperparámetros. Para <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>k</mi></mrow></math> hiperparámetros con <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>n</mi></mrow></math> valores cada uno, requiere <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><msup><mi>n</mi><mi>k</mi></msup></mrow></math> evaluaciones.
-
+<p class="MsoNormal"><span lang="ES">El método más simple consiste en evaluar todas las combinaciones posibles de valores discretizados de los hiperparámetros. Para <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">k</span> hiperparámetros con <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">n</span> valores cada uno, requiere <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">n^k</span> evaluaciones.</span></p>
 <p class="MsoNormal"><span lang="ES">Ventajas:</span></p>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Exhaustivo y reproducible</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Fácil de paralelizar</span></p>
@@ -4825,20 +4834,18 @@ El método más simple consiste en evaluar todas las combinaciones posibles de v
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Ajustar el modelo sustituto a las observaciones actuales</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Optimizar la función de adquisición para seleccionar el siguiente punto</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>Evaluar la función objetivo en el punto seleccionado</span></p>
-<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span>Actualizar las observaciones y repetir<br/>Los modelos sustitutos más comunes son:<br/><b>Procesos Gaussianos (GP)</b>: Proporcionan incertidumbre bien calibrada pero escalan pobremente<br/><b>Random Forests</b>: Manejan bien espacios de alta dimensión y variables categóricas<br/><b>Tree-structured Parzen Estimator (TPE)</b>: Modela densidades en lugar de la función objetivo</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span>Actualizar las observaciones y repetir</span></p>
+<p class="MsoNormal"><span lang="ES">Los modelos sustitutos más comunes son:</span></p>
+<p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Procesos Gaussianos (GP)</b>: Proporcionan incertidumbre bien calibrada pero escalan pobremente</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Random Forests</b>: Manejan bien espacios de alta dimensión y variables categóricas</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Tree-structured Parzen Estimator (TPE)</b>: Modela densidades en lugar de la función objetivo</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Tree-structured Parzen Estimator (TPE)</span></b></h4>
-
-TPE, propuesto por Bergstra et al. (2011) e implementado en Optuna, es particularmente efectivo para HPO. En lugar de modelar <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>p</mi><mo stretchy="false">(</mo><mi>y</mi><mo stretchy="false">|</mo><mi>λ</mi><mo stretchy="false">)</mo></mrow></math> directamente, TPE modela:
-
-<p class="MsoNormal" style="text-align:center"><math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>p</mi><mo stretchy="false">(</mo><mi>λ</mi><mo stretchy="false">|</mo><mi>y</mi><mo stretchy="false">)</mo><mo>=</mo><mrow><mo fence="true" form="prefix" stretchy="true">{</mo><mtable><mtr><mtd columnalign="left"><mi>l</mi><mo stretchy="false">(</mo><mi>λ</mi><mo stretchy="false">)</mo></mtd><mtd columnalign="left"><mtext>si </mtext><mi>y</mi><mo>&lt;</mo><msup><mi>y</mi><mo>*</mo></msup></mtd></mtr><mtr><mtd columnalign="left"><mi>g</mi><mo stretchy="false">(</mo><mi>λ</mi><mo stretchy="false">)</mo></mtd><mtd columnalign="left"><mtext>si </mtext><mi>y</mi><mo>≥</mo><msup><mi>y</mi><mo>*</mo></msup></mtd></mtr></mtable></mrow></mrow></math></p>
-
-Donde <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><msup><mi>y</mi><mo>*</mo></msup></mrow></math> es un umbral (típicamente el percentil 15-25 de las observaciones), <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>l</mi><mo stretchy="false">(</mo><mi>λ</mi><mo stretchy="false">)</mo></mrow></math> es la densidad de hiperparámetros con buen rendimiento, y <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>g</mi><mo stretchy="false">(</mo><mi>λ</mi><mo stretchy="false">)</mo></mrow></math> es la densidad de hiperparámetros con mal rendimiento.
-
+<p class="MsoNormal"><span lang="ES">TPE, propuesto por Bergstra et al. (2011) e implementado en Optuna, es particularmente efectivo para HPO. En lugar de modelar <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">p(y|\lambda)</span> directamente, TPE modela:</span></p>
+<p class="MsoNormal"><span lang="ES"><p class="MsoNormal" style="text-align:center;background:#f5f5f5;padding:8pt;margin:6pt 40pt;font-family:Consolas;font-size:10pt"><span lang="ES">p(\lambda|y) = \begin{cases} l(\lambda) &amp; \text{si } y &lt; y^<i> \\ g(\lambda) &amp; \text{si } y \geq y^</i> \end{cases}</span></p></span></p>
+<p class="MsoNormal"><span lang="ES">Donde <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">y^*</span> es un umbral (típicamente el percentil 15-25 de las observaciones), <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">l(\lambda)</span> es la densidad de hiperparámetros con buen rendimiento, y <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">g(\lambda)</span> es la densidad de hiperparámetros con mal rendimiento.</span></p>
 <p class="MsoNormal"><span lang="ES">La función de adquisición Expected Improvement se aproxima como:</span></p>
-<p class="MsoNormal" style="text-align:center"><math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>E</mi><mi>I</mi><mo stretchy="false">(</mo><mi>λ</mi><mo stretchy="false">)</mo><mo>∝</mo><mfrac><mrow><mi>l</mi><mo stretchy="false">(</mo><mi>λ</mi><mo stretchy="false">)</mo></mrow><mrow><mi>g</mi><mo stretchy="false">(</mo><mi>λ</mi><mo stretchy="false">)</mo></mrow></mfrac></mrow></math></p>
-
-Configuraciones con alta probabilidad bajo <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>l</mi></mrow></math> y baja probabilidad bajo <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>g</mi></mrow></math> tienen mayor Expected Improvement.
-
+<p class="MsoNormal"><span lang="ES"><p class="MsoNormal" style="text-align:center;background:#f5f5f5;padding:8pt;margin:6pt 40pt;font-family:Consolas;font-size:10pt"><span lang="ES">EI(\lambda) \propto \frac{l(\lambda)}{g(\lambda)}</span></p></span></p>
+<p class="MsoNormal"><span lang="ES">Configuraciones con alta probabilidad bajo <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">l</span> y baja probabilidad bajo <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5;padding:1pt 3pt">g</span> tienen mayor Expected Improvement.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Ventajas de TPE</b>:</span></p>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Maneja naturalmente espacios condicionales (hiperparámetros que dependen de otros)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Eficiente para espacios de alta dimensión</span></p>
@@ -4863,6 +4870,7 @@ Configuraciones con alta probabilidad bajo <math display="inline" xmlns="http://
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Paralelizar la evaluación de trials</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>Beneficiarse de la infraestructura de Ray para distribución</span></p>
 <p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span>Acceder a las visualizaciones de Optuna</span></p>
+<p class="MsoNormal"><span lang="ES">Optuna se ha consolidado como una opción práctica y eficiente para optimización de hiperparámetros en problemas reales (Akiba et al., 2019).</span></p>
 <a name="_Ref_Fig2"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->2<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Ciclo de optimización con Ray Tune y Optuna</span></i></p>
 <p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Ciclo de optimización con Ray Tune y Optuna" height="111" src="figures/figura_2.png" style="width:424.5pt;height:83.25pt;display:block;margin:0 auto" width="566"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
@@ -4875,6 +4883,8 @@ Configuraciones con alta probabilidad bajo <math display="inline" xmlns="http://
 <p class="MsoNormal"><span lang="ES">Breuel (2013) exploró la selección automática de arquitecturas de red para reconocimiento de texto manuscrito, optimizando número de capas, unidades y tipo de activación.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Optimización de post-procesamiento</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">Schulz &amp; Kuhn (2017) optimizaron parámetros de modelos de lenguaje para corrección de errores OCR, incluyendo pesos de interpolación entre modelos de caracteres y palabras.</span></p>
+<p class="MsoNormal"><span lang="ES">Además, la variabilidad del rendimiento puede analizarse mediante correlaciones lineales (Pearson, 1895), complementadas por criterios de magnitud del efecto (Cohen, 1988).</span></p>
+<p class="MsoNormal"><span lang="ES">Finalmente, líneas de AutoML como la búsqueda de arquitecturas (NAS) representan alternativas más costosas pero potencialmente automatizables para optimizar modelos (Zoph &amp; Le, 2017).</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Vacío en la literatura</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">A pesar de estos trabajos, existe un vacío significativo respecto a la optimización sistemática de hiperparámetros de inferencia en pipelines OCR modernos como PaddleOCR. La mayoría de trabajos se centran en:</span></p>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Entrenamiento de modelos (fine-tuning)</span></p>
@@ -4912,7 +4922,7 @@ Configuraciones con alta probabilidad bajo <math display="inline" xmlns="http://
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Conclusiones</span></h2>
 <p class="MsoNormal"><span lang="ES">La revisión del estado del arte revela un panorama en el que las herramientas técnicas están maduras, pero su aplicación óptima para dominios específicos permanece poco explorada. Los sistemas OCR modernos, como PaddleOCR, EasyOCR y DocTR, ofrecen arquitecturas sofisticadas basadas en aprendizaje profundo que alcanzan resultados impresionantes en benchmarks estándar. Sin embargo, estos resultados no siempre se trasladan a documentos del mundo real, especialmente en idiomas con menos recursos como el español.</span></p>
 <p class="MsoNormal"><span lang="ES">La evolución desde los sistemas de plantillas de los años 50 hasta los Transformers actuales ha sido espectacular, pero ha generado sistemas con decenas de hiperparámetros configurables cuyos valores por defecto representan compromisos generales, no configuraciones óptimas para dominios específicos. La literatura abunda en trabajos sobre entrenamiento y fine-tuning de modelos OCR, pero dedica poca atención a la optimización sistemática de los parámetros de inferencia, como umbrales de detección, opciones de preprocesamiento y filtros de confianza, que pueden marcar la diferencia entre un sistema usable y uno que requiere corrección manual extensiva.</span></p>
-<p class="MsoNormal"><span lang="ES">Este vacío, combinado con las particularidades del español (acentos, eñes, signos invertidos) y la escasez de recursos específicos para este idioma, define el espacio de contribución del presente trabajo. Frameworks como Ray Tune y Optuna proporcionan las herramientas para abordar esta optimización de manera sistemática; PaddleOCR, con su pipeline altamente configurable, ofrece el sustrato técnico adecuado. El siguiente capítulo traduce esta oportunidad en objetivos concretos y una metodología experimental rigurosa.</span></p><h1 style="mso-list:l22 level1 lfo18"><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><a name="_Toc147741196"></a><a name="_Toc160619813"><span style="mso-bookmark:_Toc147741196"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
+<p class="MsoNormal"><span lang="ES">Este vacío, combinado con las particularidades del español (acentos, eñes, signos invertidos) y la escasez de recursos específicos para este idioma, define el espacio de contribución del presente trabajo. Frameworks como Ray Tune y Optuna proporcionan las herramientas para abordar esta optimización de manera sistemática; PaddleOCR, con su pipeline altamente configurable, ofrece el sustrato técnico adecuado. El siguiente capítulo traduce esta oportunidad en objetivos concretos y una metodología experimental rigurosa.</span></p><h1 style="mso-list:l22 level1 lfo18"><a name="_Ref_Sec3"></a><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><a name="_Toc147741196"></a><a name="_Toc160619813"><span style="mso-bookmark:_Toc147741196"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
 major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin;
 text-transform:none'><span style="mso-list:Ignore">3.<span style='font:7.0pt "Times New Roman"'>  
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Objetivos
@@ -4952,8 +4962,15 @@ concretos y metodología de trabajo</span></span></a></span></span><span style="
 <p class="MsoNormal"><span lang="ES">Se utilizaron documentos PDF académicos de UNIR (Universidad Internacional de La Rioja), específicamente las instrucciones para la elaboración del TFE del Máster en Inteligencia Artificial.</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Proceso de Conversión</span></b></h4>
 <p class="MsoNormal"><span lang="ES">El script <span style="font-family:Consolas;font-size:10pt">prepare_dataset.ipynb</span> implementa:</span></p>
-<p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Conversión PDF a imágenes</b>:<br/>Biblioteca: PyMuPDF (fitz)<br/>Resolución: 300 DPI<br/>Formato de salida: PNG</span></p>
-<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Extracción de texto de referencia</b>:<br/>Método: <span style="font-family:Consolas;font-size:10pt">page.get_text("dict")</span> de PyMuPDF<br/>Preservación de estructura de líneas<br/>Tratamiento de texto vertical/marginal<br/>Normalización de espacios y saltos de línea</span></p>
+<p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Conversión PDF a imágenes</b>:</span></p>
+<p class="MsoListParagraphCxSpFirst" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Biblioteca: PyMuPDF (fitz)</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Resolución: 300 DPI</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Formato de salida: PNG</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Extracción de texto de referencia</b>:</span></p>
+<p class="MsoListParagraphCxSpFirst" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Método: <span style="font-family:Consolas;font-size:10pt">page.get_text("dict")</span> de PyMuPDF</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Preservación de estructura de líneas</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Tratamiento de texto vertical/marginal</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:54pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Normalización de espacios y saltos de línea</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Estructura del Dataset</span></b></h4>
 <a name="_Ref_Fig4"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->4<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Estructura del dataset de evaluación</span></i></p>
 <p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Estructura del dataset de evaluación" height="505" src="figures/figura_4.png" style="width:424.5pt;height:378.75pt;display:block;margin:0 auto" width="566"/></span></p>
@@ -4986,7 +5003,7 @@ concretos y metodología de trabajo</span></span></a></span></span><span style="
 <p class="MsoNormal"><span lang="ES">El espacio de búsqueda se definió utilizando <span style="font-family:Consolas;font-size:10pt">tune.choice()</span> para parámetros booleanos y <span style="font-family:Consolas;font-size:10pt">tune.uniform()</span> para parámetros continuos, con OptunaSearch como algoritmo de optimización configurado para minimizar CER en 64 trials. La implementación completa está disponible en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/raytune_ocr.py"><span style="font-family:Consolas;font-size:10pt">src/raytune/raytune_ocr.py</span></a> (ver Anexo A). Ray Tune se apoya en el ecosistema Ray para escalar la búsqueda (Moritz et al., 2018).</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 4: Ejecución de Optimización</span></h3>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Arquitectura de Ejecución</span></b></h4>
-<p class="MsoNormal"><span lang="ES">Se implementó una arquitectura basada en contenedores Docker para aislar los servicios OCR y facilitar la reproducibilidad (ver sección 4.2.3 para detalles de la arquitectura).</span></p>
+<p class="MsoNormal"><span lang="ES">Se implementó una arquitectura basada en contenedores Docker para aislar los servicios OCR y facilitar la reproducibilidad (ver Desarrollo de la comparativa en el <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Sec4 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Sec4">Capítulo 4</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> para detalles de la arquitectura).</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Ejecución con Docker Compose</span></b></h4>
 <p class="MsoNormal"><span lang="ES">Los servicios se orquestan mediante Docker Compose:</span></p>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.paddle.yml</span></a></span></p>
@@ -5044,7 +5061,8 @@ docker compose -f docker-compose.tuning.doctr.yml down</pre>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Sin límites de tiempo</b>: AWS y Colab imponen timeouts de sesión que interrumpen experimentos largos</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Acceso instantáneo</b>: Sin tiempo de aprovisionamiento de instancias cloud</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span><b>Almacenamiento local</b>: Dataset y resultados en disco sin costos de transferencia</span></p>
-<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">5.<span style="font-size:7pt">   </span><b>Iteración rápida</b>: Reinicio inmediato de contenedores Docker para depuración<br/>Para un proyecto de investigación con múltiples iteraciones de ajuste de hiperparámetros, la ejecución local reduce costos frente a servicios cloud. Este análisis se detalla en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.)</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">5.<span style="font-size:7pt">   </span><b>Iteración rápida</b>: Reinicio inmediato de contenedores Docker para depuración</span></p>
+<p class="MsoNormal"><span lang="ES">Para un proyecto de investigación con múltiples iteraciones de ajuste de hiperparámetros, la ejecución local reduce costos frente a servicios cloud. Este análisis se detalla en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.)</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Limitaciones Metodológicas</span></h3>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Tamaño del dataset</b>: El dataset contiene 45 páginas de documentos académicos UNIR. Resultados pueden no generalizar a otros formatos.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Subconjunto de optimización</b>: El ajuste de hiperparámetros se realizó sobre 5 páginas (páginas 5-10), y su impacto se analiza en detalle en el capítulo de desarrollo específico.</span></p>
@@ -5054,7 +5072,7 @@ docker compose -f docker-compose.tuning.doctr.yml down</pre>
 <p class="MsoNormal"><span lang="ES">Los objetivos y la metodología definidos en este capítulo establecen el marco para la experimentación. El objetivo general, alcanzar un CER inferior al 2% mediante optimización de hiperparámetros, se descompone en cinco objetivos específicos que abarcan desde la comparativa inicial de soluciones hasta la validación final de la configuración optimizada.</span></p>
 <p class="MsoNormal"><span lang="ES">La metodología experimental en cinco fases garantiza un proceso sistemático y reproducible: preparación de un dataset de 45 páginas, benchmark comparativo de tres motores OCR, definición del espacio de búsqueda, ejecución de 64 trials con Ray Tune y Optuna, y validación de la configuración resultante. Las limitaciones metodológicas, como el tamaño del dataset, el subconjunto de optimización reducido y el texto de referencia automático, se reconocen explícitamente para contextualizar la interpretación de resultados.</span></p>
 <p class="MsoNormal"><span lang="ES">El capítulo siguiente pone en práctica esta metodología, presentando el desarrollo experimental completo con sus resultados y análisis.</span></p><p class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;page-break-after:
-avoid;mso-outline-level:1;mso-list:l22 level1 lfo18"><span style="mso-bookmark:
+avoid;mso-outline-level:1;mso-list:l22 level1 lfo18"><a name="_Ref_Sec4"></a><span style="mso-bookmark:
 _Toc14106979"><span style="mso-bookmark:_Toc437515557"><a name="_Toc160619817"></a><a name="_Toc100036217"><span style="mso-bookmark:_Toc160619817"><?if !supportLists?><span lang="ES" style='font-size:18.0pt;mso-bidi-font-size:16.0pt;line-height:150%;
 font-family:"Calibri Light",sans-serif;mso-ascii-theme-font:major-latin;
 mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:major-latin;
@@ -5381,7 +5399,7 @@ Configuración óptima:
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Análisis de Correlación</span></b></h4>
-<p class="MsoNormal"><span lang="ES">Se calculó la correlación de Pearson entre los parámetros de configuración (codificados como 0/1 en el caso de booleanos) y las métricas de error (Pearson, 1895). Para interpretar la magnitud de las correlaciones se siguieron criterios habituales en investigación cuantitativa (Cohen, 1988):</span></p>
+<p class="MsoNormal"><span lang="ES">Se calculó la correlación de Pearson entre los parámetros de configuración (codificados como 0/1 en el caso de booleanos) y las métricas de error. Para interpretar la magnitud de las correlaciones se siguieron criterios habituales en investigación cuantitativa:</span></p>
 <a name="_Ref_Tab36"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->36<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Correlación de parámetros con CER.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Correlación con CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Interpretación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>+0.879</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación alta positiva</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.712</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación alta negativa</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.535</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada negativa</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">+0.428</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada positiva</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">+0.311</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada positiva</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.268</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada negativa</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NaN</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Varianza cero (valor fijo)</span></p></td></tr></table></div>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">src/results/correlations/paddle_correlations.csv</span></a>.</span></p>
@@ -5489,7 +5507,8 @@ Configuración óptima:
 <p class="MsoNormal"><span lang="ES">El clasificador de orientación de línea resuelve un problema fundamental en documentos con secciones y cambios de formato: determinar el orden correcto de lectura. Sin este clasificador:</span></p>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Las líneas del índice pueden mezclarse con el cuerpo del texto</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Los encabezados pueden insertarse en posiciones incorrectas</span></p>
-<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>Las listas numeradas pueden leerse en orden incorrecto<br/>Para documentos académicos que típicamente incluyen índice, listas y encabezados multinivel, este clasificador es esencial.</span></p>
+<p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>Las listas numeradas pueden leerse en orden incorrecto</span></p>
+<p class="MsoNormal"><span lang="ES">Para documentos académicos que típicamente incluyen índice, listas y encabezados multinivel, este clasificador es esencial.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Recomendación</b>: Siempre activar <span style="font-family:Consolas;font-size:10pt">textline_orientation=True</span> para documentos estructurados.</span></p>
 <h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Análisis del Parámetro text_det_thresh</span></b></h4>
 <p class="MsoNormal"><span lang="ES"><b>Comportamiento observado:</b></span></p>
@@ -5540,14 +5559,14 @@ Configuración óptima:
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Prioridad</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Justificación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Obligatorio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Crítico para documentos con secciones</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Recomendado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mejora orientación de documento</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.05 (rango: 0.04-0.10)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Recomendado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Detección sensible beneficia resultados</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.49 (rango: 0.4-0.6)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Recomendado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Balance de confianza</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.57 (rango: 0.5-0.7)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Opcional</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Filtra reconocimientos poco confiables</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">No recomendado</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Innecesario para PDFs digitales</span></p></td></tr></table></div>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Cuándo Aplicar Esta Metodología</span></b></h4>
+<h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">¿Cuándo aplicar esta metodología?</span></b></h4>
 <p class="MsoNormal"><span lang="ES">La optimización de hiperparámetros es recomendable cuando:</span></p>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>GPU disponible</b>: Acelera significativamente la exploración del espacio de hiperparámetros (82x más rápido que CPU).</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Modelo preentrenado adecuado</b>: El modelo ya soporta el idioma objetivo (como PaddleOCR para español).</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Dominio específico</b>: Se busca optimizar para un tipo de documento particular.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span><b>Mejora incremental</b>: El rendimiento baseline es aceptable pero mejorable.</span></p>
 <p class="MsoListParagraphCxSpLast" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">5.<span style="font-size:7pt">   </span><b>Sin datos de entrenamiento</b>: No se dispone de datasets etiquetados para fine-tuning.</span></p>
-<h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">Cuándo NO Aplicar Esta Metodología</span></b></h4>
+<h4 style="mso-list:none"><b><span lang="ES" style="text-transform:none">¿Cuándo no aplicar esta metodología?</span></b></h4>
 <p class="MsoNormal"><span lang="ES">La optimización de hiperparámetros puede ser insuficiente cuando:</span></p>
 <p class="MsoListParagraphCxSpFirst" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Idioma no soportado</b>: El modelo no incluye el idioma en su vocabulario.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Escritura manuscrita</b>: Requiere fine-tuning o modelos especializados.</span></p>
@@ -5602,7 +5621,7 @@ Configuración óptima:
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES">Los modelos Server, a pesar de ofrecer potencialmente mayor precisión, resultan inviables en hardware con VRAM limitada (≤6 GB) debido a errores de memoria (Out of Memory). Los modelos Mobile, con un consumo de memoria 88 veces menor, funcionan de manera estable y ofrecen rendimiento suficiente para el caso de uso evaluado.</span></p>
-<p class="MsoNormal"><span lang="ES">La validación con aceleración GPU demuestra que la configuración optimizada mediante Ray Tune mejora la precisión (CER: 8.85% → 7.72% en dataset completo, 0.79% en mejor trial individual) y, combinada con la aceleración de 82x proporcionada por GPU, resulta prácticamente aplicable en escenarios de producción real. Las conclusiones derivadas de esta validación se presentan en el Capítulo 5.</span></p><h1 style="mso-list:l22 level1 lfo18"><a name="_Toc160619818"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
+<p class="MsoNormal"><span lang="ES">La validación con aceleración GPU demuestra que la configuración optimizada mediante Ray Tune mejora la precisión (CER: 8.85% → 7.72% en dataset completo, 0.79% en mejor trial individual) y, combinada con la aceleración de 82x proporcionada por GPU, resulta prácticamente aplicable en escenarios de producción real. Las conclusiones derivadas de esta validación se presentan en el <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Sec5 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Sec5">Capítulo 5</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></p><h1 style="mso-list:l22 level1 lfo18"><a name="_Ref_Sec5"></a><a name="_Toc160619818"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
 major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span style="mso-list:Ignore">5.<span style='font:7.0pt "Times New Roman"'>  
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Conclusiones
 y trabajo futuro</span></a></h1><h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Conclusiones</span></h2>
@@ -5613,7 +5632,7 @@ y trabajo futuro</span></a></h1><h2 style="mso-list:l22 level2 lfo18"><span lang
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <div style="mso-element:para-border-div;border-top:solid #0098CD 1.0pt;border-left:none;border-bottom:solid #0098CD 1.0pt;border-right:none;mso-border-top-alt:solid #0098CD .5pt;mso-border-bottom-alt:solid #0098CD .5pt;padding:4.0pt 0cm 4.0pt 0cm;background:#E6F4F9">
-<p class="MsoNormal" style="background:#E6F4F9;border:none;padding:0cm;margin:0cm"><b><span lang="ES">Nota:</span></b><span lang="ES"> El objetivo de CER &lt; 2% se cumple en el mejor trial individual (0.79%, 5 páginas). La validación sobre el conjunto de datos completo (45 páginas) muestra un CER de 7.72%, evidenciando sobreajuste al subconjunto de optimización. Esta diferencia se analiza en detalle en el Capítulo 4.</span></p>
+<p class="MsoNormal" style="background:#E6F4F9;border:none;padding:0cm;margin:0cm"><b><span lang="ES">Nota:</span></b><span lang="ES"> El objetivo de CER &lt; 2% se cumple en el mejor trial individual (0.79%, 5 páginas). La validación sobre el conjunto de datos completo (45 páginas) muestra un CER de 7.72%, evidenciando sobreajuste al subconjunto de optimización. Esta diferencia se analiza en detalle en el <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Sec4 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Sec4">Capítulo 4</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></p>
 </div>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Cumplimiento de los Objetivos Específicos</span></h3>
 <p class="MsoNormal"><span lang="ES">La evaluación comparativa de soluciones OCR (OE1) reveló diferencias significativas entre las tres alternativas analizadas. De las tres soluciones de código abierto evaluadas, EasyOCR, PaddleOCR (PP-OCRv5) y DocTR, PaddleOCR demostró el mejor rendimiento base para documentos en español. Además, su arquitectura modular y la amplia configurabilidad de su pipeline lo convierten en el candidato idóneo para optimización mediante ajuste de hiperparámetros.</span></p>
@@ -5824,7 +5843,7 @@ analyze_results(results, prefix='raytune_paddle', config_keys=PADDLE_OCR_CONFIG_
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <div style="mso-element:para-border-div;border-top:solid #0098CD 1.0pt;border-left:none;border-bottom:solid #0098CD 1.0pt;border-right:none;mso-border-top-alt:solid #0098CD .5pt;mso-border-bottom-alt:solid #0098CD .5pt;padding:4.0pt 0cm 4.0pt 0cm;background:#E6F4F9">
-<p class="MsoNormal" style="background:#E6F4F9;border:none;padding:0cm;margin:0cm"><b><span lang="ES">Nota:</span></b><span lang="ES"> Ver <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Fig15 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Fig15">Figura 15</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> en el Capítulo 4 para la representación gráfica de esta distribución.</span></p>
+<p class="MsoNormal" style="background:#E6F4F9;border:none;padding:0cm;margin:0cm"><b><span lang="ES">Nota:</span></b><span lang="ES"> Ver <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Fig15 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Fig15">Figura 15</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> en el <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Sec4 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Sec4">Capítulo 4</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> para la representación gráfica de esta distribución.</span></p>
 </div>
 <h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Configuración Óptima PaddleOCR</span></h3>
 <p class="MsoNormal"><span lang="ES">La siguiente configuración logró el mejor rendimiento en el ajuste de hiperparámetros:</span></p>
@@ -5850,7 +5869,7 @@ analyze_results(results, prefix='raytune_paddle', config_keys=PADDLE_OCR_CONFIG_
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Datos de tiempo CPU de <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv"><span style="font-family:Consolas;font-size:10pt">src/raytune_paddle_subproc_results_20251207_192320.csv</span></a> y tiempos de GPU en trials de ajuste. Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <div style="mso-element:para-border-div;border-top:solid #0098CD 1.0pt;border-left:none;border-bottom:solid #0098CD 1.0pt;border-right:none;mso-border-top-alt:solid #0098CD .5pt;mso-border-bottom-alt:solid #0098CD .5pt;padding:4.0pt 0cm 4.0pt 0cm;background:#E6F4F9">
-<p class="MsoNormal" style="background:#E6F4F9;border:none;padding:0cm;margin:0cm"><b><span lang="ES">Nota:</span></b><span lang="ES"> Ver <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Fig20 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Fig20">Figura 20</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> en el Capítulo 4 para la representación gráfica de esta comparación.</span></p>
+<p class="MsoNormal" style="background:#E6F4F9;border:none;padding:0cm;margin:0cm"><b><span lang="ES">Nota:</span></b><span lang="ES"> Ver <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Fig20 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Fig20">Figura 20</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> en el <!--[if supportFields]><span style='mso-element:field-begin'></span> REF _Ref_Sec4 \h <span style='mso-element:field-separator'></span><![endif]--><a href="#_Ref_Sec4">Capítulo 4</a><!--[if supportFields]><span style='mso-element:field-end'></span><![endif]--> para la representación gráfica de esta comparación.</span></p>
 </div>
 <h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Análisis de Errores por Servicio</span></h3>
 <a name="_Ref_TabA8"></a><!--[if supportFields]><span style='mso-element:field-begin'></span> TC "Tabla A8. Tipos de errores identificados por servicio OCR." \f t \l 1 <span style='mso-element:field-end'></span><![endif]--><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A8.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Tipos de errores identificados por servicio OCR.</span></i></p>
@@ -5875,7 +5894,12 @@ analyze_results(results, prefix='raytune_paddle', config_keys=PADDLE_OCR_CONFIG_
 <p class="MsoListParagraph" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">PaddleOCR: soporte de inferencia con CUDA 12.</span></p>
 <p class="MsoListParagraph" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">PaddleOCR: soporte de Python 3.12 en dependencias.</span></p>
 <h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.10 Licencia</span></h2>
-<p class="MsoNormal"><span lang="ES">El código se distribuye bajo licencia MIT.</span></p></div>
+<p class="MsoNormal"><span lang="ES">El código se distribuye bajo licencia MIT.</span></p>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.11 Índice de acrónimos</span></h2>
+<a name="_Ref_TabA10"></a><!--[if supportFields]><span style='mso-element:field-begin'></span> TC "Tabla A10. Acrónimos utilizados en el trabajo." \f t \l 1 <span style='mso-element:field-end'></span><![endif]--><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A10.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Acrónimos utilizados en el trabajo.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Acrónimo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Significado</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">OCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Reconocimiento Óptico de Caracteres</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CER</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Character Error Rate (tasa de error de caracteres)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">WER</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Word Error Rate (tasa de error de palabras)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Graphics Processing Unit</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Central Processing Unit</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">API</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Application Programming Interface</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p></div>
 <div style="mso-element:footnote-list"><?if !supportFootnotes?><br clear="all"/>
 <hr align="left" size="1" width="33%"/>
 <?endif?>