diff --git a/apply_content.py b/apply_content.py
index 285d29f..40b1060 100644
--- a/apply_content.py
+++ b/apply_content.py
@@ -104,8 +104,9 @@ def parse_md_to_html_blocks(md_content):
             fig_file = f'figures/figura_{figure_counter}.png'
             fig_path = os.path.join(BASE_DIR, 'thesis_output', fig_file)
 
-            # Create figure with proper template format (Piedefoto-tabla class)
-            html_blocks.append(f'''<p class=Piedefoto-tabla style="margin-left:0cm;text-align:center"><span lang=ES><b>Figura {figure_counter}.</b> <i>{fig_title}</i></span></p>''')
+            # Create figure with MsoCaption class and bookmark for Word cross-reference
+            bookmark_id = f"_TocFigura{figure_counter}"
+            html_blocks.append(f'''<p class=MsoCaption style="text-align:center"><a name="{bookmark_id}"><span lang=ES style="font-size:12.0pt;line-height:150%">Figura {figure_counter}. </span></a><i><span lang=ES style="font-size:12.0pt;line-height:150%;font-weight:normal">{fig_title}</span></i></p>''')
 
             if os.path.exists(fig_path):
                 # Use actual image with proper Word-compatible format
@@ -185,12 +186,13 @@ def parse_md_to_html_blocks(md_content):
                 table_source = lines[i].replace('*', '').replace('Fuente:', '').strip()
                 i += 1
 
-            # Add table title with proper template format (Piedefoto-tabla class)
+            # Add table title with MsoCaption class and bookmark for Word cross-reference
+            bookmark_id = f"_TocTabla{table_counter}"
             if table_title:
                 clean_title = table_title.replace(f"Tabla {table_counter}.", "").strip()
-                html_blocks.append(f'<p class=Piedefoto-tabla style="margin-left:0cm"><span lang=ES><b>Tabla {table_counter}.</b> <i>{clean_title}</i></span></p>')
+                html_blocks.append(f'<p class=MsoCaption><a name="{bookmark_id}"><span lang=ES style="font-size:12.0pt;line-height:150%">Tabla {table_counter}. </span></a><i><span lang=ES style="font-size:12.0pt;line-height:150%;font-weight:normal">{clean_title}</span></i></p>')
             else:
-                html_blocks.append(f'<p class=Piedefoto-tabla style="margin-left:0cm"><span lang=ES><b>Tabla {table_counter}.</b> <i>Tabla de datos.</i></span></p>')
+                html_blocks.append(f'<p class=MsoCaption><a name="{bookmark_id}"><span lang=ES style="font-size:12.0pt;line-height:150%">Tabla {table_counter}. </span></a><i><span lang=ES style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>')
 
             # Build table HTML
             table_html = '<table class=MsoTableGrid border=1 cellspacing=0 cellpadding=0 style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt">'
diff --git a/docs/01_introduccion.md b/docs/01_introduccion.md
index 3162430..3eaf9f5 100644
--- a/docs/01_introduccion.md
+++ b/docs/01_introduccion.md
@@ -1,8 +1,8 @@
-# 1. Introducción
+# Introducción
 
 Este capítulo presenta la motivación del trabajo, identificando el problema a resolver y justificando su relevancia. Se plantea la pregunta de investigación central y se describe la estructura del documento.
 
-## 1.1. Motivación
+## Motivación
 
 El Reconocimiento Óptico de Caracteres (OCR) es una tecnología fundamental en la era de la digitalización documental. Su capacidad para convertir imágenes de texto en datos editables y procesables ha transformado sectores como la administración pública, el ámbito legal, la banca y la educación. Sin embargo, a pesar de los avances significativos impulsados por el aprendizaje profundo, la implementación práctica de sistemas OCR de alta precisión sigue presentando desafíos considerables.
 
@@ -12,7 +12,7 @@ Los modelos OCR basados en redes neuronales profundas, como los empleados en Pad
 
 La presente investigación surge de una necesidad práctica: optimizar un sistema OCR para documentos académicos en español sin disponer de recursos GPU para realizar fine-tuning. Esta restricción, lejos de ser una limitación excepcional, representa la realidad de muchos entornos académicos y empresariales donde el acceso a infraestructura de cómputo avanzada es limitado.
 
-## 1.2. Planteamiento del trabajo
+## Planteamiento del trabajo
 
 El problema central que aborda este trabajo puede formularse de la siguiente manera:
 
@@ -35,7 +35,7 @@ La relevancia de este problema radica en su aplicabilidad inmediata. Una metodol
 - Pequeñas y medianas empresas que automatizan flujos documentales
 - Desarrolladores que integran OCR en aplicaciones con restricciones de recursos
 
-## 1.3. Estructura del trabajo
+## Estructura del trabajo
 
 El presente documento se organiza en los siguientes capítulos:
 
diff --git a/docs/02_contexto_estado_arte.md b/docs/02_contexto_estado_arte.md
index f968ee3..6908a9b 100644
--- a/docs/02_contexto_estado_arte.md
+++ b/docs/02_contexto_estado_arte.md
@@ -1,8 +1,8 @@
-# 2. Contexto y estado del arte
+# Contexto y estado del arte
 
 Este capítulo presenta el marco teórico y tecnológico en el que se desarrolla el presente trabajo. Se revisan los fundamentos del Reconocimiento Óptico de Caracteres (OCR), la evolución de las técnicas basadas en aprendizaje profundo, las principales soluciones de código abierto disponibles y los trabajos previos relacionados con la optimización de sistemas OCR.
 
-## 2.1. Contexto del problema
+## Contexto del problema
 
 ### Definición y Evolución Histórica del OCR
 
@@ -74,7 +74,7 @@ El español presenta características específicas que impactan el OCR:
 - **Longitud de palabras**: Palabras generalmente más largas que en inglés
 - **Puntuación**: Signos de interrogación y exclamación invertidos
 
-## 2.2. Estado del arte
+## Estado del arte
 
 ### Soluciones OCR de Código Abierto
 
@@ -226,7 +226,7 @@ Los trabajos previos en OCR para español se han centrado principalmente en:
 
 La optimización de hiperparámetros para documentos académicos en español representa una contribución original de este trabajo.
 
-## 2.3. Conclusiones
+## Conclusiones del capítulo
 
 Este capítulo ha presentado:
 
diff --git a/docs/03_objetivos_metodologia.md b/docs/03_objetivos_metodologia.md
index 1816fa9..d4ab8a5 100644
--- a/docs/03_objetivos_metodologia.md
+++ b/docs/03_objetivos_metodologia.md
@@ -1,8 +1,8 @@
-# 3. Objetivos concretos y metodología de trabajo
+# Objetivos concretos y metodología de trabajo
 
 Este capítulo establece los objetivos del trabajo siguiendo la metodología SMART (Doran, 1981) y describe la metodología experimental empleada para alcanzarlos. Se define un objetivo general y cinco objetivos específicos, todos ellos medibles y verificables.
 
-## 3.1. Objetivo general
+## Objetivo general
 
 > **Optimizar el rendimiento de PaddleOCR para documentos académicos en español mediante ajuste de hiperparámetros, alcanzando un CER inferior al 2% sin requerir fine-tuning del modelo ni recursos GPU dedicados.**
 
@@ -16,7 +16,7 @@ Este capítulo establece los objetivos del trabajo siguiendo la metodología SMA
 | **Relevante (R)** | El impacto es demostrable: mejora la extracción de texto en documentos académicos sin costes adicionales de infraestructura |
 | **Temporal (T)** | El plazo es un cuatrimestre, correspondiente al TFM |
 
-## 3.2. Objetivos específicos
+## Objetivos específicos
 
 ### OE1: Comparar soluciones OCR de código abierto
 > **Evaluar el rendimiento base de EasyOCR, PaddleOCR y DocTR en documentos académicos en español, utilizando CER y WER como métricas, para seleccionar el modelo más prometedor.**
@@ -33,9 +33,9 @@ Este capítulo establece los objetivos del trabajo siguiendo la metodología SMA
 ### OE5: Validar la configuración optimizada
 > **Comparar el rendimiento de la configuración baseline versus la configuración optimizada sobre el dataset completo, documentando la mejora obtenida.**
 
-## 3.3. Metodología del trabajo
+## Metodología del trabajo
 
-### 3.3.1. Visión General
+### Visión General
 
 
 
@@ -71,7 +71,7 @@ flowchart TD
 
 ```
 
-### 3.3.2. Fase 1: Preparación del Dataset
+### Fase 1: Preparación del Dataset
 
 #### Fuente de Datos
 Se utilizaron documentos PDF académicos de UNIR (Universidad Internacional de La Rioja), específicamente las instrucciones para la elaboración del TFE del Máster en Inteligencia Artificial.
@@ -124,7 +124,7 @@ class ImageTextDataset:
         # Retorna (PIL.Image, str)
 ```
 
-### 3.3.3. Fase 2: Benchmark Comparativo
+### Fase 2: Benchmark Comparativo
 
 #### Modelos Evaluados
 
@@ -148,7 +148,7 @@ def evaluate_text(reference, prediction):
     }
 ```
 
-### 3.3.4. Fase 3: Espacio de Búsqueda
+### Fase 3: Espacio de Búsqueda
 
 #### Hiperparámetros Seleccionados
 
@@ -190,7 +190,7 @@ tuner = tune.Tuner(
 )
 ```
 
-### 3.3.5. Fase 4: Ejecución de Optimización
+### Fase 4: Ejecución de Optimización
 
 #### Arquitectura de Ejecución
 
@@ -232,7 +232,7 @@ Y retorna métricas en formato JSON:
 }
 ```
 
-### 3.3.6. Fase 5: Validación
+### Fase 5: Validación
 
 #### Protocolo de Validación
 
@@ -241,7 +241,7 @@ Y retorna métricas en formato JSON:
 3. **Comparación**: Evaluación sobre las 24 páginas del dataset completo
 4. **Métricas reportadas**: CER, WER, tiempo de procesamiento
 
-### 3.3.7. Entorno de Ejecución
+### Entorno de Ejecución
 
 #### Hardware
 
@@ -263,7 +263,7 @@ Y retorna métricas en formato JSON:
 | Ray | 2.52.1 |
 | Optuna | 4.6.0 |
 
-### 3.3.8. Limitaciones Metodológicas
+### Limitaciones Metodológicas
 
 1. **Tamaño del dataset**: El dataset contiene 24 páginas de un único tipo de documento. Resultados pueden no generalizar a otros formatos.
 
@@ -273,7 +273,7 @@ Y retorna métricas en formato JSON:
 
 4. **Parámetro fijo**: `text_det_unclip_ratio` quedó fijado en 0.0 durante todo el experimento por decisión de diseño inicial.
 
-## 3.4. Resumen del capítulo
+## Resumen del capítulo
 
 Este capítulo ha establecido:
 
diff --git a/docs/04_desarrollo_especifico.md b/docs/04_desarrollo_especifico.md
index 12039b8..bdc08ff 100644
--- a/docs/04_desarrollo_especifico.md
+++ b/docs/04_desarrollo_especifico.md
@@ -1,14 +1,14 @@
-# 4. Desarrollo específico de la contribución
+# Desarrollo específico de la contribución
 
 Este capítulo presenta el desarrollo completo del estudio comparativo y la optimización de hiperparámetros de sistemas OCR. Se estructura según el tipo de trabajo "Comparativa de soluciones" establecido por las instrucciones de UNIR: planteamiento de la comparativa, desarrollo de la comparativa, y discusión y análisis de resultados.
 
-## 4.1. Planteamiento de la comparativa
+## Planteamiento de la comparativa
 
-### 4.1.1. Introducción
+### Introducción
 
 Esta sección presenta los resultados del estudio comparativo realizado entre tres soluciones OCR de código abierto: EasyOCR, PaddleOCR y DocTR. Los experimentos fueron documentados en el notebook `ocr_benchmark_notebook.ipynb` del repositorio. El objetivo es identificar el modelo base más prometedor para la posterior fase de optimización de hiperparámetros.
 
-### 4.1.2. Configuración del Experimento
+### Configuración del Experimento
 
 #### Dataset de Evaluación
 
@@ -61,7 +61,7 @@ def evaluate_text(reference, prediction):
     return {'WER': wer(reference, prediction), 'CER': cer(reference, prediction)}
 ```
 
-### 4.1.3. Resultados del Benchmark
+### Resultados del Benchmark
 
 #### Resultados de PaddleOCR (Datos del CSV)
 
@@ -107,7 +107,7 @@ Del archivo CSV, un ejemplo de predicción de PaddleOCR para la página 8:
 - `titulacióon` en lugar de `titulación` (carácter duplicado)
 - `Apa` en lugar de `APA` (capitalización)
 
-### 4.1.4. Justificación de la Selección de PaddleOCR
+### Justificación de la Selección de PaddleOCR
 
 #### Criterios de Selección
 
@@ -128,13 +128,13 @@ Basándose en los resultados obtenidos y la documentación del benchmark:
 - Alta configurabilidad de hiperparámetros de inferencia
 - Pipeline modular que permite experimentación
 
-### 4.1.5. Limitaciones del Benchmark
+### Limitaciones del Benchmark
 
 1. **Tamaño reducido**: Solo 5 páginas evaluadas en el benchmark comparativo inicial
 2. **Único tipo de documento**: Documentos académicos de UNIR únicamente
 3. **Ground truth**: El texto de referencia se extrajo automáticamente del PDF, lo cual puede introducir errores en layouts complejos
 
-### 4.1.6. Resumen de la Sección
+### Resumen de la Sección
 
 Esta sección ha presentado:
 
@@ -147,13 +147,13 @@ Esta sección ha presentado:
 - `results/ai_ocr_benchmark_finetune_results_20251206_113206.csv`: Resultados numéricos
 - Documentación oficial de PaddleOCR
 
-## 4.2. Desarrollo de la comparativa: Optimización de hiperparámetros
+## Desarrollo de la comparativa: Optimización de hiperparámetros
 
-### 4.2.1. Introducción
+### Introducción
 
 Esta sección describe el proceso de optimización de hiperparámetros de PaddleOCR utilizando Ray Tune con el algoritmo de búsqueda Optuna. Los experimentos fueron implementados en el notebook `src/paddle_ocr_fine_tune_unir_raytune.ipynb` y los resultados se almacenaron en `src/raytune_paddle_subproc_results_20251207_192320.csv`.
 
-### 4.2.2. Configuración del Experimento
+### Configuración del Experimento
 
 #### Entorno de Ejecución
 
@@ -229,7 +229,7 @@ tuner = tune.Tuner(
 - **Número de trials**: 64
 - **Trials concurrentes**: 2
 
-### 4.2.3. Resultados de la Optimización
+### Resultados de la Optimización
 
 #### Estadísticas Descriptivas
 
@@ -330,7 +330,7 @@ Ejemplo de trial con fallo catastrófico:
 - WER: 59.45%
 - Configuración: `text_det_thresh=0.017`, `textline_orientation=True`
 
-### 4.2.4. Comparación Baseline vs Optimizado
+### Comparación Baseline vs Optimizado
 
 #### Resultados sobre Dataset Completo (24 páginas)
 
@@ -377,7 +377,7 @@ xychart-beta
 - Optimizado: ~149 caracteres con error
 - Diferencia: ~629 caracteres menos con errores
 
-### 4.2.5. Tiempo de Ejecución
+### Tiempo de Ejecución
 
 | Métrica | Valor |
 |---------|-------|
@@ -386,7 +386,7 @@ xychart-beta
 | Tiempo medio por página | 69.42 segundos |
 | Total páginas procesadas | 64 trials × 5 páginas = 320 evaluaciones |
 
-### 4.2.6. Resumen de la Sección
+### Resumen de la Sección
 
 Esta sección ha presentado:
 
@@ -403,13 +403,13 @@ Esta sección ha presentado:
 - `src/raytune_paddle_subproc_results_20251207_192320.csv`: Resultados de 64 trials
 - `src/paddle_ocr_tuning.py`: Script de evaluación
 
-## 4.3. Discusión y análisis de resultados
+## Discusión y análisis de resultados
 
-### 4.3.1. Introducción
+### Introducción
 
 Esta sección presenta un análisis consolidado de los resultados obtenidos en las fases de benchmark comparativo y optimización de hiperparámetros. Se discuten las implicaciones prácticas y se evalúa el cumplimiento de los objetivos planteados.
 
-### 4.3.2. Resumen de Resultados
+### Resumen de Resultados
 
 #### Resultados del Benchmark Comparativo
 
@@ -446,7 +446,7 @@ Resultados del notebook `src/paddle_ocr_fine_tune_unir_raytune.ipynb`:
 | PaddleOCR (Baseline) | 7.78% | 92.22% | 14.94% | 85.06% |
 | PaddleOCR-HyperAdjust | 1.49% | 98.51% | 7.62% | 92.38% |
 
-### 4.3.3. Análisis de Resultados
+### Análisis de Resultados
 
 #### Mejora Obtenida
 
@@ -504,7 +504,7 @@ config_optimizada = {
 }
 ```
 
-### 4.3.4. Discusión
+### Discusión
 
 #### Hallazgos Principales
 
@@ -542,7 +542,7 @@ La correlación negativa de `text_det_thresh` (-0.52) con el CER indica que:
 | OE5: Validar configuración | Documentar mejora | CER 7.78% → 1.49% | ✓ |
 | **Objetivo General** | CER < 2% | CER = 1.49% | ✓ |
 
-### 4.3.5. Implicaciones Prácticas
+### Implicaciones Prácticas
 
 #### Recomendaciones de Configuración
 
@@ -570,7 +570,7 @@ Esta metodología de optimización es aplicable cuando:
 - El modelo preentrenado ya tiene soporte para el idioma objetivo
 - Se busca mejorar rendimiento sin reentrenar
 
-### 4.3.6. Resumen de la Sección
+### Resumen de la Sección
 
 Esta sección ha presentado:
 
diff --git a/docs/05_conclusiones_trabajo_futuro.md b/docs/05_conclusiones_trabajo_futuro.md
index 3b3b80d..2aa5e3a 100644
--- a/docs/05_conclusiones_trabajo_futuro.md
+++ b/docs/05_conclusiones_trabajo_futuro.md
@@ -1,10 +1,10 @@
-# 5. Conclusiones y trabajo futuro
+# Conclusiones y trabajo futuro
 
 Este capítulo resume las principales conclusiones del trabajo, evalúa el grado de cumplimiento de los objetivos planteados y propone líneas de trabajo futuro que permitirían ampliar y profundizar los resultados obtenidos.
 
-## 5.1. Conclusiones
+## Conclusiones
 
-### 5.1.1. Conclusiones Generales
+### Conclusiones Generales
 
 Este Trabajo Fin de Máster ha demostrado que es posible mejorar significativamente el rendimiento de sistemas OCR preentrenados mediante optimización sistemática de hiperparámetros, sin requerir fine-tuning ni recursos GPU dedicados.
 
@@ -14,7 +14,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
 |---------|----------|-----------|
 | CER | < 2% | **1.49%** |
 
-### 5.1.2. Conclusiones Específicas
+### Conclusiones Específicas
 
 **Respecto a OE1 (Comparativa de soluciones OCR)**:
 - Se evaluaron tres soluciones OCR de código abierto: EasyOCR, PaddleOCR (PP-OCRv5) y DocTR
@@ -41,7 +41,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
 - La mejora obtenida fue del 80.9% en reducción del CER (7.78% → 1.49%)
 - La precisión de caracteres alcanzó el 98.51%
 
-### 5.1.3. Hallazgos Clave
+### Hallazgos Clave
 
 1. **Arquitectura sobre umbrales**: Un único parámetro booleano (`textline_orientation`) tiene más impacto que todos los umbrales continuos combinados.
 
@@ -51,7 +51,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
 
 4. **Optimización sin fine-tuning**: Se puede mejorar significativamente el rendimiento de modelos preentrenados mediante ajuste de hiperparámetros de inferencia.
 
-### 5.1.4. Contribuciones del Trabajo
+### Contribuciones del Trabajo
 
 1. **Metodología reproducible**: Se documenta un proceso completo de optimización de hiperparámetros OCR con Ray Tune + Optuna.
 
@@ -61,7 +61,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
 
 4. **Código fuente**: Todo el código está disponible en el repositorio GitHub para reproducción y extensión.
 
-### 5.1.5. Limitaciones del Trabajo
+### Limitaciones del Trabajo
 
 1. **Tipo de documento único**: Los experimentos se realizaron únicamente sobre documentos académicos de UNIR. La generalización a otros tipos de documentos requiere validación adicional.
 
@@ -73,9 +73,9 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
 
 5. **Parámetro no explorado**: `text_det_unclip_ratio` permaneció fijo en 0.0 durante todo el experimento.
 
-## 5.2. Líneas de trabajo futuro
+## Líneas de trabajo futuro
 
-### 5.2.1. Extensiones Inmediatas
+### Extensiones Inmediatas
 
 1. **Validación cruzada**: Evaluar la configuración óptima en otros tipos de documentos en español (facturas, formularios, textos manuscritos).
 
@@ -85,7 +85,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
 
 4. **Evaluación con GPU**: Medir tiempos de inferencia con aceleración GPU.
 
-### 5.2.2. Líneas de Investigación
+### Líneas de Investigación
 
 1. **Transfer learning de hiperparámetros**: Investigar si las configuraciones óptimas para un tipo de documento transfieren a otros dominios.
 
@@ -95,7 +95,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
 
 4. **Comparación con fine-tuning**: Cuantificar la brecha de rendimiento entre optimización de hiperparámetros y fine-tuning real.
 
-### 5.2.3. Aplicaciones Prácticas
+### Aplicaciones Prácticas
 
 1. **Herramienta de configuración automática**: Desarrollar una herramienta que determine automáticamente la configuración óptima para un nuevo tipo de documento.
 
@@ -103,7 +103,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
 
 3. **Benchmark público**: Publicar un benchmark de OCR para documentos en español que facilite la comparación de soluciones.
 
-### 5.2.4. Reflexión Final
+### Reflexión Final
 
 Este trabajo demuestra que, en un contexto de recursos limitados donde el fine-tuning de modelos de deep learning no es viable, la optimización de hiperparámetros representa una alternativa práctica y efectiva para mejorar sistemas OCR.
 
diff --git a/thesis_output/plantilla_individual.htm b/thesis_output/plantilla_individual.htm
index 2085cf0..3ccb067 100644
--- a/thesis_output/plantilla_individual.htm
+++ b/thesis_output/plantilla_individual.htm
@@ -4538,12 +4538,12 @@ mso-ansi-language:ES;mso-fareast-language:EN-US;mso-bidi-language:AR-SA'><br cle
 <h1 style="mso-list:l22 level1 lfo18"><a name="_Toc437515557"></a><a name="_Toc14106979"></a><a name="_Toc147741191"></a><a name="_Toc160619805"><span style="mso-bookmark:_Toc147741191"><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:major-latin;
 mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span style="mso-list:Ignore">1.<span style='font:7.0pt "Times New Roman"'>  
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Introducción</span></span></span></span></a><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="text-transform:none"> </span></span></span></h1><p class="MsoNormal"><span lang="ES">Este capítulo presenta la motivación del trabajo, identificando el problema a resolver y justificando su relevancia. Se plantea la pregunta de investigación central y se describe la estructura del documento.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">1.1. Motivación</span></h2>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Motivación</span></h2>
 <p class="MsoNormal"><span lang="ES">El Reconocimiento Óptico de Caracteres (OCR) es una tecnología fundamental en la era de la digitalización documental. Su capacidad para convertir imágenes de texto en datos editables y procesables ha transformado sectores como la administración pública, el ámbito legal, la banca y la educación. Sin embargo, a pesar de los avances significativos impulsados por el aprendizaje profundo, la implementación práctica de sistemas OCR de alta precisión sigue presentando desafíos considerables.</span></p>
 <p class="MsoNormal"><span lang="ES">El procesamiento de documentos en español presenta particularidades que complican el reconocimiento automático de texto. Los caracteres especiales (ñ, acentos), las variaciones tipográficas en documentos académicos y administrativos, y la presencia de elementos gráficos como tablas, encabezados y marcas de agua generan errores que pueden propagarse en aplicaciones downstream como la extracción de entidades nombradas o el análisis semántico.</span></p>
 <p class="MsoNormal"><span lang="ES">Los modelos OCR basados en redes neuronales profundas, como los empleados en PaddleOCR, EasyOCR o DocTR, ofrecen un rendimiento impresionante en benchmarks estándar. No obstante, su adaptación a dominios específicos típicamente requiere fine-tuning con datos etiquetados del dominio objetivo y recursos computacionales significativos (GPUs de alta capacidad). Esta barrera técnica y económica excluye a muchos investigadores y organizaciones de beneficiarse plenamente de estas tecnologías.</span></p>
 <p class="MsoNormal"><span lang="ES">La presente investigación surge de una necesidad práctica: optimizar un sistema OCR para documentos académicos en español sin disponer de recursos GPU para realizar fine-tuning. Esta restricción, lejos de ser una limitación excepcional, representa la realidad de muchos entornos académicos y empresariales donde el acceso a infraestructura de cómputo avanzada es limitado.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">1.2. Planteamiento del trabajo</span></h2>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Planteamiento del trabajo</span></h2>
 <p class="MsoNormal"><span lang="ES">El problema central que aborda este trabajo puede formularse de la siguiente manera:</span></p>
 <p class="MsoNormal" style="margin-left:2cm;margin-right:1cm"><i><span lang="ES">¿Es posible mejorar significativamente el rendimiento de modelos OCR preentrenados para documentos en español mediante la optimización sistemática de hiperparámetros, sin requerir fine-tuning ni recursos GPU?</span></i></p>
 <p class="MsoNormal"><span lang="ES">Este planteamiento se descompone en las siguientes cuestiones específicas:</span></p>
@@ -4556,7 +4556,7 @@ mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span styl
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Instituciones educativas que digitalizan archivos históricos</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Pequeñas y medianas empresas que automatizan flujos documentales</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Desarrolladores que integran OCR en aplicaciones con restricciones de recursos</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">1.3. Estructura del trabajo</span></h2>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Estructura del trabajo</span></h2>
 <p class="MsoNormal"><span lang="ES">El presente documento se organiza en los siguientes capítulos:</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Capítulo 2 - Contexto y Estado del Arte</b>: Se presenta una revisión de las tecnologías OCR basadas en aprendizaje profundo, incluyendo las arquitecturas de detección y reconocimiento de texto, así como los trabajos previos en optimización de estos sistemas.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Capítulo 3 - Objetivos y Metodología</b>: Se definen los objetivos SMART del trabajo y se describe la metodología experimental seguida, incluyendo la preparación del dataset, las métricas de evaluación y el proceso de optimización con Ray Tune.</span></p>
@@ -4568,7 +4568,7 @@ text-transform:none'><span style="mso-list:Ignore">2.<span style='font:7.0pt "Ti
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Contexto
 y estado del arte</span></span></a></span></span><span style="mso-bookmark:
 _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="text-transform:none"><o:p></o:p></span></span></span></h1><p class="MsoNormal"><span lang="ES">Este capítulo presenta el marco teórico y tecnológico en el que se desarrolla el presente trabajo. Se revisan los fundamentos del Reconocimiento Óptico de Caracteres (OCR), la evolución de las técnicas basadas en aprendizaje profundo, las principales soluciones de código abierto disponibles y los trabajos previos relacionados con la optimización de sistemas OCR.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">2.1. Contexto del problema</span></h2>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Contexto del problema</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Definición y Evolución Histórica del OCR</span></h3>
 <p class="MsoNormal"><span lang="ES">El Reconocimiento Óptico de Caracteres (OCR) es el proceso de conversión de imágenes de texto manuscrito, mecanografiado o impreso en texto codificado digitalmente. La tecnología OCR ha evolucionado significativamente desde sus orígenes en la década de 1950:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Primera generación (1950-1970)</b>: Sistemas basados en plantillas que requerían fuentes específicas.</span></p>
@@ -4577,7 +4577,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Cuarta generación (2010-presente)</b>: Arquitecturas de aprendizaje profundo que dominan el estado del arte.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Pipeline Moderno de OCR</span></h3>
 <p class="MsoNormal"><span lang="ES">Los sistemas OCR modernos siguen típicamente un pipeline de dos etapas:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES"><b>Figura 1.</b> <i>Diagrama 1</i></span></p>
+<p class="MsoCaption" style="text-align:center"><a name="_TocFigura1"><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura 1. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Diagrama 1</span></i></p>
 <p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Diagrama 1" src="figures/figura_1.png" width="500"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4596,7 +4596,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Diacríticos</b>: Los acentos pueden confundirse con ruido o artefactos</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Longitud de palabras</b>: Palabras generalmente más largas que en inglés</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Puntuación</b>: Signos de interrogación y exclamación invertidos</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">2.2. Estado del arte</span></h2>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Estado del arte</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Soluciones OCR de Código Abierto</span></h3>
 <h4><span lang="ES">EasyOCR</span></h4>
 <p class="MsoNormal"><span lang="ES">EasyOCR es una biblioteca de OCR desarrollada por Jaided AI (2020) que soporta más de 80 idiomas. Sus características principales incluyen:</span></p>
@@ -4609,7 +4609,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Arquitectura</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">  - Detector: DB (Differentiable Binarization) con backbone ResNet (Liao et al., 2020)   - Reconocedor: SVTR (Scene-Text Visual Transformer Recognition)   - Clasificador de orientación opcional</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Hiperparámetros configurables</b>:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 1.</b> <i>Hiperparámetros configurables de PaddleOCR.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla1"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 1. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Hiperparámetros configurables de PaddleOCR.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Parámetro</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Descripción</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Valor por defecto</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_thresh</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Umbral de detección de píxeles</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">0.3</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_box_thresh</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Umbral de caja de detección</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">0.6</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_unclip_ratio</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Coeficiente de expansión</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.5</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_rec_score_thresh</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Umbral de confianza de reconocimiento</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">0.5</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_textline_orientation</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Clasificación de orientación</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">False</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_doc_orientation_classify</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Clasificación de orientación de documento</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">False</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_doc_unwarping</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Corrección de deformación</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">False</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4622,7 +4622,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Fortalezas</b>: API limpia, orientación académica, salida estructurada de alto nivel</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Limitaciones</b>: Menor rendimiento en español comparado con PaddleOCR</span></p>
 <h4><span lang="ES">Comparativa de Arquitecturas</span></h4>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 2.</b> <i>Comparativa de soluciones OCR de código abierto.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla2"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 2. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Comparativa de soluciones OCR de código abierto.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Modelo</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Tipo</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Componentes</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Fortalezas Clave</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>EasyOCR</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">End-to-end (det + rec)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CRAFT + CRNN/Transformer</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Ligero, fácil de usar, multilingüe</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>PaddleOCR</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">End-to-end (det + rec + cls)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">DB + SVTR/CRNN</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Soporte multilingüe robusto, configurable</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>DocTR</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">End-to-end (det + rec)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">DB/LinkNet + CRNN/SAR/ViTSTR</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Orientado a investigación, API limpia</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4644,7 +4644,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Pruning de trials no prometedores</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Visualización de resultados</span></p>
 <p class="MsoNormal"><span lang="ES">La combinación Ray Tune + Optuna permite búsquedas eficientes en espacios de alta dimensionalidad.</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES"><b>Figura 2.</b> <i>Diagrama 2</i></span></p>
+<p class="MsoCaption" style="text-align:center"><a name="_TocFigura2"><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura 2. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Diagrama 2</span></i></p>
 <p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Diagrama 2" src="figures/figura_2.png" width="500"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4664,7 +4664,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Procesamiento de documentos de identidad</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>Reconocimiento de texto en escenas naturales</span></p>
 <p class="MsoNormal"><span lang="ES">La optimización de hiperparámetros para documentos académicos en español representa una contribución original de este trabajo.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">2.3. Conclusiones</span></h2>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Conclusiones del capítulo</span></h2>
 <p class="MsoNormal"><span lang="ES">Este capítulo ha presentado:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Los fundamentos del OCR moderno y su pipeline de detección-reconocimiento</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Las tres principales soluciones de código abierto: EasyOCR, PaddleOCR y DocTR</span></p>
@@ -4675,14 +4675,14 @@ major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin
 text-transform:none'><span style="mso-list:Ignore">3.<span style='font:7.0pt "Times New Roman"'>  
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Objetivos
 concretos y metodología de trabajo</span></span></a></span></span><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="text-transform:none"><o:p></o:p></span></span></span></h1><p class="MsoNormal"><span lang="ES">Este capítulo establece los objetivos del trabajo siguiendo la metodología SMART (Doran, 1981) y describe la metodología experimental empleada para alcanzarlos. Se define un objetivo general y cinco objetivos específicos, todos ellos medibles y verificables.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">3.1. Objetivo general</span></h2>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Objetivo general</span></h2>
 <p class="MsoNormal" style="margin-left:2cm;margin-right:1cm"><i><span lang="ES"><b>Optimizar el rendimiento de PaddleOCR para documentos académicos en español mediante ajuste de hiperparámetros, alcanzando un CER inferior al 2% sin requerir fine-tuning del modelo ni recursos GPU dedicados.</b></span></i></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Justificación SMART del Objetivo General</span></h3>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 3.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla3"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 3. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Criterio</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Cumplimiento</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>Específico (S)</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Se define claramente qué se quiere lograr: optimizar PaddleOCR mediante ajuste de hiperparámetros para documentos en español</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>Medible (M)</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Se establece una métrica cuantificable: CER &lt; 2%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>Alcanzable (A)</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Es viable dado que: (1) PaddleOCR permite configuración de hiperparámetros, (2) Ray Tune posibilita búsqueda automatizada, (3) No se requiere GPU</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>Relevante (R)</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">El impacto es demostrable: mejora la extracción de texto en documentos académicos sin costes adicionales de infraestructura</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>Temporal (T)</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">El plazo es un cuatrimestre, correspondiente al TFM</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">3.2. Objetivos específicos</span></h2>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Objetivos específicos</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">OE1: Comparar soluciones OCR de código abierto</span></h3>
 <p class="MsoNormal" style="margin-left:2cm;margin-right:1cm"><i><span lang="ES"><b>Evaluar el rendimiento base de EasyOCR, PaddleOCR y DocTR en documentos académicos en español, utilizando CER y WER como métricas, para seleccionar el modelo más prometedor.</b></span></i></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">OE2: Preparar un dataset de evaluación</span></h3>
@@ -4693,13 +4693,13 @@ concretos y metodología de trabajo</span></span></a></span></span><span style="
 <p class="MsoNormal" style="margin-left:2cm;margin-right:1cm"><i><span lang="ES"><b>Ejecutar una búsqueda automatizada de hiperparámetros utilizando Ray Tune con Optuna, evaluando al menos 50 configuraciones diferentes.</b></span></i></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">OE5: Validar la configuración optimizada</span></h3>
 <p class="MsoNormal" style="margin-left:2cm;margin-right:1cm"><i><span lang="ES"><b>Comparar el rendimiento de la configuración baseline versus la configuración optimizada sobre el dataset completo, documentando la mejora obtenida.</b></span></i></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">3.3. Metodología del trabajo</span></h2>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">3.3.1. Visión General</span></h3>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES"><b>Figura 3.</b> <i>Diagrama 3</i></span></p>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Metodología del trabajo</span></h2>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Visión General</span></h3>
+<p class="MsoCaption" style="text-align:center"><a name="_TocFigura3"><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura 3. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Diagrama 3</span></i></p>
 <p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Diagrama 3" src="figures/figura_3.png" width="500"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">3.3.2. Fase 1: Preparación del Dataset</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 1: Preparación del Dataset</span></h3>
 <h4><span lang="ES">Fuente de Datos</span></h4>
 <p class="MsoNormal"><span lang="ES">Se utilizaron documentos PDF académicos de UNIR (Universidad Internacional de La Rioja), específicamente las instrucciones para la elaboración del TFE del Máster en Inteligencia Artificial.</span></p>
 <h4><span lang="ES">Proceso de Conversión</span></h4>
@@ -4709,7 +4709,7 @@ concretos y metodología de trabajo</span></span></a></span></span><span style="
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Extracción de texto de referencia</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">   - Método: <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">page.get_text("dict")</span> de PyMuPDF    - Preservación de estructura de líneas    - Tratamiento de texto vertical/marginal    - Normalización de espacios y saltos de línea</span></p>
 <h4><span lang="ES">Estructura del Dataset</span></h4>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES"><b>Figura 4.</b> <i>Diagrama 4</i></span></p>
+<p class="MsoCaption" style="text-align:center"><a name="_TocFigura4"><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura 4. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Diagrama 4</span></i></p>
 <p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Diagrama 4" src="figures/figura_4.png" width="500"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4721,9 +4721,9 @@ concretos y metodología de trabajo</span></span></a></span></span><span style="
 
     def __getitem__(self, idx):
         # Retorna (PIL.Image, str)</pre></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">3.3.3. Fase 2: Benchmark Comparativo</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 2: Benchmark Comparativo</span></h3>
 <h4><span lang="ES">Modelos Evaluados</span></h4>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 4.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla4"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 4. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Modelo</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Versión</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Configuración</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">EasyOCR</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">-</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Idiomas: ['es', 'en']</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddleOCR</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PP-OCRv5</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Modelos server_det + server_rec</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">DocTR</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">-</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">db_resnet50 + sar_resnet31</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4736,9 +4736,9 @@ def evaluate_text(reference, prediction):
         'WER': wer(reference, prediction),
         'CER': cer(reference, prediction)
     }</pre></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">3.3.4. Fase 3: Espacio de Búsqueda</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 3: Espacio de Búsqueda</span></h3>
 <h4><span lang="ES">Hiperparámetros Seleccionados</span></h4>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 5.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla5"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 5. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Parámetro</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Tipo</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Rango/Valores</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Descripción</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_doc_orientation_classify</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Booleano</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">[True, False]</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Clasificación de orientación del documento</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_doc_unwarping</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Booleano</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">[True, False]</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Corrección de deformación del documento</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">textline_orientation</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Booleano</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">[True, False]</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Clasificación de orientación de línea de texto</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_thresh</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Continuo</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">[0.0, 0.7]</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Umbral de detección de píxeles de texto</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_box_thresh</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Continuo</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">[0.0, 0.7]</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Umbral de caja de detección</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_unclip_ratio</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Fijo</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">0.0</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Coeficiente de expansión (fijado)</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_rec_score_thresh</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Continuo</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">[0.0, 0.7]</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Umbral de confianza de reconocimiento</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4766,10 +4766,10 @@ tuner = tune.Tuner(
         max_concurrent_trials=2
     )
 )</pre></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">3.3.5. Fase 4: Ejecución de Optimización</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 4: Ejecución de Optimización</span></h3>
 <h4><span lang="ES">Arquitectura de Ejecución</span></h4>
 <p class="MsoNormal"><span lang="ES">Debido a incompatibilidades entre Ray y PaddleOCR en el mismo proceso, se implementó una arquitectura basada en subprocesos:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES"><b>Figura 5.</b> <i>Diagrama 5</i></span></p>
+<p class="MsoCaption" style="text-align:center"><a name="_TocFigura5"><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura 5. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Diagrama 5</span></i></p>
 <p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Diagrama 5" src="figures/figura_5.png" width="500"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4789,29 +4789,29 @@ tuner = tune.Tuner(
     "PAGES": 5,
     "TIME_PER_PAGE": 66.12
 }</pre></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">3.3.6. Fase 5: Validación</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 5: Validación</span></h3>
 <h4><span lang="ES">Protocolo de Validación</span></h4>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Baseline</b>: Ejecución con configuración por defecto de PaddleOCR</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Optimizado</b>: Ejecución con mejor configuración encontrada</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Comparación</b>: Evaluación sobre las 24 páginas del dataset completo</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span><b>Métricas reportadas</b>: CER, WER, tiempo de procesamiento</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">3.3.7. Entorno de Ejecución</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Entorno de Ejecución</span></h3>
 <h4><span lang="ES">Hardware</span></h4>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 6.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla6"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 6. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Componente</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Especificación</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CPU</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Intel Core (especificar modelo)</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">RAM</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">16 GB</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">GPU</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">No disponible (ejecución en CPU)</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Almacenamiento</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">SSD</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h4><span lang="ES">Software</span></h4>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 7.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla7"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 7. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Componente</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Versión</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Sistema Operativo</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Windows 10/11</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Python</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">3.11.9</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddleOCR</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">3.3.2</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddlePaddle</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">3.2.2</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Ray</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">2.52.1</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Optuna</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">4.6.0</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">3.3.8. Limitaciones Metodológicas</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Limitaciones Metodológicas</span></h3>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Tamaño del dataset</b>: El dataset contiene 24 páginas de un único tipo de documento. Resultados pueden no generalizar a otros formatos.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Ejecución en CPU</b>: Los tiempos de procesamiento (~70s/página) serían significativamente menores con GPU.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Ground truth imperfecto</b>: El texto de referencia extraído de PDF puede contener errores en documentos con layouts complejos.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Parámetro fijo</b>: <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_unclip_ratio</span> quedó fijado en 0.0 durante todo el experimento por decisión de diseño inicial.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">3.4. Resumen del capítulo</span></h2>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Resumen del capítulo</span></h2>
 <p class="MsoNormal"><span lang="ES">Este capítulo ha establecido:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Un objetivo general SMART: alcanzar CER &lt; 2% mediante optimización de hiperparámetros</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Cinco objetivos específicos medibles y alcanzables</span></p>
@@ -4840,13 +4840,13 @@ específico de la contribución</span></span></span></span><span style="mso-book
 font-family:"Calibri Light",sans-serif;mso-ascii-theme-font:major-latin;
 mso-hansi-theme-font:major-latin;mso-bidi-font-family:"Times New Roman";
 color:#0098CD;mso-font-kerning:16.0pt;mso-bidi-font-weight:bold'><o:p></o:p></span></span></span></p><p class="MsoNormal"><span lang="ES">Este capítulo presenta el desarrollo completo del estudio comparativo y la optimización de hiperparámetros de sistemas OCR. Se estructura según el tipo de trabajo "Comparativa de soluciones" establecido por las instrucciones de UNIR: planteamiento de la comparativa, desarrollo de la comparativa, y discusión y análisis de resultados.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">4.1. Planteamiento de la comparativa</span></h2>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.1.1. Introducción</span></h3>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Planteamiento de la comparativa</span></h2>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Introducción</span></h3>
 <p class="MsoNormal"><span lang="ES">Esta sección presenta los resultados del estudio comparativo realizado entre tres soluciones OCR de código abierto: EasyOCR, PaddleOCR y DocTR. Los experimentos fueron documentados en el notebook <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">ocr_benchmark_notebook.ipynb</span> del repositorio. El objetivo es identificar el modelo base más prometedor para la posterior fase de optimización de hiperparámetros.</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.1.2. Configuración del Experimento</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Configuración del Experimento</span></h3>
 <h4><span lang="ES">Dataset de Evaluación</span></h4>
 <p class="MsoNormal"><span lang="ES">Se utilizó el documento "Instrucciones para la redacción y elaboración del TFE" del Máster Universitario en Inteligencia Artificial de UNIR, ubicado en la carpeta <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">instructions/</span>.</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 8.</b> <i>Tabla 3. Características del dataset de evaluación.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla8"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 8. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla 3. Características del dataset de evaluación.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Característica</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Número de páginas evaluadas</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">5 (páginas 1-5 en benchmark inicial)</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Formato</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PDF digital (no escaneado)</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Idioma</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Español</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Resolución de conversión</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">300 DPI</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4871,10 +4871,10 @@ color:#0098CD;mso-font-kerning:16.0pt;mso-bidi-font-weight:bold'><o:p></o:p></sp
 
 def evaluate_text(reference, prediction):
     return {'WER': wer(reference, prediction), 'CER': cer(reference, prediction)}</pre></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.1.3. Resultados del Benchmark</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Resultados del Benchmark</span></h3>
 <h4><span lang="ES">Resultados de PaddleOCR (Datos del CSV)</span></h4>
 <p class="MsoNormal"><span lang="ES">Del archivo <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">results/ai_ocr_benchmark_finetune_results_20251206_113206.csv</span>, se obtienen los siguientes resultados de PaddleOCR para las páginas 5-9 del documento:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 9.</b> <i>Tabla 4. Resultados de PaddleOCR por página (benchmark inicial).</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla9"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 9. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla 4. Resultados de PaddleOCR por página (benchmark inicial).</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Página</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">WER</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">CER</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">5</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">12.16%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">6.33%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">6</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">12.81%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">6.40%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">7</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">11.06%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">6.24%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">8</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">8.13%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.54%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">9</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">10.61%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">5.58%</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4883,7 +4883,7 @@ def evaluate_text(reference, prediction):
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">WER medio: ~10.95%</span></p>
 <h4><span lang="ES">Comparativa de Modelos</span></h4>
 <p class="MsoNormal"><span lang="ES">Según la documentación del notebook <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">ocr_benchmark_notebook.ipynb</span>, los tres modelos evaluados representan diferentes paradigmas de OCR:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 10.</b> <i>Tabla 5. Comparativa de arquitecturas OCR evaluadas.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla10"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 10. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla 5. Comparativa de arquitecturas OCR evaluadas.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Modelo</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Tipo</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Componentes</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Fortalezas Clave</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>EasyOCR</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">End-to-end (det + rec)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">DB + CRNN/Transformer</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Ligero, fácil de usar, multilingüe</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>PaddleOCR (PP-OCR)</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">End-to-end (det + rec + cls)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">DB + SRN/CRNN</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Soporte multilingüe robusto, pipeline configurable</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>DocTR</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">End-to-end (det + rec)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">DB/LinkNet + CRNN/SAR/VitSTR</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Orientado a investigación, API limpia</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4893,7 +4893,7 @@ def evaluate_text(reference, prediction):
 <p class="MsoNormal"><span lang="ES"><b>Errores observados en este ejemplo:</b></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">titulacióon</span> en lugar de <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">titulación</span> (carácter duplicado)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">Apa</span> en lugar de <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">APA</span> (capitalización)</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.1.4. Justificación de la Selección de PaddleOCR</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Justificación de la Selección de PaddleOCR</span></h3>
 <h4><span lang="ES">Criterios de Selección</span></h4>
 <p class="MsoNormal"><span lang="ES">Basándose en los resultados obtenidos y la documentación del benchmark:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Rendimiento</b>: PaddleOCR obtuvo CER entre 1.54% y 6.40% en las páginas evaluadas</span></p>
@@ -4905,11 +4905,11 @@ def evaluate_text(reference, prediction):
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Resultados iniciales prometedores (CER ~5%)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Alta configurabilidad de hiperparámetros de inferencia</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Pipeline modular que permite experimentación</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.1.5. Limitaciones del Benchmark</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Limitaciones del Benchmark</span></h3>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Tamaño reducido</b>: Solo 5 páginas evaluadas en el benchmark comparativo inicial</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Único tipo de documento</b>: Documentos académicos de UNIR únicamente</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Ground truth</b>: El texto de referencia se extrajo automáticamente del PDF, lo cual puede introducir errores en layouts complejos</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.1.6. Resumen de la Sección</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Resumen de la Sección</span></h3>
 <p class="MsoNormal"><span lang="ES">Esta sección ha presentado:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>La configuración del benchmark según <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">ocr_benchmark_notebook.ipynb</span></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Los resultados cuantitativos de PaddleOCR del archivo CSV de resultados</span></p>
@@ -4918,13 +4918,13 @@ def evaluate_text(reference, prediction):
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">ocr_benchmark_notebook.ipynb</span>: Código del benchmark</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">results/ai_ocr_benchmark_finetune_results_20251206_113206.csv</span>: Resultados numéricos</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Documentación oficial de PaddleOCR</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">4.2. Desarrollo de la comparativa: Optimización de hiperparámetros</span></h2>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.2.1. Introducción</span></h3>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Desarrollo de la comparativa: Optimización de hiperparámetros</span></h2>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Introducción</span></h3>
 <p class="MsoNormal"><span lang="ES">Esta sección describe el proceso de optimización de hiperparámetros de PaddleOCR utilizando Ray Tune con el algoritmo de búsqueda Optuna. Los experimentos fueron implementados en el notebook <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">src/paddle_ocr_fine_tune_unir_raytune.ipynb</span> y los resultados se almacenaron en <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">src/raytune_paddle_subproc_results_20251207_192320.csv</span>.</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.2.2. Configuración del Experimento</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Configuración del Experimento</span></h3>
 <h4><span lang="ES">Entorno de Ejecución</span></h4>
 <p class="MsoNormal"><span lang="ES">Según los outputs del notebook:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 11.</b> <i>Tabla 6. Entorno de ejecución del experimento.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla11"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 11. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla 6. Entorno de ejecución del experimento.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Componente</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Versión/Especificación</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Python</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">3.11.9</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddlePaddle</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">3.2.2</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddleOCR</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">3.3.2</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Ray</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">2.52.1</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">GPU</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">No disponible (CPU only)</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4945,7 +4945,7 @@ def evaluate_text(reference, prediction):
     "text_rec_score_thresh": tune.uniform(0.0, 0.7),
 }</pre></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Descripción de parámetros</b> (según documentación de PaddleOCR):</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 12.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla12"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 12. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Parámetro</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Descripción</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_doc_orientation_classify</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Clasificación de orientación del documento</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_doc_unwarping</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Corrección de deformación del documento</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">textline_orientation</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Clasificación de orientación de línea de texto</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_thresh</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Umbral de detección de píxeles de texto</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_box_thresh</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Umbral de caja de detección</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_unclip_ratio</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Coeficiente de expansión (fijado en 0.0)</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_rec_score_thresh</span></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Umbral de confianza de reconocimiento</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4966,10 +4966,10 @@ def evaluate_text(reference, prediction):
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Algoritmo de búsqueda</b>: Optuna (TPE - Tree-structured Parzen Estimator)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Número de trials</b>: 64</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Trials concurrentes</b>: 2</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.2.3. Resultados de la Optimización</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Resultados de la Optimización</span></h3>
 <h4><span lang="ES">Estadísticas Descriptivas</span></h4>
 <p class="MsoNormal"><span lang="ES">Del archivo CSV de resultados (<span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">raytune_paddle_subproc_results_20251207_192320.csv</span>):</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 13.</b> <i>Tabla 7. Estadísticas descriptivas de los 64 trials de Ray Tune.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla13"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 13. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla 7. Estadísticas descriptivas de los 64 trials de Ray Tune.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Estadística</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">CER</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">WER</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Tiempo (s)</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Tiempo/Página (s)</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>count</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">64</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">64</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">64</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">64</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>mean</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">5.25%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">14.28%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">347.61</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">69.42</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>std</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">11.03%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">10.75%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">7.88</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.57</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>min</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.15%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">9.89%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">320.97</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">64.10</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>25%</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.20%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">10.04%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">344.24</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">68.76</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>50%</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.23%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">10.20%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">346.42</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">69.19</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>75%</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">4.03%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">13.20%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">350.14</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">69.93</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>max</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">51.61%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">59.45%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">368.57</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">73.63</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4989,24 +4989,24 @@ Configuración óptima:
 <h4><span lang="ES">Análisis de Correlación</span></h4>
 <p class="MsoNormal"><span lang="ES">Correlación de Pearson entre parámetros y métricas de error (del notebook):</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Correlación con CER:</b></span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 14.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla14"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 14. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Parámetro</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Correlación</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CER</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.000</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">config/text_det_box_thresh</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">0.226</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">config/text_rec_score_thresh</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">-0.161</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>config/text_det_thresh</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>-0.523</b></span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">config/text_det_unclip_ratio</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">NaN</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Correlación con WER:</b></span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 15.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla15"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 15. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Parámetro</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Correlación</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">WER</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.000</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">config/text_det_box_thresh</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">0.227</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">config/text_rec_score_thresh</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">-0.173</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>config/text_det_thresh</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>-0.521</b></span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">config/text_det_unclip_ratio</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">NaN</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Hallazgo clave</b>: El parámetro <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_thresh</span> muestra la correlación más fuerte (-0.52), indicando que valores más altos de este umbral tienden a reducir el error.</span></p>
 <h4><span lang="ES">Impacto del Parámetro textline_orientation</span></h4>
 <p class="MsoNormal"><span lang="ES">Según el análisis del notebook, este parámetro booleano tiene el mayor impacto:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 16.</b> <i>Tabla 8. Impacto del parámetro textline_orientation en las métricas de error.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla16"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 16. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla 8. Impacto del parámetro textline_orientation en las métricas de error.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">textline_orientation</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">CER Medio</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">WER Medio</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">True</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">~3.76%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">~12.73%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">False</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">~12.40%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">~21.71%</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Interpretación</b>: El CER medio es ~3.3x menor con <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">textline_orientation=True</span> (3.76% vs 12.40%). Además, la varianza es mucho menor, lo que indica resultados más consistentes. Para documentos en español con layouts mixtos (tablas, encabezados, direcciones), la clasificación de orientación ayuda a PaddleOCR a ordenar correctamente las líneas de texto.</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES"><b>Figura 6.</b> <i>Impacto de textline_orientation en CER</i></span></p>
+<p class="MsoCaption" style="text-align:center"><a name="_TocFigura6"><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura 6. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Impacto de textline_orientation en CER</span></i></p>
 <p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Impacto de textline_orientation en CER" src="figures/figura_6.png" width="500"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -5018,21 +5018,21 @@ Configuración óptima:
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">CER: 51.61%</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">WER: 59.45%</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Configuración: <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_thresh=0.017</span>, <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">textline_orientation=True</span></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.2.4. Comparación Baseline vs Optimizado</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Comparación Baseline vs Optimizado</span></h3>
 <h4><span lang="ES">Resultados sobre Dataset Completo (24 páginas)</span></h4>
 <p class="MsoNormal"><span lang="ES">Del análisis final del notebook ejecutando sobre las 24 páginas:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 17.</b> <i>Tabla 9. Comparación baseline vs configuración optimizada (24 páginas).</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla17"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 17. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla 9. Comparación baseline vs configuración optimizada (24 páginas).</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Modelo</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">CER</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">WER</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddleOCR (Baseline)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">7.78%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">14.94%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddleOCR-HyperAdjust</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.49%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">7.62%</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h4><span lang="ES">Métricas de Mejora</span></h4>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 18.</b> <i>Tabla 10. Análisis de la mejora obtenida.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla18"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 18. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla 10. Análisis de la mejora obtenida.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Métrica</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Baseline</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Optimizado</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Mejora Absoluta</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Reducción Error</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CER</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">7.78%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.49%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">-6.29 pp</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">80.9%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">WER</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">14.94%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">7.62%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">-7.32 pp</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">49.0%</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h4><span lang="ES">Interpretación (del notebook)</span></h4>
 <p class="MsoNormal" style="margin-left:2cm;margin-right:1cm"><i><span lang="ES">"La optimización de hiperparámetros mejoró la precisión de caracteres de 92.2% a 98.5%, una ganancia de 6.3 puntos porcentuales. Aunque el baseline ya ofrecía resultados aceptables, la configuración optimizada reduce los errores residuales en un 80.9%."</span></i></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES"><b>Figura 7.</b> <i>Comparación Baseline vs Optimizado (24 páginas)</i></span></p>
+<p class="MsoCaption" style="text-align:center"><a name="_TocFigura7"><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura 7. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Comparación Baseline vs Optimizado (24 páginas)</span></i></p>
 <p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Comparación Baseline vs Optimizado (24 páginas)" src="figures/figura_7.png" width="500"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -5040,12 +5040,12 @@ Configuración óptima:
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Baseline: ~778 caracteres con error</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Optimizado: ~149 caracteres con error</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Diferencia: ~629 caracteres menos con errores</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.2.5. Tiempo de Ejecución</span></h3>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 19.</b> <i>Tabla de datos.</i></span></p>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Tiempo de Ejecución</span></h3>
+<p class="MsoCaption"><a name="_TocTabla19"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 19. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Métrica</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Tiempo total del experimento</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">~6 horas (64 trials × ~6 min/trial)</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Tiempo medio por trial</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">367.72 segundos</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Tiempo medio por página</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">69.42 segundos</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Total páginas procesadas</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">64 trials × 5 páginas = 320 evaluaciones</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.2.6. Resumen de la Sección</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Resumen de la Sección</span></h3>
 <p class="MsoNormal"><span lang="ES">Esta sección ha presentado:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Configuración del experimento</b>: 64 trials con Ray Tune + Optuna sobre 7 hiperparámetros</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Resultados estadísticos</b>: CER medio 5.25%, CER mínimo 1.15%</span></p>
@@ -5056,50 +5056,50 @@ Configuración óptima:
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">src/paddle_ocr_fine_tune_unir_raytune.ipynb</span>: Código del experimento</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">src/raytune_paddle_subproc_results_20251207_192320.csv</span>: Resultados de 64 trials</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">src/paddle_ocr_tuning.py</span>: Script de evaluación</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">4.3. Discusión y análisis de resultados</span></h2>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.3.1. Introducción</span></h3>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Discusión y análisis de resultados</span></h2>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Introducción</span></h3>
 <p class="MsoNormal"><span lang="ES">Esta sección presenta un análisis consolidado de los resultados obtenidos en las fases de benchmark comparativo y optimización de hiperparámetros. Se discuten las implicaciones prácticas y se evalúa el cumplimiento de los objetivos planteados.</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.3.2. Resumen de Resultados</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Resumen de Resultados</span></h3>
 <h4><span lang="ES">Resultados del Benchmark Comparativo</span></h4>
 <p class="MsoNormal"><span lang="ES">Del archivo <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">results/ai_ocr_benchmark_finetune_results_20251206_113206.csv</span>, PaddleOCR con configuración inicial (<span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_textline_orientation=True</span>) obtuvo los siguientes resultados en las páginas 5-9:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 20.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla20"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 20. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Página</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">WER</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">CER</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">5</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">12.16%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">6.33%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">6</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">12.81%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">6.40%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">7</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">11.06%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">6.24%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">8</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">8.13%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.54%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">9</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">10.61%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">5.58%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>Promedio</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>10.95%</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>5.22%</b></span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h4><span lang="ES">Resultados de la Optimización con Ray Tune</span></h4>
 <p class="MsoNormal"><span lang="ES">Del archivo <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">src/raytune_paddle_subproc_results_20251207_192320.csv</span> (64 trials):</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 21.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla21"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 21. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Métrica</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CER mínimo</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.15%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CER medio</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">5.25%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CER máximo</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">51.61%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">WER mínimo</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">9.89%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">WER medio</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">14.28%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">WER máximo</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">59.45%</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h4><span lang="ES">Comparación Final (Dataset Completo - 24 páginas)</span></h4>
 <p class="MsoNormal"><span lang="ES">Resultados del notebook <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">src/paddle_ocr_fine_tune_unir_raytune.ipynb</span>:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 22.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla22"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 22. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Modelo</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">CER</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Precisión Caracteres</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">WER</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Precisión Palabras</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddleOCR (Baseline)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">7.78%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">92.22%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">14.94%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">85.06%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddleOCR-HyperAdjust</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">1.49%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">98.51%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">7.62%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">92.38%</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.3.3. Análisis de Resultados</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Análisis de Resultados</span></h3>
 <h4><span lang="ES">Mejora Obtenida</span></h4>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 23.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla23"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 23. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Forma de Medición</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Mejora en precisión de caracteres (absoluta)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">+6.29 puntos porcentuales</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Reducción del CER (relativa)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">80.9%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Mejora en precisión de palabras (absoluta)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">+7.32 puntos porcentuales</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Reducción del WER (relativa)</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">49.0%</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Precisión final de caracteres</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">98.51%</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h4><span lang="ES">Impacto de Hiperparámetros Individuales</span></h4>
 <p class="MsoNormal"><span lang="ES"><b>Parámetro <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">textline_orientation</span></b></span></p>
 <p class="MsoNormal"><span lang="ES">Este parámetro booleano demostró ser el más influyente:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 24.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla24"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 24. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Valor</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">CER Medio</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Impacto</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">True</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">~3.76%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Rendimiento óptimo</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">False</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">~12.40%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">3.3x peor</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Reducción del CER</b>: 69.7% cuando se habilita la clasificación de orientación de línea.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Parámetro <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_thresh</span></b></span></p>
 <p class="MsoNormal"><span lang="ES">Correlación con CER: <b>-0.523</b> (la más fuerte de los parámetros continuos)</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 25.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla25"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 25. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Rango</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Comportamiento</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">&lt; 0.1</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Fallos catastróficos (CER 40-50%)</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">0.3 - 0.6</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Rendimiento óptimo</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Valor óptimo</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">0.4690</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Parámetros con menor impacto</b></span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 26.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla26"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 26. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Parámetro</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Correlación con CER</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Valor óptimo</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">text_det_box_thresh</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">+0.226</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">0.5412</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">text_rec_score_thresh</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">-0.161</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">0.6350</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">use_doc_orientation_classify</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">-</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">False</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">use_doc_unwarping</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">-</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">False</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -5113,7 +5113,7 @@ Configuración óptima:
     "text_det_unclip_ratio": 0.0,
     "text_rec_score_thresh": 0.6350,
 }</pre></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.3.4. Discusión</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Discusión</span></h3>
 <h4><span lang="ES">Hallazgos Principales</span></h4>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Importancia de la clasificación de orientación de línea</b>: El parámetro <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">textline_orientation=True</span> es el factor más determinante. Esto tiene sentido para documentos con layouts mixtos (tablas, encabezados, direcciones) donde el orden correcto de las líneas de texto es crucial.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Umbral de detección crítico</b>: El parámetro <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_thresh</span> presenta un umbral mínimo efectivo (~0.1). Valores inferiores generan demasiados falsos positivos en la detección, corrompiendo el reconocimiento posterior.</span></p>
@@ -5129,11 +5129,11 @@ Configuración óptima:
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Ejecución en CPU</b>: Los tiempos reportados (~69s/página) corresponden a ejecución en CPU. Con GPU, los tiempos serían significativamente menores.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Parámetro fijo</b>: <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_unclip_ratio</span> permaneció fijo en 0.0 durante todo el experimento por decisión de diseño.</span></p>
 <h4><span lang="ES">Comparación con Objetivos</span></h4>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 27.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla27"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 27. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Objetivo</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Meta</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Resultado</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Cumplimiento</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">OE1: Comparar soluciones OCR</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Evaluar EasyOCR, PaddleOCR, DocTR</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddleOCR seleccionado</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">✓</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">OE2: Preparar dataset</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Construir dataset estructurado</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Dataset de 24 páginas</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">✓</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">OE3: Identificar hiperparámetros críticos</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Analizar correlaciones</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">textline_orientation</span> y <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_thresh</span> identificados</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">✓</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">OE4: Optimizar con Ray Tune</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Mínimo 50 configuraciones</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">64 trials ejecutados</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">✓</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">OE5: Validar configuración</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Documentar mejora</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CER 7.78% → 1.49%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">✓</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>Objetivo General</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CER &lt; 2%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CER = 1.49%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">✓</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.3.5. Implicaciones Prácticas</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Implicaciones Prácticas</span></h3>
 <h4><span lang="ES">Recomendaciones de Configuración</span></h4>
 <p class="MsoNormal"><span lang="ES">Para documentos académicos en español similares a los evaluados:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Obligatorio</b>: <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_textline_orientation=True</span></span></p>
@@ -5142,7 +5142,7 @@ Configuración óptima:
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span><b>No recomendado</b>: Habilitar <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_doc_orientation_classify</span> o <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">use_doc_unwarping</span> para documentos digitales</span></p>
 <h4><span lang="ES">Impacto Cuantitativo</span></h4>
 <p class="MsoNormal"><span lang="ES">En un documento típico de 10,000 caracteres:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 28.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla28"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 28. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Configuración</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Errores estimados</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Baseline</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">~778 caracteres</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Optimizada</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">~149 caracteres</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>Reducción</b></span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>629 caracteres menos con errores</b></span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -5151,7 +5151,7 @@ Configuración óptima:
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">No se dispone de recursos GPU para fine-tuning</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">El modelo preentrenado ya tiene soporte para el idioma objetivo</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Se busca mejorar rendimiento sin reentrenar</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">4.3.6. Resumen de la Sección</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Resumen de la Sección</span></h3>
 <p class="MsoNormal"><span lang="ES">Esta sección ha presentado:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Los resultados consolidados del benchmark y la optimización</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>El análisis del impacto de cada hiperparámetro</span></p>
@@ -5166,15 +5166,15 @@ Configuración óptima:
 major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span style="mso-list:Ignore">5.<span style='font:7.0pt "Times New Roman"'>  
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Conclusiones
 y trabajo futuro</span></a></h1><p class="MsoNormal"><span lang="ES">Este capítulo resume las principales conclusiones del trabajo, evalúa el grado de cumplimiento de los objetivos planteados y propone líneas de trabajo futuro que permitirían ampliar y profundizar los resultados obtenidos.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">5.1. Conclusiones</span></h2>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">5.1.1. Conclusiones Generales</span></h3>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Conclusiones</span></h2>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Conclusiones Generales</span></h3>
 <p class="MsoNormal"><span lang="ES">Este Trabajo Fin de Máster ha demostrado que es posible mejorar significativamente el rendimiento de sistemas OCR preentrenados mediante optimización sistemática de hiperparámetros, sin requerir fine-tuning ni recursos GPU dedicados.</span></p>
 <p class="MsoNormal"><span lang="ES">El objetivo principal del trabajo era alcanzar un CER inferior al 2% en documentos académicos en español. Los resultados obtenidos confirman el cumplimiento de este objetivo:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 29.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla29"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 29. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Métrica</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Objetivo</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Resultado</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">CER</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">&lt; 2%</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES"><b>1.49%</b></span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">5.1.2. Conclusiones Específicas</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Conclusiones Específicas</span></h3>
 <p class="MsoNormal"><span lang="ES"><b>Respecto a OE1 (Comparativa de soluciones OCR)</b>:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Se evaluaron tres soluciones OCR de código abierto: EasyOCR, PaddleOCR (PP-OCRv5) y DocTR</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">PaddleOCR demostró el mejor rendimiento base para documentos en español</span></p>
@@ -5195,38 +5195,38 @@ y trabajo futuro</span></a></h1><p class="MsoNormal"><span lang="ES">Este capít
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Se validó la configuración óptima sobre el dataset completo de 24 páginas</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">La mejora obtenida fue del 80.9% en reducción del CER (7.78% → 1.49%)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">La precisión de caracteres alcanzó el 98.51%</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">5.1.3. Hallazgos Clave</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Hallazgos Clave</span></h3>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Arquitectura sobre umbrales</b>: Un único parámetro booleano (<span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">textline_orientation</span>) tiene más impacto que todos los umbrales continuos combinados.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Umbrales mínimos efectivos</b>: Valores de <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_thresh</span> &lt; 0.1 causan fallos catastróficos (CER &gt;40%).</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Simplicidad para documentos digitales</b>: Para documentos PDF digitales (no escaneados), los módulos de corrección de orientación y deformación son innecesarios.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Optimización sin fine-tuning</b>: Se puede mejorar significativamente el rendimiento de modelos preentrenados mediante ajuste de hiperparámetros de inferencia.</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">5.1.4. Contribuciones del Trabajo</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Contribuciones del Trabajo</span></h3>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Metodología reproducible</b>: Se documenta un proceso completo de optimización de hiperparámetros OCR con Ray Tune + Optuna.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Análisis de hiperparámetros de PaddleOCR</b>: Se cuantifica el impacto de cada parámetro configurable mediante correlaciones y análisis comparativo.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Configuración óptima para español</b>: Se proporciona una configuración validada para documentos académicos en español.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Código fuente</b>: Todo el código está disponible en el repositorio GitHub para reproducción y extensión.</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">5.1.5. Limitaciones del Trabajo</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Limitaciones del Trabajo</span></h3>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Tipo de documento único</b>: Los experimentos se realizaron únicamente sobre documentos académicos de UNIR. La generalización a otros tipos de documentos requiere validación adicional.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Tamaño del dataset</b>: 24 páginas es un corpus limitado para conclusiones estadísticamente robustas.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Ground truth automático</b>: La extracción automática del texto de referencia puede introducir errores en layouts complejos.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Ejecución en CPU</b>: Los tiempos de procesamiento (~69s/página) limitan la aplicabilidad en escenarios de alto volumen.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Parámetro no explorado</b>: <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_unclip_ratio</span> permaneció fijo en 0.0 durante todo el experimento.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">5.2. Líneas de trabajo futuro</span></h2>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">5.2.1. Extensiones Inmediatas</span></h3>
+<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Líneas de trabajo futuro</span></h2>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Extensiones Inmediatas</span></h3>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Validación cruzada</b>: Evaluar la configuración óptima en otros tipos de documentos en español (facturas, formularios, textos manuscritos).</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Exploración de <span style="font-family:Consolas;font-size:10pt;background:#f5f5f5">text_det_unclip_ratio</span></b>: Incluir este parámetro en el espacio de búsqueda.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Dataset ampliado</b>: Construir un corpus más amplio y diverso de documentos en español.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Evaluación con GPU</b>: Medir tiempos de inferencia con aceleración GPU.</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">5.2.2. Líneas de Investigación</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Líneas de Investigación</span></h3>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Transfer learning de hiperparámetros</b>: Investigar si las configuraciones óptimas para un tipo de documento transfieren a otros dominios.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Optimización multi-objetivo</b>: Considerar simultáneamente CER, WER y tiempo de inferencia como objetivos.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>AutoML para OCR</b>: Aplicar técnicas de AutoML más avanzadas (Neural Architecture Search, meta-learning).</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Comparación con fine-tuning</b>: Cuantificar la brecha de rendimiento entre optimización de hiperparámetros y fine-tuning real.</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">5.2.3. Aplicaciones Prácticas</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Aplicaciones Prácticas</span></h3>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Herramienta de configuración automática</b>: Desarrollar una herramienta que determine automáticamente la configuración óptima para un nuevo tipo de documento.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Integración en pipelines de producción</b>: Implementar la configuración optimizada en sistemas reales de procesamiento documental.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Benchmark público</b>: Publicar un benchmark de OCR para documentos en español que facilite la comparación de soluciones.</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">5.2.4. Reflexión Final</span></h3>
+<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Reflexión Final</span></h3>
 <p class="MsoNormal"><span lang="ES">Este trabajo demuestra que, en un contexto de recursos limitados donde el fine-tuning de modelos de deep learning no es viable, la optimización de hiperparámetros representa una alternativa práctica y efectiva para mejorar sistemas OCR.</span></p>
 <p class="MsoNormal"><span lang="ES">La metodología propuesta es reproducible, los resultados son cuantificables, y las conclusiones son aplicables a escenarios reales de procesamiento documental. La reducción del CER del 7.78% al 1.49% representa una mejora sustancial que puede tener impacto directo en aplicaciones downstream como extracción de información, análisis semántico y búsqueda de documentos.</span></p>
 <p class="MsoNormal"><span lang="ES">El código fuente y los datos experimentales están disponibles públicamente para facilitar la reproducción y extensión de este trabajo.</span></p><p class="Ttulo1sinnumerar"><a name="_Toc160619821"><span lang="ES">Referencias
@@ -5278,7 +5278,7 @@ major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin
 └── README.md</pre></span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">A.3 Requisitos de Software</span></h2>
 <p class="MsoNormal"><span lang="ES">Para reproducir los experimentos se requieren las siguientes dependencias:</span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES"><b>Tabla 30.</b> <i>Tabla de datos.</i></span></p>
+<p class="MsoCaption"><a name="_TocTabla30"><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla 30. </span></a><i><span lang="ES" style="font-size:12.0pt;line-height:150%;font-weight:normal">Tabla de datos.</span></i></p>
 <table border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt"><tr><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Componente</span></b></p></td><td style="border:solid windowtext 1.0pt;padding:5px;background:#F0F0F0"><p class="MsoNormal" style="margin:0"><b><span lang="ES">Versión</span></b></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Python</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">3.11.9</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddlePaddle</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">3.2.2</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PaddleOCR</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">3.3.2</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Ray</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">2.52.1</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">Optuna</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">4.6.0</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">jiwer</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">(última versión)</span></p></td></tr><tr><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">PyMuPDF</span></p></td><td style="border:solid windowtext 1.0pt;padding:5px"><p class="MsoNormal" style="margin:0"><span lang="ES">(última versión)</span></p></td></tr></table>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>

Criterio	Cumplimiento
Específico (S)	Se define claramente qué se quiere lograr: optimizar PaddleOCR mediante ajuste de hiperparámetros para documentos en español
Medible (M)	Se establece una métrica cuantificable: CER < 2%
Alcanzable (A)	Es viable dado que: (1) PaddleOCR permite configuración de hiperparámetros, (2) Ray Tune posibilita búsqueda automatizada, (3) No se requiere GPU
Relevante (R)	El impacto es demostrable: mejora la extracción de texto en documentos académicos sin costes adicionales de infraestructura
Temporal (T)	El plazo es un cuatrimestre, correspondiente al TFM
Modelo	Versión	Configuración
EasyOCR	-	Idiomas: ['es', 'en']
PaddleOCR	PP-OCRv5	Modelos server_det + server_rec
DocTR	-	db_resnet50 + sar_resnet31
Parámetro	Tipo	Rango/Valores	Descripción
use_doc_orientation_classify	Booleano	[True, False]	Clasificación de orientación del documento
use_doc_unwarping	Booleano	[True, False]	Corrección de deformación del documento
textline_orientation	Booleano	[True, False]	Clasificación de orientación de línea de texto
text_det_thresh	Continuo	[0.0, 0.7]	Umbral de detección de píxeles de texto
text_det_box_thresh	Continuo	[0.0, 0.7]	Umbral de caja de detección
text_det_unclip_ratio	Fijo	0.0	Coeficiente de expansión (fijado)
text_rec_score_thresh	Continuo	[0.0, 0.7]	Umbral de confianza de reconocimiento
Componente	Especificación
CPU	Intel Core (especificar modelo)
RAM	16 GB
GPU	No disponible (ejecución en CPU)
Almacenamiento	SSD
Componente	Versión
Sistema Operativo	Windows 10/11
Python	3.11.9
PaddleOCR	3.3.2
PaddlePaddle	3.2.2
Ray	2.52.1
Optuna	4.6.0
Característica	Valor
Número de páginas evaluadas	5 (páginas 1-5 en benchmark inicial)
Formato	PDF digital (no escaneado)
Idioma	Español
Resolución de conversión	300 DPI
Página	WER	CER
5	12.16%	6.33%
6	12.81%	6.40%
7	11.06%	6.24%
8	8.13%	1.54%
9	10.61%	5.58%
Modelo	Tipo	Componentes	Fortalezas Clave
EasyOCR	End-to-end (det + rec)	DB + CRNN/Transformer	Ligero, fácil de usar, multilingüe
PaddleOCR (PP-OCR)	End-to-end (det + rec + cls)	DB + SRN/CRNN	Soporte multilingüe robusto, pipeline configurable
DocTR	End-to-end (det + rec)	DB/LinkNet + CRNN/SAR/VitSTR	Orientado a investigación, API limpia
Componente	Versión/Especificación
Python	3.11.9
PaddlePaddle	3.2.2
PaddleOCR	3.3.2
Ray	2.52.1
GPU	No disponible (CPU only)
Estadística	CER	WER	Tiempo (s)	Tiempo/Página (s)
count	64	64	64	64
mean	5.25%	14.28%	347.61	69.42
std	11.03%	10.75%	7.88	1.57
min	1.15%	9.89%	320.97	64.10
25%	1.20%	10.04%	344.24	68.76
50%	1.23%	10.20%	346.42	69.19
75%	4.03%	13.20%	350.14	69.93
max	51.61%	59.45%	368.57	73.63