docs/03_objetivos_metodologia.md

# Objetivos concretos y metodología de trabajo

Este capítulo establece los objetivos del trabajo siguiendo la metodología SMART (Doran, 1981) y describe la metodología experimental empleada para alcanzarlos. Se define un objetivo general y cinco objetivos específicos, todos ellos medibles y verificables.

## Objetivo general

> **Optimizar el rendimiento de PaddleOCR para documentos académicos en español mediante ajuste de hiperparámetros, alcanzando un CER inferior al 2% sin requerir fine-tuning del modelo ni recursos GPU dedicados.**

### Justificación SMART del Objetivo General

**Tabla 4.** *Justificación SMART del objetivo general.*

| Criterio | Cumplimiento |
|----------|--------------|
| **Específico (S)** | Se define claramente qué se quiere lograr: optimizar PaddleOCR mediante ajuste de hiperparámetros para documentos en español |
| **Medible (M)** | Se establece una métrica cuantificable: CER < 2% |
| **Alcanzable (A)** | Es viable dado que: (1) PaddleOCR permite configuración de hiperparámetros, (2) Ray Tune posibilita búsqueda automatizada, (3) No se requiere GPU |
| **Relevante (R)** | El impacto es demostrable: mejora la extracción de texto en documentos académicos sin costes adicionales de infraestructura |
| **Temporal (T)** | El plazo es un cuatrimestre, correspondiente al TFM |

*Fuente: Elaboración propia.*

## Objetivos específicos

### OE1: Comparar soluciones OCR de código abierto
> **Evaluar el rendimiento base de EasyOCR, PaddleOCR y DocTR en documentos académicos en español, utilizando CER y WER como métricas, para seleccionar el modelo más prometedor.**

### OE2: Preparar un dataset de evaluación
> **Construir un dataset estructurado de imágenes de documentos académicos en español con su texto de referencia (ground truth) extraído del PDF original.**

### OE3: Identificar hiperparámetros críticos
> **Analizar la correlación entre los hiperparámetros de PaddleOCR y las métricas de error para identificar los parámetros con mayor impacto en el rendimiento.**

### OE4: Optimizar hiperparámetros con Ray Tune
> **Ejecutar una búsqueda automatizada de hiperparámetros utilizando Ray Tune con Optuna, evaluando al menos 50 configuraciones diferentes.**

### OE5: Validar la configuración optimizada
> **Comparar el rendimiento de la configuración baseline versus la configuración optimizada sobre el dataset completo, documentando la mejora obtenida.**

## Metodología del trabajo

### Visión General


```mermaid
---
title: "Fases de la metodología experimental"
---
flowchart LR
    A["Fase 1<br/>Dataset"] --> B["Fase 2<br/>Benchmark"] --> C["Fase 3<br/>Espacio"] --> D["Fase 4<br/>Optimización"] --> E["Fase 5<br/>Validación"]
```

**Descripción de las fases:**

- **Fase 1 - Preparación del Dataset**: Conversión PDF a imágenes (300 DPI), extracción de ground truth con PyMuPDF
- **Fase 2 - Benchmark Comparativo**: Evaluación de EasyOCR, PaddleOCR, DocTR con métricas CER/WER
- **Fase 3 - Espacio de Búsqueda**: Identificación de hiperparámetros y configuración de Ray Tune + Optuna
- **Fase 4 - Optimización**: Ejecución de 64 trials con paralelización (2 concurrentes)
- **Fase 5 - Validación**: Comparación baseline vs optimizado, análisis de correlaciones

### Fase 1: Preparación del Dataset

#### Fuente de Datos
Se utilizaron documentos PDF académicos de UNIR (Universidad Internacional de La Rioja), específicamente las instrucciones para la elaboración del TFE del Máster en Inteligencia Artificial.

#### Proceso de Conversión
El script `prepare_dataset.ipynb` implementa:

1. **Conversión PDF a imágenes**:
   - Biblioteca: PyMuPDF (fitz)
   - Resolución: 300 DPI
   - Formato de salida: PNG

2. **Extracción de texto de referencia**:
   - Método: `page.get_text("dict")` de PyMuPDF
   - Preservación de estructura de líneas
   - Tratamiento de texto vertical/marginal
   - Normalización de espacios y saltos de línea

#### Estructura del Dataset

```mermaid
---
title: "Estructura del dataset de evaluación"
---
flowchart LR
    dataset["dataset/"] --> d0["0/"]

    d0 --> pdf["instrucciones.pdf"]

    d0 --> img["img/"]
    img --> img1["page_0001.png"]
    img --> img2["page_0002.png"]
    img --> imgN["..."]

    d0 --> txt["txt/"]
    txt --> txt1["page_0001.txt"]
    txt --> txt2["page_0002.txt"]
    txt --> txtN["..."]

    dataset --> dots["..."]
```

#### Clase ImageTextDataset

Se implementó una clase Python para cargar pares imagen-texto que retorna tuplas (PIL.Image, str) desde carpetas pareadas. La implementación completa está disponible en `src/ocr_benchmark_notebook.ipynb` (ver Anexo A).

### Fase 2: Benchmark Comparativo

#### Modelos Evaluados

**Tabla 5.** *Modelos OCR evaluados en el benchmark inicial.*

| Modelo | Versión | Configuración |
|--------|---------|---------------|
| EasyOCR | - | Idiomas: ['es', 'en'] |
| PaddleOCR | PP-OCRv5 | Modelos server_det + server_rec |
| DocTR | - | db_resnet50 + sar_resnet31 |

*Fuente: Elaboración propia.*

#### Métricas de Evaluación

Se utilizó la biblioteca `jiwer` para calcular CER y WER comparando el texto de referencia con la predicción del modelo OCR. La implementación está disponible en `src/ocr_benchmark_notebook.ipynb` (ver Anexo A).

### Fase 3: Espacio de Búsqueda

#### Hiperparámetros Seleccionados

**Tabla 6.** *Hiperparámetros seleccionados para optimización.*

| Parámetro | Tipo | Rango/Valores | Descripción |
|-----------|------|---------------|-------------|
| `use_doc_orientation_classify` | Booleano | [True, False] | Clasificación de orientación del documento |
| `use_doc_unwarping` | Booleano | [True, False] | Corrección de deformación del documento |
| `textline_orientation` | Booleano | [True, False] | Clasificación de orientación de línea de texto |
| `text_det_thresh` | Continuo | [0.0, 0.7] | Umbral de detección de píxeles de texto |
| `text_det_box_thresh` | Continuo | [0.0, 0.7] | Umbral de caja de detección |
| `text_det_unclip_ratio` | Fijo | 0.0 | Coeficiente de expansión (fijado) |
| `text_rec_score_thresh` | Continuo | [0.0, 0.7] | Umbral de confianza de reconocimiento |

*Fuente: Elaboración propia.*

#### Configuración de Ray Tune

El espacio de búsqueda se definió utilizando `tune.choice()` para parámetros booleanos y `tune.uniform()` para parámetros continuos, con OptunaSearch como algoritmo de optimización configurado para minimizar CER en 64 trials. La implementación completa está disponible en `src/raytune/raytune_ocr.py` (ver Anexo A).

### Fase 4: Ejecución de Optimización

#### Arquitectura de Ejecución

Se implementó una arquitectura basada en contenedores Docker para aislar los servicios OCR y facilitar la reproducibilidad:

```mermaid
---
title: "Arquitectura de ejecución con Docker Compose"
---
flowchart LR
    subgraph Docker["Docker Compose"]
        A["RayTune Container"]
        B["OCR Service Container"]
    end

    A -->|"HTTP POST /evaluate"| B
    B -->|"JSON {CER, WER, TIME}"| A
    A -.->|"Health check /health"| B
```

#### Ejecución con Docker Compose

Los servicios se orquestan mediante Docker Compose (`src/docker-compose.tuning.*.yml`):

```bash
# Iniciar servicio OCR
docker compose -f docker-compose.tuning.doctr.yml up -d doctr-gpu

# Ejecutar optimización (64 trials)
docker compose -f docker-compose.tuning.doctr.yml run raytune --service doctr --samples 64

# Detener servicios
docker compose -f docker-compose.tuning.doctr.yml down
```

El servicio OCR expone una API REST que retorna métricas en formato JSON:

```json
{
    "CER": 0.0125,
    "WER": 0.1040,
    "TIME": 331.09,
    "PAGES": 5,
    "TIME_PER_PAGE": 66.12
}
```

### Fase 5: Validación

#### Protocolo de Validación

1. **Baseline**: Ejecución con configuración por defecto de PaddleOCR
2. **Optimizado**: Ejecución con mejor configuración encontrada
3. **Comparación**: Evaluación sobre las 24 páginas del dataset completo
4. **Métricas reportadas**: CER, WER, tiempo de procesamiento

### Entorno de Ejecución

#### Hardware

**Tabla 7.** *Especificaciones de hardware del entorno de desarrollo.*

| Componente | Especificación |
|------------|----------------|
| CPU | AMD Ryzen 7 5800H |
| RAM | 16 GB DDR4 |
| GPU | NVIDIA RTX 3060 Laptop (5.66 GB VRAM) |
| Almacenamiento | SSD |

*Fuente: Elaboración propia.*

#### Software

**Tabla 8.** *Versiones de software utilizadas.*

| Componente | Versión |
|------------|---------|
| Sistema Operativo | Ubuntu 24.04.3 LTS |
| Python | 3.12.3 |
| PaddleOCR | 3.3.2 |
| PaddlePaddle | 3.2.2 |
| Ray | 2.52.1 |
| Optuna | 4.7.0 |

*Fuente: Elaboración propia.*

### Limitaciones Metodológicas

1. **Tamaño del dataset**: El dataset contiene 24 páginas de un único tipo de documento. Resultados pueden no generalizar a otros formatos.

2. **Ejecución en CPU**: Los tiempos de procesamiento (~70s/página) serían significativamente menores con GPU.

3. **Ground truth imperfecto**: El texto de referencia extraído de PDF puede contener errores en documentos con layouts complejos.

4. **Parámetro fijo**: `text_det_unclip_ratio` quedó fijado en 0.0 durante todo el experimento por decisión de diseño inicial.

## Resumen del capítulo

Este capítulo ha establecido:

1. Un objetivo general SMART: alcanzar CER < 2% mediante optimización de hiperparámetros
2. Cinco objetivos específicos medibles y alcanzables
3. Una metodología experimental en cinco fases claramente definidas
4. El espacio de búsqueda de hiperparámetros y la configuración de Ray Tune
5. Las limitaciones reconocidas del enfoque

El siguiente capítulo presenta el desarrollo específico de la contribución, incluyendo el benchmark comparativo de soluciones OCR, la optimización de hiperparámetros y el análisis de resultados.
autogen test 2025-12-16 00:07:00 +01:00			`# Objetivos concretos y metodología de trabajo`
Markdown chapters. 2025-12-10 16:06:47 +01:00
Make template readable 2025-12-15 23:03:36 +01:00			`Este capítulo establece los objetivos del trabajo siguiendo la metodología SMART (Doran, 1981) y describe la metodología experimental empleada para alcanzarlos. Se define un objetivo general y cinco objetivos específicos, todos ellos medibles y verificables.`
Markdown chapters. 2025-12-10 16:06:47 +01:00
autogen test 2025-12-16 00:07:00 +01:00			`## Objetivo general`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			`> Optimizar el rendimiento de PaddleOCR para documentos académicos en español mediante ajuste de hiperparámetros, alcanzando un CER inferior al 2% sin requerir fine-tuning del modelo ni recursos GPU dedicados.`

			`### Justificación SMART del Objetivo General`

raytune as docker 2026-01-19 16:32:45 +01:00			`Tabla 4. Justificación SMART del objetivo general.`

Markdown chapters. 2025-12-10 16:06:47 +01:00			`\| Criterio \| Cumplimiento \|`
			`\|----------\|--------------\|`
			`\| Específico (S) \| Se define claramente qué se quiere lograr: optimizar PaddleOCR mediante ajuste de hiperparámetros para documentos en español \|`
			`\| Medible (M) \| Se establece una métrica cuantificable: CER < 2% \|`
			`\| Alcanzable (A) \| Es viable dado que: (1) PaddleOCR permite configuración de hiperparámetros, (2) Ray Tune posibilita búsqueda automatizada, (3) No se requiere GPU \|`
			`\| Relevante (R) \| El impacto es demostrable: mejora la extracción de texto en documentos académicos sin costes adicionales de infraestructura \|`
			`\| Temporal (T) \| El plazo es un cuatrimestre, correspondiente al TFM \|`

raytune as docker 2026-01-19 16:32:45 +01:00			`Fuente: Elaboración propia.`

autogen test 2025-12-16 00:07:00 +01:00			`## Objetivos específicos`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			`### OE1: Comparar soluciones OCR de código abierto`
			`> Evaluar el rendimiento base de EasyOCR, PaddleOCR y DocTR en documentos académicos en español, utilizando CER y WER como métricas, para seleccionar el modelo más prometedor.`

			`### OE2: Preparar un dataset de evaluación`
			`> Construir un dataset estructurado de imágenes de documentos académicos en español con su texto de referencia (ground truth) extraído del PDF original.`

			`### OE3: Identificar hiperparámetros críticos`
			`> Analizar la correlación entre los hiperparámetros de PaddleOCR y las métricas de error para identificar los parámetros con mayor impacto en el rendimiento.`

			`### OE4: Optimizar hiperparámetros con Ray Tune`
			`> Ejecutar una búsqueda automatizada de hiperparámetros utilizando Ray Tune con Optuna, evaluando al menos 50 configuraciones diferentes.`

			`### OE5: Validar la configuración optimizada`
			`> Comparar el rendimiento de la configuración baseline versus la configuración optimizada sobre el dataset completo, documentando la mejora obtenida.`

autogen test 2025-12-16 00:07:00 +01:00			`## Metodología del trabajo`
Make template readable 2025-12-15 23:03:36 +01:00
autogen test 2025-12-16 00:07:00 +01:00			`### Visión General`
Make template readable 2025-12-15 23:03:36 +01:00


			```mermaid
Update generation 2025-12-16 00:31:27 +01:00			`---`
			`title: "Fases de la metodología experimental"`
			`---`
Generation test 2025-12-16 00:14:23 +01:00			`flowchart LR`
			`A["Fase 1<br/>Dataset"] --> B["Fase 2<br/>Benchmark"] --> C["Fase 3<br/>Espacio"] --> D["Fase 4<br/>Optimización"] --> E["Fase 5<br/>Validación"]`
			```
Make template readable 2025-12-15 23:03:36 +01:00
Generation test 2025-12-16 00:14:23 +01:00			`Descripción de las fases:`
Markdown chapters. 2025-12-10 16:06:47 +01:00
Generation test 2025-12-16 00:14:23 +01:00			`- Fase 1 - Preparación del Dataset: Conversión PDF a imágenes (300 DPI), extracción de ground truth con PyMuPDF`
			`- Fase 2 - Benchmark Comparativo: Evaluación de EasyOCR, PaddleOCR, DocTR con métricas CER/WER`
			`- Fase 3 - Espacio de Búsqueda: Identificación de hiperparámetros y configuración de Ray Tune + Optuna`
			`- Fase 4 - Optimización: Ejecución de 64 trials con paralelización (2 concurrentes)`
			`- Fase 5 - Validación: Comparación baseline vs optimizado, análisis de correlaciones`
Markdown chapters. 2025-12-10 16:06:47 +01:00
autogen test 2025-12-16 00:07:00 +01:00			`### Fase 1: Preparación del Dataset`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			`#### Fuente de Datos`
			`Se utilizaron documentos PDF académicos de UNIR (Universidad Internacional de La Rioja), específicamente las instrucciones para la elaboración del TFE del Máster en Inteligencia Artificial.`

			`#### Proceso de Conversión`
			El script `prepare_dataset.ipynb` implementa:

			`1. Conversión PDF a imágenes:`
			`- Biblioteca: PyMuPDF (fitz)`
			`- Resolución: 300 DPI`
			`- Formato de salida: PNG`

			`2. Extracción de texto de referencia:`
			- Método: `page.get_text("dict")` de PyMuPDF
			`- Preservación de estructura de líneas`
			`- Tratamiento de texto vertical/marginal`
			`- Normalización de espacios y saltos de línea`

			`#### Estructura del Dataset`

Make template readable 2025-12-15 23:03:36 +01:00			```mermaid
Update generation 2025-12-16 00:31:27 +01:00			`---`
			`title: "Estructura del dataset de evaluación"`
			`---`
Make template readable 2025-12-15 23:03:36 +01:00			`flowchart LR`
			`dataset["dataset/"] --> d0["0/"]`

			`d0 --> pdf["instrucciones.pdf"]`

			`d0 --> img["img/"]`
			`img --> img1["page_0001.png"]`
			`img --> img2["page_0002.png"]`
			`img --> imgN["..."]`

			`d0 --> txt["txt/"]`
			`txt --> txt1["page_0001.txt"]`
			`txt --> txt2["page_0002.txt"]`
			`txt --> txtN["..."]`

			`dataset --> dots["..."]`
Markdown chapters. 2025-12-10 16:06:47 +01:00			```

			`#### Clase ImageTextDataset`

regen docs 2026-01-19 17:38:43 +01:00			Se implementó una clase Python para cargar pares imagen-texto que retorna tuplas (PIL.Image, str) desde carpetas pareadas. La implementación completa está disponible en `src/ocr_benchmark_notebook.ipynb` (ver Anexo A).
Markdown chapters. 2025-12-10 16:06:47 +01:00
autogen test 2025-12-16 00:07:00 +01:00			`### Fase 2: Benchmark Comparativo`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			`#### Modelos Evaluados`

raytune as docker 2026-01-19 16:32:45 +01:00			`Tabla 5. Modelos OCR evaluados en el benchmark inicial.`

Markdown chapters. 2025-12-10 16:06:47 +01:00			`\| Modelo \| Versión \| Configuración \|`
			`\|--------\|---------\|---------------\|`
			`\| EasyOCR \| - \| Idiomas: ['es', 'en'] \|`
			`\| PaddleOCR \| PP-OCRv5 \| Modelos server_det + server_rec \|`
			`\| DocTR \| - \| db_resnet50 + sar_resnet31 \|`

raytune as docker 2026-01-19 16:32:45 +01:00			`Fuente: Elaboración propia.`

Markdown chapters. 2025-12-10 16:06:47 +01:00			`#### Métricas de Evaluación`

regen docs 2026-01-19 17:38:43 +01:00			Se utilizó la biblioteca `jiwer` para calcular CER y WER comparando el texto de referencia con la predicción del modelo OCR. La implementación está disponible en `src/ocr_benchmark_notebook.ipynb` (ver Anexo A).
Markdown chapters. 2025-12-10 16:06:47 +01:00
autogen test 2025-12-16 00:07:00 +01:00			`### Fase 3: Espacio de Búsqueda`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			`#### Hiperparámetros Seleccionados`

raytune as docker 2026-01-19 16:32:45 +01:00			`Tabla 6. Hiperparámetros seleccionados para optimización.`

Markdown chapters. 2025-12-10 16:06:47 +01:00			`\| Parámetro \| Tipo \| Rango/Valores \| Descripción \|`
			`\|-----------\|------\|---------------\|-------------\|`
			\| `use_doc_orientation_classify` \| Booleano \| [True, False] \| Clasificación de orientación del documento \|
			\| `use_doc_unwarping` \| Booleano \| [True, False] \| Corrección de deformación del documento \|
			\| `textline_orientation` \| Booleano \| [True, False] \| Clasificación de orientación de línea de texto \|
			\| `text_det_thresh` \| Continuo \| [0.0, 0.7] \| Umbral de detección de píxeles de texto \|
			\| `text_det_box_thresh` \| Continuo \| [0.0, 0.7] \| Umbral de caja de detección \|
			\| `text_det_unclip_ratio` \| Fijo \| 0.0 \| Coeficiente de expansión (fijado) \|
			\| `text_rec_score_thresh` \| Continuo \| [0.0, 0.7] \| Umbral de confianza de reconocimiento \|

raytune as docker 2026-01-19 16:32:45 +01:00			`Fuente: Elaboración propia.`

Markdown chapters. 2025-12-10 16:06:47 +01:00			`#### Configuración de Ray Tune`

regen docs 2026-01-19 17:38:43 +01:00			El espacio de búsqueda se definió utilizando `tune.choice()` para parámetros booleanos y `tune.uniform()` para parámetros continuos, con OptunaSearch como algoritmo de optimización configurado para minimizar CER en 64 trials. La implementación completa está disponible en `src/raytune/raytune_ocr.py` (ver Anexo A).
Markdown chapters. 2025-12-10 16:06:47 +01:00
autogen test 2025-12-16 00:07:00 +01:00			`### Fase 4: Ejecución de Optimización`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			`#### Arquitectura de Ejecución`

regen docs 2026-01-19 17:38:43 +01:00			`Se implementó una arquitectura basada en contenedores Docker para aislar los servicios OCR y facilitar la reproducibilidad:`
Markdown chapters. 2025-12-10 16:06:47 +01:00
Make template readable 2025-12-15 23:03:36 +01:00			```mermaid
Update generation 2025-12-16 00:31:27 +01:00			`---`
regen docs 2026-01-19 17:38:43 +01:00			`title: "Arquitectura de ejecución con Docker Compose"`
Update generation 2025-12-16 00:31:27 +01:00			`---`
Make template readable 2025-12-15 23:03:36 +01:00			`flowchart LR`
regen docs 2026-01-19 17:38:43 +01:00			`subgraph Docker["Docker Compose"]`
			`A["RayTune Container"]`
			`B["OCR Service Container"]`
			`end`

			`A -->\|"HTTP POST /evaluate"\| B`
			`B -->\|"JSON {CER, WER, TIME}"\| A`
			`A -.->\|"Health check /health"\| B`
Markdown chapters. 2025-12-10 16:06:47 +01:00			```

regen docs 2026-01-19 17:38:43 +01:00			`#### Ejecución con Docker Compose`
Markdown chapters. 2025-12-10 16:06:47 +01:00
regen docs 2026-01-19 17:38:43 +01:00			Los servicios se orquestan mediante Docker Compose (`src/docker-compose.tuning.*.yml`):
Markdown chapters. 2025-12-10 16:06:47 +01:00
			```bash
regen docs 2026-01-19 17:38:43 +01:00			`# Iniciar servicio OCR`
			`docker compose -f docker-compose.tuning.doctr.yml up -d doctr-gpu`

			`# Ejecutar optimización (64 trials)`
			`docker compose -f docker-compose.tuning.doctr.yml run raytune --service doctr --samples 64`

			`# Detener servicios`
			`docker compose -f docker-compose.tuning.doctr.yml down`
Markdown chapters. 2025-12-10 16:06:47 +01:00			```

regen docs 2026-01-19 17:38:43 +01:00			`El servicio OCR expone una API REST que retorna métricas en formato JSON:`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			```json
			`{`
			`"CER": 0.0125,`
			`"WER": 0.1040,`
			`"TIME": 331.09,`
			`"PAGES": 5,`
			`"TIME_PER_PAGE": 66.12`
			`}`
			```

autogen test 2025-12-16 00:07:00 +01:00			`### Fase 5: Validación`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			`#### Protocolo de Validación`

			`1. Baseline: Ejecución con configuración por defecto de PaddleOCR`
			`2. Optimizado: Ejecución con mejor configuración encontrada`
			`3. Comparación: Evaluación sobre las 24 páginas del dataset completo`
			`4. Métricas reportadas: CER, WER, tiempo de procesamiento`

autogen test 2025-12-16 00:07:00 +01:00			`### Entorno de Ejecución`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			`#### Hardware`

raytune as docker 2026-01-19 16:32:45 +01:00			`Tabla 7. Especificaciones de hardware del entorno de desarrollo.`

Markdown chapters. 2025-12-10 16:06:47 +01:00			`\| Componente \| Especificación \|`
			`\|------------\|----------------\|`
raytune as docker 2026-01-19 16:32:45 +01:00			`\| CPU \| AMD Ryzen 7 5800H \|`
			`\| RAM \| 16 GB DDR4 \|`
			`\| GPU \| NVIDIA RTX 3060 Laptop (5.66 GB VRAM) \|`
Markdown chapters. 2025-12-10 16:06:47 +01:00			`\| Almacenamiento \| SSD \|`

raytune as docker 2026-01-19 16:32:45 +01:00			`Fuente: Elaboración propia.`

Markdown chapters. 2025-12-10 16:06:47 +01:00			`#### Software`

raytune as docker 2026-01-19 16:32:45 +01:00			`Tabla 8. Versiones de software utilizadas.`

Markdown chapters. 2025-12-10 16:06:47 +01:00			`\| Componente \| Versión \|`
			`\|------------\|---------\|`
raytune as docker 2026-01-19 16:32:45 +01:00			`\| Sistema Operativo \| Ubuntu 24.04.3 LTS \|`
			`\| Python \| 3.12.3 \|`
Markdown chapters. 2025-12-10 16:06:47 +01:00			`\| PaddleOCR \| 3.3.2 \|`
			`\| PaddlePaddle \| 3.2.2 \|`
			`\| Ray \| 2.52.1 \|`
raytune as docker 2026-01-19 16:32:45 +01:00			`\| Optuna \| 4.7.0 \|`

			`Fuente: Elaboración propia.`
Markdown chapters. 2025-12-10 16:06:47 +01:00
autogen test 2025-12-16 00:07:00 +01:00			`### Limitaciones Metodológicas`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			`1. Tamaño del dataset: El dataset contiene 24 páginas de un único tipo de documento. Resultados pueden no generalizar a otros formatos.`

			`2. Ejecución en CPU: Los tiempos de procesamiento (~70s/página) serían significativamente menores con GPU.`

			`3. Ground truth imperfecto: El texto de referencia extraído de PDF puede contener errores en documentos con layouts complejos.`

			4. Parámetro fijo: `text_det_unclip_ratio` quedó fijado en 0.0 durante todo el experimento por decisión de diseño inicial.

autogen test 2025-12-16 00:07:00 +01:00			`## Resumen del capítulo`
Markdown chapters. 2025-12-10 16:06:47 +01:00
			`Este capítulo ha establecido:`

			`1. Un objetivo general SMART: alcanzar CER < 2% mediante optimización de hiperparámetros`
			`2. Cinco objetivos específicos medibles y alcanzables`
			`3. Una metodología experimental en cinco fases claramente definidas`
			`4. El espacio de búsqueda de hiperparámetros y la configuración de Ray Tune`
			`5. Las limitaciones reconocidas del enfoque`

Add references to each chapter 2025-12-10 22:34:33 +01:00			`El siguiente capítulo presenta el desarrollo específico de la contribución, incluyendo el benchmark comparativo de soluciones OCR, la optimización de hiperparámetros y el análisis de resultados.`