diff --git a/.claude/commands/documentation-review.md b/.claude/commands/documentation-review.md
index 0a3910a..d9b7976 100644
--- a/.claude/commands/documentation-review.md
+++ b/.claude/commands/documentation-review.md
@@ -1,97 +1,137 @@
-Review and validate the documentation for this Master's Thesis project.
-
-## Instructions
-
-1. **Read metrics source files first** to get the correct values:
-   - `docs/metrics/metrics_paddle.md` - PaddleOCR results
-   - `docs/metrics/metrics_doctr.md` - DocTR results
-   - `docs/metrics/metrics_easyocr.md` - EasyOCR results
-   - `docs/metrics/metrics.md` - Comparative summary
-   - `src/results/*.csv` - Raw data from 64 trials per service
-
-2. **Review UNIR guidelines** for formatting and structure rules:
-   - **`instructions/plantilla_individual.htm`** - **PRIMARY REFERENCE** for all styling (CSS classes, Word styles)
-   - **`instructions/plantilla_individual_files/`** - Support files with additional style definitions
-   - `instructions/instrucciones.pdf` - TFE writing instructions
-   - `instructions/plantilla_individual.pdf` - Official template preview
-
-   **IMPORTANT:** When styling elements (tables, figures, notes, quotes), ALWAYS check `plantilla_individual.htm` for existing Word/CSS classes (e.g., `MsoQuote`, `MsoCaption`, `Piedefoto-tabla`). Use these classes instead of custom inline styles.
-
-### UNIR Color Palette (from plantilla_individual.htm)
-
-| Color | Hex | Usage |
-|-------|-----|-------|
-| Primary Blue | `#0098CD` | Headings, titles, diagram borders |
-| Light Blue BG | `#E6F4F9` | Backgrounds, callout boxes, nodes |
-| Dark Gray | `#404040` | Primary text |
-| Accent Blue | `#5B9BD5` | Table headers, accent elements |
-| Light Accent | `#9CC2E5` | Table borders |
-| Very Light Blue | `#DEEAF6` | Secondary backgrounds, subgraphs |
-| White | `#FFFFFF` | Header text, contrast |
-
-### Table Styles (from template)
-- `MsoTableGrid` - Basic grid table
-- `MsoTable15Grid4Accent1` - Styled table with UNIR colors (header: `#5B9BD5`, borders: `#9CC2E5`)
-- `Piedefoto-tabla` - Table caption/source style
-
-3. **Validate each documentation file** checking:
-
-### Data Accuracy
-- All CER/WER values must match those in `docs/metrics/*.md`
-- Verify: baseline, optimized, best trial, percentage improvement
-- Verify: GPU vs CPU acceleration factor
-- Verify: dataset size (pages)
-
-### UNIR Formatting
-- Tables: `**Tabla N.** *Descriptive title in italics.*` followed by table, then `*Fuente: ...*`
-  - Table titles must describe the content (e.g., "Comparación de modelos OCR")
-- Figures: `**Figura N.** *Descriptive title in italics.*`
-  - Figure titles must describe the content (e.g., "Pipeline de un sistema OCR moderno")
-- Sequential numbering (no duplicates, no gaps)
-- APA citation format for references
-
-### Mermaid Diagrams
-- **All diagrams must be in Mermaid format** (no external images for flowcharts/charts)
-- All Mermaid diagrams must use the UNIR color theme
-- Required YAML frontmatter config (Mermaid v11+):
-  ```mermaid
-  ---
-  title: "Diagram Title"
-  config:
-    theme: base
-    themeVariables:
-      primaryColor: "#E6F4F9"
-      primaryTextColor: "#404040"
-      primaryBorderColor: "#0098CD"
-      lineColor: "#0098CD"
-  ---
-  flowchart LR
-      A[Node] --> B[Node]
-  ```
-- Colors: `#0098CD` (UNIR blue for borders/lines), `#E6F4F9` (light blue background)
-- All diagrams must have a descriptive `title:` in YAML frontmatter
-- Titles MUST be quoted: `title: "Descriptive Title"` (not `title: Descriptive Title`)
-- Titles should describe the diagram content, not generic "Diagrama N"
-- Verify theme is applied to all diagrams in `docs/*.md`
-
-**Note on Bar Charts (`xychart-beta`):**
-- Bar chart colors are **automatically converted to light blue** (`#0098CD`) during figure generation
-- The `xyChart.plotColorPalette` config in YAML frontmatter does NOT work reliably with mmdc
-- Instead, `generate_mermaid_figures.py` post-processes SVG to replace default colors (`#ECECFF`, `#FFF4DD`)
-- No manual color configuration needed in xychart-beta blocks - they will be styled automatically
-
-### Files to Review
-- `docs/00_resumen.md` - Resumen/Abstract
-- `docs/03_objetivos_metodologia.md` - Objectives
-- `docs/04_desarrollo_especifico.md` - Main results (most critical)
-- `docs/05_conclusiones_trabajo_futuro.md` - Conclusions
-- `docs/07_anexo_a.md` - Technical annex
-- `README.md` - Project overview
-
-4. **Report findings** with:
-   - List of incorrect values found (with file:line references)
-   - Formatting issues detected
-   - Specific corrections needed
-   - Overall documentation health assessment
-
-5. **Language**: All docs/* files must be in Spanish. README.md and CLAUDE.md can be in English.
+Review and validate the documentation for this Master's Thesis project.
+
+## Instructions
+
+1. **Read metrics source files first** to get the correct values:
+   - `docs/metrics/metrics_paddle.md` - PaddleOCR results
+   - `docs/metrics/metrics_doctr.md` - DocTR results
+   - `docs/metrics/metrics_easyocr.md` - EasyOCR results
+   - `docs/metrics/metrics.md` - Comparative summary
+   - `src/results/*.csv` - Raw data from 64 trials per service (5-page tuning subset)
+   - `src/*/requirements.txt` - Dependency versions used for the experiments
+
+2. **Review UNIR guidelines** for formatting and structure rules:
+   - **`instructions/plantilla_individual.htm`** - **PRIMARY REFERENCE** for all styling (CSS classes, Word styles)
+   - **`instructions/plantilla_individual_files/`** - Support files with additional style definitions
+   - `instructions/instrucciones.pdf` - TFE writing instructions
+   - `instructions/plantilla_individual.pdf` - Official template preview
+
+   **IMPORTANT:** When styling elements (tables, figures, notes, quotes), ALWAYS check `plantilla_individual.htm` for existing Word/CSS classes (e.g., `MsoQuote`, `MsoCaption`, `Piedefoto-tabla`). Use these classes instead of custom inline styles.
+
+### UNIR Color Palette (from plantilla_individual.htm)
+
+| Color | Hex | Usage |
+|-------|-----|-------|
+| Primary Blue | `#0098CD` | Headings, titles, diagram borders |
+| Light Blue BG | `#E6F4F9` | Backgrounds, callout boxes, nodes |
+| Dark Gray | `#404040` | Primary text |
+| Accent Blue | `#5B9BD5` | Table headers, accent elements |
+| Light Accent | `#9CC2E5` | Table borders |
+| Very Light Blue | `#DEEAF6` | Secondary backgrounds, subgraphs |
+| White | `#FFFFFF` | Header text, contrast |
+
+### Table Styles (from template)
+- `MsoTableGrid` - Basic grid table
+- `MsoTable15Grid4Accent1` - Styled table with UNIR colors (header: `#5B9BD5`, borders: `#9CC2E5`)
+- `Piedefoto-tabla` - Table caption/source style
+
+3. **Validate each documentation file** checking:
+
+### Data Accuracy
+- All CER/WER values must match those in `docs/metrics/*.md`
+- Verify: baseline, optimized, best trial, percentage improvement
+- Verify: GPU vs CPU acceleration factor
+- Verify: dataset size (pages)
+
+### UNIR Formatting
+- Tables: `**Tabla N.** *Descriptive title in italics.*` followed by table, then a line that starts with `Fuente:` immediately after the table (no blank lines), e.g., `Fuente: ...`
+  - Table titles must describe the content (e.g., "Comparación de modelos OCR")
+- Figures: `**Figura N.** *Descriptive title in italics.*`
+  - Figure titles must describe the content (e.g., "Pipeline de un sistema OCR moderno")
+- Sequential numbering (no duplicates, no gaps)
+- APA citation format for references
+
+### Word Generation Alignment
+- Table sources are only captured when the line **immediately after** the table starts with `Fuente:` (per `apply_content.py`).
+- Mermaid figures use the YAML `title:` for captions in Word output; `**Figura N.**` lines are ignored by the generator but should remain for UNIR compliance.
+
+### Mermaid Diagrams
+- **All diagrams must be in Mermaid format** (no external images for flowcharts/charts)
+- All Mermaid diagrams must use the UNIR color theme
+- Required YAML frontmatter config (Mermaid v11+):
+  ```mermaid
+  ---
+  title: "Diagram Title"
+  config:
+    theme: base
+    themeVariables:
+      primaryColor: "#E6F4F9"
+      primaryTextColor: "#404040"
+      primaryBorderColor: "#0098CD"
+      lineColor: "#0098CD"
+  ---
+  flowchart LR
+      A[Node] --> B[Node]
+  ```
+- Colors: `#0098CD` (UNIR blue for borders/lines), `#E6F4F9` (light blue background)
+- All diagrams must have a descriptive `title:` in YAML frontmatter
+- Titles MUST be quoted: `title: "Descriptive Title"` (not `title: Descriptive Title`)
+- Titles should describe the diagram content, not generic "Diagrama N"
+- Verify theme is applied to all diagrams in `docs/*.md`
+
+**Note on Bar Charts (`xychart-beta`):**
+- Bar chart colors are **automatically converted to light blue** (`#0098CD`) during figure generation
+- The `xyChart.plotColorPalette` config in YAML frontmatter does NOT work reliably with mmdc
+- Instead, `generate_mermaid_figures.py` post-processes SVG to replace default colors (`#ECECFF`, `#FFF4DD`)
+- No manual color configuration needed in xychart-beta blocks - they will be styled automatically
+
+### Files to Review
+- `docs/00_resumen.md` - Resumen/Abstract
+- `docs/01_introduccion.md` - Introducción
+- `docs/02_contexto_estado_arte.md` - Contexto y estado del arte
+- `docs/03_objetivos_metodologia.md` - Objetivos y metodología
+- `docs/04_desarrollo_especifico.md` - Desarrollo específico (resultados)
+- `docs/05_conclusiones_trabajo_futuro.md` - Conclusiones y trabajo futuro
+- `docs/06_referencias_bibliograficas.md` - Referencias
+- `docs/07_anexo_a.md` - Anexo técnico
+- `README.md` - Project overview
+
+4. **Report findings** with:
+   - List of incorrect values found (with file:line references)
+   - Formatting issues detected
+   - Specific corrections needed
+   - Overall documentation health assessment
+
+5. **Language**: All docs/* files must be in Spanish. README.md and CLAUDE.md can be in English.
+
+6. **Audit Run (repeatable process)**:
+   - Validate each Mermaid diagram that contains numbers against its stated source (CSV or metrics file).
+   - Confirm every figure/table that includes metrics has a valid `*Fuente:*` line pointing to:
+     - `src/results/*.csv`, `src/results/correlations/*.csv`, or `docs/metrics/*.md`, or
+     - External sources listed in `docs/07_anexo_a.md`.
+   - Record any missing or mismatched sources before making edits.
+
+## Writing Style (Required)
+
+- Use fluent Spanish with standard punctuation, avoid long dashes.
+- Prefer commas, semicolons, or short sentences over em dashes.
+- Keep paragraphs concise and clear, avoid overly long sentences.
+
+## Data Integrity (Required)
+
+- Do not invent or estimate values. Every numeric claim must be sourced from `src/results/*.csv`, `docs/metrics/*.md`, or external documentation explicitly listed in `docs/07_anexo_a.md`.
+- If a value is not present in those sources, remove it or mark it as unknown and request clarification.
+- Source of truth for OCR metrics in `docs/00-07`: use `docs/metrics/*.md` for both "Resultados del Subconjunto de Ajuste" and "Evaluación del Dataset Completo", and `src/results/*.csv` for tuning subset values referenced by those sections.
+
+## CSV Verification (Required)
+
+Use the CSVs to validate best-trial values and to confirm that tuning-only figures are not confused with full-dataset results.
+
+
+### Interpretation Rules
+
+- The CSVs are from tuning on pages 5-10, not the full 45-page dataset.
+- Values like “best trial CER” and “best trial WER” must match the CSVs.
+- Full-dataset metrics must be sourced elsewhere and clearly labeled as full evaluation.
+- `src/raytune_paddle_subproc_results_20251207_192320.csv` is CPU-only timing reference; do not use it for accuracy claims.
+- GPU results are the primary research driver. CPU results are only used to illustrate timing without GPU.
diff --git a/.claude/commands/word-generation.md b/.claude/commands/word-generation.md
index d913ef4..a31a19e 100644
--- a/.claude/commands/word-generation.md
+++ b/.claude/commands/word-generation.md
@@ -70,8 +70,18 @@ npm install @mermaid-js/mermaid-cli
 - **Color replacement**: Both `fill` and `stroke` attributes are replaced for colors `#ECECFF` and `#FFF4DD` (default Mermaid bar colors).
 - **Config file**: `mermaid.config.json` in root directory sets the base theme for all diagrams.
 
-### Error Handling
-
-- If `generate_mermaid_figures.py` fails: Check mmdc (mermaid-cli) is installed
-- If `apply_content.py` fails: Check beautifulsoup4 is installed
-- Report any errors with the specific step that failed
+### Error Handling
+
+- If `generate_mermaid_figures.py` fails: Check mmdc (mermaid-cli) is installed
+- If `apply_content.py` fails: Check beautifulsoup4 is installed
+- Report any errors with the specific step that failed
+
+### Observed Issues (Local)
+
+- `generate_mermaid_figures.py` may fail on macOS with errors like:
+  - `Running as root without --no-sandbox is not supported`
+  - `Failed to launch the browser process` / `MachPortRendezvousServer` permission errors
+- If that happens, verify the Puppeteer config in `tem/scripts/puppeteer_config.json` is picked up by `generate_mermaid_figures.py` and includes:
+  - `"args": ["--no-sandbox", "--disable-setuid-sandbox"]`
+  - `"executablePath"` pointing to the local Chrome binary, e.g. `/Applications/Google Chrome.app/Contents/MacOS/Google Chrome`
+- If the error persists, rerun Step 1 with escalated permissions.
diff --git a/.gitignore b/.gitignore
index 62025a2..0dc8758 100644
--- a/.gitignore
+++ b/.gitignore
@@ -13,3 +13,5 @@ src/output_*.ipynb
 debugset/
 
 src/dataset_hf/
+tem/
+temp/
diff --git a/AGENTS.md b/AGENTS.md
new file mode 100644
index 0000000..1765af4
--- /dev/null
+++ b/AGENTS.md
@@ -0,0 +1,51 @@
+# Repository Guidelines
+
+## Project Structure & Module Organization
+
+- `docs/`: Thesis chapters 00-07 in Spanish (UNIR structure). Edit these for narrative changes.
+- `src/`: OCR tuning code, services, notebooks, and results. Key subfolders: `raytune/`, `paddle_ocr/`, `doctr_service/`, `easyocr_service/`, `results/`, `results/correlations/`.
+- `instructions/`: UNIR template and writing rules (`plantilla_individual.htm` is the styling source of truth).
+- `thesis_output/`: Generated thesis HTML and figures (do not edit by hand).
+- Root scripts: `generate_mermaid_figures.py` (Mermaid to PNG) and `apply_content.py` (template assembly).
+- Temporary scripts go in `tem/scripts/`.
+
+## Build, Test, and Development Commands
+
+- `source .venv/bin/activate` before installing or running Python tools.
+- `npm install`: install Mermaid CLI (`node_modules/.bin/mmdc`) for figure generation.
+- `python3 generate_mermaid_figures.py`: write PNGs to `thesis_output/figures/` from `docs/*.md`.
+- `python3 apply_content.py`: generate `thesis_output/plantilla_individual.htm` from `docs/` + `instructions/`.
+- `jupyter notebook src/prepare_dataset.ipynb`: prepare OCR dataset from PDFs.
+- `jupyter notebook src/paddle_ocr_fine_tune_unir_raytune.ipynb`: run the main tuning experiment.
+- Docker tuning (GPU):
+  - `docker compose -f src/docker-compose.tuning.paddle.yml up -d paddle-ocr-gpu`
+  - `docker compose -f src/docker-compose.tuning.paddle.yml run raytune --service paddle --samples 64`
+  - `docker compose -f src/docker-compose.tuning.paddle.yml down`
+- Use `.claude/commands/word-generation.md` to regenerate the thesis output.
+
+## Coding Style & Naming Conventions
+
+- Python: PEP 8, 4-space indentation, `snake_case`.
+- Notebooks live in `src/` and should keep execution order clean when committed.
+- Documentation in `docs/` is Spanish; code comments stay in English.
+
+## Data, Documentation, and Formatting Rules
+
+- Run `.claude/commands/documentation-review.md` before editing `docs/00-07`.
+- Do not invent numbers. Every numeric claim must come from `src/results/*.csv`, `src/results/correlations/*.csv`, `docs/metrics/*.md`, or external sources listed in `docs/07_anexo_a.md`.
+- Tables and figures must use UNIR caption format: `**Tabla N.** *Título.*` / `**Figura N.** *Título.*` plus `*Fuente: ...*`.
+- Mermaid diagrams require YAML frontmatter with a quoted `title:` and UNIR theme variables.
+- Use full repository links in `*Fuente:*` lines, e.g. `[https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md`)
+
+## Testing Guidelines
+
+- No automated tests. Validate changes by running a small tuning run and checking CSV output in `src/results/`.
+
+## Commit & Pull Request Guidelines
+
+- Commit messages are short, sentence case, and may include a tracker reference in parentheses.
+- Keep commits focused; mention generated outputs (figures, HTML) when relevant.
+
+## Agent-Specific Notes
+
+- Follow `claude.md` for thesis-specific constraints and templates.
diff --git a/apply_content.py b/apply_content.py
index 3699c22..2f9b9f4 100644
--- a/apply_content.py
+++ b/apply_content.py
@@ -4,18 +4,25 @@
 import re
 import os
 import shutil
-from bs4 import BeautifulSoup, NavigableString
-from latex2mathml.converter import convert as latex_to_mathml
-from PIL import Image
-
-BASE_DIR = os.path.dirname(os.path.abspath(__file__))
-TEMPLATE_INPUT = os.path.join(BASE_DIR, 'instructions/plantilla_individual.htm')
-TEMPLATE_OUTPUT = os.path.join(BASE_DIR, 'thesis_output/plantilla_individual.htm')
-DOCS_DIR = os.path.join(BASE_DIR, 'docs')
-
-# Global counters for tables and figures
-table_counter = 0
-figure_counter = 0
+from bs4 import BeautifulSoup, NavigableString
+from latex2mathml.converter import convert as latex_to_mathml
+from PIL import Image
+
+BASE_DIR = os.path.dirname(os.path.abspath(__file__))
+TEMPLATE_INPUT = os.path.join(BASE_DIR, 'instructions/plantilla_individual.htm')
+TEMPLATE_OUTPUT = os.path.join(BASE_DIR, 'thesis_output/plantilla_individual.htm')
+DOCS_DIR = os.path.join(BASE_DIR, 'docs')
+
+# Accept Fuente/Source lines with or without markdown bold
+SOURCE_LINE_RE = re.compile(r'^\s*(?:\*{1,2})?(Fuente|Source):(?:\*{1,2})?\s*(.*)$', re.IGNORECASE)
+
+# Global counters for tables and figures
+table_counter = 0
+figure_counter = 0
+anexo_table_counter = 0
+anexo_figure_counter = 0
+# Global sequential counter for figure filenames (figura_1.png, figura_2.png, etc.)
+global_figure_index = 0
 
 def read_file(path):
     try:
@@ -41,7 +48,7 @@ def md_to_html_para(text):
     text = re.sub(r'\[([^\]]+)\]\(([^)]+)\)', r'<a href="\2">\1</a>', text)
     return text
 
-def convert_latex_formulas(text):
+def convert_latex_formulas(text):
     """Convert LaTeX formulas to MathML for Word compatibility."""
     # Block formulas $$...$$
     def convert_block(match):
@@ -62,11 +69,22 @@ def convert_latex_formulas(text):
         except:
             return match.group(0)
 
-    text = re.sub(r'\$([^$]+)\$', convert_inline, text)
-    return text
-
-def extract_table_title(lines, current_index):
-    """Look for table title in preceding lines (e.g., **Tabla 1.** *Title*)."""
+    text = re.sub(r'\$([^$]+)\$', convert_inline, text)
+    return text
+
+def extract_source_from_line(line):
+    """Return source text if line is a Fuente/Source line, otherwise None."""
+    match = SOURCE_LINE_RE.match(line.strip())
+    if not match:
+        return None
+    return match.group(2).strip()
+
+def is_source_line(line):
+    """Check whether a line starts with Fuente:/Source: (optionally bold)."""
+    return SOURCE_LINE_RE.match(line.strip()) is not None
+
+def extract_table_title(lines, current_index):
+    """Look for table title in preceding lines (e.g., **Tabla 1.** *Title*)."""
     # Check previous non-empty lines for table title
     for i in range(current_index - 1, max(0, current_index - 5), -1):
         line = lines[i].strip()
@@ -97,9 +115,9 @@ def extract_figure_title_from_mermaid(lines, current_index):
 
     return None
 
-def parse_md_to_html_blocks(md_content):
+def parse_md_to_html_blocks(md_content, is_anexo=False):
     """Convert markdown content to HTML blocks with template styles."""
-    global table_counter, figure_counter
+    global table_counter, figure_counter, anexo_table_counter, anexo_figure_counter, global_figure_index
 
     html_blocks = []
     lines = md_content.split('\n')
@@ -115,7 +133,17 @@ def parse_md_to_html_blocks(md_content):
 
         # Mermaid diagram - convert to figure with actual image
         if line.strip().startswith('```mermaid'):
-            figure_counter += 1
+            # Always increment global index for sequential filenames
+            global_figure_index += 1
+
+            # Use Anexo-specific counter with "A" prefix for display, or global counter
+            if is_anexo:
+                anexo_figure_counter += 1
+                fig_num = f"A{anexo_figure_counter}"  # Display number: A1, A2, A3...
+            else:
+                figure_counter += 1
+                fig_num = str(figure_counter)  # Display number: 1, 2, 3...
+
             mermaid_lines = []
             i += 1
             while i < len(lines) and not lines[i].strip() == '```':
@@ -132,17 +160,22 @@ def parse_md_to_html_blocks(md_content):
             if title_match:
                 fig_title = title_match.group(1).strip()
             else:
-                fig_title = f"Diagrama {figure_counter}"
+                fig_title = f"Diagrama {fig_num}"
 
-            # Check if the generated PNG exists
-            fig_file = f'figures/figura_{figure_counter}.png'
+            # Use global sequential index for filename (figura_1.png, figura_2.png, etc.)
+            fig_file = f'figures/figura_{global_figure_index}.png'
             fig_path = os.path.join(BASE_DIR, 'thesis_output', fig_file)
 
             # Create figure with MsoCaption class and proper Word SEQ field for cross-reference
             # Format: "Figura X." in bold, title in italic (per UNIR guidelines)
             # Word TOC looks for text with Caption style - anchor must be outside main caption text
-            bookmark_id = f"_Ref_Fig{figure_counter}"
-            html_blocks.append(f'''<a name="{bookmark_id}"></a><p class=MsoCaption style="text-align:center"><b><span lang=ES style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \\* ARABIC <span style='mso-element:field-separator'></span><![endif]-->{figure_counter}<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang=ES style="font-size:12.0pt;line-height:150%"> </span><i><span lang=ES style="font-size:12.0pt;line-height:150%">{fig_title}</span></i></p>''')
+            bookmark_id = f"_Ref_Fig{fig_num}"
+            # mso-pagination:keep-with-next ensures caption stays with figure image (correct MSO property)
+            # For Anexo figures, use static text (no SEQ field) to prevent Word from overwriting A1, A2...
+            if is_anexo:
+                html_blocks.append(f'''<a name="{bookmark_id}"></a><p class=MsoCaption style="text-align:center;mso-pagination:keep-with-next"><b><span lang=ES style="font-size:12.0pt;line-height:150%">Figura {fig_num}.</span></b><span lang=ES style="font-size:12.0pt;line-height:150%"> </span><i><span lang=ES style="font-size:12.0pt;line-height:150%">{fig_title}</span></i></p>''')
+            else:
+                html_blocks.append(f'''<a name="{bookmark_id}"></a><p class=MsoCaption style="text-align:center;mso-pagination:keep-with-next"><b><span lang=ES style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \\* ARABIC <span style='mso-element:field-separator'></span><![endif]-->{fig_num}<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang=ES style="font-size:12.0pt;line-height:150%"> </span><i><span lang=ES style="font-size:12.0pt;line-height:150%">{fig_title}</span></i></p>''')
 
             if os.path.exists(fig_path):
                 # Read actual image dimensions and scale to fit page width
@@ -162,12 +195,35 @@ def parse_md_to_html_blocks(md_content):
                 w_pt = new_w * 0.75
                 h_pt = new_h * 0.75
 
-                html_blocks.append(f'''<p class=MsoNormal style="text-align:center"><span lang=ES><img width="{new_w}" height="{new_h}" style="width:{w_pt}pt;height:{h_pt}pt;display:block;margin:0 auto" src="{fig_file}" alt="{fig_title}"/></span></p>''')
+                # mso-pagination:keep-with-next ensures image stays with source line
+                html_blocks.append(f'''<p class=MsoNormal style="text-align:center;mso-pagination:keep-with-next"><span lang=ES><img width="{new_w}" height="{new_h}" style="width:{w_pt}pt;height:{h_pt}pt;display:block;margin:0 auto" src="{fig_file}" alt="{fig_title}"/></span></p>''')
             else:
                 # Fallback to placeholder
-                html_blocks.append(f'''<p class=MsoNormal style="text-align:center;border:1px dashed #999;padding:20px;margin:10px 40px;background:#f9f9f9"><span lang=ES style="color:#666">[Insertar diagrama Mermaid aquí]</span></p>''')
+                # mso-pagination:keep-with-next ensures placeholder stays with source line
+                html_blocks.append(f'''<p class=MsoNormal style="text-align:center;mso-pagination:keep-with-next;border:1px dashed #999;padding:20px;margin:10px 40px;background:#f9f9f9"><span lang=ES style="color:#666">[Insertar diagrama Mermaid aquí]</span></p>''')
+
+            # Check if next non-empty line has custom Fuente
+            custom_source = None
+            lookahead = i + 1
+            while lookahead < len(lines) and not lines[lookahead].strip():
+                lookahead += 1
+            if lookahead < len(lines):
+                next_line = lines[lookahead].strip()
+                if is_source_line(next_line):
+                    # Extract custom source, removing markdown formatting
+                    custom_source = extract_source_from_line(next_line)
+                    # Ensure it ends with a period
+                    if custom_source and not custom_source.endswith('.'):
+                        custom_source += '.'
+                    # Skip this line by advancing i past it
+                    i = lookahead
+
+            if custom_source:
+                source_html = md_to_html_para(custom_source)
+                html_blocks.append(f'''<p class=Piedefoto-tabla style="margin-left:0cm;text-align:center"><span lang=ES>Fuente: {source_html}</span></p>''')
+            else:
+                html_blocks.append(f'''<p class=Piedefoto-tabla style="margin-left:0cm;text-align:center"><span lang=ES>Fuente: Elaboración propia.</span></p>''')
 
-            html_blocks.append(f'''<p class=Piedefoto-tabla style="margin-left:0cm;text-align:center"><span lang=ES>Fuente: Elaboración propia.</span></p>''')
             html_blocks.append('<p class=MsoNormal><span lang=ES><o:p>&nbsp;</o:p></span></p>')
             i += 1
             continue
@@ -192,17 +248,28 @@ def parse_md_to_html_blocks(md_content):
         # Headers - ## becomes h2, ### becomes h3
         if line.startswith('####'):
             text = line.lstrip('#').strip()
-            html_blocks.append(f'<h4><span lang=ES>{text}</span></h4>')
+            # Apply consistent styling like h2/h3, disable numbering for h4
+            html_blocks.append(f'<h4 style="mso-list:none"><span lang=ES style="text-transform:none">{text}</span></h4>')
             i += 1
             continue
         elif line.startswith('###'):
             text = line.lstrip('#').strip()
-            html_blocks.append(f'<h3 style="mso-list:l22 level3 lfo18"><span lang=ES style="text-transform:none">{text}</span></h3>')
+            # Disable auto-numbering for Anexo content or A.x headings
+            if is_anexo or re.match(r'^A\.\d+', text):
+                # mso-list:none explicitly disables inherited list numbering from template CSS
+                html_blocks.append(f'<h3 style="mso-list:none"><span lang=ES style="text-transform:none">{text}</span></h3>')
+            else:
+                html_blocks.append(f'<h3 style="mso-list:l22 level3 lfo18"><span lang=ES style="text-transform:none">{text}</span></h3>')
             i += 1
             continue
         elif line.startswith('##'):
             text = line.lstrip('#').strip()
-            html_blocks.append(f'<h2 style="mso-list:l22 level2 lfo18"><span lang=ES style="text-transform:none">{text}</span></h2>')
+            # Disable auto-numbering for Anexo content or A.x headings
+            if is_anexo or re.match(r'^A\.\d+', text):
+                # mso-list:none explicitly disables inherited list numbering from template CSS
+                html_blocks.append(f'<h2 style="mso-list:none"><span lang=ES style="text-transform:none">{text}</span></h2>')
+            else:
+                html_blocks.append(f'<h2 style="mso-list:l22 level2 lfo18"><span lang=ES style="text-transform:none">{text}</span></h2>')
             i += 1
             continue
         elif line.startswith('#'):
@@ -212,7 +279,13 @@ def parse_md_to_html_blocks(md_content):
 
         # Table - check for table title pattern first
         if '|' in line and i + 1 < len(lines) and '---' in lines[i + 1]:
-            table_counter += 1
+            # Use Anexo-specific counter with "A" prefix, or global counter
+            if is_anexo:
+                anexo_table_counter += 1
+                table_num = f"A{anexo_table_counter}"
+            else:
+                table_counter += 1
+                table_num = str(table_counter)
 
             # Check if previous line has table title (e.g., **Tabla 1.** *Title*)
             table_title = None
@@ -239,15 +312,18 @@ def parse_md_to_html_blocks(md_content):
                     table_lines.append(lines[i])
                 i += 1
 
-            # Look ahead for source
-            if i < len(lines) and 'Fuente:' in lines[i]:
-                table_source = lines[i].replace('*', '').replace('Fuente:', '').strip()
-                i += 1
+            # Look ahead for source (skip blank lines first)
+            source_idx = i
+            while source_idx < len(lines) and not lines[source_idx].strip():
+                source_idx += 1
+            if source_idx < len(lines) and is_source_line(lines[source_idx]):
+                table_source = extract_source_from_line(lines[source_idx])
+                i = source_idx + 1
 
             # Add table title with MsoCaption class and proper Word SEQ field for cross-reference
             # Format: "Tabla X." in bold, title in italic (per UNIR guidelines)
             # Word TOC looks for text with Caption style - anchor must be outside main caption text
-            bookmark_id = f"_Ref_Tab{table_counter}"
+            bookmark_id = f"_Ref_Tab{table_num}"
             if table_title:
                 # Remove any "Tabla X." or "Tabla AX." pattern from the title
                 clean_title = re.sub(r'^Tabla\s+[A-Z]?\d+\.\s*', '', table_title).strip()
@@ -256,10 +332,14 @@ def parse_md_to_html_blocks(md_content):
                 clean_title = alt_title
             else:
                 clean_title = "Tabla de datos."
-            html_blocks.append(f'''<a name="{bookmark_id}"></a><p class=MsoCaption><b><span lang=ES style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \\* ARABIC <span style='mso-element:field-separator'></span><![endif]-->{table_counter}<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang=ES style="font-size:12.0pt;line-height:150%"> </span><i><span lang=ES style="font-size:12.0pt;line-height:150%">{clean_title}</span></i></p>''')
+            # mso-pagination:keep-with-next ensures caption stays with table (correct MSO property)
+            # For Anexo tables, use static text (no SEQ field) to prevent Word from overwriting A1, A2...
+            if is_anexo:
+                html_blocks.append(f'''<a name="{bookmark_id}"></a><p class=MsoCaption style="mso-pagination:keep-with-next"><b><span lang=ES style="font-size:12.0pt;line-height:150%">Tabla {table_num}.</span></b><span lang=ES style="font-size:12.0pt;line-height:150%"> </span><i><span lang=ES style="font-size:12.0pt;line-height:150%">{clean_title}</span></i></p>''')
+            else:
+                html_blocks.append(f'''<a name="{bookmark_id}"></a><p class=MsoCaption style="mso-pagination:keep-with-next"><b><span lang=ES style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \\* ARABIC <span style='mso-element:field-separator'></span><![endif]-->{table_num}<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang=ES style="font-size:12.0pt;line-height:150%"> </span><i><span lang=ES style="font-size:12.0pt;line-height:150%">{clean_title}</span></i></p>''')
 
             # Build table HTML with APA style (horizontal lines only, no vertical)
-            # Wrap in centered div for Word compatibility
             table_html = '<div align="center"><table class=MsoTableGrid border=1 cellspacing=0 cellpadding=0 align="center" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:\'Plain Table 1\'">'
             for j, tline in enumerate(table_lines):
                 cells = [c.strip() for c in tline.split('|')[1:-1]]
@@ -278,8 +358,11 @@ def parse_md_to_html_blocks(md_content):
             table_html += '</table></div>'
             html_blocks.append(table_html)
 
-            # Add source with proper template format
-            html_blocks.append(f'<p class=Piedefoto-tabla style="margin-left:0cm"><span lang=ES>Fuente: {table_source}.</span></p>')
+            # Add source with proper template format (convert markdown links to HTML)
+            source_html = md_to_html_para(table_source)
+            if not table_source.endswith('.'):
+                source_html += '.'
+            html_blocks.append(f'<p class=Piedefoto-tabla style="margin-left:0cm"><span lang=ES>Fuente: {source_html}</span></p>')
             html_blocks.append('<p class=MsoNormal><span lang=ES><o:p>&nbsp;</o:p></span></p>')
             continue
 
@@ -320,9 +403,9 @@ def parse_md_to_html_blocks(md_content):
         if line.strip().startswith('**Figura') or line.strip().startswith('*Figura'):
             i += 1
             continue
-        if line.strip().startswith('*Fuente:') or line.strip().startswith('Fuente:'):
-            i += 1
-            continue
+        if is_source_line(line):
+            i += 1
+            continue
 
         # Regular paragraph
         para_lines = [line]
@@ -341,10 +424,10 @@ def parse_md_to_html_blocks(md_content):
 
     return '\n\n'.join(html_blocks)
 
-def extract_section_content(md_content):
+def extract_section_content(md_content, is_anexo=False):
     """Extract content from markdown, skipping the first # header."""
     md_content = re.sub(r'^#\s+[^\n]+\n+', '', md_content, count=1)
-    return parse_md_to_html_blocks(md_content)
+    return parse_md_to_html_blocks(md_content, is_anexo=is_anexo)
 
 def find_section_element(soup, keyword):
     """Find element containing keyword (h1 or special paragraph classes)."""
@@ -396,6 +479,16 @@ def format_references(refs_content):
 
     return refs_html
 
+def split_into_paragraphs(text, lang='ES'):
+    """Split text by double newlines and wrap each paragraph in <p> tags."""
+    paragraphs = []
+    for para in text.split('\n\n'):
+        para = para.strip()
+        if para:
+            formatted = md_to_html_para(para)
+            paragraphs.append(f'<p class=MsoNormal><span lang={lang}>{formatted}</span></p>')
+    return '\n'.join(paragraphs)
+
 def extract_resumen_parts(resumen_content):
     """Extract Spanish resumen and English abstract from 00_resumen.md"""
     parts = resumen_content.split('---')
@@ -408,25 +501,25 @@ def extract_resumen_parts(resumen_content):
     spanish_keywords = ''
     if '**Palabras clave:**' in spanish_part:
         text_part, kw_part = spanish_part.split('**Palabras clave:**')
-        spanish_text = text_part.replace('# Resumen', '').strip()
-        spanish_keywords = kw_part.strip()
+        spanish_text = split_into_paragraphs(text_part.replace('# Resumen', '').strip(), 'ES')
+        spanish_keywords = md_to_html_para(kw_part.strip())
     else:
-        spanish_text = spanish_part.replace('# Resumen', '').strip()
+        spanish_text = split_into_paragraphs(spanish_part.replace('# Resumen', '').strip(), 'ES')
 
     # Extract English content
     english_text = ''
     english_keywords = ''
     if '**Keywords:**' in english_part:
         text_part, kw_part = english_part.split('**Keywords:**')
-        english_text = text_part.replace('# Abstract', '').strip()
-        english_keywords = kw_part.strip()
+        english_text = split_into_paragraphs(text_part.replace('# Abstract', '').strip(), 'EN-US')
+        english_keywords = md_to_html_para(kw_part.strip())
     else:
-        english_text = english_part.replace('# Abstract', '').strip()
+        english_text = split_into_paragraphs(english_part.replace('# Abstract', '').strip(), 'EN-US')
 
     return spanish_text, spanish_keywords, english_text, english_keywords
 
 def main():
-    global table_counter, figure_counter
+    global table_counter, figure_counter, anexo_table_counter, anexo_figure_counter
 
     print("Reading template...")
     html_content = read_file(TEMPLATE_INPUT)
@@ -470,8 +563,8 @@ def main():
             if hasattr(elem, 'decompose'):
                 elem.decompose()
 
-        # Insert new resumen content
-        resumen_html = f'''<p class=MsoNormal><span lang=ES>{spanish_text}</span></p>
+        # Insert new resumen content (spanish_text already contains <p> tags)
+        resumen_html = f'''{spanish_text}
 <p class=MsoNormal><span lang=ES><o:p>&nbsp;</o:p></span></p>
 <p class=MsoNormal><b><span lang=ES>Palabras clave:</span></b><span lang=ES> {spanish_kw}</span></p>
 <p class=MsoNormal><span lang=ES><o:p>&nbsp;</o:p></span></p>'''
@@ -502,8 +595,8 @@ def main():
             if hasattr(elem, 'decompose'):
                 elem.decompose()
 
-        # Insert new abstract content
-        abstract_html = f'''<p class=MsoNormal><span lang=EN-US>{english_text}</span></p>
+        # Insert new abstract content (english_text already contains <p> tags)
+        abstract_html = f'''{english_text}
 <p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>
 <p class=MsoNormal><b><span lang=EN-US>Keywords:</span></b><span lang=EN-US> {english_kw}</span></p>
 <p class=MsoNormal><span lang=EN-US><o:p>&nbsp;</o:p></span></p>'''
@@ -578,10 +671,10 @@ def main():
             # Also remove surrounding caption and source
             prev_sib = table.find_previous_sibling()
             next_sib = table.find_next_sibling()
-            if prev_sib and 'Tabla 1. Ejemplo' in prev_sib.get_text():
-                prev_sib.decompose()
-            if next_sib and 'Fuente:' in next_sib.get_text():
-                next_sib.decompose()
+            if prev_sib and 'Tabla 1. Ejemplo' in prev_sib.get_text():
+                prev_sib.decompose()
+            if next_sib and SOURCE_LINE_RE.search(next_sib.get_text().strip()):
+                next_sib.decompose()
             table.decompose()
             print("    ✓ Removed template table example")
             break
@@ -648,14 +741,14 @@ def main():
                     current.extract()
                 current = next_elem
 
-            anexo_content = extract_section_content(docs['anexo'])
+            anexo_content = extract_section_content(docs['anexo'], is_anexo=True)
             anexo_soup = BeautifulSoup(anexo_content, 'html.parser')
             insert_point = anexo_elem
             for new_elem in reversed(list(anexo_soup.children)):
                 insert_point.insert_after(new_elem)
             print(f"    ✓ Replaced content")
 
-    print(f"\nSummary: {table_counter} tables, {figure_counter} figures processed")
+    print(f"\nSummary: {table_counter} tables + {anexo_table_counter} Anexo tables, {figure_counter} figures + {anexo_figure_counter} Anexo figures processed")
 
     print("Saving modified template...")
     output_html = str(soup)
diff --git a/claude.md b/claude.md
index 316339b..2610244 100644
--- a/claude.md
+++ b/claude.md
@@ -79,7 +79,7 @@ MastersThesis/
 │   └── plantilla_individual.htm  # Word template (HTML version, source)
 ├── apply_content.py         # Generates TFM document from docs/ + template
 ├── generate_mermaid_figures.py  # Converts Mermaid diagrams to PNG
-├── ocr_benchmark_notebook.ipynb  # Initial OCR benchmark
+├── src/archived/ocr_benchmark_notebook.ipynb  # Archived benchmark (do not cite)
 └── README.md
 ```
 
@@ -312,7 +312,7 @@ ALL objectives (general and specific) MUST be SMART:
 
 #### APA Format is MANDATORY
 
-Reference guide: https://bibliografiaycitas.unir.net/
+Reference guide: [https://bibliografiaycitas.unir.net/](https://bibliografiaycitas.unir.net/)
 
 **In-text citations:**
 - Single author: (Du, 2020) or Du (2020)
diff --git a/docs/00_resumen.md b/docs/00_resumen.md
index de1ce36..e0f0c11 100644
--- a/docs/00_resumen.md
+++ b/docs/00_resumen.md
@@ -2,9 +2,11 @@
 
 El presente Trabajo Fin de Máster aborda la optimización de sistemas de Reconocimiento Óptico de Caracteres (OCR) basados en inteligencia artificial para documentos en español. El objetivo principal es identificar la configuración óptima de hiperparámetros que maximice la precisión del reconocimiento de texto sin requerir fine-tuning de los modelos base.
 
-Se realizó un estudio comparativo de tres soluciones OCR de código abierto: EasyOCR, PaddleOCR (PP-OCRv5) y DocTR, evaluando su rendimiento mediante las métricas estándar CER (Character Error Rate) y WER (Word Error Rate) sobre un corpus de 45 páginas de documentos académicos en español. Tras identificar PaddleOCR como la solución más prometedora, se procedió a una optimización sistemática de hiperparámetros utilizando Ray Tune con el algoritmo de búsqueda Optuna, ejecutando 64 configuraciones diferentes con aceleración GPU (NVIDIA RTX 3060).
+Se realizó un estudio comparativo de tres soluciones OCR de código abierto: EasyOCR, PaddleOCR (PP-OCRv5) y DocTR. Se evaluó su rendimiento mediante las métricas estándar CER (Character Error Rate) y WER (Word Error Rate) sobre un corpus de 45 páginas de documentos académicos en español. Tras identificar PaddleOCR como la solución más prometedora, se procedió a una optimización sistemática de hiperparámetros utilizando Ray Tune con el algoritmo de búsqueda Optuna, ejecutando 64 configuraciones diferentes con aceleración GPU (NVIDIA RTX 3060).
 
-Los resultados demuestran que la optimización de hiperparámetros logró mejoras significativas: el mejor trial individual alcanzó un CER de 0.79% (precisión del 99.21%), cumpliendo el objetivo de CER < 2%. Al validar la configuración optimizada sobre el dataset completo de 45 páginas, se obtuvo una mejora del 12.8% en CER (de 8.85% a 7.72%). El hallazgo más relevante fue que el parámetro `textline_orientation` (clasificación de orientación de línea de texto) tiene un impacto crítico en el rendimiento. Adicionalmente, se identificó que el umbral de detección (`text_det_thresh`) presenta una correlación negativa moderada (-0.52) con el error.
+Los resultados demuestran que la optimización de hiperparámetros logró mejoras significativas: el mejor trial individual alcanzó un CER de 0.79% (precisión del 99.21%), cumpliendo el objetivo de CER < 2%. Al validar la configuración optimizada sobre el dataset completo de 45 páginas, se obtuvo una mejora del 12.8% en CER (de 8.85% a 7.72%). El hallazgo más relevante fue que el parámetro `textline_orientation` (clasificación de orientación de línea de texto) tiene un impacto crítico en el rendimiento. Adicionalmente, se identificó que el umbral de detección (`text_det_thresh`) presenta una correlación positiva moderada (0.43) con el error, lo que indica que valores más bajos tienden a mejorar el rendimiento.
+
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md), [`src/results/correlations/paddle_correlations.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv).
 
 Este trabajo demuestra que la optimización de hiperparámetros es una alternativa viable al fine-tuning, especialmente útil cuando se dispone de modelos preentrenados para el idioma objetivo. La infraestructura dockerizada desarrollada permite reproducir los experimentos y facilita la evaluación sistemática de configuraciones OCR.
 
@@ -16,9 +18,11 @@ Este trabajo demuestra que la optimización de hiperparámetros es una alternati
 
 This Master's Thesis addresses the optimization of Artificial Intelligence-based Optical Character Recognition (OCR) systems for Spanish documents. The main objective is to identify the optimal hyperparameter configuration that maximizes text recognition accuracy without requiring fine-tuning of the base models.
 
-A comparative study of three open-source OCR solutions was conducted: EasyOCR, PaddleOCR (PP-OCRv5), and DocTR, evaluating their performance using standard CER (Character Error Rate) and WER (Word Error Rate) metrics on a corpus of 45 pages of academic documents in Spanish. After identifying PaddleOCR as the most promising solution, systematic hyperparameter optimization was performed using Ray Tune with the Optuna search algorithm, executing 64 different configurations with GPU acceleration (NVIDIA RTX 3060).
+A comparative study of three open-source OCR solutions was conducted with EasyOCR, PaddleOCR (PP-OCRv5), and DocTR. Their performance was evaluated using standard CER (Character Error Rate) and WER (Word Error Rate) metrics on a corpus of 45 pages of academic documents in Spanish. After identifying PaddleOCR as the most promising solution, systematic hyperparameter optimization was performed using Ray Tune with the Optuna search algorithm, executing 64 different configurations with GPU acceleration (NVIDIA RTX 3060).
 
-Results demonstrate that hyperparameter optimization achieved significant improvements: the best individual trial reached a CER of 0.79% (99.21% accuracy), meeting the CER < 2% objective. When validating the optimized configuration on the full 45-page dataset, a 12.8% CER improvement was obtained (from 8.85% to 7.72%). The most relevant finding was that the `textline_orientation` parameter (text line orientation classification) has a critical impact on performance. Additionally, the detection threshold (`text_det_thresh`) was found to have a moderate negative correlation (-0.52) with error.
+Results demonstrate that hyperparameter optimization achieved significant improvements. The best individual trial reached a CER of 0.79% (99.21% accuracy), meeting the CER < 2% objective. When validating the optimized configuration on the full 45-page dataset, a 12.8% CER improvement was obtained (from 8.85% to 7.72%). The most relevant finding was that the `textline_orientation` parameter (text line orientation classification) has a critical impact on performance. Additionally, the detection threshold (`text_det_thresh`) showed a moderate positive correlation (0.43) with error, indicating that lower values tend to improve performance.
+
+Sources: [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md), [`src/results/correlations/paddle_correlations.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv).
 
 This work demonstrates that hyperparameter optimization is a viable alternative to fine-tuning, especially useful when pre-trained models for the target language are available. The dockerized infrastructure developed enables experiment reproducibility and facilitates systematic evaluation of OCR configurations.
 
diff --git a/docs/01_introduccion.md b/docs/01_introduccion.md
index a94c652..92b9bb1 100644
--- a/docs/01_introduccion.md
+++ b/docs/01_introduccion.md
@@ -4,17 +4,17 @@
 
 ## Motivación
 
-El Reconocimiento Óptico de Caracteres (OCR) es una tecnología fundamental en la era de la digitalización documental. Su capacidad para convertir imágenes de texto en datos editables y procesables ha transformado sectores como la administración pública, el ámbito legal, la banca y la educación. Según estimaciones del sector, el mercado global de OCR alcanzó los 13.4 mil millones de dólares en 2023, con proyecciones de crecimiento continuo impulsado por la transformación digital empresarial (Grand View Research, 2023). Sin embargo, a pesar de los avances significativos impulsados por el aprendizaje profundo, la implementación práctica de sistemas OCR de alta precisión sigue presentando desafíos considerables.
+El Reconocimiento Óptico de Caracteres (OCR) es una tecnología fundamental en la era de la digitalización documental. Su capacidad para convertir imágenes de texto en datos editables y procesables ha transformado sectores como la administración pública, el ámbito legal, la banca y la educación. La expansión de la transformación digital empresarial ha impulsado su adopción, aunque la implementación práctica de sistemas OCR de alta precisión sigue presentando desafíos considerables.
 
 ### El contexto de la digitalización documental
 
 La digitalización de documentos ha pasado de ser una opción a una necesidad estratégica para organizaciones de todos los tamaños. Los beneficios son múltiples: reducción del espacio físico de almacenamiento, facilidad de búsqueda y recuperación, preservación del patrimonio documental, y habilitación de flujos de trabajo automatizados. Sin embargo, la mera conversión de papel a imagen digital no aprovecha plenamente estas ventajas; es necesario extraer el texto contenido en los documentos para permitir su indexación, análisis y procesamiento automatizado.
 
-El OCR actúa como puente entre el mundo físico del documento impreso y el mundo digital del texto procesable. Su precisión determina directamente la calidad de los procesos downstream: un error de reconocimiento en un nombre propio puede invalidar una búsqueda; un dígito mal reconocido en una factura puede causar discrepancias contables; una palabra mal interpretada en un contrato puede alterar su significado legal.
+El OCR actúa como puente entre el mundo físico del documento impreso y el mundo digital del texto procesable. Su precisión determina directamente la calidad de los procesos downstream. Un error de reconocimiento en un nombre propio puede invalidar una búsqueda; un dígito mal reconocido en una factura puede causar discrepancias contables. Una palabra mal interpretada en un contrato puede alterar su significado legal.
 
 ### Desafíos específicos del español
 
-El procesamiento de documentos en español presenta particularidades que complican el reconocimiento automático de texto. Los caracteres especiales propios del idioma (la letra ñ, las vocales acentuadas á, é, í, ó, ú, la diéresis ü, y los signos de puntuación invertidos ¿ y ¡) no están presentes en muchos conjuntos de entrenamiento internacionales, lo que puede degradar el rendimiento de modelos preentrenados predominantemente en inglés.
+El procesamiento de documentos en español presenta particularidades que complican el reconocimiento automático de texto. Los caracteres especiales propios del idioma (la letra ñ, las vocales acentuadas á, é, í, ó, ú, la diéresis ü, y los signos de puntuación invertidos ¿, ¡) no están presentes en muchos conjuntos de entrenamiento internacionales, lo que puede degradar el rendimiento de modelos preentrenados predominantemente en inglés.
 
 La Tabla 1 resume los principales desafíos lingüísticos del OCR en español:
 
@@ -27,15 +27,15 @@ La Tabla 1 resume los principales desafíos lingüísticos del OCR en español:
 | Abreviaturas | Dr., Sra., Ud., etc. | Puntos internos confunden segmentación |
 | Nombres propios | Tildes en apellidos (García, Martínez) | Bases de datos sin soporte Unicode |
 
-*Fuente: Elaboración propia.*
+**Fuente:** Elaboración propia.
 
-Además de los aspectos lingüísticos, los documentos académicos y administrativos en español presentan características tipográficas que complican el reconocimiento: variaciones en fuentes entre encabezados, cuerpo y notas al pie; presencia de tablas con bordes y celdas; logotipos institucionales; marcas de agua; y elementos gráficos como firmas o sellos. Estos elementos generan ruido que puede propagarse en aplicaciones downstream como la extracción de entidades nombradas o el análisis semántico.
+Además de los aspectos lingüísticos, los documentos académicos y administrativos en español presentan características tipográficas que complican el reconocimiento: variaciones en fuentes entre encabezados, cuerpo y notas al pie; presencia de índices, listas numeradas y cambios frecuentes de estilo; y saltos de línea que rompen la continuidad del texto. Estos elementos generan ruido que puede propagarse en aplicaciones downstream como la extracción de entidades nombradas o el análisis semántico.
 
 ### La brecha entre investigación y práctica
 
-Los modelos OCR basados en redes neuronales profundas, como los empleados en PaddleOCR, EasyOCR o DocTR, ofrecen un rendimiento impresionante en benchmarks estándar. PaddleOCR, por ejemplo, reporta tasas de precisión superiores al 97% en conjuntos de datos como ICDAR 2015 (Du et al., 2020). No obstante, estos resultados en condiciones controladas no siempre se trasladan a documentos del mundo real.
+Los modelos OCR basados en redes neuronales profundas, como los empleados en PaddleOCR, EasyOCR o DocTR, ofrecen un rendimiento competitivo en benchmarks estándar. No obstante, estos resultados en condiciones controladas no siempre se trasladan a documentos del mundo real.
 
-La adaptación de modelos preentrenados a dominios específicos típicamente requiere fine-tuning con datos etiquetados del dominio objetivo y recursos computacionales significativos. El fine-tuning de un modelo de reconocimiento de texto puede requerir decenas de miles de imágenes etiquetadas y días de entrenamiento en GPUs de alta capacidad. Esta barrera técnica y económica excluye a muchos investigadores y organizaciones de beneficiarse plenamente de estas tecnologías.
+La adaptación de modelos preentrenados a dominios específicos típicamente requiere fine-tuning con datos etiquetados del dominio objetivo y recursos computacionales significativos. Esta barrera técnica y económica excluye a muchos investigadores y organizaciones de beneficiarse plenamente de estas tecnologías.
 
 La Tabla 2 ilustra los requisitos típicos para diferentes estrategias de mejora de OCR:
 
@@ -43,18 +43,18 @@ La Tabla 2 ilustra los requisitos típicos para diferentes estrategias de mejora
 
 | Estrategia | Datos requeridos | Hardware | Tiempo | Expertise |
 |------------|------------------|----------|--------|-----------|
-| Fine-tuning completo | >10,000 imágenes etiquetadas | GPU (≥16GB VRAM) | Días-Semanas | Alto |
-| Fine-tuning parcial | >1,000 imágenes etiquetadas | GPU (≥8GB VRAM) | Horas-Días | Medio-Alto |
-| Transfer learning | >500 imágenes etiquetadas | GPU (≥8GB VRAM) | Horas | Medio |
-| **Optimización de hiperparámetros** | **<100 imágenes de validación** | **CPU suficiente** | **Horas** | **Bajo-Medio** |
+| Fine-tuning completo | Miles de imágenes etiquetadas | GPU de alta memoria | Días o semanas | Alto |
+| Fine-tuning parcial | Cientos o miles de imágenes etiquetadas | GPU dedicada | Horas o días | Medio-Alto |
+| Transfer learning | Centenas de imágenes etiquetadas | GPU dedicada | Horas | Medio |
+| **Optimización de hiperparámetros** | **Subconjunto de validación** | **CPU o GPU (CUDA 12.2+ en Docker DocTR)** | **Horas** | **Bajo-Medio** |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/07_anexo_a.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/07_anexo_a.md), sección A.9.
 
 ### La oportunidad: optimización sin fine-tuning
 
-La presente investigación surge de una necesidad práctica: optimizar un sistema OCR para documentos académicos en español sin disponer de recursos GPU para realizar fine-tuning. Esta restricción, lejos de ser una limitación excepcional, representa la realidad de muchos entornos académicos y empresariales donde el acceso a infraestructura de cómputo avanzada es limitado.
+La presente investigación surge de una necesidad práctica: optimizar un sistema OCR para documentos académicos en español sin disponer de infraestructura de entrenamiento dedicada para fine-tuning. Esta restricción, lejos de ser una limitación excepcional, representa la realidad de muchos entornos académicos y empresariales donde el acceso a cómputo avanzado es limitado.
 
-La hipótesis central de este trabajo es que los modelos OCR preentrenados contienen capacidades latentes que pueden activarse mediante la configuración adecuada de sus hiperparámetros de inferencia. Parámetros como los umbrales de detección de texto, las opciones de preprocesamiento de imagen, y los filtros de confianza de reconocimiento pueden tener un impacto significativo en el rendimiento final, y su optimización sistemática puede aproximarse a los beneficios del fine-tuning sin sus costes asociados.
+La hipótesis central de este trabajo es que los modelos OCR preentrenados contienen capacidades latentes que pueden activarse mediante la configuración adecuada de sus hiperparámetros de inferencia. Parámetros como los umbrales de detección de texto, las opciones de preprocesamiento de imagen, y los filtros de confianza de reconocimiento pueden tener un impacto significativo en el rendimiento final. Su optimización sistemática puede aproximarse a los beneficios del fine-tuning sin sus costes asociados.
 
 Esta oportunidad se ve reforzada por la disponibilidad de frameworks modernos de optimización de hiperparámetros como Ray Tune (Liaw et al., 2018) y algoritmos de búsqueda eficientes como Optuna (Akiba et al., 2019), que permiten explorar espacios de configuración de manera sistemática y eficiente.
 
@@ -64,7 +64,7 @@ Esta oportunidad se ve reforzada por la disponibilidad de frameworks modernos de
 
 Las observaciones anteriores conducen a formular el problema central de este trabajo:
 
-> ¿Es posible mejorar significativamente el rendimiento de modelos OCR preentrenados para documentos en español mediante la optimización sistemática de hiperparámetros, sin requerir fine-tuning ni recursos GPU?
+> ¿Es posible mejorar significativamente el rendimiento de modelos OCR preentrenados para documentos en español mediante la optimización sistemática de hiperparámetros, sin requerir fine-tuning y con recursos computacionales de consumo?
 
 Este planteamiento parte de una observación fundamental: los sistemas OCR modernos exponen múltiples parámetros configurables que afectan su comportamiento durante la inferencia. Estos parámetros incluyen umbrales de detección, opciones de preprocesamiento, y filtros de calidad. En la práctica habitual, estos parámetros se dejan en sus valores por defecto, asumiendo que fueron optimizados por los desarrolladores del modelo. Sin embargo, los valores por defecto representan compromisos generales que pueden no ser óptimos para dominios específicos.
 
@@ -82,7 +82,7 @@ Identificar los parámetros más influyentes permite focalizar el esfuerzo de op
 
 **PI3. Optimización automatizada**: ¿Puede un proceso de búsqueda automatizada de hiperparámetros (mediante Ray Tune/Optuna) encontrar configuraciones que superen significativamente los valores por defecto?
 
-Esta pregunta evalúa la viabilidad práctica de la metodología propuesta. "Significativamente" se define operacionalmente como una reducción del CER de al menos 50% respecto al baseline, un umbral que representaría una mejora sustancial en la calidad del texto reconocido.
+Esta pregunta evalúa la viabilidad práctica de la metodología propuesta. "Significativamente" se define como una mejora sustancial respecto al baseline, con impacto observable en la calidad del texto reconocido.
 
 **PI4. Viabilidad práctica**: ¿Son los tiempos de inferencia y los recursos requeridos compatibles con un despliegue en entornos con recursos limitados?
 
@@ -100,9 +100,9 @@ Este trabajo se centra específicamente en:
 | **Idioma** | Español | Otros idiomas |
 | **Modelos** | EasyOCR, PaddleOCR, DocTR | Soluciones comerciales (Google Cloud Vision, AWS Textract) |
 | **Método de mejora** | Optimización de hiperparámetros | Fine-tuning, aumento de datos |
-| **Hardware** | Ejecución en CPU | Aceleración GPU |
+| **Hardware** | GPU de consumo y CPU para referencia de tiempos | Infraestructura multi-GPU |
 
-*Fuente: Elaboración propia.*
+**Fuente:** Elaboración propia.
 
 ### Relevancia y beneficiarios
 
@@ -118,11 +118,10 @@ La relevancia de este problema radica en su aplicabilidad inmediata. Una metodol
 
 ## Estructura del trabajo
 
-El documento sigue una estructura que refleja el proceso investigador. Tras esta introducción, el **Capítulo 2** sitúa el trabajo en su contexto técnico, revisando las tecnologías OCR basadas en aprendizaje profundo —desde las arquitecturas de detección hasta los modelos de reconocimiento— y los trabajos previos en optimización de estos sistemas.
+El documento sigue una estructura que refleja el proceso investigador. Tras esta introducción, el **Capítulo 2** sitúa el trabajo en su contexto técnico y revisa las tecnologías OCR basadas en aprendizaje profundo. Se describen las arquitecturas de detección, los modelos de reconocimiento y los trabajos previos en optimización de estos sistemas.
 
-El **Capítulo 3** traduce las preguntas de investigación en objetivos concretos siguiendo la metodología SMART, y describe con detalle el enfoque experimental: preparación del dataset, métricas de evaluación y configuración del proceso de optimización con Ray Tune y Optuna.
+El **Capítulo 3** traduce las preguntas de investigación en objetivos concretos, siguiendo la metodología SMART. Además, describe con detalle el enfoque experimental: preparación del dataset, métricas de evaluación y configuración del proceso de optimización con Ray Tune y Optuna.
 
-El núcleo del trabajo se desarrolla en el **Capítulo 4**, que presenta el estudio comparativo y la optimización de hiperparámetros estructurados en tres fases: planteamiento de la comparativa con evaluación de EasyOCR, PaddleOCR y DocTR; desarrollo de la optimización mediante 64 trials con Ray Tune; y análisis crítico de los resultados obtenidos.
+El núcleo del trabajo se desarrolla en el **Capítulo 4**, que presenta el estudio comparativo y la optimización de hiperparámetros en tres fases: planteamiento de la comparativa con evaluación de EasyOCR, PaddleOCR y DocTR; desarrollo de la optimización mediante 64 trials con Ray Tune; y análisis crítico de los resultados obtenidos.
 
 Finalmente, el **Capítulo 5** sintetiza las contribuciones, evalúa el grado de cumplimiento de los objetivos y propone líneas de trabajo futuro. Los **Anexos** proporcionan acceso al repositorio de código fuente y datos, así como tablas detalladas de resultados experimentales.
-
diff --git a/docs/02_contexto_estado_arte.md b/docs/02_contexto_estado_arte.md
index bda02ce..48ed34e 100644
--- a/docs/02_contexto_estado_arte.md
+++ b/docs/02_contexto_estado_arte.md
@@ -1,6 +1,6 @@
 # Contexto y estado del arte
 
-Para comprender el alcance y las decisiones tomadas en este trabajo, es necesario situarlo en su contexto tecnológico. El Reconocimiento Óptico de Caracteres ha recorrido un largo camino desde los primeros sistemas de plantillas de los años 50 hasta las sofisticadas arquitecturas de aprendizaje profundo actuales. A lo largo de este capítulo se revisan los fundamentos técnicos del OCR moderno, se analizan las principales soluciones de código abierto y se identifican los vacíos en la literatura que motivan la contribución de este trabajo.
+Para comprender el alcance y las decisiones tomadas en este trabajo, es necesario situarlo en su contexto tecnológico. El Reconocimiento Óptico de Caracteres ha recorrido un largo camino desde los primeros sistemas de plantillas de los años 50 hasta las sofisticadas arquitecturas de aprendizaje profundo actuales. A lo largo de este capítulo se revisan los fundamentos técnicos del OCR moderno. Se analizan las principales soluciones de código abierto y se identifican los vacíos en la literatura que motivan la contribución de este trabajo.
 
 ## Contexto del problema
 
@@ -129,7 +129,7 @@ Las arquitecturas más utilizadas para detección de texto incluyen:
 | CRAFT | Bottom-up | Polígonos de palabra | Robusto a espaciado | Mayor coste computacional |
 | DB | Segmentación | Polígonos arbitrarios | Rápido, preciso | Sensible a parámetros |
 
-*Fuente: Elaboración propia a partir de Zhou et al. (2017), Baek et al. (2019), Liao et al. (2020).*
+**Fuente:** Elaboración propia a partir de Zhou et al. (2017), Baek et al. (2019), Liao et al. (2020).
 
 #### Etapa 2: Reconocimiento de Texto (Text Recognition)
 
@@ -157,7 +157,7 @@ La arquitectura CRNN consta de tres componentes:
 | Attention-based | CNN | LSTM+Attn | Cross-entropy | Flexible longitud |
 | TrOCR | ViT | Transformer | Cross-entropy | Estado del arte |
 
-*Fuente: Elaboración propia a partir de Shi et al. (2016), Du et al. (2022), Li et al. (2023).*
+**Fuente:** Elaboración propia a partir de Shi et al. (2016), Du et al. (2022), Li et al. (2023).
 
 ### Métricas de Evaluación
 
@@ -183,11 +183,7 @@ Donde:
 - I = número de inserciones de caracteres
 - N = número total de caracteres en el texto de referencia
 
-Un CER del 1% indica que, en promedio, 1 de cada 100 caracteres contiene un error. Para aplicaciones críticas como:
-- **Documentos financieros**: Se requiere CER < 0.1%
-- **Documentos médicos**: Se requiere CER < 0.5%
-- **Documentos académicos**: CER < 2% es aceptable
-- **Búsqueda y archivo**: CER < 5% puede ser suficiente
+Un CER bajo indica que el sistema comete pocos errores a nivel de carácter. Para aplicaciones críticas se requiere un nivel de error muy reducido, mientras que en tareas de búsqueda o archivo pueden aceptarse errores mayores.
 
 #### Word Error Rate (WER)
 
@@ -195,11 +191,11 @@ El WER mide el error a nivel de palabra, utilizando la misma fórmula pero consi
 
 $$WER = \frac{S_w + D_w + I_w}{N_w}$$
 
-El WER es generalmente mayor que el CER, ya que un solo error de carácter puede invalidar una palabra completa. La relación típica es WER ≈ 2-3 × CER para texto en español.
+El WER es generalmente mayor que el CER, ya que un solo error de carácter puede invalidar una palabra completa. Esta diferencia es relevante cuando se comparan sistemas que preservan caracteres pero pierden palabras completas.
 
 #### Otras Métricas Complementarias
 
-**Precision y Recall a nivel de palabra**: Útiles cuando se evalúa la capacidad del sistema para detectar palabras específicas.
+**Precisión y Recall a nivel de palabra**: Útiles cuando se evalúa la capacidad del sistema para detectar palabras específicas.
 
 **Bag-of-Words Accuracy**: Mide la proporción de palabras correctamente reconocidas independientemente de su orden.
 
@@ -302,7 +298,7 @@ PaddleOCR expone numerosos hiperparámetros que permiten ajustar el comportamien
 | `text_det_unclip_ratio` | Factor de expansión de cajas detectadas | [0.0, 3.0] | 1.5 |
 | `text_det_limit_side_len` | Tamaño máximo del lado de imagen | [320, 2560] | 960 |
 
-*Fuente: Documentación oficial de PaddleOCR (PaddlePaddle, 2024).*
+**Fuente:** Documentación oficial de PaddleOCR (PaddlePaddle, 2024).
 
 **Tabla 7.** *Hiperparámetros de reconocimiento de PaddleOCR.*
 
@@ -312,7 +308,7 @@ PaddleOCR expone numerosos hiperparámetros que permiten ajustar el comportamien
 | `use_textline_orientation` | Activar clasificación de orientación de línea | {True, False} | False |
 | `rec_batch_size` | Tamaño de batch para reconocimiento | [1, 64] | 6 |
 
-*Fuente: Documentación oficial de PaddleOCR (PaddlePaddle, 2024).*
+**Fuente:** Documentación oficial de PaddleOCR (PaddlePaddle, 2024).
 
 **Tabla 8.** *Hiperparámetros de preprocesamiento de PaddleOCR.*
 
@@ -322,7 +318,7 @@ PaddleOCR expone numerosos hiperparámetros que permiten ajustar el comportamien
 | `use_doc_unwarping` | Corrección de deformación/curvatura | Alto para fotos de documentos |
 | `use_angle_cls` | Clasificador de ángulo 0°/180° | Medio para documentos rotados |
 
-*Fuente: Documentación oficial de PaddleOCR (PaddlePaddle, 2024).*
+**Fuente:** Documentación oficial de PaddleOCR (PaddlePaddle, 2024).
 
 **Fortalezas de PaddleOCR**:
 - Alta precisión en múltiples benchmarks
@@ -366,24 +362,24 @@ DocTR (Document Text Recognition) es una biblioteca desarrollada por Mindee (202
 | **Framework** | PyTorch | PaddlePaddle | TF/PyTorch |
 | **Detector** | CRAFT | DB | DB/LinkNet |
 | **Reconocedor** | CRNN | SVTR/CRNN | CRNN/SAR/ViTSTR |
-| **Idiomas** | 80+ | 80+ | 9 |
+| **Idiomas** | Multilingüe | Multilingüe | Limitado |
 | **Configurabilidad** | Baja | Alta | Media |
 | **Documentación** | Media | Alta (CN) | Alta (EN) |
 | **Actividad** | Media | Alta | Media |
 | **Licencia** | Apache 2.0 | Apache 2.0 | Apache 2.0 |
 
-*Fuente: Elaboración propia a partir de documentación oficial (2024).*
+**Fuente:** Elaboración propia a partir de documentación oficial (2024).
 
 **Tabla 10.** *Comparativa de facilidad de uso.*
 
 | Aspecto | EasyOCR | PaddleOCR | DocTR |
 |---------|---------|-----------|-------|
 | Instalación | `pip install` | `pip install` | `pip install` |
-| Líneas para OCR básico | 3 | 5 | 6 |
+| Complejidad de uso | Baja | Media | Media |
 | GPU requerida | Opcional | Opcional | Opcional |
-| Memoria mínima | 2 GB | 4 GB | 4 GB |
+| Requisitos de memoria | Bajos | Medios | Medios |
 
-*Fuente: Elaboración propia.*
+**Fuente:** Elaboración propia a partir de documentación oficial.
 
 ### Optimización de Hiperparámetros
 
@@ -544,7 +540,7 @@ Los principales recursos para evaluación de OCR en español incluyen:
 
 **FUNSD-ES**: Versión en español del Form Understanding in Noisy Scanned Documents dataset. Contiene formularios escaneados con anotaciones de texto y estructura.
 
-**MLT (ICDAR Multi-Language Text)**: Dataset multilingüe de las competiciones ICDAR que incluye muestras en español. Las ediciones 2017 y 2019 contienen texto en escenas naturales.
+**MLT (ICDAR Multi-Language Text)**: Dataset multilingüe de las competiciones ICDAR que incluye muestras en español. Las ediciones recientes contienen texto en escenas naturales.
 
 **XFUND**: Dataset de comprensión de formularios en múltiples idiomas, incluyendo español, con anotaciones de entidades y relaciones.
 
@@ -552,11 +548,11 @@ Los principales recursos para evaluación de OCR en español incluyen:
 
 | Dataset | Tipo | Idiomas | Tamaño | Uso principal |
 |---------|------|---------|--------|---------------|
-| FUNSD-ES | Formularios | ES | ~200 docs | Document understanding |
-| MLT 2019 | Escenas | Multi (incl. ES) | 10K imgs | Text detection |
-| XFUND | Formularios | 7 (incl. ES) | 1.4K docs | Information extraction |
+| FUNSD-ES | Formularios | ES | Pequeño | Document understanding |
+| MLT | Escenas | Multi (incl. ES) | Medio | Text detection |
+| XFUND | Formularios | Multi (incl. ES) | Medio | Information extraction |
 
-*Fuente: Elaboración propia a partir de repositorios oficiales.*
+**Fuente:** Elaboración propia a partir de repositorios oficiales.
 
 #### Limitaciones de Recursos para Español
 
@@ -568,6 +564,8 @@ Comparado con inglés y chino, el español cuenta con:
 
 Esta escasez de recursos específicos para español motivó la creación de un dataset propio basado en documentos académicos de UNIR para este trabajo.
 
+Además, se priorizó un dataset propio aunque fuera de tamaño reducido porque el objetivo era evaluar texto académico en un formato sencillo y reproducible (texto plano con índice), sin tablas ni estructuras complejas. Ese perfil no está bien cubierto por datasets públicos centrados en formularios o escenas naturales, por lo que se optó por un corpus controlado y alineado con el dominio del TFM.
+
 #### Trabajos Previos en OCR para Español
 
 Los trabajos previos en OCR para español se han centrado principalmente en:
@@ -586,14 +584,12 @@ Los trabajos previos en OCR para español se han centrado principalmente en:
 | Bulatov et al. (2020) | Documentos ID | Pipeline especializado |
 | Fischer et al. (2012) | Multilingual | Transferencia entre idiomas |
 
-*Fuente: Elaboración propia.*
+**Fuente:** Elaboración propia.
 
 La optimización de hiperparámetros para documentos académicos en español representa una contribución original de este trabajo, abordando un nicho no explorado en la literatura.
 
-## Conclusiones del capítulo
+En síntesis, la revisión del estado del arte revela un panorama en el que las herramientas técnicas están maduras, pero su aplicación óptima para dominios específicos permanece poco explorada. Los sistemas OCR modernos, como PaddleOCR, EasyOCR y DocTR, ofrecen arquitecturas sofisticadas basadas en aprendizaje profundo que alcanzan resultados impresionantes en benchmarks estándar. Sin embargo, estos resultados no siempre se trasladan a documentos del mundo real, especialmente en idiomas con menos recursos como el español.
 
-La revisión del estado del arte revela un panorama en el que las herramientas técnicas están maduras, pero su aplicación óptima para dominios específicos permanece poco explorada. Los sistemas OCR modernos —PaddleOCR, EasyOCR, DocTR— ofrecen arquitecturas sofisticadas basadas en aprendizaje profundo que alcanzan resultados impresionantes en benchmarks estándar. Sin embargo, estos resultados no siempre se trasladan a documentos del mundo real, especialmente en idiomas con menos recursos como el español.
-
-La evolución desde los sistemas de plantillas de los años 50 hasta los Transformers actuales ha sido espectacular, pero ha generado sistemas con decenas de hiperparámetros configurables cuyos valores por defecto representan compromisos generales, no configuraciones óptimas para dominios específicos. La literatura abunda en trabajos sobre entrenamiento y fine-tuning de modelos OCR, pero dedica poca atención a la optimización sistemática de los parámetros de inferencia —umbrales de detección, opciones de preprocesamiento, filtros de confianza— que pueden marcar la diferencia entre un sistema usable y uno que requiere corrección manual extensiva.
+La evolución desde los sistemas de plantillas de los años 50 hasta los Transformers actuales ha sido espectacular, pero ha generado sistemas con decenas de hiperparámetros configurables cuyos valores por defecto representan compromisos generales, no configuraciones óptimas para dominios específicos. La literatura abunda en trabajos sobre entrenamiento y fine-tuning de modelos OCR, pero dedica poca atención a la optimización sistemática de los parámetros de inferencia, como umbrales de detección, opciones de preprocesamiento y filtros de confianza, que pueden marcar la diferencia entre un sistema usable y uno que requiere corrección manual extensiva.
 
 Este vacío, combinado con las particularidades del español (acentos, eñes, signos invertidos) y la escasez de recursos específicos para este idioma, define el espacio de contribución del presente trabajo. Frameworks como Ray Tune y Optuna proporcionan las herramientas para abordar esta optimización de manera sistemática; PaddleOCR, con su pipeline altamente configurable, ofrece el sustrato técnico adecuado. El siguiente capítulo traduce esta oportunidad en objetivos concretos y una metodología experimental rigurosa.
diff --git a/docs/03_objetivos_metodologia.md b/docs/03_objetivos_metodologia.md
index bc680fd..9694607 100644
--- a/docs/03_objetivos_metodologia.md
+++ b/docs/03_objetivos_metodologia.md
@@ -18,7 +18,7 @@ La motivación presentada en el capítulo anterior se traduce ahora en objetivos
 | **Relevante (R)** | El impacto es demostrable: mejora la extracción de texto en documentos académicos sin costes adicionales de infraestructura |
 | **Temporal (T)** | El plazo es un cuatrimestre, correspondiente al TFM |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).
 
 ## Objetivos específicos
 
@@ -41,7 +41,7 @@ La motivación presentada en el capítulo anterior se traduce ahora en objetivos
 
 ### Visión General
 
-La metodología se estructura en cinco fases secuenciales, cada una de las cuales produce resultados que alimentan la siguiente. Desde la preparación del dataset hasta la validación final, el proceso sigue un diseño experimental que permite reproducir y verificar cada paso.
+La metodología se estructura en cinco fases secuenciales, cada una de las cuales produce resultados que alimentan la siguiente. Desde la preparación del dataset hasta la validación final, el proceso sigue un diseño experimental. Esto permite reproducir y verificar cada paso.
 
 ```mermaid
 ---
@@ -118,7 +118,12 @@ flowchart LR
 
 #### Clase ImageTextDataset
 
-Se implementó una clase Python para cargar pares imagen-texto que retorna tuplas (PIL.Image, str) desde carpetas pareadas. La implementación completa está disponible en `src/ocr_benchmark_notebook.ipynb` (ver Anexo A).
+Se implementó una clase Python para cargar pares imagen-texto que retorna tuplas (PIL.Image, str) desde carpetas pareadas. La implementación se encuentra en:
+
+- [`src/prepare_dataset.ipynb`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/prepare_dataset.ipynb)
+- [`src/paddle_ocr/dataset_manager.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/dataset_manager.py)
+- [`src/easyocr_service/dataset_manager.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/dataset_manager.py)
+- [`src/doctr_service/dataset_manager.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/dataset_manager.py)
 
 ### Fase 2: Benchmark Comparativo
 
@@ -129,14 +134,18 @@ Se implementó una clase Python para cargar pares imagen-texto que retorna tupla
 | Modelo | Versión | Configuración |
 |--------|---------|---------------|
 | EasyOCR | - | Idiomas: ['es', 'en'] |
-| PaddleOCR | PP-OCRv5 | Modelos server_det + server_rec |
+| PaddleOCR | PP-OCRv5 | Modelos Mobile (limitación de VRAM) |
 | DocTR | - | db_resnet50 + sar_resnet31 |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).
 
 #### Métricas de Evaluación
 
-Se utilizó la biblioteca `jiwer` para calcular CER y WER comparando el texto de referencia con la predicción del modelo OCR. La implementación está disponible en `src/ocr_benchmark_notebook.ipynb` (ver Anexo A).
+Se utilizó la biblioteca `jiwer` para calcular CER y WER comparando el texto de referencia con la predicción del modelo OCR. La implementación se encuentra en:
+
+- [`src/paddle_ocr/paddle_ocr_tuning_rest.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/paddle_ocr_tuning_rest.py)
+- [`src/easyocr_service/easyocr_tuning_rest.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/easyocr_tuning_rest.py)
+- [`src/doctr_service/doctr_tuning_rest.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/doctr_tuning_rest.py)
 
 ### Fase 3: Espacio de Búsqueda
 
@@ -154,11 +163,11 @@ Se utilizó la biblioteca `jiwer` para calcular CER y WER comparando el texto de
 | `text_det_unclip_ratio` | Fijo | 0.0 | Coeficiente de expansión (fijado) |
 | `text_rec_score_thresh` | Continuo | [0.0, 0.7] | Umbral de confianza de reconocimiento |
 
-*Fuente: Elaboración propia.*
+**Fuente:** Elaboración propia.
 
 #### Configuración de Ray Tune
 
-El espacio de búsqueda se definió utilizando `tune.choice()` para parámetros booleanos y `tune.uniform()` para parámetros continuos, con OptunaSearch como algoritmo de optimización configurado para minimizar CER en 64 trials. La implementación completa está disponible en `src/raytune/raytune_ocr.py` (ver Anexo A).
+El espacio de búsqueda se definió utilizando `tune.choice()` para parámetros booleanos y `tune.uniform()` para parámetros continuos, con OptunaSearch como algoritmo de optimización configurado para minimizar CER en 64 trials. La implementación completa está disponible en [`src/raytune/raytune_ocr.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/raytune_ocr.py) (ver Anexo A).
 
 ### Fase 4: Ejecución de Optimización
 
@@ -168,7 +177,12 @@ Se implementó una arquitectura basada en contenedores Docker para aislar los se
 
 #### Ejecución con Docker Compose
 
-Los servicios se orquestan mediante Docker Compose (`src/docker-compose.tuning.*.yml`):
+Los servicios se orquestan mediante Docker Compose:
+
+- [`src/docker-compose.tuning.paddle.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml)
+- [`src/docker-compose.tuning.doctr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml)
+- [`src/docker-compose.tuning.easyocr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml)
+- [`src/docker-compose.tuning.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.yml)
 
 ```bash
 # Iniciar servicio OCR
@@ -181,18 +195,18 @@ docker compose -f docker-compose.tuning.doctr.yml run raytune --service doctr --
 docker compose -f docker-compose.tuning.doctr.yml down
 ```
 
-El servicio OCR expone una API REST que retorna métricas en formato JSON:
+El servicio OCR expone una API REST que retorna métricas en formato JSON. Ejemplo real de un trial con mejor CER:
 
 ```json
 {
-    "CER": 0.0149,
-    "WER": 0.0762,
-    "TIME": 15.8,
-    "PAGES": 5,
-    "TIME_PER_PAGE": 3.16
+    "CER": 0.007884,
+    "WER": 0.077848,
+    "TIME_PER_PAGE": 0.5895
 }
 ```
 
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
+
 ### Fase 5: Validación
 
 #### Protocolo de Validación
@@ -215,22 +229,22 @@ El servicio OCR expone una API REST que retorna métricas en formato JSON:
 | GPU | NVIDIA RTX 3060 Laptop (5.66 GB VRAM) |
 | Almacenamiento | SSD |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).
 
 #### Software
 
-**Tabla 17.** *Versiones de software utilizadas.*
+**Tabla 17.** *Software utilizado en el entorno de desarrollo.*
 
 | Componente | Versión |
 |------------|---------|
-| Sistema Operativo | Ubuntu 24.04.3 LTS |
-| Python | 3.12.3 |
-| PaddleOCR | 3.3.2 |
 | PaddlePaddle | 3.2.2 |
-| Ray | 2.52.1 |
+| PaddleOCR | 3.3.2 |
+| Ray Tune | 2.52.1 |
 | Optuna | 4.7.0 |
+| DocTR (python-doctr) | >= 0.8.0 |
+| EasyOCR | >= 1.7.0 |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`src/paddle_ocr/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/requirements.txt), [`src/raytune/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/requirements.txt), [`src/doctr_service/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/requirements.txt), [`src/easyocr_service/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/requirements.txt).
 
 #### Justificación de Ejecución Local vs Cloud
 
@@ -244,7 +258,7 @@ La decisión de ejecutar los experimentos en hardware local en lugar de utilizar
 | Google Colab Pro | T4/P100 | ~$1.30 | $10 + CU extras |
 | Google Colab Pro+ | T4/V100/A100 | ~$1.30 | $50 + CU extras |
 
-*Fuente: Elaboración propia a partir de precios públicos de AWS y Google Cloud (enero 2026).*
+**Fuente:** Precios públicos de AWS y Google Cloud. Ver Anexo A, sección de fuentes de precios cloud (enero 2026).
 
 Para las tareas específicas de este proyecto, los costos estimados en cloud serían:
 
@@ -252,11 +266,11 @@ Para las tareas específicas de este proyecto, los costos estimados en cloud ser
 
 | Tarea | Tiempo GPU | Costo AWS | Costo Colab Pro |
 |-------|------------|-----------|-----------------|
-| Ajuste hiperparámetros (64×3 trials) | ~3 horas | ~$1.58 | ~$3.90 |
+| Ajuste hiperparámetros (64x3 trials) | ~3 horas | ~$1.58 | ~$3.90 |
 | Evaluación completa (45 páginas) | ~5 min | ~$0.04 | ~$0.11 |
 | Desarrollo y depuración (20 horas/mes) | 20 horas | ~$10.52 | ~$26.00 |
 
-*Fuente: Elaboración propia.*
+**Fuente:** Elaboración propia a partir de precios públicos. Ver Anexo A, sección de fuentes de precios cloud (enero 2026).
 
 Las ventajas de la ejecución local incluyen:
 
@@ -266,7 +280,7 @@ Las ventajas de la ejecución local incluyen:
 4. **Almacenamiento local**: Dataset y resultados en disco sin costos de transferencia
 5. **Iteración rápida**: Reinicio inmediato de contenedores Docker para depuración
 
-Para un proyecto de investigación con múltiples iteraciones de ajuste de hiperparámetros, la ejecución local ahorra aproximadamente $50-100 mensuales comparado con servicios cloud, además de ofrecer mayor flexibilidad en la velocidad de iteración durante el desarrollo.
+Para un proyecto de investigación con múltiples iteraciones de ajuste de hiperparámetros, la ejecución local reduce costos frente a servicios cloud. Este análisis se detalla en [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).)
 
 ### Limitaciones Metodológicas
 
@@ -280,9 +294,8 @@ Para un proyecto de investigación con múltiples iteraciones de ajuste de hiper
 
 ## Síntesis del capítulo
 
-Los objetivos y la metodología definidos en este capítulo establecen el marco para la experimentación. El objetivo general —alcanzar un CER inferior al 2% mediante optimización de hiperparámetros— se descompone en cinco objetivos específicos que abarcan desde la comparativa inicial de soluciones hasta la validación final de la configuración optimizada.
+Los objetivos y la metodología definidos en este capítulo establecen el marco para la experimentación. El objetivo general, alcanzar un CER inferior al 2% mediante optimización de hiperparámetros, se descompone en cinco objetivos específicos que abarcan desde la comparativa inicial de soluciones hasta la validación final de la configuración optimizada.
 
-La metodología experimental en cinco fases garantiza un proceso sistemático y reproducible: preparación de un dataset de 45 páginas, benchmark comparativo de tres motores OCR, definición del espacio de búsqueda, ejecución de 64 trials con Ray Tune y Optuna, y validación de la configuración resultante. Las limitaciones metodológicas —tamaño del dataset, subconjunto de optimización reducido, texto de referencia automático— se reconocen explícitamente para contextualizar la interpretación de resultados.
+La metodología experimental en cinco fases garantiza un proceso sistemático y reproducible: preparación de un dataset de 45 páginas, benchmark comparativo de tres motores OCR, definición del espacio de búsqueda, ejecución de 64 trials con Ray Tune y Optuna, y validación de la configuración resultante. Las limitaciones metodológicas, como el tamaño del dataset, el subconjunto de optimización reducido y el texto de referencia automático, se reconocen explícitamente para contextualizar la interpretación de resultados.
 
 El capítulo siguiente pone en práctica esta metodología, presentando el desarrollo experimental completo con sus resultados y análisis.
-
diff --git a/docs/04_desarrollo_especifico.md b/docs/04_desarrollo_especifico.md
index 20e3a04..9bae2e3 100644
--- a/docs/04_desarrollo_especifico.md
+++ b/docs/04_desarrollo_especifico.md
@@ -1,18 +1,18 @@
 # Desarrollo específico de la contribución
 
-El presente capítulo constituye el núcleo técnico de este trabajo fin de máster. Siguiendo la estructura de "Comparativa de soluciones" establecida por las instrucciones de UNIR, se desarrollan tres fases interrelacionadas: el planteamiento y ejecución del benchmark comparativo, el proceso de optimización de hiperparámetros mediante Ray Tune, y finalmente el análisis e interpretación de los resultados obtenidos.
+El presente capítulo constituye el núcleo técnico de este trabajo fin de máster. Siguiendo la estructura de "Comparativa de soluciones" establecida por las instrucciones de UNIR, se desarrollan tres fases interrelacionadas. Estas fases son tres: planteamiento y ejecución del benchmark comparativo, optimización de hiperparámetros mediante Ray Tune, y análisis e interpretación de los resultados.
 
 ## Planteamiento de la comparativa
 
 ### Introducción
 
-Antes de abordar la optimización de hiperparámetros, era necesario seleccionar el motor OCR que serviría como base para la experimentación. Para ello, se realizó un estudio comparativo entre tres soluciones de código abierto representativas del estado del arte: EasyOCR, PaddleOCR y DocTR. Los experimentos, documentados en el notebook `ocr_benchmark_notebook.ipynb` del repositorio, permitieron identificar el modelo más prometedor para la fase de optimización posterior.
+Antes de abordar la optimización de hiperparámetros, era necesario seleccionar el motor OCR que serviría como base para la experimentación. Para ello, se realizó un estudio comparativo entre tres soluciones de código abierto representativas del estado del arte: EasyOCR, PaddleOCR y DocTR. Los experimentos, documentados en los informes de métricas y en los CSV de resultados del repositorio, permitieron identificar el modelo más prometedor para la fase de optimización posterior.
 
 ### Identificación del Problema
 
-El reconocimiento óptico de caracteres en documentos académicos en español presenta desafíos específicos que la literatura no ha abordado en profundidad. A diferencia de los benchmarks estándar en inglés, los documentos académicos hispanohablantes combinan características ortográficas propias —acentos, eñes, diéresis y signos de puntuación invertidos— con layouts estructuralmente complejos.
+El reconocimiento óptico de caracteres en documentos académicos en español presenta desafíos específicos que la literatura no ha abordado en profundidad. A diferencia de los benchmarks estándar en inglés, los documentos académicos hispanohablantes combinan características ortográficas propias, como acentos, eñes, diéresis y signos de puntuación invertidos, con una estructura sencilla basada en índice y encabezados.
 
-Los documentos académicos típicos incluyen texto corrido entremezclado con tablas, listas numeradas, encabezados multinivel y notas al pie, lo que complica significativamente la tarea de ordenación del texto reconocido. A esto se suma el uso de tipografía profesional con múltiples fuentes, tamaños y estilos (negrita, cursiva), que puede confundir a los modelos de reconocimiento. Aunque los PDFs digitales suelen tener alta calidad, pueden contener artefactos de compresión que degradan la legibilidad de caracteres pequeños o de bajo contraste.
+Los documentos académicos típicos incluyen texto corrido con índice, listas numeradas, encabezados multinivel y notas al pie, lo que complica la tarea de ordenación del texto reconocido. A esto se suma el uso de tipografía profesional con múltiples fuentes, tamaños y estilos (negrita, cursiva), que puede confundir a los modelos de reconocimiento. Aunque los PDFs digitales suelen tener alta calidad, pueden contener artefactos de compresión que degradan la legibilidad de caracteres pequeños o de bajo contraste.
 
 ### Alternativas Evaluadas
 
@@ -26,9 +26,9 @@ Se seleccionaron tres soluciones OCR de código abierto representativas del esta
 | PaddleOCR | Baidu | PP-OCRv5 | Estado del arte industrial |
 | DocTR | Mindee | Última estable | Orientación académica |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).
 
-**Imágenes Docker disponibles en el registro del proyecto:**
+Imágenes Docker disponibles en el registro del proyecto:
 - PaddleOCR: [`seryus.ddns.net/unir/paddle-ocr-gpu`](https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-gpu/latest), [`seryus.ddns.net/unir/paddle-ocr-cpu`](https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-cpu/latest)
 - EasyOCR: [`seryus.ddns.net/unir/easyocr-gpu`](https://seryus.ddns.net/unir/-/packages/container/easyocr-gpu/latest)
 - DocTR: [`seryus.ddns.net/unir/doctr-gpu`](https://seryus.ddns.net/unir/-/packages/container/doctr-gpu/latest)
@@ -47,7 +47,7 @@ Los criterios establecidos para evaluar las soluciones fueron:
 
 #### Dataset de Evaluación
 
-Se utilizó el documento "Instrucciones para la redacción y elaboración del TFE" del Máster Universitario en Inteligencia Artificial de UNIR, ubicado en la carpeta `instructions/`.
+Se utilizó el documento "Instrucciones para la redacción y elaboración del TFE" del Máster Universitario en Inteligencia Artificial de UNIR, ubicado en la carpeta [`instructions/`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/instructions/).
 
 **Tabla 21.** *Características del dataset de evaluación inicial.*
 
@@ -60,54 +60,56 @@ Se utilizó el documento "Instrucciones para la redacción y elaboración del TF
 | Resolución de conversión | 300 DPI |
 | Formato de imagen | PNG |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).
 
 #### Proceso de Conversión
 
-La conversión del PDF a imágenes se realizó mediante PyMuPDF (fitz) a 300 DPI, resolución estándar para OCR que proporciona suficiente detalle para caracteres pequeños sin generar archivos excesivamente grandes. La implementación está disponible en `src/ocr_benchmark_notebook.ipynb` (ver Anexo A).
+La conversión del PDF a imágenes se realizó mediante PyMuPDF (fitz) a 300 DPI, resolución estándar para OCR que proporciona suficiente detalle para caracteres pequeños sin generar archivos excesivamente grandes. La implementación está disponible en [`src/prepare_dataset.ipynb`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/prepare_dataset.ipynb).
 
 #### Extracción del Ground Truth
 
-El texto de referencia se extrajo directamente del PDF mediante PyMuPDF, preservando la estructura de líneas del documento original. Esta aproximación puede introducir errores en layouts muy complejos (tablas anidadas, texto en columnas). La implementación está disponible en `src/ocr_benchmark_notebook.ipynb` (ver Anexo A).
+El texto de referencia se extrajo directamente del PDF mediante PyMuPDF, preservando la estructura de líneas del documento original. Esta aproximación puede introducir errores en el orden de lectura cuando hay secciones con encabezados, listas o saltos de línea, por lo que se documenta junto al pipeline de preparación en [`src/prepare_dataset.ipynb`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/prepare_dataset.ipynb). Para la comparación entre motores, las salidas se guardan en `debugset/` al activar `save_output=True`, y el flujo de trabajo se describe en [`src/README.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/README.md) y en los README de cada servicio: [`src/paddle_ocr/README.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/README.md), [`src/easyocr_service/README.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/README.md), [`src/doctr_service/README.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/README.md).
 
 #### Configuración de los Modelos
 
-La configuración de cada modelo se detalla en `src/ocr_benchmark_notebook.ipynb` (ver Anexo A):
+La configuración de cada modelo se detalla en los README de cada servicio y sus ficheros de dependencias:
 
 - **EasyOCR**: Configurado con soporte para español e inglés, permitiendo reconocer palabras en ambos idiomas que puedan aparecer en documentos académicos (referencias, términos técnicos).
 
-- **PaddleOCR (PP-OCRv5)**: Se utilizaron los modelos "server" (PP-OCRv5_server_det y PP-OCRv5_server_rec) que ofrecen mayor precisión a costa de mayor tiempo de inferencia. La versión utilizada fue PaddleOCR 3.2.0.
+- **PaddleOCR (PP-OCRv5)**: Se utilizaron los modelos Mobile, adecuados para la VRAM disponible. Los modelos Server se probaron y produjeron OOM en este hardware. La versión utilizada fue PaddleOCR 3.3.2.
 
 - **DocTR**: Se seleccionaron las arquitecturas db_resnet50 para detección y sar_resnet31 para reconocimiento, representando una configuración de alta precisión.
 
+**Fuente:** [`src/paddle_ocr/README.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/README.md), [`src/easyocr_service/README.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/README.md), [`src/doctr_service/README.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/README.md), [`src/paddle_ocr/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/requirements.txt), [`src/easyocr_service/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/requirements.txt), [`src/doctr_service/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/requirements.txt).
+
 #### Métricas de Evaluación
 
-Se utilizó la biblioteca `jiwer` para calcular CER y WER de manera estandarizada. La normalización a minúsculas y eliminación de espacios extremos asegura una comparación justa que no penaliza diferencias de capitalización. La implementación está disponible en `src/ocr_benchmark_notebook.ipynb` (ver Anexo A).
+Se utilizó la biblioteca `jiwer` para calcular CER y WER de manera estandarizada. La normalización a minúsculas y eliminación de espacios extremos asegura una comparación justa que no penaliza diferencias de capitalización. La implementación está disponible en [`src/paddle_ocr/paddle_ocr_tuning_rest.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/paddle_ocr_tuning_rest.py), [`src/easyocr_service/easyocr_tuning_rest.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/easyocr_tuning_rest.py) y [`src/doctr_service/doctr_tuning_rest.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/doctr_tuning_rest.py).
 
 ### Resultados del Benchmark
 
 #### Resultados de PaddleOCR (Configuración Baseline)
 
-Durante el benchmark inicial se evaluó PaddleOCR con configuración por defecto en un subconjunto del dataset. Los resultados preliminares mostraron variabilidad significativa entre páginas, con CER entre 1.54% y 6.40% dependiendo de la complejidad del layout.
+Durante el benchmark inicial se evaluó PaddleOCR con configuración por defecto en un subconjunto del dataset. Los resultados preliminares mostraron variabilidad significativa entre páginas, en función de los cambios de formato y de la estructura del texto.
 
-**Tabla 22.** *Variabilidad del CER por tipo de contenido.*
+**Tabla 22.** *Variabilidad del error por tipo de contenido.*
 
-| Tipo de contenido | CER aproximado | Observaciones |
-|-------------------|----------------|---------------|
-| Texto corrido | ~1.5-2% | Mejor rendimiento |
-| Texto con listas | ~3-4% | Rendimiento medio |
-| Tablas | ~5-6% | Mayor dificultad |
-| Encabezados + notas | ~4-5% | Layouts mixtos |
+| Tipo de contenido | Nivel de error | Observaciones |
+|-------------------|---------------|---------------|
+| Texto corrido | Bajo | Mejor rendimiento |
+| Texto con listas | Medio | Rendimiento intermedio |
+| Índice y encabezados | Medio | Orden de lectura sensible |
+| Encabezados + notas | Medio | Variación tipográfica |
 
-*Fuente: Elaboración propia a partir del benchmark.*
+**Fuente:** Elaboración propia a partir del benchmark.
 
 **Observaciones del benchmark inicial:**
 
-1. Las páginas con tablas y layouts complejos presentaron mayor error debido a la dificultad de ordenar correctamente las líneas de texto.
+1. Las páginas con más cambios de formato y listados presentaron mayor error debido a la dificultad de ordenar correctamente las líneas de texto.
 
-2. La página con texto corrido continuo obtuvo el mejor resultado (CER ~1.5%), demostrando la capacidad del modelo para texto estándar.
+2. La página con texto corrido continuo obtuvo el mejor resultado, demostrando la capacidad del modelo para texto estándar.
 
-3. El promedio general se situó en CER ~5-6%, superando el umbral de aceptabilidad para documentos académicos pero con margen de mejora.
+3. El promedio general se situó en un rango medio de error, con margen de mejora.
 
 4. Los errores más frecuentes fueron: confusión de acentos, caracteres duplicados, y errores en signos de puntuación.
 
@@ -123,7 +125,7 @@ Los tres modelos evaluados representan diferentes paradigmas de OCR:
 | **PaddleOCR** | End-to-end (det + rec + cls) | DB + SVTR/CRNN | Soporte multilingüe robusto, pipeline configurable |
 | **DocTR** | End-to-end (det + rec) | DB/LinkNet + CRNN/SAR/ViTSTR | Orientado a investigación, API limpia |
 
-*Fuente: Documentación oficial de cada herramienta (JaidedAI, 2020; PaddlePaddle, 2024; Mindee, 2021).*
+**Fuente:** Documentación oficial de cada herramienta (JaidedAI, 2020; PaddlePaddle, 2024; Mindee, 2021).
 
 #### Análisis Cualitativo de Errores
 
@@ -156,17 +158,17 @@ Un análisis cualitativo de los errores producidos reveló patrones específicos
 
 La selección de PaddleOCR para la fase de optimización se basó en los siguientes criterios:
 
-**Tabla 24.** *Evaluación de criterios de selección.*
+**Tabla 24.** *Evaluación de criterios de selección (cualitativa).*
 
 | Criterio | EasyOCR | PaddleOCR | DocTR |
 |----------|---------|-----------|-------|
-| CER benchmark | ~6-8% | ~5-6% | ~7-9% |
-| Configurabilidad | Baja (3 params) | **Alta (>10 params)** | Media (5 params) |
+| CER benchmark | Medio | **Mejor** | Medio |
+| Configurabilidad | Baja | **Alta** | Media |
 | Soporte español | Sí | **Sí (dedicado)** | Limitado |
 | Documentación | Media | **Alta** | Alta |
 | Mantenimiento | Medio | **Alto** | Medio |
 
-*Fuente: Elaboración propia.*
+**Fuente:** Elaboración propia a partir del benchmark y la documentación de cada herramienta.
 
 #### Hiperparámetros Disponibles en PaddleOCR
 
@@ -191,8 +193,8 @@ Esta riqueza de configuración permite explorar sistemáticamente el espacio de
 
 **Se selecciona PaddleOCR (PP-OCRv5)** para la fase de optimización debido a:
 
-1. **Resultados iniciales prometedores**: CER ~5% en configuración por defecto, con potencial de mejora
-2. **Alta configurabilidad**: Más de 10 hiperparámetros ajustables en tiempo de inferencia
+1. **Resultados iniciales prometedores**: Rendimiento base competitivo con margen de mejora
+2. **Alta configurabilidad**: Múltiples hiperparámetros ajustables en tiempo de inferencia
 3. **Pipeline modular**: Permite aislar el impacto de cada componente
 4. **Soporte activo para español**: Modelos específicos y actualizaciones frecuentes
 5. **Documentación técnica**: Descripción detallada de cada parámetro
@@ -203,23 +205,21 @@ Esta riqueza de configuración permite explorar sistemáticamente el espacio de
 
 2. **Único tipo de documento**: Documentos académicos de UNIR únicamente. Otros tipos de documentos (facturas, formularios, contratos) podrían presentar resultados diferentes.
 
-3. **Ground truth automático**: El texto de referencia se extrajo programáticamente del PDF, lo cual puede introducir errores en layouts complejos donde el orden de lectura no es evidente.
+3. **Ground truth automático**: El texto de referencia se extrajo programáticamente del PDF, lo cual puede introducir errores en el orden de lectura cuando hay secciones con encabezados y saltos de línea.
 
-4. **Ejecución en CPU**: Todos los experimentos se realizaron en CPU, limitando la exploración de configuraciones que podrían beneficiarse de aceleración GPU.
+4. **Referencia CPU separada**: Los tiempos en CPU se midieron en un experimento independiente y solo se usan como comparación de rendimiento frente a GPU.
 
 ### Síntesis del Benchmark
 
-El benchmark comparativo ha permitido identificar PaddleOCR como la solución más prometedora para la fase de optimización, gracias a su combinación de rendimiento base aceptable (~5-6% CER), alta configurabilidad del pipeline y documentación técnica completa. Sin embargo, el análisis también reveló limitaciones importantes: el tamaño reducido del benchmark (5 páginas), la restricción a un único tipo de documento, y la extracción automática del ground truth que puede introducir errores en layouts complejos. Estas limitaciones se tendrán en cuenta al interpretar los resultados de la fase de optimización.
+El benchmark comparativo ha permitido identificar PaddleOCR como la solución más prometedora para la fase de optimización, gracias a su combinación de rendimiento base competitivo, alta configurabilidad del pipeline y documentación técnica completa. Sin embargo, el análisis también reveló limitaciones importantes: el tamaño reducido del benchmark (5 páginas), la restricción a un único tipo de documento, y la extracción automática del ground truth que puede introducir errores en el orden de lectura cuando hay secciones con encabezados y saltos de línea. Estas limitaciones se tendrán en cuenta al interpretar los resultados de la fase de optimización.
 
-**Fuentes de datos:** `ocr_benchmark_notebook.ipynb` y documentación oficial de PaddleOCR.
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md), [`src/results/*.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/*.csv), documentación oficial de PaddleOCR.
 
 ## Desarrollo de la comparativa: Optimización de hiperparámetros
 
 ### Introducción
 
-Una vez seleccionado PaddleOCR como motor base, el siguiente paso fue explorar sistemáticamente su espacio de configuración para identificar los hiperparámetros que maximizan el rendimiento en documentos académicos en español. Para ello se empleó Ray Tune con el algoritmo de búsqueda Optuna, una combinación que permite explorar eficientemente espacios de búsqueda mixtos (parámetros continuos y categóricos). Los experimentos se implementaron en [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py) con apoyo de la librería [`src/raytune_ocr.py`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/raytune_ocr.py), almacenándose los resultados en [`src/results/`](https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/results).
-
-Esta aproximación ofrece ventajas significativas frente al fine-tuning tradicional: no requiere datasets de entrenamiento etiquetados, no modifica los pesos del modelo preentrenado, y puede ejecutarse con hardware de consumo cuando se dispone de aceleración GPU.
+Una vez seleccionado PaddleOCR como motor base, el siguiente paso fue explorar sistemáticamente su espacio de configuración para identificar los hiperparámetros que maximizan el rendimiento en documentos académicos en español. Para ello se empleó Ray Tune con el algoritmo de búsqueda Optuna, una combinación que permite explorar eficientemente espacios de búsqueda mixtos (parámetros continuos y categóricos). Los experimentos se implementaron en [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/run_tuning.py) con apoyo de la librería [`src/raytune_ocr.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_ocr.py), almacenándose los resultados en [`src/results`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results). Esta aproximación ofrece ventajas significativas frente al fine-tuning tradicional: no requiere datasets de entrenamiento etiquetados, no modifica los pesos del modelo preentrenado, y puede ejecutarse con hardware de consumo cuando se dispone de aceleración GPU.
 
 ### Configuración del Experimento
 
@@ -241,7 +241,7 @@ El experimento se ejecutó en el siguiente entorno:
 | RAM | 16 GB DDR4 |
 | GPU | NVIDIA RTX 3060 Laptop (5.66 GB VRAM) |
 
-*Fuente: Configuración del entorno de ejecución. Resultados en `src/results/` generados por `src/run_tuning.py`.*
+**Fuente:** [`src/paddle_ocr/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/requirements.txt), [`src/raytune/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/requirements.txt), [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).
 
 #### Arquitectura de Ejecución
 
@@ -251,7 +251,7 @@ La arquitectura basada en contenedores Docker es fundamental para este proyecto
 - **Incompatibilidades CUDA/cuDNN**: Cada motor OCR requiere versiones específicas de CUDA y cuDNN que no pueden coexistir en un mismo entorno virtual
 - **Aislamiento de Ray Tune**: Ray Tune tiene sus propias dependencias que pueden entrar en conflicto con las librerías de inferencia OCR
 
-Esta arquitectura containerizada permite ejecutar cada componente en su entorno aislado óptimo, comunicándose via API REST:
+Esta arquitectura containerizada permite ejecutar cada componente en su entorno aislado óptimo, comunicándose vía API REST:
 
 ```mermaid
 ---
@@ -275,10 +275,10 @@ flowchart LR
     A -.->|"Health check /health"| B
 ```
 
-La arquitectura containerizada (`src/docker-compose.tuning.*.yml`) ofrece:
+La arquitectura containerizada [`src/docker-compose.tuning.paddle.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml), [`src/docker-compose.tuning.doctr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml), [`src/docker-compose.tuning.easyocr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml), [`src/docker-compose.tuning.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.yml) ofrece:
 1. Aislamiento de dependencias entre Ray Tune y los motores OCR
 2. Health checks automáticos para asegurar disponibilidad del servicio
-3. Comunicación via API REST (endpoints `/health` y `/evaluate`)
+3. Comunicación vía API REST (endpoints `/health` y `/evaluate`)
 4. Soporte para GPU mediante nvidia-docker
 
 ```bash
@@ -317,7 +317,7 @@ La infraestructura del proyecto se basa en contenedores Docker para garantizar r
 | [`seryus.ddns.net/unir/doctr-gpu`](https://seryus.ddns.net/unir/-/packages/container/doctr-gpu/latest) | DocTR con aceleración GPU | `nvidia/cuda:13.0.2-cudnn-runtime` | 8003 |
 | [`seryus.ddns.net/unir/raytune`](https://seryus.ddns.net/unir/-/packages/container/raytune/latest) | Orquestador Ray Tune | `python:3.12-slim` | - |
 
-*Fuente: Elaboración propia. Dockerfiles disponibles en [`src/paddle_ocr/`](https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/paddle_ocr), [`src/easyocr_service/`](https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/easyocr_service), [`src/doctr_service/`](https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/doctr_service), [`src/raytune/`](https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/raytune).*
+**Fuente:** Elaboración propia. Dockerfiles disponibles en [`src/paddle_ocr`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr), [`src/easyocr_service`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service), [`src/doctr_service`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service), [`src/raytune`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune).
 
 ##### Arquitectura de Microservicios
 
@@ -390,7 +390,7 @@ flowchart LR
 
 **Ventajas de esta estrategia:**
 1. **Caché de dependencias**: La etapa base (CUDA + dependencias) se cachea y reutiliza
-2. **Builds rápidos**: Los cambios de código solo reconstruyen la etapa de deploy (~10 segundos)
+2. **Builds rápidos**: Los cambios de código solo reconstruyen la etapa de deploy
 3. **Imágenes optimizadas**: Solo se incluyen los archivos necesarios para ejecución
 
 ##### Docker Compose Files
@@ -401,12 +401,12 @@ El proyecto incluye múltiples archivos Docker Compose para diferentes escenario
 
 | Archivo | Propósito | Servicios |
 |---------|-----------|-----------|
-| [`docker-compose.tuning.yml`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/docker-compose.tuning.yml) | Optimización principal | RayTune + PaddleOCR + DocTR |
-| [`docker-compose.tuning.easyocr.yml`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/docker-compose.tuning.easyocr.yml) | Optimización EasyOCR | RayTune + EasyOCR |
-| [`docker-compose.tuning.paddle.yml`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/docker-compose.tuning.paddle.yml) | Optimización PaddleOCR | RayTune + PaddleOCR |
-| [`docker-compose.tuning.doctr.yml`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/docker-compose.tuning.doctr.yml) | Optimización DocTR | RayTune + DocTR |
+| [`src/docker-compose.tuning.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.yml)| Optimización principal | RayTune + PaddleOCR + DocTR |
+| [`src/docker-compose.tuning.easyocr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml)| Optimización EasyOCR | RayTune + EasyOCR |
+| [`src/docker-compose.tuning.paddle.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml)| Optimización PaddleOCR | RayTune + PaddleOCR |
+| [`src/docker-compose.tuning.doctr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml)| Optimización DocTR | RayTune + DocTR |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`src/docker-compose.tuning.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.yml), [`src/docker-compose.tuning.easyocr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml), [`src/docker-compose.tuning.paddle.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml), [`src/docker-compose.tuning.doctr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml).
 
 > **Nota:** EasyOCR y PaddleOCR utilizan el mismo puerto (8002). Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez durante los experimentos. Por esta razón, EasyOCR tiene su propio archivo Docker Compose separado.
 
@@ -418,11 +418,11 @@ Se utilizan volúmenes Docker nombrados para persistir los modelos descargados e
 
 | Volumen | Servicio | Contenido |
 |---------|----------|-----------|
-| `paddlex-model-cache` | PaddleOCR | Modelos PP-OCRv5 (~500 MB) |
-| `easyocr-model-cache` | EasyOCR | Modelos CRAFT + CRNN (~400 MB) |
-| `doctr-model-cache` | DocTR | Modelos db_resnet50 + crnn_vgg16_bn (~300 MB) |
+| `paddlex-model-cache` | PaddleOCR | Modelos PP-OCRv5 |
+| `easyocr-model-cache` | EasyOCR | Modelos CRAFT + CRNN |
+| `doctr-model-cache` | DocTR | Modelos db_resnet50 + crnn_vgg16_bn |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`src/docker-compose.tuning.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.yml), [`src/docker-compose.tuning.easyocr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml), [`src/docker-compose.tuning.paddle.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml), [`src/docker-compose.tuning.doctr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml).
 
 ##### Health Checks y Monitorización
 
@@ -442,6 +442,8 @@ Los tiempos de `start_period` varían según el servicio debido al tiempo de car
 - **EasyOCR**: 120 segundos (carga de modelos CRAFT)
 - **DocTR**: 180 segundos (modelos ResNet más pesados)
 
+**Fuente:** [`src/docker-compose.tuning.paddle.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml), [`src/docker-compose.tuning.easyocr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml), [`src/docker-compose.tuning.doctr.yml`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml).
+
 ##### Flujo de Ejecución Completo
 
 ```mermaid
@@ -509,9 +511,10 @@ docker compose -f docker-compose.tuning.paddle.yml down
 ```
 
 Los resultados de los experimentos están disponibles en:
-- [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv)
-- [`src/results/raytune_easyocr_results_20260119_120204.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_easyocr_results_20260119_120204.csv)
-- [`src/results/raytune_doctr_results_20260119_121445.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_doctr_results_20260119_121445.csv)
+- [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv)
+- [`src/results/raytune_easyocr_results_20260119_120204.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_easyocr_results_20260119_120204.csv)
+- [`src/results/raytune_doctr_results_20260119_121445.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_doctr_results_20260119_121445.csv)
+- [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv)
 
 #### Dataset Extendido
 
@@ -521,19 +524,19 @@ Para la fase de optimización se extendió el dataset:
 
 | Característica | Valor |
 |----------------|-------|
-| Páginas totales | 24 |
+| Páginas del dataset completo | 45 |
 | Páginas por trial | 5 (páginas 5-10) |
 | Estructura | Carpetas `img/` y `txt/` pareadas |
 | Resolución | 300 DPI |
 | Formato imagen | PNG |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md), [`src/prepare_dataset.ipynb`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/prepare_dataset.ipynb).
 
-La clase `ImageTextDataset` gestiona la carga de pares imagen-texto desde la estructura de carpetas pareadas. La implementación está disponible en el repositorio (ver Anexo A).
+La clase `ImageTextDataset` gestiona la carga de pares imagen-texto desde la estructura de carpetas pareadas. La implementación está disponible en [`src/paddle_ocr/dataset_manager.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/dataset_manager.py), [`src/easyocr_service/dataset_manager.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/dataset_manager.py) y [`src/doctr_service/dataset_manager.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/dataset_manager.py).
 
 #### Espacio de Búsqueda
 
-El espacio de búsqueda se definió considerando los hiperparámetros más relevantes identificados en la documentación de PaddleOCR, utilizando `tune.choice()` para parámetros booleanos y `tune.uniform()` para umbrales continuos. La implementación está disponible en `src/raytune/raytune_ocr.py` (ver Anexo A).
+El espacio de búsqueda se definió considerando los hiperparámetros más relevantes identificados en la documentación de PaddleOCR, utilizando `tune.choice()` para parámetros booleanos y `tune.uniform()` para umbrales continuos. La implementación está disponible en [`src/raytune/raytune_ocr.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/raytune_ocr.py) (ver Anexo A).
 
 **Tabla 30.** *Descripción detallada del espacio de búsqueda.*
 
@@ -547,7 +550,7 @@ El espacio de búsqueda se definió considerando los hiperparámetros más relev
 | `text_det_unclip_ratio` | Fijo | 0.0 | Coeficiente de expansión (no explorado) |
 | `text_rec_score_thresh` | Continuo | [0.0, 0.7] | Umbral de confianza de reconocimiento |
 
-*Fuente: Documentación de PaddleOCR.*
+**Fuente:** Documentación de PaddleOCR.
 
 **Justificación del espacio:**
 
@@ -559,7 +562,7 @@ El espacio de búsqueda se definió considerando los hiperparámetros más relev
 
 #### Configuración de Ray Tune
 
-Se configuró Ray Tune con OptunaSearch como algoritmo de búsqueda, optimizando CER en 64 trials con 2 ejecuciones concurrentes. La implementación está disponible en `src/raytune/raytune_ocr.py` (ver Anexo A).
+Se configuró Ray Tune con OptunaSearch como algoritmo de búsqueda, optimizando CER en 64 trials con 2 ejecuciones concurrentes. La implementación está disponible en [`src/raytune/raytune_ocr.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/raytune_ocr.py) (ver Anexo A).
 
 **Tabla 31.** *Parámetros de configuración de Ray Tune.*
 
@@ -571,15 +574,11 @@ Se configuró Ray Tune con OptunaSearch como algoritmo de búsqueda, optimizando
 | Número de trials | 64 | Balance entre exploración y tiempo |
 | Trials concurrentes | 2 | Limitado por memoria disponible |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`src/raytune/raytune_ocr.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/raytune_ocr.py).
 
-**Elección de 64 trials:**
+Elección de 64 trials:
 
-El número de trials se eligió considerando:
-- Espacio de búsqueda de 7 dimensiones (3 booleanas + 4 continuas)
-- Tiempo estimado por trial: ~6 minutos
-- Tiempo total objetivo: <8 horas
-- Regla empírica: 10× dimensiones = 70 trials mínimo recomendado
+El número de trials se eligió buscando un equilibrio entre exploración del espacio de búsqueda y tiempo total de ejecución.
 
 ### Resultados de la Optimización
 
@@ -587,21 +586,21 @@ El número de trials se eligió considerando:
 
 El experimento se ejecutó exitosamente con los siguientes resultados globales:
 
-**Tabla 32.** *Resumen de la ejecución del experimento.*
+**Tabla 32.** *Resumen de la ejecución del experimento (referencia CPU).*
 
 | Métrica | Valor |
 |---------|-------|
 | Trials completados | 64/64 |
 | Trials fallidos | 0 |
-| Tiempo total | ~6.4 horas |
-| Tiempo medio por trial | 367.72 segundos |
-| Páginas procesadas | 320 (64 trials × 5 páginas) |
+| Tiempo total (CPU) | 6.2 horas |
+| Tiempo medio por trial (CPU) | 347.6 segundos |
+| Páginas procesadas | 320 (64 trials x 5 páginas) |
 
-*Fuente: Logs de Ray Tune.*
+**Fuente:** [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv).
 
 #### Estadísticas Descriptivas
 
-Del archivo CSV de resultados (`src/results/raytune_paddle_results_20260119_122609.csv`):
+Del archivo CSV de resultados [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv):
 
 **Tabla 33.** *Estadísticas descriptivas de los 64 trials.*
 
@@ -614,9 +613,9 @@ Del archivo CSV de resultados (`src/results/raytune_paddle_results_20260119_1226
 | **50%** (mediana) | 0.87% | 8.39% | 0.59 |
 | **max** | 7.30% | 13.20% | 2.22 |
 
-*Fuente: `src/results/raytune_paddle_results_20260119_122609.csv`.*
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
-**Observaciones:**
+Observaciones:
 
 1. **Baja varianza en CER**: La desviación estándar (2.20%) es similar a la media (2.30%), indicando una distribución relativamente consistente sin valores extremos catastróficos.
 
@@ -635,7 +634,9 @@ Del archivo CSV de resultados (`src/results/raytune_paddle_results_20260119_1226
 | 5% - 10% | 11 | 17.2% |
 | > 10% | 0 | 0.0% |
 
-*Fuente: Elaboración propia a partir de `src/results/raytune_paddle_results_20260119_122609.csv`.*
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
+
+**Figura 15.** *Distribución de trials por rango de CER.*
 
 ```mermaid
 ---
@@ -655,6 +656,8 @@ pie showData
     "CER 5-10%" : 11
 ```
 
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
+
 La mayoría de trials (67.2%) alcanzaron CER < 2%, cumpliendo el objetivo establecido. Ningún trial presentó fallos catastróficos (CER > 10%), demostrando la estabilidad de la optimización con GPU.
 
 #### Mejor Configuración Encontrada
@@ -687,32 +690,41 @@ Configuración óptima:
 | text_det_unclip_ratio | 0.0 | 1.5 | -1.5 (fijado) |
 | text_rec_score_thresh | **0.5658** | 0.5 | +0.066 |
 
-*Fuente: Análisis de [`src/results/`](https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/results) generados por [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py).*
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
 #### Análisis de Correlación
 
-Se calculó la correlación de Pearson entre los parámetros continuos y las métricas de error:
+Se calculó la correlación de Pearson entre los parámetros de configuración (codificados como 0/1 en el caso de booleanos) y las métricas de error:
 
 **Tabla 36.** *Correlación de parámetros con CER.*
 
 | Parámetro | Correlación con CER | Interpretación |
 |-----------|---------------------|----------------|
-| `text_det_thresh` | **-0.523** | Correlación moderada negativa |
-| `text_det_box_thresh` | +0.226 | Correlación débil positiva |
-| `text_rec_score_thresh` | -0.161 | Correlación débil negativa |
+| `use_doc_unwarping` | **+0.879** | Correlación alta positiva |
+| `use_doc_orientation_classify` | -0.712 | Correlación alta negativa |
+| `textline_orientation` | -0.535 | Correlación moderada negativa |
+| `text_det_thresh` | +0.428 | Correlación moderada positiva |
+| `text_det_box_thresh` | +0.311 | Correlación moderada positiva |
+| `text_rec_score_thresh` | -0.268 | Correlación moderada negativa |
 | `text_det_unclip_ratio` | NaN | Varianza cero (valor fijo) |
 
-*Fuente: Análisis de [`src/results/`](https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/results) generados por [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py).*
+**Fuente:** [`src/results/correlations/paddle_correlations.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv).
 
 **Tabla 37.** *Correlación de parámetros con WER.*
 
 | Parámetro | Correlación con WER | Interpretación |
 |-----------|---------------------|----------------|
-| `text_det_thresh` | **-0.521** | Correlación moderada negativa |
-| `text_det_box_thresh` | +0.227 | Correlación débil positiva |
-| `text_rec_score_thresh` | -0.173 | Correlación débil negativa |
+| `use_doc_unwarping` | **+0.744** | Correlación alta positiva |
+| `use_doc_orientation_classify` | -0.602 | Correlación alta negativa |
+| `textline_orientation` | -0.591 | Correlación moderada negativa |
+| `text_det_thresh` | +0.399 | Correlación moderada positiva |
+| `text_det_box_thresh` | +0.256 | Correlación moderada positiva |
+| `text_rec_score_thresh` | -0.080 | Correlación débil negativa |
+| `text_det_unclip_ratio` | NaN | Varianza cero (valor fijo) |
 
-*Fuente: Análisis de [`src/results/`](https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/results) generados por [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py).*
+**Fuente:** [`src/results/correlations/paddle_correlations.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv).
+
+**Figura 16.** *Correlación de hiperparámetros con CER.*
 
 ```mermaid
 ---
@@ -727,15 +739,17 @@ config:
   xyChart:
     plotColorPalette: "#0098CD"
 ---
-xychart-beta
-    x-axis ["text_det_thresh", "text_det_box_thresh", "text_rec_score_thresh"]
-    y-axis "Correlación con CER" -0.6 --> 0.3
-    bar [-0.523, 0.226, -0.161]
+xychart-beta horizontal
+    y-axis "Correlación con CER" -0.8 --> 0.9
+    x-axis ["unwarp", "orient_doc", "orient_line", "det_thresh", "box_thresh", "rec_score"]
+    bar [0.879, -0.712, -0.535, 0.428, 0.311, -0.268]
 ```
 
-*Leyenda: Valores negativos indican que aumentar el parámetro reduce el CER. El parámetro `text_det_thresh` tiene la correlación más fuerte (-0.52).*
+**Fuente:** [`src/results/correlations/paddle_correlations.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv).
 
-**Hallazgo clave**: El parámetro `text_det_thresh` muestra la correlación más fuerte (-0.52 con ambas métricas), indicando que valores más altos de este umbral tienden a reducir el error. Este umbral controla qué píxeles se consideran "texto" en el mapa de probabilidad del detector.
+Leyenda: Valores positivos indican que aumentar el parámetro incrementa el CER. Los parámetros booleanos se codifican como 0/1 para el cálculo de la correlación. Abreviaturas: unwarp = `use_doc_unwarping`, orient_doc = `use_doc_orientation_classify`, orient_line = `textline_orientation`, det_thresh = `text_det_thresh`, box_thresh = `text_det_box_thresh`, rec_score = `text_rec_score_thresh`.
+
+**Hallazgo clave**: `use_doc_unwarping` presenta la correlación positiva más alta con CER (0.879), lo que indica que activar este módulo incrementa el error en este dataset. En cambio, `use_doc_orientation_classify` y `textline_orientation` tienen correlación negativa, asociada a mejoras cuando están activados.
 
 #### Impacto del Parámetro textline_orientation
 
@@ -745,18 +759,20 @@ El parámetro booleano `textline_orientation` demostró tener el mayor impacto e
 
 | textline_orientation | CER Medio | CER Std | WER Medio | N trials |
 |---------------------|-----------|---------|-----------|----------|
-| True | 3.76% | 7.12% | 12.73% | 32 |
-| False | 12.40% | 14.93% | 21.71% | 32 |
+| True | 1.74% | 1.94% | 8.75% | 52 |
+| False | 4.73% | 1.37% | 11.42% | 12 |
 
-*Fuente: Análisis de [`src/results/`](https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/results) generados por [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py).*
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
-**Interpretación:**
+Interpretación:
 
-1. **Reducción del CER**: Con `textline_orientation=True`, el CER medio es 3.3 veces menor (3.76% vs 12.40%).
+1. **Reducción del CER**: Con `textline_orientation=True`, el CER medio es 2.7 veces menor (1.74% vs 4.73%).
 
-2. **Menor varianza**: La desviación estándar también se reduce significativamente (7.12% vs 14.93%), indicando resultados más consistentes.
+2. **Varianza**: La desviación estándar es mayor cuando `textline_orientation=True` (1.94% vs 1.37%), aunque los valores medios siguen siendo mejores.
 
-3. **Reducción del CER**: 69.7% cuando se habilita la clasificación de orientación de línea.
+3. **Reducción del CER**: 63.2% cuando se habilita la clasificación de orientación de línea.
+
+**Figura 17.** *Impacto de textline_orientation en CER.*
 
 ```mermaid
 ---
@@ -774,37 +790,31 @@ config:
 xychart-beta
     x-axis ["textline_orientation=False", "textline_orientation=True"]
     y-axis "CER (%)" 0 --> 15
-    bar [12.40, 3.76]
+    bar [4.73, 1.74]
 ```
 
-**Explicación técnica:**
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
-El parámetro `textline_orientation` activa un clasificador que determina la orientación de cada línea de texto detectada. Para documentos con layouts mixtos (tablas, encabezados laterales, direcciones postales), este clasificador asegura que el texto se lea en el orden correcto, evitando la mezcla de líneas de diferentes columnas o secciones.
+Explicación técnica:
 
-#### Análisis de Fallos Catastróficos
+El parámetro `textline_orientation` activa un clasificador que determina la orientación de cada línea de texto detectada. Para documentos con índice, encabezados y listas, este clasificador asegura que el texto se lea en el orden correcto, evitando la mezcla de líneas de diferentes secciones.
 
-Los trials con CER muy alto (>20%) presentaron patrones específicos:
+#### Análisis de Trials con Mayor CER
 
-**Tabla 39.** *Características de trials con fallos catastróficos.*
+No se observaron fallos catastróficos (CER > 10%). El CER máximo fue 7.30%, por lo que el análisis se centra en los trials con peor desempeño relativo:
 
-| Trial | CER | text_det_thresh | textline_orientation | Diagnóstico |
-|-------|-----|-----------------|---------------------|-------------|
-| #47 | 51.61% | 0.017 | True | Umbral muy bajo |
-| #23 | 43.29% | 0.042 | False | Umbral bajo + sin orientación |
-| #12 | 38.76% | 0.089 | False | Umbral bajo + sin orientación |
-| #56 | 35.12% | 0.023 | False | Umbral muy bajo + sin orientación |
+**Tabla 39.** *Trials con mayor CER.*
 
-*Fuente: Análisis del CSV de resultados.*
+| Trial ID | CER | text_det_thresh | textline_orientation |
+|----------|-----|-----------------|---------------------|
+| f699b826 | 7.30% | 0.285 | False |
+| 34bfaecf | 7.29% | 0.030 | True |
+| 8c1998de | 6.44% | 0.369 | True |
+| 8b33e2a2 | 6.41% | 0.664 | False |
 
-**Diagnóstico:**
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
-1. **Umbral de detección muy bajo** (`text_det_thresh` < 0.1): Genera exceso de falsos positivos en la detección, incluyendo artefactos, manchas y ruido como "texto".
-
-2. **Desactivación de orientación**: Sin el clasificador de orientación, las líneas de texto pueden mezclarse incorrectamente, especialmente en tablas.
-
-3. **Combinación fatal**: La peor combinación es umbral bajo + sin orientación, que produce textos completamente desordenados y con inserciones de ruido.
-
-**Recomendación**: Evitar `text_det_thresh` < 0.1 en cualquier configuración.
+Observación: Los peores resultados muestran variabilidad tanto en `text_det_thresh` como en `textline_orientation`, sin un patrón único dominante en este subconjunto de trials.
 
 ### Comparación Baseline vs Optimizado
 
@@ -819,7 +829,7 @@ La configuración óptima identificada se evaluó sobre el dataset completo de 4
 | PaddleOCR (Baseline) | 8.85% | 91.15% | 13.05% | 86.95% |
 | PaddleOCR-HyperAdjust | **7.72%** | **92.28%** | **11.40%** | **88.60%** |
 
-*Fuente: Validación final. Código en [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py), resultados en [`src/results/`](https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/results).*
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md).
 
 > **Nota sobre generalización:** El mejor trial individual (5 páginas) alcanzó un CER de 0.79%, cumpliendo el objetivo de CER < 2%. Sin embargo, al aplicar la configuración al dataset completo de 45 páginas, el CER aumentó a 7.72%, evidenciando sobreajuste al subconjunto de entrenamiento. Esta diferencia es un hallazgo importante que se discute en la sección de análisis.
 
@@ -833,10 +843,12 @@ La configuración óptima identificada se evaluó sobre el dataset completo de 4
 | Valor optimizado | 7.72% | 11.40% |
 | Mejora absoluta | -1.13 pp | -1.65 pp |
 | Reducción relativa del error | **12.8%** | **12.6%** |
-| Factor de mejora | 1.15× | 1.14× |
+| Factor de mejora | 1.15x | 1.14x |
 | **Mejor trial (5 páginas)** | **0.79%** | **7.78%** |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md).
+
+**Figura 18.** *Reducción de errores: baseline vs optimizado (45 páginas).*
 
 ```mermaid
 ---
@@ -857,24 +869,13 @@ xychart-beta
     bar [8.85, 7.72, 13.05, 11.40]
 ```
 
-*Leyenda: CER = Character Error Rate, WER = Word Error Rate. Baseline = configuración por defecto de PaddleOCR. Optimizado = configuración encontrada por Ray Tune. Los valores corresponden al dataset completo de 45 páginas.*
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md).
+
+Leyenda: CER = Character Error Rate, WER = Word Error Rate. Baseline = configuración por defecto de PaddleOCR. Optimizado = configuración encontrada por Ray Tune. Los valores corresponden al dataset completo de 45 páginas.
 
 #### Impacto Práctico
 
-**En un documento típico de 10,000 caracteres:**
-
-| Configuración | Caracteres con error | Palabras con error* |
-|---------------|---------------------|---------------------|
-| Baseline | ~885 | ~196 |
-| Optimizada (full dataset) | ~772 | ~171 |
-| Optimizada (mejor trial) | ~79 | ~117 |
-| **Reducción (full dataset)** | **113 menos** | **25 menos** |
-
-*Asumiendo longitud media de palabra = 6.6 caracteres en español.
-
-**Interpretación:**
-
-> "La optimización de hiperparámetros logró una mejora del 12.8% en el CER sobre el dataset completo de 45 páginas. Aunque esta mejora es más modesta que la observada en los trials individuales (donde se alcanzó 0.79% CER), demuestra el valor de la optimización sistemática. La diferencia entre el mejor trial (0.79%) y el resultado en dataset completo (7.72%) revela un fenómeno de sobreajuste al subconjunto de 5 páginas usado para evaluación."
+La reducción de CER y WER implica menos correcciones manuales en el texto reconocido. En conjunto, los resultados muestran una mejora medible en precisión, aunque la generalización depende del tamaño y representatividad del subconjunto de optimización.
 
 ### Tiempo de Ejecución
 
@@ -882,27 +883,27 @@ xychart-beta
 
 | Métrica | Valor |
 |---------|-------|
-| Tiempo total del experimento | ~1.5 horas |
-| Tiempo medio por trial | ~4.2 segundos |
+| Tiempo total del experimento | ~5.0 minutos |
+| Tiempo medio por trial | 4.64 segundos |
 | Tiempo medio por página | 0.84 segundos |
 | Variabilidad (std) | 0.53 segundos/página |
 | Páginas procesadas totales | 320 |
 
-*Fuente: [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv).*
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
-**Observaciones:**
+Observaciones:
 
 1. El tiempo por página (~0.84 segundos) corresponde a ejecución con GPU (RTX 3060).
 2. La variabilidad del tiempo es moderada (std = 0.53 s/página), con algunos trials más lentos debido a configuraciones con módulos de preprocesamiento activos.
-3. En comparación, la ejecución en CPU requiere ~69 segundos/página (82× más lento), lo que justifica el uso de GPU para optimización y producción.
+3. En comparación, la ejecución en CPU requiere ~69 segundos/página (82x más lento), lo que justifica el uso de GPU para optimización y producción.
 
 ### Síntesis de la Optimización
 
-Los 64 trials ejecutados con Ray Tune y aceleración GPU revelaron patrones claros en el comportamiento de PaddleOCR. El hallazgo más significativo es que los parámetros estructurales —`textline_orientation` y `use_doc_orientation_classify`— tienen mayor impacto que los umbrales numéricos: activarlos reduce el CER medio de 12.40% a 3.76%. En cuanto a umbrales, valores bajos de `text_det_thresh` (~0.05) benefician el rendimiento, mientras que `use_doc_unwarping` resulta innecesario para PDFs digitales.
+Los 64 trials ejecutados con Ray Tune y aceleración GPU revelaron patrones claros en el comportamiento de PaddleOCR. El hallazgo más significativo es que los parámetros estructurales, `textline_orientation` y `use_doc_orientation_classify`, tienen mayor impacto que los umbrales numéricos. Al activarlos se reduce el CER medio de 4.73% a 1.74%. En cuanto a umbrales, valores bajos de `text_det_thresh` (aprox. 0.05) benefician el rendimiento, mientras que `use_doc_unwarping` resulta innecesario para PDFs digitales.
 
 El mejor trial alcanzó un CER de 0.79%, cumpliendo el objetivo de CER < 2%. No obstante, la validación sobre el dataset completo de 45 páginas arrojó un CER de 7.72%, evidenciando sobreajuste al subconjunto de optimización de 5 páginas. Aun así, esto representa una mejora del 12.8% respecto al baseline (8.85%), demostrando el valor de la optimización sistemática incluso cuando la generalización es imperfecta.
 
-**Fuentes de datos:** [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py), [`src/raytune_ocr.py`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/raytune_ocr.py), [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv).
+**Fuente:** [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/run_tuning.py), [`src/raytune_ocr.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_ocr.py), [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
 ## Discusión y análisis de resultados
 
@@ -916,13 +917,15 @@ Los resultados obtenidos en las secciones anteriores requieren un análisis que
 
 **Tabla 43.** *Evolución del rendimiento a través del estudio.*
 
-| Fase | Configuración | CER | Mejora vs anterior |
+| Fase | Configuración | CER | Mejora vs baseline |
 |------|--------------|-----|-------------------|
-| Benchmark inicial | Baseline (5 páginas) | ~7-8% | - |
-| Optimización (mejor trial) | Optimizada (5 páginas) | **0.79%** | ~90% vs baseline |
-| Validación final | Optimizada (45 páginas) | 7.72% | 12.8% vs baseline |
+| Benchmark inicial | Baseline (5 páginas) | 7.76% | - |
+| Optimización (mejor trial) | Optimizada (5 páginas) | **0.79%** | 89.8% |
+| Validación final | Optimizada (45 páginas) | 7.72% | 12.8% |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md).
+
+**Figura 19.** *Evolución del CER a través del estudio.*
 
 ```mermaid
 ---
@@ -940,12 +943,14 @@ config:
 xychart-beta
     x-axis ["Baseline", "Mejor trial (5 pág)", "Validación (45 pág)"]
     y-axis "CER (%)" 0 --> 10
-    bar [8.85, 0.79, 7.72]
+    bar [7.76, 0.79, 7.72]
 ```
 
-*Leyenda: El mejor trial alcanza CER 0.79% (objetivo cumplido). La validación sobre dataset completo muestra CER 7.72%, evidenciando sobreajuste al subconjunto de optimización.*
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md).
 
-El incremento del CER de 0.79% (5 páginas) a 7.72% (45 páginas) evidencia sobreajuste al subconjunto de optimización. Este fenómeno es esperado cuando se optimiza sobre un subconjunto pequeño y se valida sobre el dataset completo con mayor diversidad de layouts.
+Leyenda: El mejor trial alcanza CER 0.79% (objetivo cumplido). La validación sobre dataset completo muestra CER 7.72%, evidenciando sobreajuste al subconjunto de optimización.
+
+El incremento del CER de 0.79% (5 páginas) a 7.72% (45 páginas) evidencia sobreajuste al subconjunto de optimización. Este fenómeno es esperado cuando se optimiza sobre un subconjunto pequeño y se valida sobre el dataset completo con mayor diversidad de secciones y estilos.
 
 #### Comparación con Objetivo
 
@@ -958,7 +963,7 @@ El incremento del CER de 0.79% (5 páginas) a 7.72% (45 páginas) evidencia sobr
 | Método | Sin fine-tuning | Solo hiperparámetros | Solo hiperparámetros | ✓ |
 | Hardware | GPU | RTX 3060 | RTX 3060 | ✓ |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md).
 
 > **Análisis del cumplimiento:** El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%), demostrando que la optimización de hiperparámetros puede alcanzar la precisión objetivo. Sin embargo, la validación sobre el dataset completo (7.72%) muestra que la generalización requiere trabajo adicional, como un subconjunto de optimización más representativo o técnicas de regularización.
 
@@ -970,16 +975,18 @@ Basándose en el análisis de los resultados de optimización:
 
 **Tabla 45.** *Ranking de importancia de hiperparámetros.*
 
-| Rank | Parámetro | Impacto | Evidencia |
-|------|-----------|---------|-----------|
-| 1 | `textline_orientation` | **Crítico** | Presente en todos los mejores trials |
-| 2 | `use_doc_orientation_classify` | **Alto** | Activado en configuración óptima |
-| 3 | `text_det_thresh` | **Alto** | Valor óptimo bajo (0.0462) |
-| 4 | `text_det_box_thresh` | Medio | Moderado (0.4862) |
-| 5 | `text_rec_score_thresh` | Medio | Moderado (0.5658) |
-| 6 | `use_doc_unwarping` | Nulo | Desactivado en configuración óptima |
+| Rank | Parámetro | Pearson (CER) | Signo | Evidencia |
+|------|-----------|---------------|-------|-----------|
+| 1 | `use_doc_unwarping` | 0.879 | Positivo | Correlación más alta con CER |
+| 2 | `use_doc_orientation_classify` | -0.712 | Negativo | Correlación alta con CER |
+| 3 | `textline_orientation` | -0.535 | Negativo | Correlación alta con CER |
+| 4 | `text_det_thresh` | 0.428 | Positivo | Correlación moderada con CER |
+| 5 | `text_det_box_thresh` | 0.311 | Positivo | Correlación moderada con CER |
+| 6 | `text_rec_score_thresh` | -0.268 | Negativo | Correlación moderada con CER |
 
-*Fuente: Elaboración propia basada en [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv).*
+**Fuente:** [`src/results/correlations/paddle_correlations.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv).
+
+**Figura 21.** *Ranking de importancia de hiperparámetros.*
 
 ```mermaid
 ---
@@ -995,24 +1002,28 @@ config:
     plotColorPalette: "#0098CD"
 ---
 xychart-beta horizontal
-    x-axis ["use_doc_unwarping", "text_rec_score_thresh", "text_det_box_thresh", "text_det_thresh", "use_doc_orientation", "textline_orientation"]
+    x-axis ["use_doc_unwarping", "use_doc_orientation_classify", "textline_orientation", "text_det_thresh", "text_det_box_thresh", "text_rec_score_thresh"]
     y-axis "Impacto relativo" 0 --> 100
-    bar [0, 30, 40, 70, 80, 100]
+    bar [100.0, 81.0, 60.8, 48.7, 35.4, 30.5]
 ```
 
-*Leyenda: Impacto relativo estimado basado en análisis de correlación y presencia en configuraciones óptimas. `textline_orientation` es el parámetro más crítico.*
+**Fuente:** [`src/results/correlations/paddle_correlations.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv).
+
+Leyenda: Impacto relativo basado en |Pearson| (CER), normalizado respecto al valor máximo.
+
+En términos de correlación lineal, `use_doc_unwarping` es el parámetro con mayor relación absoluta con el CER y su signo positivo indica que activarlo incrementa el error en este dataset. En cambio, `use_doc_orientation_classify` y `textline_orientation` presentan correlación negativa, lo que sugiere mejoras cuando están activados.
 
 #### Análisis del Parámetro textline_orientation
 
 **Por qué es tan importante:**
 
-El clasificador de orientación de línea resuelve un problema fundamental en documentos con layouts complejos: determinar el orden correcto de lectura. Sin este clasificador:
+El clasificador de orientación de línea resuelve un problema fundamental en documentos con secciones y cambios de formato: determinar el orden correcto de lectura. Sin este clasificador:
 
-1. Las líneas de una tabla pueden mezclarse con texto adyacente
-2. Los encabezados laterales pueden insertarse en posiciones incorrectas
-3. El texto en columnas puede leerse en orden incorrecto
+1. Las líneas del índice pueden mezclarse con el cuerpo del texto
+2. Los encabezados pueden insertarse en posiciones incorrectas
+3. Las listas numeradas pueden leerse en orden incorrecto
 
-Para documentos académicos que típicamente incluyen tablas, listas y encabezados multinivel, este clasificador es esencial.
+Para documentos académicos que típicamente incluyen índice, listas y encabezados multinivel, este clasificador es esencial.
 
 **Recomendación**: Siempre activar `textline_orientation=True` para documentos estructurados.
 
@@ -1020,20 +1031,7 @@ Para documentos académicos que típicamente incluyen tablas, listas y encabezad
 
 **Comportamiento observado:**
 
-| Rango | CER típico | Comportamiento |
-|-------|------------|----------------|
-| 0.0 - 0.1 | 1-3% | Detecta más texto, incluyendo bordes |
-| 0.1 - 0.3 | 2-5% | Rendimiento variable |
-| 0.3 - 0.5 | 3-7% | Balance precisión/recall |
-| 0.5 - 0.7 | 4-7% | Más conservador |
-
-**Interpretación:**
-
-- En ejecución GPU con modelos Mobile, valores bajos de `text_det_thresh` funcionan bien
-- El valor óptimo (0.0462) indica que una detección más sensible beneficia el rendimiento
-- A diferencia de CPU, no se observaron fallos catastróficos con valores bajos
-
-**Valor óptimo encontrado**: 0.0462
+El análisis de correlación muestra que valores más bajos de `text_det_thresh` favorecen el rendimiento en este dataset. El valor óptimo encontrado en los trials fue 0.0462, lo que sugiere que una detección más sensible beneficia el resultado.
 
 #### Análisis de Parámetros de Preprocesamiento
 
@@ -1064,22 +1062,22 @@ Para documentos PDF digitales como los evaluados, este módulo es innecesario y
 | Pérdida de eñe | Baja | año → ano | Modelo de reconocimiento |
 | Texto desordenado | Variable | Mezcla de líneas | Fallo de orientación |
 
-*Fuente: Análisis cualitativo.*
+**Fuente:** Análisis cualitativo.
 
 #### Patrones de Fallo por Tipo de Contenido
 
-**Tabla 47.** *Tasa de error por tipo de contenido.*
+**Tabla 47.** *Tasa de error por tipo de contenido (cualitativa).*
 
-| Tipo de contenido | CER estimado | Factor de riesgo |
-|-------------------|--------------|------------------|
-| Párrafos de texto | ~1% | Bajo |
-| Listas numeradas | ~2% | Medio |
-| Tablas simples | ~3% | Medio |
-| Encabezados + pie de página | ~2% | Medio |
-| Tablas complejas | ~5% | Alto |
-| Texto en columnas | ~4% | Alto |
+| Tipo de contenido | Nivel de error | Factor de riesgo |
+|-------------------|----------------|------------------|
+| Párrafos de texto | Bajo | Bajo |
+| Listas numeradas | Medio | Medio |
+| Índice y encabezados | Medio | Medio |
+| Encabezados + pie de página | Medio | Medio |
+| Texto con cambios tipográficos | Medio | Medio |
+| Listas con numeración densa | Alto | Alto |
 
-*Fuente: Estimación cualitativa.*
+**Fuente:** Estimación cualitativa.
 
 ### Comparación con Objetivos Específicos
 
@@ -1093,7 +1091,7 @@ Para documentos PDF digitales como los evaluados, este módulo es innecesario y
 | OE4 | Optimizar con Ray Tune (≥50 trials) | 64 trials ejecutados con GPU | ✓ Cumplido |
 | OE5 | Validar configuración optimizada | CER: 8.85% → 7.72% (dataset), 0.79% (mejor trial) | ✓ Parcial |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md), [`src/results/correlations/paddle_correlations.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv), [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
 > **Nota sobre OE5:** El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%). La validación sobre el dataset completo (7.72%) muestra que la generalización requiere mayor trabajo, identificándose como línea de trabajo futuro.
 
@@ -1109,7 +1107,7 @@ Para documentos PDF digitales como los evaluados, este módulo es innecesario y
 
 #### Limitaciones Metodológicas
 
-1. **Ground truth automático**: El texto de referencia se extrajo programáticamente del PDF, lo cual puede introducir errores en layouts complejos donde el orden de lectura no es evidente.
+1. **Ground truth automático**: El texto de referencia se extrajo programáticamente del PDF, lo cual puede introducir errores en el orden de lectura cuando hay secciones con encabezados y saltos de línea.
 
 2. **Tamaño del dataset**: 45 páginas es un dataset limitado. Un dataset más amplio proporcionaría estimaciones más robustas.
 
@@ -1133,20 +1131,20 @@ Para documentos académicos en español similares a los evaluados:
 
 | Parámetro | Valor | Prioridad | Justificación |
 |-----------|-------|-----------|---------------|
-| `textline_orientation` | True | Obligatorio | Crítico para layouts complejos |
+| `textline_orientation` | True | Obligatorio | Crítico para documentos con secciones |
 | `use_doc_orientation_classify` | True | Recomendado | Mejora orientación de documento |
 | `text_det_thresh` | 0.05 (rango: 0.04-0.10) | Recomendado | Detección sensible beneficia resultados |
 | `text_det_box_thresh` | 0.49 (rango: 0.4-0.6) | Recomendado | Balance de confianza |
 | `text_rec_score_thresh` | 0.57 (rango: 0.5-0.7) | Opcional | Filtra reconocimientos poco confiables |
 | `use_doc_unwarping` | False | No recomendado | Innecesario para PDFs digitales |
 
-*Fuente: Análisis de [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv).*
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
 #### Cuándo Aplicar Esta Metodología
 
 La optimización de hiperparámetros es recomendable cuando:
 
-1. **GPU disponible**: Acelera significativamente la exploración del espacio de hiperparámetros (82× más rápido que CPU).
+1. **GPU disponible**: Acelera significativamente la exploración del espacio de hiperparámetros (82x más rápido que CPU).
 
 2. **Modelo preentrenado adecuado**: El modelo ya soporta el idioma objetivo (como PaddleOCR para español).
 
@@ -1166,7 +1164,7 @@ La optimización de hiperparámetros puede ser insuficiente cuando:
 
 3. **Documentos muy degradados**: Escaneos de baja calidad o documentos históricos.
 
-4. **Requisitos de CER < 0.5%**: Puede requerir fine-tuning para alcanzar precisiones muy altas.
+4. **Requisitos de CER muy bajo**: Puede requerir fine-tuning para alcanzar precisiones muy altas.
 
 ### Síntesis del Capítulo
 
@@ -1174,18 +1172,24 @@ A lo largo de este capítulo se ha desarrollado el proceso completo de evaluaci
 
 Los resultados cuantifican tanto los logros como las limitaciones del enfoque. El mejor trial individual alcanzó un CER de 0.79%, cumpliendo holgadamente el objetivo de CER < 2%. Sin embargo, la validación sobre el dataset completo de 45 páginas reveló un CER de 7.72%, lo que representa una mejora del 12.8% respecto al baseline (8.85%) pero evidencia sobreajuste al subconjunto de optimización. Esta observación es valiosa: indica que futuros trabajos deberían emplear subconjuntos de optimización más representativos o aplicar técnicas de regularización.
 
-Desde el punto de vista práctico, la infraestructura dockerizada desarrollada y la aceleración GPU (82× más rápida que CPU) demuestran la viabilidad de esta metodología tanto para experimentación como para despliegue en producción.
+Desde el punto de vista práctico, la infraestructura dockerizada desarrollada y la aceleración GPU (82x más rápida que CPU) demuestran la viabilidad de esta metodología tanto para experimentación como para despliegue en producción.
 
-**Fuentes de datos:**
-- [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py): Script principal de optimización
-- [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv): Resultados CSV de PaddleOCR
-- [`src/results/raytune_easyocr_results_20260119_120204.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_easyocr_results_20260119_120204.csv): Resultados CSV de EasyOCR
-- [`src/results/raytune_doctr_results_20260119_121445.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_doctr_results_20260119_121445.csv): Resultados CSV de DocTR
+**Fuente:**
+- [`src/run_tuning.py`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/run_tuning.py) - Script principal de optimización
+- [`src/raytune/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/requirements.txt) - Dependencias del orquestador Ray Tune
+- [`src/paddle_ocr/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/requirements.txt) - Dependencias del servicio PaddleOCR
+- [`src/easyocr_service/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/requirements.txt) - Dependencias del servicio EasyOCR
+- [`src/doctr_service/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/requirements.txt) - Dependencias del servicio DocTR
+- [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv) - Resultados CSV de PaddleOCR
+- [`src/results/correlations/paddle_correlations.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv) - Correlaciones de hiperparámetros (PaddleOCR)
+- [`src/results/raytune_easyocr_results_20260119_120204.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_easyocr_results_20260119_120204.csv) - Resultados CSV de EasyOCR
+- [`src/results/raytune_doctr_results_20260119_121445.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_doctr_results_20260119_121445.csv) - Resultados CSV de DocTR
+- [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv) - Referencia de tiempos en CPU para PaddleOCR
 
-**Imágenes Docker:**
-- [`seryus.ddns.net/unir/paddle-ocr-gpu`](https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-gpu/latest): PaddleOCR con soporte GPU
-- [`seryus.ddns.net/unir/easyocr-gpu`](https://seryus.ddns.net/unir/-/packages/container/easyocr-gpu/latest): EasyOCR con soporte GPU
-- [`seryus.ddns.net/unir/doctr-gpu`](https://seryus.ddns.net/unir/-/packages/container/doctr-gpu/latest): DocTR con soporte GPU
+Imágenes Docker:
+- [`seryus.ddns.net/unir/paddle-ocr-gpu`](https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-gpu/latest) - PaddleOCR con soporte GPU
+- [`seryus.ddns.net/unir/easyocr-gpu`](https://seryus.ddns.net/unir/-/packages/container/easyocr-gpu/latest) - EasyOCR con soporte GPU
+- [`seryus.ddns.net/unir/doctr-gpu`](https://seryus.ddns.net/unir/-/packages/container/doctr-gpu/latest) - DocTR con soporte GPU
 
 ### Comparativa de Rendimiento CPU vs GPU
 
@@ -1203,13 +1207,15 @@ Esta sección presenta la comparación de rendimiento entre ejecución en CPU y
 | Sistema Operativo | Ubuntu 24.04.3 LTS |
 | Kernel | 6.14.0-37-generic |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).
+
+Nota: Los requisitos de entorno documentados por dependencias se detallan en [`docs/07_anexo_a.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/07_anexo_a.md), sección A.9.
 
 Este hardware representa configuración típica de desarrollo, permitiendo evaluar el rendimiento en condiciones realistas de despliegue.
 
 #### Comparación CPU vs GPU
 
-Se comparó el tiempo de procesamiento entre CPU y GPU utilizando los datos de [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/raytune_paddle_subproc_results_20251207_192320.csv) (CPU) y [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv) (GPU).
+Se comparó el tiempo de procesamiento entre CPU y GPU utilizando los datos de [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv)(CPU) y [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv)(GPU).
 
 **Tabla 51.** *Rendimiento comparativo CPU vs GPU.*
 
@@ -1217,9 +1223,11 @@ Se comparó el tiempo de procesamiento entre CPU y GPU utilizando los datos de [
 |---------|-----|----------------|----------------------|
 | Tiempo/Página (promedio) | 69.4s | 0.84s | **82x** |
 | Dataset completo (45 páginas) | ~52 min | ~38 seg | **82x** |
-| 64 trials × 5 páginas | ~6.4 horas | ~1.5 horas | **4.3x** |
+| 64 trials x 5 páginas | 6.2 horas | ~5.0 min | **75x** |
 
-*Fuente: Elaboración propia a partir de [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/raytune_paddle_subproc_results_20251207_192320.csv) y [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv).*
+**Fuente:** [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv), [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
+
+**Figura 20.** *Tiempo de procesamiento: CPU vs GPU (segundos/página).*
 
 ```mermaid
 ---
@@ -1240,11 +1248,13 @@ xychart-beta
     bar [69.4, 0.84]
 ```
 
-*Leyenda: Aceleración de **82×** con GPU. El procesamiento de una página pasa de 69.4s (CPU) a 0.84s (GPU).*
+**Fuente:** [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv), [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
-La aceleración de 82× obtenida con GPU transforma la viabilidad del enfoque:
-- **Optimización en CPU (6.4 horas)**: Viable pero lento para iteraciones rápidas
-- **Optimización en GPU (1.5 horas)**: Permite explorar más configuraciones y realizar múltiples experimentos
+Leyenda: Aceleración de **82x** con GPU. El procesamiento de una página pasa de 69.4s (CPU) a 0.84s (GPU).
+
+La aceleración de 82x obtenida con GPU transforma la viabilidad del enfoque:
+- **Optimización en CPU (6.2 horas)**: Viable pero lento para iteraciones rápidas
+- **Optimización en GPU (~5.0 minutos)**: Permite explorar más configuraciones y realizar múltiples experimentos
 - **Producción con GPU (0.84s/página)**: Habilita procesamiento en tiempo real
 
 #### Comparación de Modelos PaddleOCR
@@ -1258,20 +1268,8 @@ PaddleOCR ofrece dos variantes de modelos: Mobile (optimizados para dispositivos
 | PP-OCRv5 Mobile | 0.06 GB | Funciona correctamente | ✓ Recomendado |
 | PP-OCRv5 Server | 5.3 GB | OOM en página 2 | ✗ Requiere >8 GB VRAM |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).
 
 Los modelos Server, a pesar de ofrecer potencialmente mayor precisión, resultan inviables en hardware con VRAM limitada (≤6 GB) debido a errores de memoria (Out of Memory). Los modelos Mobile, con un consumo de memoria 88 veces menor, funcionan de manera estable y ofrecen rendimiento suficiente para el caso de uso evaluado.
 
-#### Conclusiones de la Validación GPU
-
-La validación con aceleración GPU permite extraer las siguientes conclusiones:
-
-1. **Aceleración significativa**: La GPU proporciona una aceleración de 82× sobre CPU, haciendo viable el procesamiento en tiempo real para aplicaciones interactivas.
-
-2. **Modelos Mobile recomendados**: Para hardware con VRAM limitada (≤6 GB), los modelos Mobile de PP-OCRv5 ofrecen el mejor balance entre precisión y recursos, funcionando de manera estable sin errores de memoria.
-
-3. **Viabilidad práctica**: Con GPU, el procesamiento de un documento completo (45 páginas) toma menos de 30 segundos, validando la aplicabilidad en entornos de producción donde el tiempo de respuesta es crítico.
-
-4. **Escalabilidad**: La arquitectura de microservicios dockerizados utilizada para la validación GPU facilita el despliegue horizontal, permitiendo escalar el procesamiento según demanda.
-
-Esta validación demuestra que la configuración optimizada mediante Ray Tune mejora la precisión (CER: 8.85% → 7.72% en dataset completo, 0.79% en mejor trial individual) y, combinada con aceleración GPU, resulta prácticamente aplicable en escenarios de producción real.
+La validación con aceleración GPU demuestra que la configuración optimizada mediante Ray Tune mejora la precisión (CER: 8.85% → 7.72% en dataset completo, 0.79% en mejor trial individual) y, combinada con la aceleración de 82x proporcionada por GPU, resulta prácticamente aplicable en escenarios de producción real. Las conclusiones derivadas de esta validación se presentan en el Capítulo 5.
diff --git a/docs/05_conclusiones_trabajo_futuro.md b/docs/05_conclusiones_trabajo_futuro.md
index f9fd544..db84e65 100644
--- a/docs/05_conclusiones_trabajo_futuro.md
+++ b/docs/05_conclusiones_trabajo_futuro.md
@@ -16,35 +16,45 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
 |---------|----------|-------------|------------------|--------------|
 | CER | < 2% | **0.79%** | **7.72%** | ✓ Parcial |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md).
 
 > **Nota:** El objetivo de CER < 2% se cumple en el mejor trial individual (0.79%, 5 páginas). La validación sobre el conjunto de datos completo (45 páginas) muestra un CER de 7.72%, evidenciando sobreajuste al subconjunto de optimización. Esta diferencia se analiza en detalle en el Capítulo 4.
 
 ### Cumplimiento de los Objetivos Específicos
 
-La evaluación comparativa de soluciones OCR (OE1) reveló diferencias significativas entre las tres alternativas analizadas. De las tres soluciones de código abierto evaluadas —EasyOCR, PaddleOCR (PP-OCRv5) y DocTR—, PaddleOCR demostró el mejor rendimiento base para documentos en español. Además, su arquitectura modular y la amplia configurabilidad de su pipeline lo convierten en el candidato idóneo para optimización mediante ajuste de hiperparámetros.
+La evaluación comparativa de soluciones OCR (OE1) reveló diferencias significativas entre las tres alternativas analizadas. De las tres soluciones de código abierto evaluadas, EasyOCR, PaddleOCR (PP-OCRv5) y DocTR, PaddleOCR demostró el mejor rendimiento base para documentos en español. Además, su arquitectura modular y la amplia configurabilidad de su pipeline lo convierten en el candidato idóneo para optimización mediante ajuste de hiperparámetros.
 
-En cuanto a la preparación del conjunto de datos (OE2), se construyó un corpus estructurado con 45 páginas de documentos académicos de UNIR. La implementación de la clase `ImageTextDataset` permite cargar de forma eficiente pares imagen-texto, mientras que el texto de referencia se extrajo automáticamente del PDF original mediante PyMuPDF, garantizando así la consistencia entre las imágenes y sus transcripciones esperadas.
+En cuanto a la preparación del conjunto de datos (OE2), se construyó un corpus estructurado con 45 páginas de documentos académicos de UNIR. La implementación de la clase `ImageTextDataset` permite cargar de forma eficiente pares imagen-texto. El texto de referencia se extrajo automáticamente del PDF original mediante PyMuPDF, garantizando así la consistencia entre las imágenes y sus transcripciones esperadas.
 
-El análisis de hiperparámetros (OE3) arrojó resultados particularmente reveladores. El parámetro `textline_orientation` emergió como el factor más influyente, resultando crítico para obtener buenos resultados en documentos con diseños complejos. Asimismo, `use_doc_orientation_classify` demostró un impacto positivo en la configuración con GPU. Por otra parte, el umbral `text_det_thresh` presenta una correlación negativa moderada (-0.52) con el CER, lo que indica que valores más bajos tienden a mejorar el rendimiento, aunque con un límite inferior por debajo del cual el sistema falla catastróficamente. Cabe destacar que `use_doc_unwarping` no aporta mejora alguna en documentos digitales, ya que estos no presentan las deformaciones físicas para las que fue diseñado este módulo.
+El análisis de hiperparámetros (OE3) arrojó resultados particularmente reveladores. El parámetro `textline_orientation` emergió como el factor más influyente, resultando crítico para obtener buenos resultados en documentos con diseños complejos. Asimismo, `use_doc_orientation_classify` demostró un impacto positivo en la configuración con GPU. Por otra parte, el umbral `text_det_thresh` presenta una correlación positiva moderada (0.43) con el CER, lo que indica que valores más bajos tienden a mejorar el rendimiento. Cabe destacar que `use_doc_unwarping` no aporta mejora alguna en documentos digitales, ya que estos no presentan las deformaciones físicas para las que fue diseñado este módulo.
 
-La experimentación con Ray Tune (OE4) se completó satisfactoriamente mediante 64 trials ejecutados con el algoritmo OptunaSearch y aceleración GPU. El tiempo total del experimento —aproximadamente 1.5 horas con una GPU RTX 3060— demuestra la viabilidad práctica de esta aproximación. La arquitectura basada en contenedores Docker resultó esencial para superar las incompatibilidades entre Ray y los motores OCR, al tiempo que garantiza la portabilidad y reproducibilidad de los experimentos.
+**Fuente:** [`src/results/correlations/paddle_correlations.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv).
+
+La experimentación con Ray Tune (OE4) se completó satisfactoriamente mediante 64 trials ejecutados con el algoritmo OptunaSearch y aceleración GPU. El tiempo total del experimento, en torno a 5 minutos con una GPU RTX 3060, demuestra la viabilidad práctica de esta aproximación. La arquitectura basada en contenedores Docker resultó esencial para superar las incompatibilidades entre Ray y los motores OCR, al tiempo que garantiza la portabilidad y reproducibilidad de los experimentos.
 
 Finalmente, la validación de la configuración óptima (OE5) se realizó sobre el conjunto de datos completo de 45 páginas. El mejor trial individual alcanzó un CER de 0.79%, equivalente a una precisión del 99.21%. Sin embargo, la evaluación sobre el conjunto de datos completo arrojó un CER de 7.72%, lo que representa una mejora del 12.8% respecto al baseline (8.85%), pero queda lejos del resultado del mejor trial. Esta diferencia revela un sobreajuste al subconjunto de optimización de 5 páginas, un fenómeno que se analiza en detalle en la sección de limitaciones.
 
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md).
+
 ### Hallazgos Clave
 
-El hallazgo más significativo de este trabajo es que las decisiones arquitectónicas tienen mayor impacto que los umbrales numéricos. Un único parámetro booleano —`textline_orientation`— influye más en el rendimiento final que todos los umbrales continuos combinados. Este resultado sugiere que, al optimizar sistemas OCR, conviene priorizar la exploración de configuraciones estructurales antes de ajustar finamente los valores numéricos.
+El hallazgo más significativo de este trabajo es que las decisiones arquitectónicas tienen mayor impacto que los umbrales numéricos. Un único parámetro booleano, `textline_orientation`, influye más en el rendimiento final que todos los umbrales continuos combinados. Este resultado sugiere que, al optimizar sistemas OCR, conviene priorizar la exploración de configuraciones estructurales antes de ajustar finamente los valores numéricos.
 
-No obstante, los umbrales presentan límites operativos que deben respetarse. Valores de `text_det_thresh` inferiores a 0.1 provocan fallos catastróficos, con tasas de error que superan el 40%. Este comportamiento indica la existencia de regiones del espacio de hiperparámetros que deben evitarse, lo cual tiene implicaciones para el diseño de espacios de búsqueda en futuros experimentos.
+No obstante, los umbrales presentan límites operativos que deben respetarse. En este estudio no se observaron fallos catastróficos (CER > 10%), pero los peores trials alcanzaron CER de hasta 7.30%, lo que indica que ciertas combinaciones de umbrales degradan el rendimiento. Este comportamiento sugiere la necesidad de acotar el espacio de búsqueda en futuros experimentos.
 
-Otro hallazgo relevante es la innecesariedad de ciertos módulos para documentos digitales. Los PDF generados directamente desde procesadores de texto no presentan las deformaciones físicas —arrugas, curvaturas, rotaciones— para las que fueron diseñados los módulos de corrección. En estos casos, desactivar `use_doc_unwarping` no solo simplifica el pipeline, sino que puede mejorar el rendimiento al evitar procesamientos innecesarios.
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
+
+Otro hallazgo relevante es la innecesariedad de ciertos módulos para documentos digitales. Los PDF generados directamente desde procesadores de texto no presentan deformaciones físicas, como arrugas, curvaturas o rotaciones, para las que fueron diseñados los módulos de corrección. En estos casos, desactivar `use_doc_unwarping` no solo simplifica el pipeline, sino que puede mejorar el rendimiento al evitar procesamientos innecesarios.
 
 Finalmente, los resultados demuestran que es posible mejorar modelos preentrenados mediante ajuste exclusivo de hiperparámetros de inferencia, sin necesidad de reentrenamiento. Sin embargo, esta aproximación requiere validación cuidadosa, ya que las configuraciones optimizadas sobre subconjuntos pequeños pueden no generalizar a conjuntos de datos más amplios o diversos.
 
+Respecto a la validación con aceleración GPU, la GPU proporciona una aceleración de 82x sobre CPU, haciendo viable el procesamiento en tiempo real para aplicaciones interactivas. Con GPU, el procesamiento de un documento completo (45 páginas) toma aproximadamente 38 segundos, validando la aplicabilidad en entornos de producción donde el tiempo de respuesta es crítico. Para hardware con VRAM limitada (≤6 GB), los modelos Mobile de PP-OCRv5 ofrecen el mejor balance entre precisión y recursos, funcionando de manera estable sin errores de memoria, mientras que los modelos Server resultan inviables debido a errores Out of Memory. Además, la arquitectura de microservicios dockerizados utilizada facilita el despliegue horizontal, permitiendo escalar el procesamiento según demanda.
+
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).
+
 ### Contribuciones del Trabajo
 
-La principal contribución de este trabajo es una metodología reproducible para la optimización de hiperparámetros OCR. El proceso completo —desde la preparación del conjunto de datos hasta la validación de la configuración óptima— queda documentado y es replicable mediante las herramientas Ray Tune y Optuna.
+La principal contribución de este trabajo es una metodología reproducible para la optimización de hiperparámetros OCR. El proceso completo, desde la preparación del conjunto de datos hasta la validación de la configuración óptima, queda documentado y es replicable mediante las herramientas Ray Tune y Optuna.
 
 En segundo lugar, el análisis sistemático de los hiperparámetros de PaddleOCR constituye una contribución al conocimiento disponible sobre este motor OCR. Mediante el cálculo de correlaciones y análisis comparativo, se cuantifica el impacto de cada parámetro configurable, información que puede orientar futuros trabajos de optimización.
 
@@ -54,13 +64,15 @@ Por último, todo el código fuente, las imágenes Docker y los datos experiment
 
 ### Limitaciones del Trabajo
 
-Es necesario reconocer varias limitaciones que condicionan el alcance de las conclusiones presentadas. En primer lugar, todos los experimentos se realizaron sobre un único tipo de documento: textos académicos de UNIR. La generalización a otros formatos —facturas, formularios, documentos manuscritos— requeriría validación adicional con conjuntos de datos específicos.
+Es necesario reconocer varias limitaciones que condicionan el alcance de las conclusiones presentadas. En primer lugar, todos los experimentos se realizaron sobre un único tipo de documento, textos académicos de UNIR. La generalización a otros formatos, como facturas, formularios o documentos manuscritos, requeriría validación adicional con conjuntos de datos específicos.
 
 El tamaño del corpus constituye otra limitación relevante. Con 45 páginas, el conjunto de datos es modesto para extraer conclusiones estadísticamente robustas. Además, el subconjunto de optimización de tan solo 5 páginas resultó insuficiente para evitar el sobreajuste, como evidencia la brecha entre el CER del mejor trial (0.79%) y el resultado sobre el conjunto completo (7.72%).
 
 Desde el punto de vista metodológico, la extracción automática del texto de referencia mediante PyMuPDF puede introducir errores en documentos con diseños complejos, donde el orden de lectura no es evidente. Asimismo, el parámetro `text_det_unclip_ratio` permaneció fijo en 0.0 durante todo el experimento, dejando inexplorada una dimensión potencialmente relevante del espacio de hiperparámetros.
 
-Por último, aunque la GPU RTX 3060 utilizada proporcionó una aceleración de 82× respecto a la ejecución en CPU, se trata de hardware de consumo. Equipamiento empresarial con mayor capacidad de VRAM permitiría ejecutar múltiples servicios OCR simultáneamente y explorar espacios de búsqueda más amplios en menos tiempo.
+Por último, aunque la GPU RTX 3060 utilizada proporcionó una aceleración de 82x respecto a la ejecución en CPU, se trata de hardware de consumo. Equipamiento empresarial con mayor capacidad de VRAM permitiría ejecutar múltiples servicios OCR simultáneamente y explorar espacios de búsqueda más amplios en menos tiempo.
+
+**Fuente:** [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv), [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
 ## Líneas de trabajo futuro
 
@@ -68,7 +80,7 @@ Por último, aunque la GPU RTX 3060 utilizada proporcionó una aceleración de 8
 
 Las limitaciones identificadas sugieren varias extensiones que podrían abordarse a corto plazo. La más urgente es la validación cruzada de la configuración óptima en otros tipos de documentos en español, como facturas, formularios administrativos o textos manuscritos. Esta validación revelaría el grado de transferibilidad de los hallazgos actuales.
 
-Para abordar el problema del sobreajuste, futuros experimentos deberían utilizar un subconjunto de optimización más amplio. Un conjunto de 15-20 páginas representativas reduciría la varianza y mejoraría la generalización de las configuraciones encontradas. Complementariamente, sería conveniente construir un corpus más amplio y diverso de documentos en español, incluyendo diferentes tipografías, diseños y calidades de imagen.
+Para abordar el problema del sobreajuste, futuros experimentos deberían utilizar un subconjunto de optimización más amplio. Un conjunto más representativo reduciría la varianza y mejoraría la generalización de las configuraciones encontradas. Complementariamente, sería conveniente construir un corpus más amplio y diverso de documentos en español, incluyendo diferentes tipografías, diseños y calidades de imagen.
 
 Desde el punto de vista técnico, queda pendiente la exploración del parámetro `text_det_unclip_ratio`, que permaneció fijo en este trabajo. Incluirlo en el espacio de búsqueda podría revelar interacciones con otros parámetros actualmente desconocidas.
 
@@ -94,7 +106,6 @@ En síntesis, este trabajo ha demostrado que la optimización de hiperparámetro
 
 La metodología propuesta cumple los requisitos de reproducibilidad científica: los experimentos pueden replicarse, los resultados son cuantificables y las conclusiones son aplicables a escenarios reales de procesamiento documental. Sin embargo, la experiencia también ha puesto de manifiesto la importancia de diseñar cuidadosamente los experimentos de optimización. Aunque el objetivo de CER inferior al 2% se alcanzó en el mejor trial individual (0.79%), la validación sobre el conjunto de datos completo (7.72%) revela que el tamaño y representatividad del subconjunto de optimización son factores críticos que no deben subestimarse.
 
-La infraestructura dockerizada desarrollada constituye una aportación práctica que trasciende los resultados numéricos. Al encapsular los motores OCR en contenedores independientes, se resuelven problemas de compatibilidad entre dependencias y se garantiza que cualquier investigador pueda reproducir exactamente las condiciones experimentales. La aceleración de 82× proporcionada por GPU transforma lo que sería un experimento de días en uno de horas, haciendo viable la exploración exhaustiva de espacios de hiperparámetros con hardware de consumo.
+La infraestructura dockerizada desarrollada constituye una aportación práctica que trasciende los resultados numéricos. Al encapsular los motores OCR en contenedores independientes, se resuelven problemas de compatibilidad entre dependencias y se garantiza que cualquier investigador pueda reproducir exactamente las condiciones experimentales. La aceleración de 82x proporcionada por GPU transforma lo que sería un experimento de horas en uno de minutos, haciendo viable la exploración exhaustiva de espacios de hiperparámetros con hardware de consumo.
 
 El código fuente, las imágenes Docker y los datos experimentales están disponibles públicamente en el [repositorio del proyecto](https://seryus.ddns.net/unir/MastersThesis). Esta apertura busca facilitar no solo la reproducción de los resultados, sino también la extensión de este trabajo hacia nuevos tipos de documentos, idiomas o motores OCR.
-
diff --git a/docs/06_referencias_bibliograficas.md b/docs/06_referencias_bibliograficas.md
index 953fff0..3198348 100644
--- a/docs/06_referencias_bibliograficas.md
+++ b/docs/06_referencias_bibliograficas.md
@@ -1,50 +1,49 @@
 # Referencias bibliográficas {.unnumbered}
 
-Akiba, T., Sano, S., Yanase, T., Ohta, T., & Koyama, M. (2019). Optuna: A next-generation hyperparameter optimization framework. *Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining*, 2623-2631. https://doi.org/10.1145/3292500.3330701
+Akiba, T., Sano, S., Yanase, T., Ohta, T., & Koyama, M. (2019). Optuna: A next-generation hyperparameter optimization framework. *Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining*, 2623-2631. [https://doi.org/10.1145/3292500.3330701](https://doi.org/10.1145/3292500.3330701)
 
-Baek, Y., Lee, B., Han, D., Yun, S., & Lee, H. (2019). Character region awareness for text detection. *Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition*, 9365-9374. https://doi.org/10.1109/CVPR.2019.00959
+Baek, Y., Lee, B., Han, D., Yun, S., & Lee, H. (2019). Character region awareness for text detection. *Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition*, 9365-9374. [https://doi.org/10.1109/CVPR.2019.00959](https://doi.org/10.1109/CVPR.2019.00959)
 
-Bergstra, J., & Bengio, Y. (2012). Random search for hyper-parameter optimization. *Journal of Machine Learning Research*, 13(1), 281-305. https://jmlr.org/papers/v13/bergstra12a.html
+Bergstra, J., & Bengio, Y. (2012). Random search for hyper-parameter optimization. *Journal of Machine Learning Research*, 13(1), 281-305. [https://jmlr.org/papers/v13/bergstra12a.html](https://jmlr.org/papers/v13/bergstra12a.html)
 
-Bergstra, J., Bardenet, R., Bengio, Y., & Kégl, B. (2011). Algorithms for hyper-parameter optimization. *Advances in Neural Information Processing Systems*, 24, 2546-2554. https://papers.nips.cc/paper/2011/hash/86e8f7ab32cfd12577bc2619bc635690-Abstract.html
+Bergstra, J., Bardenet, R., Bengio, Y., & Kégl, B. (2011). Algorithms for hyper-parameter optimization. *Advances in Neural Information Processing Systems*, 24, 2546-2554. [https://papers.nips.cc/paper/2011/hash/86e8f7ab32cfd12577bc2619bc635690-Abstract.html](https://papers.nips.cc/paper/2011/hash/86e8f7ab32cfd12577bc2619bc635690-Abstract.html)
 
 Cohen, J. (1988). *Statistical power analysis for the behavioral sciences* (2nd ed.). Lawrence Erlbaum Associates.
 
 Doran, G. T. (1981). There's a S.M.A.R.T. way to write management's goals and objectives. *Management Review*, 70(11), 35-36.
 
-Du, Y., Li, C., Guo, R., Yin, X., Liu, W., Zhou, J., Bai, Y., Yu, Z., Yang, Y., Dang, Q., & Wang, H. (2020). PP-OCR: A practical ultra lightweight OCR system. *arXiv preprint arXiv:2009.09941*. https://arxiv.org/abs/2009.09941
+Du, Y., Li, C., Guo, R., Yin, X., Liu, W., Zhou, J., Bai, Y., Yu, Z., Yang, Y., Dang, Q., & Wang, H. (2020). PP-OCR: A practical ultra lightweight OCR system. *arXiv*. [https://arxiv.org/abs/2009.09941](https://arxiv.org/abs/2009.09941)
 
-Du, Y., Li, C., Guo, R., Cui, C., Liu, W., Zhou, J., Lu, B., Yang, Y., Liu, Q., Hu, X., Yu, D., & Wang, H. (2023). PP-OCRv4: Mobile scene text detection and recognition. *arXiv preprint arXiv:2310.05930*. https://arxiv.org/abs/2310.05930
+Du, Y., Li, C., Guo, R., Cui, C., Liu, W., Zhou, J., Lu, B., Yang, Y., Liu, Q., Hu, X., Yu, D., & Wang, H. (2023). PP-OCRv4: Mobile scene text detection and recognition. *arXiv*. [https://arxiv.org/abs/2310.05930](https://arxiv.org/abs/2310.05930)
 
-Feurer, M., & Hutter, F. (2019). Hyperparameter optimization. In F. Hutter, L. Kotthoff, & J. Vanschoren (Eds.), *Automated machine learning: Methods, systems, challenges* (pp. 3-33). Springer. https://doi.org/10.1007/978-3-030-05318-5_1
+Feurer, M., & Hutter, F. (2019). Hyperparameter optimization. In F. Hutter, L. Kotthoff, & J. Vanschoren (Eds.), *Automated machine learning: Methods, systems, challenges* (pp. 3-33). Springer. [https://doi.org/10.1007/978-3-030-05318-5_1](https://doi.org/10.1007/978-3-030-05318-5_1)
 
-He, P., Huang, W., Qiao, Y., Loy, C. C., & Tang, X. (2016). Reading scene text in deep convolutional sequences. *Proceedings of the AAAI Conference on Artificial Intelligence*, 30(1), 3501-3508. https://doi.org/10.1609/aaai.v30i1.10291
+He, P., Huang, W., Qiao, Y., Loy, C. C., & Tang, X. (2016). Reading scene text in deep convolutional sequences. *Proceedings of the AAAI Conference on Artificial Intelligence*, 30(1), 3501-3508. [https://doi.org/10.1609/aaai.v30i1.10291](https://doi.org/10.1609/aaai.v30i1.10291)
 
-JaidedAI. (2020). EasyOCR: Ready-to-use OCR with 80+ supported languages. GitHub. https://github.com/JaidedAI/EasyOCR
+JaidedAI. (2020). *EasyOCR: Ready-to-use OCR with 80+ supported languages* [Computer software]. GitHub. [https://github.com/JaidedAI/EasyOCR](https://github.com/JaidedAI/EasyOCR)
 
-Liang, J., Doermann, D., & Li, H. (2005). Camera-based analysis of text and documents: A survey. *International Journal of Document Analysis and Recognition*, 7(2), 84-104. https://doi.org/10.1007/s10032-004-0138-z
+Liang, J., Doermann, D., & Li, H. (2005). Camera-based analysis of text and documents: A survey. *International Journal of Document Analysis and Recognition*, 7(2), 84-104. [https://doi.org/10.1007/s10032-004-0138-z](https://doi.org/10.1007/s10032-004-0138-z)
 
-Liao, M., Wan, Z., Yao, C., Chen, K., & Bai, X. (2020). Real-time scene text detection with differentiable binarization. *Proceedings of the AAAI Conference on Artificial Intelligence*, 34(07), 11474-11481. https://doi.org/10.1609/aaai.v34i07.6812
+Liao, M., Wan, Z., Yao, C., Chen, K., & Bai, X. (2020). Real-time scene text detection with differentiable binarization. *Proceedings of the AAAI Conference on Artificial Intelligence*, 34(07), 11474-11481. [https://doi.org/10.1609/aaai.v34i07.6812](https://doi.org/10.1609/aaai.v34i07.6812)
 
-Liaw, R., Liang, E., Nishihara, R., Moritz, P., Gonzalez, J. E., & Stoica, I. (2018). Tune: A research platform for distributed model selection and training. *arXiv preprint arXiv:1807.05118*. https://arxiv.org/abs/1807.05118
+Liaw, R., Liang, E., Nishihara, R., Moritz, P., Gonzalez, J. E., & Stoica, I. (2018). Tune: A research platform for distributed model selection and training. *arXiv*. [https://arxiv.org/abs/1807.05118](https://arxiv.org/abs/1807.05118)
 
-Mindee. (2021). DocTR: Document Text Recognition. GitHub. https://github.com/mindee/doctr
+Mindee. (2021). *DocTR: Document text recognition* [Computer software]. GitHub. [https://github.com/mindee/doctr](https://github.com/mindee/doctr)
 
-Moritz, P., Nishihara, R., Wang, S., Tumanov, A., Liaw, R., Liang, E., Elibol, M., Yang, Z., Paul, W., Jordan, M. I., & Stoica, I. (2018). Ray: A distributed framework for emerging AI applications. *13th USENIX Symposium on Operating Systems Design and Implementation (OSDI 18)*, 561-577. https://www.usenix.org/conference/osdi18/presentation/moritz
+Moritz, P., Nishihara, R., Wang, S., Tumanov, A., Liaw, R., Liang, E., Elibol, M., Yang, Z., Paul, W., Jordan, M. I., & Stoica, I. (2018). Ray: A distributed framework for emerging AI applications. *13th USENIX Symposium on Operating Systems Design and Implementation (OSDI 18)*, 561-577. [https://www.usenix.org/conference/osdi18/presentation/moritz](https://www.usenix.org/conference/osdi18/presentation/moritz)
 
-Morris, A. C., Maier, V., & Green, P. D. (2004). From WER and RIL to MER and WIL: Improved evaluation measures for connected speech recognition. *Eighth International Conference on Spoken Language Processing*. https://doi.org/10.21437/Interspeech.2004-668
+Morris, A. C., Maier, V., & Green, P. D. (2004). From WER and RIL to MER and WIL: Improved evaluation measures for connected speech recognition. *Eighth International Conference on Spoken Language Processing*. [https://doi.org/10.21437/Interspeech.2004-668](https://doi.org/10.21437/Interspeech.2004-668)
 
-PaddlePaddle. (2024). PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle. GitHub. https://github.com/PaddlePaddle/PaddleOCR
+PaddlePaddle. (2024). *PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle* [Computer software]. GitHub. [https://github.com/PaddlePaddle/PaddleOCR](https://github.com/PaddlePaddle/PaddleOCR)
 
-Pearson, K. (1895). Notes on regression and inheritance in the case of two parents. *Proceedings of the Royal Society of London*, 58, 240-242. https://doi.org/10.1098/rspl.1895.0041
+Pearson, K. (1895). Notes on regression and inheritance in the case of two parents. *Proceedings of the Royal Society of London*, 58, 240-242. [https://doi.org/10.1098/rspl.1895.0041](https://doi.org/10.1098/rspl.1895.0041)
 
-PyMuPDF. (2024). PyMuPDF documentation. https://pymupdf.readthedocs.io/
+PyMuPDF. (2024). *PyMuPDF documentation*. [https://pymupdf.readthedocs.io/](https://pymupdf.readthedocs.io/)
 
-Shi, B., Bai, X., & Yao, C. (2016). An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition. *IEEE Transactions on Pattern Analysis and Machine Intelligence*, 39(11), 2298-2304. https://doi.org/10.1109/TPAMI.2016.2646371
+Shi, B., Bai, X., & Yao, C. (2016). An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition. *IEEE Transactions on Pattern Analysis and Machine Intelligence*, 39(11), 2298-2304. [https://doi.org/10.1109/TPAMI.2016.2646371](https://doi.org/10.1109/TPAMI.2016.2646371)
 
-Smith, R. (2007). An overview of the Tesseract OCR engine. *Ninth International Conference on Document Analysis and Recognition (ICDAR 2007)*, 2, 629-633. https://doi.org/10.1109/ICDAR.2007.4376991
+Smith, R. (2007). An overview of the Tesseract OCR engine. *Ninth International Conference on Document Analysis and Recognition (ICDAR 2007)*, 2, 629-633. [https://doi.org/10.1109/ICDAR.2007.4376991](https://doi.org/10.1109/ICDAR.2007.4376991)
 
-Zhou, X., Yao, C., Wen, H., Wang, Y., Zhou, S., He, W., & Liang, J. (2017). EAST: An efficient and accurate scene text detector. *Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition*, 5551-5560. https://doi.org/10.1109/CVPR.2017.283
-
-Zoph, B., & Le, Q. V. (2017). Neural architecture search with reinforcement learning. *International Conference on Learning Representations (ICLR)*. https://arxiv.org/abs/1611.01578
+Zhou, X., Yao, C., Wen, H., Wang, Y., Zhou, S., He, W., & Liang, J. (2017). EAST: An efficient and accurate scene text detector. *Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition*, 5551-5560. [https://doi.org/10.1109/CVPR.2017.283](https://doi.org/10.1109/CVPR.2017.283)
 
+Zoph, B., & Le, Q. V. (2017). Neural architecture search with reinforcement learning. *International Conference on Learning Representations (ICLR)*. [https://arxiv.org/abs/1611.01578](https://arxiv.org/abs/1611.01578)
diff --git a/docs/07_anexo_a.md b/docs/07_anexo_a.md
index 41003d3..7b733a4 100644
--- a/docs/07_anexo_a.md
+++ b/docs/07_anexo_a.md
@@ -6,7 +6,7 @@ Este anexo proporciona la información técnica necesaria para reproducir los ex
 
 Todo el código fuente y los datos utilizados en este trabajo están disponibles públicamente en el siguiente repositorio:
 
-**URL del repositorio:** https://seryus.ddns.net/unir/MastersThesis
+**URL del repositorio:** [https://seryus.ddns.net/unir/MastersThesis](https://seryus.ddns.net/unir/MastersThesis)
 
 El repositorio incluye:
 
@@ -32,71 +32,25 @@ config:
 flowchart TB
     subgraph root["MastersThesis/"]
         direction TB
+        docs["docs/ - Capítulos del TFM + métricas"]
+        instructions["instructions/ - Plantilla UNIR"]
 
-        subgraph docs["docs/ - Capítulos TFM"]
-            d0["00-07 chapters (.md)"]
-            subgraph metrics["metrics/"]
-                m1["metrics_paddle.md"]
-                m2["metrics_doctr.md"]
-                m3["metrics_easyocr.md"]
-            end
+        subgraph src["src/ - Código y resultados"]
+            paddle["paddle_ocr/ - Microservicio PaddleOCR"]
+            easy["easyocr_service/ - Microservicio EasyOCR"]
+            doctr["doctr_service/ - Microservicio DocTR"]
+            ray["raytune/ - Orquestación Ray Tune"]
+            results["results/ - CSV de trials"]
+            corr["results/correlations/ - Correlaciones"]
         end
-
-        subgraph src["src/ - Código fuente"]
-            subgraph paddle["paddle_ocr/"]
-                p1["paddle_ocr_tuning_rest.py"]
-                p2["Dockerfile.gpu/cpu"]
-            end
-            subgraph doctr["doctr_service/"]
-                dt1["doctr_tuning_rest.py"]
-            end
-            subgraph easy["easyocr_service/"]
-                e1["easyocr_tuning_rest.py"]
-            end
-            subgraph ray["raytune/"]
-                r1["raytune_ocr.py"]
-                r2["run_tuning.py"]
-            end
-            results["results/*.csv"]
-            dataset["dataset/"]
-        end
-
-        subgraph thesis["thesis_output/"]
-            htm["plantilla_individual.htm"]
-            figs["figures/figura_1-11.png"]
-        end
-
-        subgraph inst["instructions/"]
-            i1["instrucciones.pdf"]
-            i2["plantilla_individual.htm"]
-        end
-
-        scripts["apply_content.py<br/>generate_mermaid_figures.py"]
-        config["claude.md<br/>README.md"]
     end
 ```
 
-**Tabla A1.** *Descripción de directorios principales.*
-
-| Directorio | Contenido |
-|------------|-----------|
-| `docs/` | Capítulos del TFM en Markdown (estructura UNIR) |
-| `docs/metrics/` | Métricas de rendimiento por servicio OCR |
-| `src/paddle_ocr/` | Servicio PaddleOCR dockerizado |
-| `src/doctr_service/` | Servicio DocTR dockerizado |
-| `src/easyocr_service/` | Servicio EasyOCR dockerizado |
-| `src/raytune/` | Scripts de optimización Ray Tune |
-| `src/results/` | CSVs con resultados de 64 trials por servicio |
-| `thesis_output/` | Documento TFM generado + figuras PNG |
-| `instructions/` | Plantilla e instrucciones UNIR oficiales |
-
-*Fuente: Elaboración propia.*
-
 ## A.3 Requisitos de Software
 
 ### Sistema de Desarrollo
 
-**Tabla A2.** *Especificaciones del sistema de desarrollo.*
+**Tabla A1.** *Especificaciones del sistema de desarrollo.*
 
 | Componente | Especificación |
 |------------|----------------|
@@ -106,21 +60,24 @@ flowchart TB
 | GPU | NVIDIA RTX 3060 Laptop (5.66 GB VRAM) |
 | CUDA | 12.4 |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md).
 
 ### Dependencias
 
-**Tabla A3.** *Dependencias del proyecto.*
+**Tabla A2.** *Dependencias del proyecto.*
 
 | Componente | Versión |
 |------------|---------|
-| Python | 3.12.3 |
-| Docker | 29.1.5 |
-| NVIDIA Container Toolkit | Requerido para GPU |
-| Ray | 2.52.1 |
+| PaddlePaddle | 3.2.2 |
+| PaddleOCR | 3.3.2 |
+| Ray Tune | 2.52.1 |
 | Optuna | 4.7.0 |
+| DocTR (python-doctr) | >= 0.8.0 |
+| EasyOCR | >= 1.7.0 |
+| Docker | Requerido para contenedores |
+| NVIDIA Container Toolkit | Requerido para GPU |
 
-*Fuente: Elaboración propia.*
+**Fuente:** [`src/paddle_ocr/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/requirements.txt), [`src/raytune/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/requirements.txt), [`src/doctr_service/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/requirements.txt), [`src/easyocr_service/requirements.txt`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/requirements.txt), [`src/README.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/README.md).
 
 ## A.4 Instrucciones de Ejecución de Servicios OCR
 
@@ -231,7 +188,7 @@ analyze_results(results, prefix='raytune_paddle', config_keys=PADDLE_OCR_CONFIG_
 
 ### Servicios y Puertos
 
-**Tabla A4.** *Servicios Docker y puertos.*
+**Tabla A3.** *Servicios Docker y puertos.*
 
 | Servicio | Puerto | Script de Ajuste | Nota |
 |----------|--------|------------------|------|
@@ -239,7 +196,7 @@ analyze_results(results, prefix='raytune_paddle', config_keys=PADDLE_OCR_CONFIG_
 | DocTR | 8003 | `doctr_payload` | - |
 | EasyOCR | 8002 | `easyocr_payload` | Conflicto con PaddleOCR |
 
-*Fuente: Elaboración propia.*
+**Fuente:** Elaboración propia.
 
 > **Nota:** Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez. PaddleOCR y EasyOCR comparten el puerto 8002. Para cambiar de servicio, detener el actual con `docker compose down`.
 
@@ -249,7 +206,7 @@ Esta sección presenta los resultados completos de las evaluaciones comparativas
 
 ### Comparativa General de Servicios
 
-**Tabla A5.** *Comparativa de servicios OCR en dataset de 45 páginas (GPU RTX 3060).*
+**Tabla A4.** *Comparativa de servicios OCR en dataset de 45 páginas (GPU RTX 3060).*
 
 | Servicio | CER | WER | Tiempo/Página | Tiempo Total | VRAM |
 |----------|-----|-----|---------------|--------------|------|
@@ -257,7 +214,7 @@ Esta sección presenta los resultados completos de las evaluaciones comparativas
 | EasyOCR | 11.23% | 36.36% | 1.88s | 88.5s | ~2 GB |
 | DocTR | 12.06% | 42.01% | 0.50s | 28.4s | ~1 GB |
 
-*Fuente: Benchmark realizado el 2026-01-19. Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md), [`docs/metrics/metrics_easyocr.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_easyocr.md), [`docs/metrics/metrics_doctr.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_doctr.md).
 
 **Ganador:** PaddleOCR (Mobile) - Mejor precisión (7.76% CER) con velocidad competitiva y mínimo consumo de VRAM.
 
@@ -265,7 +222,7 @@ Esta sección presenta los resultados completos de las evaluaciones comparativas
 
 Se ejecutaron 64 trials por servicio utilizando Ray Tune con Optuna sobre las páginas 5-10 del primer documento.
 
-**Tabla A6.** *Resultados del ajuste de hiperparámetros por servicio.*
+**Tabla A5.** *Resultados del ajuste de hiperparámetros por servicio.*
 
 | Servicio | CER Base | CER Ajustado | Mejora | Mejor Trial (5 páginas) |
 |----------|----------|--------------|--------|-------------------------|
@@ -273,9 +230,44 @@ Se ejecutaron 64 trials por servicio utilizando Ray Tune con Optuna sobre las p
 | DocTR | 12.06% | 12.07% | 0% | 7.43% |
 | EasyOCR | 11.23% | 11.14% | 0.8% | 5.83% |
 
-*Fuente: Resultados de 64 trials Ray Tune por servicio. Elaboración propia.*
+**Fuente:** [`docs/metrics/metrics_paddle.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md), [`docs/metrics/metrics_easyocr.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_easyocr.md), [`docs/metrics/metrics_doctr.md`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_doctr.md).
 
-> **Nota sobre sobreajuste:** La diferencia entre los resultados del mejor trial (subconjunto de 5 páginas) y el dataset completo (45 páginas) indica sobreajuste parcial a las páginas de ajuste. Un subconjunto más grande (15-20 páginas) mejoraría la generalización.
+> **Nota sobre sobreajuste:** La diferencia entre los resultados del mejor trial (subconjunto de 5 páginas) y el dataset completo (45 páginas) indica sobreajuste parcial a las páginas de ajuste. Un subconjunto más amplio mejoraría la generalización.
+
+### Distribución de trials por rango de CER (PaddleOCR)
+
+**Tabla A6.** *Distribución de trials por rango de CER.*
+
+| Rango CER | Número de trials | Porcentaje |
+|-----------|------------------|------------|
+| < 2% | 43 | 67.2% |
+| 2% - 5% | 10 | 15.6% |
+| 5% - 10% | 11 | 17.2% |
+| > 10% | 0 | 0.0% |
+
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
+
+**Figura A1.** *Distribución de trials por rango de CER (PaddleOCR).*
+
+```mermaid
+---
+title: "Distribución de trials por rango de CER (PaddleOCR)"
+config:
+  theme: base
+  themeVariables:
+    primaryColor: "#E6F4F9"
+    primaryTextColor: "#404040"
+    primaryBorderColor: "#0098CD"
+    lineColor: "#0098CD"
+---
+pie showData
+    title Distribución de 64 trials
+    "CER < 2%" : 43
+    "CER 2-5%" : 10
+    "CER 5-10%" : 11
+```
+
+**Fuente:** [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv).
 
 ### Configuración Óptima PaddleOCR
 
@@ -294,7 +286,7 @@ La siguiente configuración logró el mejor rendimiento en el ajuste de hiperpar
 ```
 
 **Hallazgos clave:**
-- `textline_orientation=true`: Crítico para documentos con layouts mixtos
+- `textline_orientation=true`: Crítico para documentos con secciones y encabezados
 - `use_doc_orientation_classify=true`: Mejora detección de orientación
 - `use_doc_unwarping=false`: Innecesario para PDFs digitales
 - `text_det_thresh` bajo (0.0462): Detección más sensible mejora resultados
@@ -305,11 +297,33 @@ La siguiente configuración logró el mejor rendimiento en el ajuste de hiperpar
 
 | Métrica | CPU | GPU (RTX 3060) | Aceleración |
 |---------|-----|----------------|-------------|
-| Tiempo/Página | 69.4s | 0.55s | **126x más rápido** |
-| Mejor CER | 1.15% | 0.79% | GPU mejor |
-| 45 páginas | ~52 min | ~25 seg | **126x más rápido** |
+| Tiempo/Página | 69.4s | 0.84s | **82x más rápido** |
+| 45 páginas | ~52 min | ~38 seg | **82x más rápido** |
 
-*Fuente: Datos CPU de `raytune_paddle_subproc_results_20251207_192320.csv`. Elaboración propia.*
+**Fuente:** Datos de tiempo CPU de [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv) y tiempos de GPU en trials de ajuste. Elaboración propia.
+
+**Figura A2.** *Tiempo de procesamiento: CPU vs GPU (segundos/página).*
+
+```mermaid
+---
+title: "Tiempo de procesamiento: CPU vs GPU (segundos/página)"
+config:
+  theme: base
+  themeVariables:
+    primaryColor: "#E6F4F9"
+    primaryTextColor: "#404040"
+    primaryBorderColor: "#0098CD"
+    lineColor: "#0098CD"
+  xyChart:
+    plotColorPalette: "#0098CD"
+---
+xychart-beta
+    x-axis ["CPU", "GPU (RTX 3060)"]
+    y-axis "Segundos por página" 0 --> 75
+    bar [69.4, 0.84]
+```
+
+**Fuente:** [`src/raytune_paddle_subproc_results_20251207_192320.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv) y [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv). Leyenda: Aceleración de **82x** con GPU. El procesamiento de una página pasa de 69.4s (CPU) a 0.84s (GPU).
 
 ### Análisis de Errores por Servicio
 
@@ -317,11 +331,11 @@ La siguiente configuración logró el mejor rendimiento en el ajuste de hiperpar
 
 | Servicio | Fortalezas | Debilidades | ¿Fine-tuning recomendado? |
 |----------|------------|-------------|---------------------------|
-| **PaddleOCR** | Preserva estructura, buen manejo de español | Errores menores de acentos (~5%) | No (ya excelente) |
+| **PaddleOCR** | Preserva estructura, buen manejo de español | Errores menores de acentos | No (ya excelente) |
 | DocTR | Más rápido | Pierde estructura, omite TODOS los diacríticos | Sí (para diacríticos) |
 | EasyOCR | Modelo correcto para español | Caracteres espurios, confunde `o`/`0` | Sí (problemas del detector) |
 
-*Fuente: Análisis manual del debugset. Elaboración propia.*
+**Fuente:** Análisis manual del debugset. Elaboración propia.
 
 ### Archivos de Resultados
 
@@ -331,12 +345,33 @@ Los resultados crudos de los 64 trials por servicio están disponibles en el rep
 
 | Servicio | Archivo CSV |
 |----------|-------------|
-| PaddleOCR | [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv) |
-| DocTR | [`src/results/raytune_doctr_results_20260119_121445.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_doctr_results_20260119_121445.csv) |
-| EasyOCR | [`src/results/raytune_easyocr_results_20260119_120204.csv`](https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_easyocr_results_20260119_120204.csv) |
+| PaddleOCR | [`src/results/raytune_paddle_results_20260119_122609.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv)|
+| DocTR | [`src/results/raytune_doctr_results_20260119_121445.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_doctr_results_20260119_121445.csv)|
+| EasyOCR | [`src/results/raytune_easyocr_results_20260119_120204.csv`](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_easyocr_results_20260119_120204.csv)|
 
-*Fuente: Elaboración propia.*
+**Fuente:** Elaboración propia.
 
-## A.8 Licencia
+## A.8 Fuentes de precios cloud
+
+Las tablas de costos cloud se basan en las páginas oficiales de precios. Se consultaron en enero de 2026.
+
+- AWS EC2 g4dn.xlarge: [https://aws.amazon.com/ec2/instance-types/g4/](https://aws.amazon.com/ec2/instance-types/g4/)
+- Google Colab Pro: [https://colab.research.google.com/signup](https://colab.research.google.com/signup)
+- Google Colab Pro+: [https://colab.research.google.com/signup](https://colab.research.google.com/signup)
+
+## A.9 Requisitos documentados por dependencias
+
+Requisitos extraídos de la documentación oficial de las dependencias usadas:
+
+- DocTR: requiere Python 3.10 o superior.
+  **Fuente:** [https://github.com/mindee/doctr](https://github.com/mindee/doctr)
+- DocTR Docker: imágenes basadas en CUDA 12.2, el host debe ser al menos 12.2.
+  **Fuente:** [https://github.com/mindee/doctr](https://github.com/mindee/doctr)
+- PaddleOCR: soporte de inferencia con CUDA 12.
+  **Fuente:** [https://github.com/PaddlePaddle/PaddleOCR](https://github.com/PaddlePaddle/PaddleOCR)
+- PaddleOCR: soporte de Python 3.12 en dependencias.
+  **Fuente:** [https://github.com/PaddlePaddle/PaddleOCR](https://github.com/PaddlePaddle/PaddleOCR)
+
+## A.10 Licencia
 
 El código se distribuye bajo licencia MIT.
diff --git a/docs/metrics/metrics.md b/docs/metrics/metrics.md
index eb99784..e5a06af 100644
--- a/docs/metrics/metrics.md
+++ b/docs/metrics/metrics.md
@@ -29,7 +29,7 @@
 
 | Tarea | Tiempo GPU | Costo AWS | Costo Colab Pro |
 |-------|------------|-----------|-----------------|
-| Ajuste hiperparámetros (64×3 trials) | ~3 horas | ~$1.58 | ~$3.90 |
+| Ajuste hiperparámetros (64x3 trials) | ~3 horas | ~$1.58 | ~$3.90 |
 | Evaluación completa (45 páginas) | ~5 min | ~$0.04 | ~$0.11 |
 | Desarrollo/debug (20 horas/mes) | 20 horas | ~$10.52 | ~$26.00 |
 
@@ -68,7 +68,7 @@ Este documento presenta resultados de dos fases experimentales distintas realiza
 
 *Fuente: Elaboración propia.*
 
-La fase de optimización representa el **resultado principal del TFM** (CER 1.49%, precisión 98.51%). La fase de validación GPU confirma la viabilidad práctica del enfoque, demostrando una aceleración de 126x respecto a CPU.
+La fase de optimización representa el **resultado principal del TFM** (CER 1.49%, precisión 98.51%). La fase de validación GPU confirma la viabilidad práctica del enfoque. La aceleración respecto a CPU se estima en 82x cuando se compara el tiempo medio por página de los trials de ajuste en CPU y GPU.
 
 ## Comparación de Servicios OCR
 
@@ -180,13 +180,12 @@ flowchart LR
 
 ## Rendimiento CPU vs GPU (PaddleOCR)
 
-Datos de `raytune_paddle_subproc_results_20251207_192320.csv` (CPU) vs RTX 3060 (GPU):
+Datos de tiempos de los trials de ajuste en CPU (`raytune_paddle_subproc_results_20251207_192320.csv`) frente a GPU (RTX 3060):
 
 | Métrica | CPU | GPU (RTX 3060) | Aceleración |
 |---------|-----|----------------|-------------|
-| **Tiempo/Página** | 69.4s | 0.55s | **126x más rápido** |
-| **Mejor CER** | 1.15% | 0.79% | GPU mejor |
-| **45 páginas** | ~52 min | ~25 seg | **126x más rápido** |
+| **Tiempo/Página** | 69.4s | 0.84s | **82x más rápido** |
+| **45 páginas** | ~52 min | ~38 seg | **82x más rápido** |
 
 ```mermaid
 ---
@@ -204,10 +203,10 @@ xychart-beta
     title "Tiempo de Procesamiento por Página: CPU vs GPU"
     x-axis ["CPU", "GPU (RTX 3060)"]
     y-axis "Segundos" 0 --> 80
-    bar [69.4, 0.55]
+    bar [69.4, 0.84]
 ```
 
-> **Conclusión:** GPU es esencial para uso práctico de OCR. El procesamiento en CPU es 126x más lento, haciéndolo impráctico para procesamiento por lotes.
+> **Conclusión:** GPU es esencial para uso práctico de OCR. En los trials de ajuste, el procesamiento en CPU es 82x más lento.
 
 ## Datos Crudos del Benchmark
 
diff --git a/docs/metrics/metrics_doctr.md b/docs/metrics/metrics_doctr.md
index e22d6ed..5943e1a 100644
--- a/docs/metrics/metrics_doctr.md
+++ b/docs/metrics/metrics_doctr.md
@@ -1,180 +1,182 @@
-# Resultados de Ajuste de Hiperparámetros DocTR
-
-**Fecha de Ajuste:** 2026-01-19
-**Plataforma:** NVIDIA RTX 3060 Laptop GPU
-**Muestras:** 64
-**Páginas de Prueba:** 5-10 (primer documento)
-
-### ¿Por Qué Solo 5 Páginas?
-
-Usamos solo 5 páginas (páginas 5-10) para el ajuste de hiperparámetros porque:
-
-1. **Velocidad**: 64 pruebas × 5 páginas = 320 evaluaciones de página. Con 45 páginas, serían 2,880 evaluaciones (~9x más tiempo)
-2. **Eficiencia de recursos**: Cada prueba toma ~2-20 segundos en GPU
-
-**Riesgo de Sobreajuste**: El ajuste de hiperparámetros en un subconjunto pequeño PUEDE causar sobreajuste. Nuestros resultados confirman esto:
-- Subconjunto de ajuste: **38% mejora** (7.43% CER)
-- Dataset completo: **0% mejora** (12.07% CER)
-
-La falta total de mejora en el dataset completo indica sobreajuste severo a las páginas 5-10, combinado con limitaciones a nivel de modelo (manejo de diacríticos, estructura de líneas) que los hiperparámetros no pueden corregir.
-
-## Evaluación del Dataset Completo (45 páginas)
-
-| Métrica | Base | Ajustado | Mejora |
-|---------|------|----------|--------|
-| **CER** | 12.06% | 12.07% | **0%** |
-| **WER** | 42.01% | 42.26% | **0%** |
-| Tiempo/Página | 0.33s | 0.34s | - |
-
-> **Nota:** El ajuste no generalizó al dataset completo. Los problemas de DocTR parecen ser a nivel de modelo (diacríticos, estructura de líneas).
-
-## Resultados del Subconjunto de Ajuste (páginas 5-10)
-
-| Métrica | Base | Ajustado | Mejora |
-|---------|------|----------|--------|
-| **CER** | 12.06% | **7.43%** | **38%** |
-| **WER** | 42.01% | **35.23%** | **16%** |
-
-> Nota: Las mejoras en el subconjunto de ajuste no se transfirieron al dataset completo.
-
-## Mejor Configuración Encontrada
-
-```json
-{
-  "assume_straight_pages": true,
-  "straighten_pages": false,
-  "preserve_aspect_ratio": false,
-  "symmetric_pad": false,
-  "disable_page_orientation": true,
-  "disable_crop_orientation": false,
-  "resolve_lines": true,
-  "resolve_blocks": false,
-  "paragraph_break": 0.0977
-}
-```
-
-## Hallazgos Clave
-
-1. **straighten_pages: false** - ¡Crítico! Configurarlo en true causa ~79% CER (catastrófico)
-2. **assume_straight_pages: true** - Funciona bien con escaneos de documentos rectos
-3. **resolve_lines: true** - Ayuda a mantener la estructura de líneas
-4. **disable_page_orientation: true** - Evita rotación innecesaria
-
-## Impacto de Parámetros
-
-Parámetros que mejoraron la precisión:
-- `straighten_pages=False` absolutamente crítico
-- `assume_straight_pages=True` en los mejores resultados
-- `resolve_lines=True` mantiene la estructura del texto
-
-Parámetros que perjudicaron la precisión:
-- `straighten_pages=True` catastróficamente malo (~79% CER)
-- `resolve_blocks=True` ligeramente peor que False
-
-## Limitaciones Conocidas
-
-Incluso con ajuste, DocTR todavía tiene problemas:
-- Omite diacríticos (tildes) - probablemente problema a nivel de modelo
-- Todavía tiene mayor WER que PaddleOCR debido a problemas de estructura
-
-## Evaluación del Dataset Completo
-
-**Estado:** Completado
-
-```bash
-curl -X POST http://localhost:8003/evaluate_full \
-  -H "Content-Type: application/json" \
-  -d '{
-    "pdf_folder": "/app/dataset",
-    "assume_straight_pages": true,
-    "straighten_pages": false,
-    "preserve_aspect_ratio": false,
-    "symmetric_pad": false,
-    "disable_page_orientation": true,
-    "disable_crop_orientation": false,
-    "resolve_lines": true,
-    "resolve_blocks": false,
-    "paragraph_break": 0.0977,
-    "save_output": true
-  }'
-```
-
-**Resultado:** CER 12.07%, WER 42.26%, 0.34s/página (sin mejora sobre la base)
-
-**Conclusión:** Los problemas de precisión de DocTR son a nivel de modelo, no ajustables por hiperparámetros.
-
-## Configuración del Modelo
-
-### Modelo Actual
-
-| Componente | Modelo | Estado |
-|------------|--------|--------|
-| Detección | `db_resnet50` | Correcto |
-| Reconocimiento | `crnn_vgg16_bn` | Mejor opción disponible |
-
-El modelo `crnn_vgg16_bn` fue entrenado principalmente con datasets en inglés y francés, lo que explica la pérdida sistemática de diacríticos españoles (á, é, í, ó, ú, ñ).
-
-### Prueba con Modelo Alternativo (parseq)
-
-Se probó el modelo `parseq` (transformer) como alternativa:
-
-| Métrica | crnn_vgg16_bn | parseq | Resultado |
-|---------|---------------|--------|-----------|
-| **CER** | 12.07% | 12.32% | **+2% peor** |
-| **WER** | 42.26% | 44.0% | **+4% peor** |
-| Tiempo/Página | 0.34s | 0.70s | 2x más lento |
-| Diacríticos | No | No | Sin mejora |
-
-**Conclusión:** El modelo `parseq` no mejora los diacríticos españoles y es más lento. Todos los modelos pre-entrenados de DocTR fueron entrenados principalmente en inglés/francés. Para español se requeriría **fine-tuning con corpus español**.
-
-### No Se Recomienda Cambio de Modelo
-
-Mantener `crnn_vgg16_bn` (más rápido, ligeramente mejor precisión). Los problemas de diacríticos son de **datos de entrenamiento**, no de arquitectura del modelo
-
-## Análisis de Errores del Debugset
-
-### Errores Observados
-
-| Ground Truth | DocTR | Tipo de Error |
-|--------------|-------|---------------|
-| `bibliográficas` | `bibliograficas` | Diacrítico omitido |
-| `sección` | `seccion` | Diacrítico omitido |
-| `Máster` | `Master` | Diacrítico omitido |
-| `información` | `informacion` | Diacrítico omitido |
-| `o amplían` | `O amplian` | Mayúscula incorrecta |
-| Líneas separadas | Todo en una línea | **Estructura perdida** |
-
-### Problemas Críticos
-
-1. **Pérdida total de estructura**: Todo el texto de la página se colapsa en una sola línea
-2. **Omisión sistemática de diacríticos**: TODOS los acentos españoles se pierden
-3. **Errores de capitalización**: `o` → `O` en medio de oraciones
-
-### ¿Fine-tuning Recomendado?
-
-**Sí, para diacríticos.** El modelo CRNN de DocTR fue entrenado principalmente con textos en inglés y francés, lo que explica la omisión sistemática de acentos españoles.
-
-| Problema | ¿Fine-tuning ayuda? | Explicación |
-|----------|---------------------|-------------|
-| Diacríticos | **Sí** | Entrenar con corpus español enseñaría al modelo los acentos |
-| Estructura de líneas | **No** | Problema arquitectural del modelo, no de entrenamiento |
-| Capitalización | **Parcial** | Podría mejorar con datos de entrenamiento adecuados |
-
-### Cómo Fine-Tunear DocTR
-
-```python
-from doctr.models import recognition_predictor
-from doctr.datasets import RecognitionDataset
-
-# Cargar dataset español
-train_set = RecognitionDataset(
-    img_folder="path/to/spanish/images",
-    labels_path="path/to/spanish/labels.json"
-)
-
-# Fine-tune el modelo de reconocimiento
-model = recognition_predictor(pretrained=True)
-# ... configurar entrenamiento
-```
-
-Documentación: https://mindee.github.io/doctr/using_doctr/custom_models_training.html
+# Resultados de Ajuste de Hiperparámetros DocTR
+
+**Fecha de Ajuste:** 2026-01-19
+**Plataforma:** NVIDIA RTX 3060 Laptop GPU
+**Muestras:** 64
+**Páginas de Prueba:** 5-10 (primer documento)
+
+### ¿Por Qué Solo 5 Páginas?
+
+Usamos solo 5 páginas (páginas 5-10) para el ajuste de hiperparámetros porque:
+
+1. **Velocidad**: 64 pruebas x 5 páginas = 320 evaluaciones de página. Con 45 páginas, serían 2,880 evaluaciones (~9x más tiempo)
+2. **Eficiencia de recursos**: Cada prueba toma ~2-20 segundos en GPU
+
+**Riesgo de Sobreajuste**: El ajuste de hiperparámetros en un subconjunto pequeño PUEDE causar sobreajuste. Nuestros resultados confirman esto:
+- Subconjunto de ajuste: **38% mejora** (7.43% CER)
+- Dataset completo: **0% mejora** (12.07% CER)
+
+La falta total de mejora en el dataset completo indica sobreajuste severo a las páginas 5-10, combinado con limitaciones a nivel de modelo (manejo de diacríticos, estructura de líneas) que los hiperparámetros no pueden corregir.
+
+## Evaluación del Dataset Completo (45 páginas)
+
+| Métrica | Base | Ajustado | Mejora |
+|---------|------|----------|--------|
+| **CER** | 12.06% | 12.07% | **0%** |
+| **WER** | 42.01% | 42.26% | **0%** |
+| Tiempo/Página | 0.33s | 0.34s | - |
+
+> **Nota:** El ajuste no generalizó al dataset completo. Los problemas de DocTR parecen ser a nivel de modelo (diacríticos, estructura de líneas).
+
+## Resultados del Subconjunto de Ajuste (páginas 5-10)
+
+| Métrica | Base | Ajustado | Mejora |
+|---------|------|----------|--------|
+| **CER** | 12.06% | **7.43%** | **38%** |
+| **WER** | 42.01% | **35.23%** | **16%** |
+
+> Nota: Las mejoras en el subconjunto de ajuste no se transfirieron al dataset completo.
+
+*Fuente: [https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_doctr_results_20260119_121445.csv*](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_doctr_results_20260119_121445.csv*)
+
+## Mejor Configuración Encontrada
+
+```json
+{
+  "assume_straight_pages": true,
+  "straighten_pages": false,
+  "preserve_aspect_ratio": false,
+  "symmetric_pad": false,
+  "disable_page_orientation": true,
+  "disable_crop_orientation": false,
+  "resolve_lines": true,
+  "resolve_blocks": false,
+  "paragraph_break": 0.0977
+}
+```
+
+## Hallazgos Clave
+
+1. **straighten_pages: false** - ¡Crítico! Configurarlo en true causa ~79% CER (catastrófico)
+2. **assume_straight_pages: true** - Funciona bien con escaneos de documentos rectos
+3. **resolve_lines: true** - Ayuda a mantener la estructura de líneas
+4. **disable_page_orientation: true** - Evita rotación innecesaria
+
+## Impacto de Parámetros
+
+Parámetros que mejoraron la precisión:
+- `straighten_pages=False` absolutamente crítico
+- `assume_straight_pages=True` en los mejores resultados
+- `resolve_lines=True` mantiene la estructura del texto
+
+Parámetros que perjudicaron la precisión:
+- `straighten_pages=True` catastróficamente malo (~79% CER)
+- `resolve_blocks=True` ligeramente peor que False
+
+## Limitaciones Conocidas
+
+Incluso con ajuste, DocTR todavía tiene problemas:
+- Omite diacríticos (tildes) - probablemente problema a nivel de modelo
+- Todavía tiene mayor WER que PaddleOCR debido a problemas de estructura
+
+## Evaluación del Dataset Completo
+
+**Estado:** Completado
+
+```bash
+curl -X POST http://localhost:8003/evaluate_full \
+  -H "Content-Type: application/json" \
+  -d '{
+    "pdf_folder": "/app/dataset",
+    "assume_straight_pages": true,
+    "straighten_pages": false,
+    "preserve_aspect_ratio": false,
+    "symmetric_pad": false,
+    "disable_page_orientation": true,
+    "disable_crop_orientation": false,
+    "resolve_lines": true,
+    "resolve_blocks": false,
+    "paragraph_break": 0.0977,
+    "save_output": true
+  }'
+```
+
+**Resultado:** CER 12.07%, WER 42.26%, 0.34s/página (sin mejora sobre la base)
+
+**Conclusión:** Los problemas de precisión de DocTR son a nivel de modelo, no ajustables por hiperparámetros.
+
+## Configuración del Modelo
+
+### Modelo Actual
+
+| Componente | Modelo | Estado |
+|------------|--------|--------|
+| Detección | `db_resnet50` | Correcto |
+| Reconocimiento | `crnn_vgg16_bn` | Mejor opción disponible |
+
+El modelo `crnn_vgg16_bn` fue entrenado principalmente con datasets en inglés y francés, lo que explica la pérdida sistemática de diacríticos españoles (á, é, í, ó, ú, ñ).
+
+### Prueba con Modelo Alternativo (parseq)
+
+Se probó el modelo `parseq` (transformer) como alternativa:
+
+| Métrica | crnn_vgg16_bn | parseq | Resultado |
+|---------|---------------|--------|-----------|
+| **CER** | 12.07% | 12.32% | **+2% peor** |
+| **WER** | 42.26% | 44.0% | **+4% peor** |
+| Tiempo/Página | 0.34s | 0.70s | 2x más lento |
+| Diacríticos | No | No | Sin mejora |
+
+**Conclusión:** El modelo `parseq` no mejora los diacríticos españoles y es más lento. Todos los modelos pre-entrenados de DocTR fueron entrenados principalmente en inglés/francés. Para español se requeriría **fine-tuning con corpus español**.
+
+### No Se Recomienda Cambio de Modelo
+
+Mantener `crnn_vgg16_bn` (más rápido, ligeramente mejor precisión). Los problemas de diacríticos son de **datos de entrenamiento**, no de arquitectura del modelo
+
+## Análisis de Errores del Debugset
+
+### Errores Observados
+
+| Ground Truth | DocTR | Tipo de Error |
+|--------------|-------|---------------|
+| `bibliográficas` | `bibliograficas` | Diacrítico omitido |
+| `sección` | `seccion` | Diacrítico omitido |
+| `Máster` | `Master` | Diacrítico omitido |
+| `información` | `informacion` | Diacrítico omitido |
+| `o amplían` | `O amplian` | Mayúscula incorrecta |
+| Líneas separadas | Todo en una línea | **Estructura perdida** |
+
+### Problemas Críticos
+
+1. **Pérdida total de estructura**: Todo el texto de la página se colapsa en una sola línea
+2. **Omisión sistemática de diacríticos**: TODOS los acentos españoles se pierden
+3. **Errores de capitalización**: `o` → `O` en medio de oraciones
+
+### ¿Fine-tuning Recomendado?
+
+**Sí, para diacríticos.** El modelo CRNN de DocTR fue entrenado principalmente con textos en inglés y francés, lo que explica la omisión sistemática de acentos españoles.
+
+| Problema | ¿Fine-tuning ayuda? | Explicación |
+|----------|---------------------|-------------|
+| Diacríticos | **Sí** | Entrenar con corpus español enseñaría al modelo los acentos |
+| Estructura de líneas | **No** | Problema arquitectural del modelo, no de entrenamiento |
+| Capitalización | **Parcial** | Podría mejorar con datos de entrenamiento adecuados |
+
+### Cómo Fine-Tunear DocTR
+
+```python
+from doctr.models import recognition_predictor
+from doctr.datasets import RecognitionDataset
+
+# Cargar dataset español
+train_set = RecognitionDataset(
+    img_folder="path/to/spanish/images",
+    labels_path="path/to/spanish/labels.json"
+)
+
+# Fine-tune el modelo de reconocimiento
+model = recognition_predictor(pretrained=True)
+# ... configurar entrenamiento
+```
+
+Documentación: [https://mindee.github.io/doctr/using_doctr/custom_models_training.html](https://mindee.github.io/doctr/using_doctr/custom_models_training.html)
diff --git a/docs/metrics/metrics_easyocr.md b/docs/metrics/metrics_easyocr.md
index 9542342..ec44aec 100644
--- a/docs/metrics/metrics_easyocr.md
+++ b/docs/metrics/metrics_easyocr.md
@@ -1,182 +1,184 @@
-# Resultados de Ajuste de Hiperparámetros EasyOCR
-
-**Fecha de Ajuste:** 2026-01-19
-**Plataforma:** NVIDIA RTX 3060 Laptop GPU
-**Muestras:** 64
-**Páginas de Prueba:** 5-10 (primer documento)
-
-### ¿Por Qué Solo 5 Páginas?
-
-Usamos solo 5 páginas (páginas 5-10) para el ajuste de hiperparámetros porque:
-
-1. **Velocidad**: 64 pruebas × 5 páginas = 320 evaluaciones de página. Con 45 páginas, serían 2,880 evaluaciones (~9x más tiempo)
-2. **Eficiencia de recursos**: Cada prueba toma ~10-20 segundos en GPU
-
-**Riesgo de Sobreajuste**: El ajuste de hiperparámetros en un subconjunto pequeño PUEDE causar sobreajuste. Nuestros resultados confirman esto:
-- Subconjunto de ajuste: **48% mejora** (5.83% CER)
-- Dataset completo: **0.8% mejora** (11.14% CER)
-
-La mejora mínima en el dataset completo indica que los hiperparámetros se sobreajustaron a las páginas 5-10. Los problemas de EasyOCR (detecciones espurias, pérdida de estructura) también pueden ser parcialmente a nivel de modelo.
-
-## Evaluación del Dataset Completo (45 páginas)
-
-| Métrica | Base | Ajustado | Mejora |
-|---------|------|----------|--------|
-| **CER** | 11.23% | 11.14% | **0.8%** |
-| **WER** | 36.36% | 36.85% | **-1.3%** |
-| Tiempo/Página | 1.84s | 1.94s | - |
-
-> **Nota:** El ajuste mostró mejora mínima en el dataset completo. Los problemas de EasyOCR pueden ser a nivel de modelo.
-
-## Resultados del Subconjunto de Ajuste (páginas 5-10)
-
-| Métrica | Base | Ajustado | Mejora |
-|---------|------|----------|--------|
-| **CER** | 11.23% | **5.83%** | **48%** |
-| **WER** | 36.36% | **26.33%** | **28%** |
-
-> Nota: Las grandes mejoras en el subconjunto de ajuste no se transfirieron al dataset completo.
-
-## Mejor Configuración Encontrada
-
-```json
-{
-  "text_threshold": 0.6647,
-  "low_text": 0.4247,
-  "link_threshold": 0.2184,
-  "slope_ths": 0.1629,
-  "ycenter_ths": 0.7994,
-  "height_ths": 0.6437,
-  "width_ths": 0.6065,
-  "add_margin": 0.1462,
-  "contrast_ths": 0.1671,
-  "adjust_contrast": 0.6416,
-  "decoder": "greedy",
-  "beamWidth": 7,
-  "min_size": 10
-}
-```
-
-## Hallazgos Clave
-
-1. **decoder: greedy** - Consistentemente mejor que beamsearch para este dataset
-2. **Mayor text_threshold (0.66)** - Reduce detecciones espurias
-3. **min_size: 10** - Filtra artefactos de ruido pequeños
-4. **Umbrales moderados** - Sensibilidad de detección balanceada
-
-## Impacto de Parámetros
-
-Parámetros que mejoraron la precisión:
-- `decoder="greedy"` consistentemente superó a beamsearch
-- Mayor `text_threshold` (0.6-0.8) redujo el ruido
-- `min_size >= 5` ayudó a filtrar artefactos
-
-Parámetros que perjudicaron la precisión:
-- `decoder="beamsearch"` causó ~35-40% CER en muchas pruebas
-- `text_threshold` muy bajo (<0.4) detectó demasiado ruido
-- `min_size` alto (>15) omitió algo de texto
-
-## Comparación con Problemas de Base
-
-Problemas originales identificados en el debugset:
-- Inserciones espurias de caracteres - **Mejorado** con umbrales más altos
-- Pérdida de estructura - Todavía presente pero menos severa
-
-## Evaluación del Dataset Completo
-
-**Estado:** Completado
-
-```bash
-curl -X POST http://localhost:8002/evaluate_full \
-  -H "Content-Type: application/json" \
-  -d '{
-    "pdf_folder": "/app/dataset",
-    "text_threshold": 0.6647,
-    "low_text": 0.4247,
-    "link_threshold": 0.2184,
-    "slope_ths": 0.1629,
-    "ycenter_ths": 0.7994,
-    "height_ths": 0.6437,
-    "width_ths": 0.6065,
-    "add_margin": 0.1462,
-    "contrast_ths": 0.1671,
-    "adjust_contrast": 0.6416,
-    "decoder": "greedy",
-    "beamWidth": 7,
-    "min_size": 10,
-    "save_output": true
-  }'
-```
-
-**Resultado:** CER 11.14%, WER 36.85%, 1.94s/página (mejora mínima)
-
-**Conclusión:** El ajuste de EasyOCR proporcionó mejora insignificante en el dataset completo.
-
-## Configuración del Modelo
-
-### Modelo Actual (Correcto para Español)
-
-| Componente | Modelo | Estado |
-|------------|--------|--------|
-| Detección | CRAFT | Correcto |
-| Reconocimiento | `latin_g2.pth` | Correcto para español |
-| Idiomas | `es,en` | Correcto |
-
-El modelo `latin_g2.pth` está optimizado para idiomas con escritura latina incluyendo español. **El modelo de reconocimiento es correcto** - los problemas observados (caracteres espurios `0`, `;`, `g`) son del **detector CRAFT**, no del modelo de reconocimiento.
-
-### No Se Requiere Cambio de Modelo
-
-A diferencia de DocTR, EasyOCR usa el modelo correcto para español. Los problemas son de detección (umbrales del CRAFT), no de reconocimiento.
-
-## Análisis de Errores del Debugset
-
-### Errores Observados
-
-| Ground Truth | EasyOCR | Tipo de Error |
-|--------------|---------|---------------|
-| `o figura` | `0 figura` | Letra `o` → número `0` |
-| `tabla o figura` | `tabla 0 figura` | Letra `o` → número `0` |
-| `grupal,` | `grupal;` | Coma → punto y coma |
-| `páginas,` | `páginas;` | Puntuación incorrecta |
-| (ninguno) | `g`, `1`, `2` | **Caracteres espurios insertados** |
-| Líneas separadas | Todo en una línea | **Estructura perdida** |
-
-### Problemas Críticos
-
-1. **Caracteres espurios**: El detector CRAFT inserta caracteres falsos (`g`, `1`, `2`, `;`) que no existen en el documento
-2. **Confusión letra/número**: Consistentemente confunde `o` con `0`
-3. **Puntuación incorrecta**: Reemplaza comas por punto y coma
-4. **Pérdida de estructura**: Todo el texto se colapsa en una línea
-
-### ¿Fine-tuning Recomendado?
-
-**Sí.** EasyOCR tiene problemas significativos que podrían mejorarse con fine-tuning:
-
-| Problema | ¿Fine-tuning ayuda? | Explicación |
-|----------|---------------------|-------------|
-| Caracteres espurios | **Sí** | El detector CRAFT puede entrenarse para reducir falsos positivos |
-| Confusión `o`/`0` | **Sí** | El modelo de reconocimiento aprendería del contexto español |
-| Puntuación | **Sí** | Corpus español enseñaría patrones de puntuación correctos |
-| Estructura | **Parcial** | Depende de parámetros de agrupación de texto |
-
-### Cómo Fine-Tunear EasyOCR
-
-EasyOCR permite fine-tuning del modelo de reconocimiento:
-
-```bash
-# 1. Preparar dataset en formato EasyOCR
-# Estructura: images/ + labels.txt (imagen<tab>texto)
-
-# 2. Entrenar modelo de reconocimiento
-python train.py \
-  --train_data ./train_data \
-  --valid_data ./valid_data \
-  --lang_list es en \
-  --saved_model ./custom_model
-```
-
-Documentación: https://github.com/JaidedAI/EasyOCR/blob/master/custom_model.md
-
-### Alternativa Recomendada
-
-Dado el CER de 11.14% y los problemas fundamentales de EasyOCR, se recomienda **usar PaddleOCR** (7.72% CER) en lugar de invertir esfuerzo en fine-tuning de EasyOCR
+# Resultados de Ajuste de Hiperparámetros EasyOCR
+
+**Fecha de Ajuste:** 2026-01-19
+**Plataforma:** NVIDIA RTX 3060 Laptop GPU
+**Muestras:** 64
+**Páginas de Prueba:** 5-10 (primer documento)
+
+### ¿Por Qué Solo 5 Páginas?
+
+Usamos solo 5 páginas (páginas 5-10) para el ajuste de hiperparámetros porque:
+
+1. **Velocidad**: 64 pruebas x 5 páginas = 320 evaluaciones de página. Con 45 páginas, serían 2,880 evaluaciones (~9x más tiempo)
+2. **Eficiencia de recursos**: Cada prueba toma ~10-20 segundos en GPU
+
+**Riesgo de Sobreajuste**: El ajuste de hiperparámetros en un subconjunto pequeño PUEDE causar sobreajuste. Nuestros resultados confirman esto:
+- Subconjunto de ajuste: **48% mejora** (5.83% CER)
+- Dataset completo: **0.8% mejora** (11.14% CER)
+
+La mejora mínima en el dataset completo indica que los hiperparámetros se sobreajustaron a las páginas 5-10. Los problemas de EasyOCR (detecciones espurias, pérdida de estructura) también pueden ser parcialmente a nivel de modelo.
+
+## Evaluación del Dataset Completo (45 páginas)
+
+| Métrica | Base | Ajustado | Mejora |
+|---------|------|----------|--------|
+| **CER** | 11.23% | 11.14% | **0.8%** |
+| **WER** | 36.36% | 36.85% | **-1.3%** |
+| Tiempo/Página | 1.84s | 1.94s | - |
+
+> **Nota:** El ajuste mostró mejora mínima en el dataset completo. Los problemas de EasyOCR pueden ser a nivel de modelo.
+
+## Resultados del Subconjunto de Ajuste (páginas 5-10)
+
+| Métrica | Base | Ajustado | Mejora |
+|---------|------|----------|--------|
+| **CER** | 11.23% | **5.83%** | **48%** |
+| **WER** | 36.36% | **26.33%** | **28%** |
+
+> Nota: Las grandes mejoras en el subconjunto de ajuste no se transfirieron al dataset completo.
+
+*Fuente: [https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_easyocr_results_20260119_120204.csv*](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_easyocr_results_20260119_120204.csv*)
+
+## Mejor Configuración Encontrada
+
+```json
+{
+  "text_threshold": 0.6647,
+  "low_text": 0.4247,
+  "link_threshold": 0.2184,
+  "slope_ths": 0.1629,
+  "ycenter_ths": 0.7994,
+  "height_ths": 0.6437,
+  "width_ths": 0.6065,
+  "add_margin": 0.1462,
+  "contrast_ths": 0.1671,
+  "adjust_contrast": 0.6416,
+  "decoder": "greedy",
+  "beamWidth": 7,
+  "min_size": 10
+}
+```
+
+## Hallazgos Clave
+
+1. **decoder: greedy** - Consistentemente mejor que beamsearch para este dataset
+2. **Mayor text_threshold (0.66)** - Reduce detecciones espurias
+3. **min_size: 10** - Filtra artefactos de ruido pequeños
+4. **Umbrales moderados** - Sensibilidad de detección balanceada
+
+## Impacto de Parámetros
+
+Parámetros que mejoraron la precisión:
+- `decoder="greedy"` consistentemente superó a beamsearch
+- Mayor `text_threshold` (0.6-0.8) redujo el ruido
+- `min_size >= 5` ayudó a filtrar artefactos
+
+Parámetros que perjudicaron la precisión:
+- `decoder="beamsearch"` causó ~35-40% CER en muchas pruebas
+- `text_threshold` muy bajo (<0.4) detectó demasiado ruido
+- `min_size` alto (>15) omitió algo de texto
+
+## Comparación con Problemas de Base
+
+Problemas originales identificados en el debugset:
+- Inserciones espurias de caracteres - **Mejorado** con umbrales más altos
+- Pérdida de estructura - Todavía presente pero menos severa
+
+## Evaluación del Dataset Completo
+
+**Estado:** Completado
+
+```bash
+curl -X POST http://localhost:8002/evaluate_full \
+  -H "Content-Type: application/json" \
+  -d '{
+    "pdf_folder": "/app/dataset",
+    "text_threshold": 0.6647,
+    "low_text": 0.4247,
+    "link_threshold": 0.2184,
+    "slope_ths": 0.1629,
+    "ycenter_ths": 0.7994,
+    "height_ths": 0.6437,
+    "width_ths": 0.6065,
+    "add_margin": 0.1462,
+    "contrast_ths": 0.1671,
+    "adjust_contrast": 0.6416,
+    "decoder": "greedy",
+    "beamWidth": 7,
+    "min_size": 10,
+    "save_output": true
+  }'
+```
+
+**Resultado:** CER 11.14%, WER 36.85%, 1.94s/página (mejora mínima)
+
+**Conclusión:** El ajuste de EasyOCR proporcionó mejora insignificante en el dataset completo.
+
+## Configuración del Modelo
+
+### Modelo Actual (Correcto para Español)
+
+| Componente | Modelo | Estado |
+|------------|--------|--------|
+| Detección | CRAFT | Correcto |
+| Reconocimiento | `latin_g2.pth` | Correcto para español |
+| Idiomas | `es,en` | Correcto |
+
+El modelo `latin_g2.pth` está optimizado para idiomas con escritura latina incluyendo español. **El modelo de reconocimiento es correcto** - los problemas observados (caracteres espurios `0`, `;`, `g`) son del **detector CRAFT**, no del modelo de reconocimiento.
+
+### No Se Requiere Cambio de Modelo
+
+A diferencia de DocTR, EasyOCR usa el modelo correcto para español. Los problemas son de detección (umbrales del CRAFT), no de reconocimiento.
+
+## Análisis de Errores del Debugset
+
+### Errores Observados
+
+| Ground Truth | EasyOCR | Tipo de Error |
+|--------------|---------|---------------|
+| `o figura` | `0 figura` | Letra `o` → número `0` |
+| `tabla o figura` | `tabla 0 figura` | Letra `o` → número `0` |
+| `grupal,` | `grupal;` | Coma → punto y coma |
+| `páginas,` | `páginas;` | Puntuación incorrecta |
+| (ninguno) | `g`, `1`, `2` | **Caracteres espurios insertados** |
+| Líneas separadas | Todo en una línea | **Estructura perdida** |
+
+### Problemas Críticos
+
+1. **Caracteres espurios**: El detector CRAFT inserta caracteres falsos (`g`, `1`, `2`, `;`) que no existen en el documento
+2. **Confusión letra/número**: Consistentemente confunde `o` con `0`
+3. **Puntuación incorrecta**: Reemplaza comas por punto y coma
+4. **Pérdida de estructura**: Todo el texto se colapsa en una línea
+
+### ¿Fine-tuning Recomendado?
+
+**Sí.** EasyOCR tiene problemas significativos que podrían mejorarse con fine-tuning:
+
+| Problema | ¿Fine-tuning ayuda? | Explicación |
+|----------|---------------------|-------------|
+| Caracteres espurios | **Sí** | El detector CRAFT puede entrenarse para reducir falsos positivos |
+| Confusión `o`/`0` | **Sí** | El modelo de reconocimiento aprendería del contexto español |
+| Puntuación | **Sí** | Corpus español enseñaría patrones de puntuación correctos |
+| Estructura | **Parcial** | Depende de parámetros de agrupación de texto |
+
+### Cómo Fine-Tunear EasyOCR
+
+EasyOCR permite fine-tuning del modelo de reconocimiento:
+
+```bash
+# 1. Preparar dataset en formato EasyOCR
+# Estructura: images/ + labels.txt (imagen<tab>texto)
+
+# 2. Entrenar modelo de reconocimiento
+python train.py \
+  --train_data ./train_data \
+  --valid_data ./valid_data \
+  --lang_list es en \
+  --saved_model ./custom_model
+```
+
+Documentación: [https://github.com/JaidedAI/EasyOCR/blob/master/custom_model.md](https://github.com/JaidedAI/EasyOCR/blob/master/custom_model.md)
+
+### Alternativa Recomendada
+
+Dado el CER de 11.14% y los problemas fundamentales de EasyOCR, se recomienda **usar PaddleOCR** (7.72% CER) en lugar de invertir esfuerzo en fine-tuning de EasyOCR
diff --git a/docs/metrics/metrics_paddle.md b/docs/metrics/metrics_paddle.md
index 1e38053..80a741d 100644
--- a/docs/metrics/metrics_paddle.md
+++ b/docs/metrics/metrics_paddle.md
@@ -1,143 +1,145 @@
-# Resultados de Ajuste de Hiperparámetros PaddleOCR
-
-> **Resultados principales del TFM:**
-> - Mejor trial (5 páginas): **CER 0.79%** ✓ cumple objetivo CER < 2%
-> - Dataset completo (45 páginas): **CER 7.72%** (mejora del 12.8% respecto a baseline)
-
-**Fecha de Ajuste:** 2026-01-19
-**Plataforma:** NVIDIA RTX 3060 Laptop GPU
-**Muestras:** 64
-**Páginas de Prueba:** 5-10 (primer documento)
-
-### ¿Por Qué Solo 5 Páginas?
-
-Usamos solo 5 páginas (páginas 5-10) para el ajuste de hiperparámetros porque:
-
-1. **Velocidad**: 64 pruebas × 5 páginas = 320 evaluaciones de página. Con 45 páginas, serían 2,880 evaluaciones (~9x más tiempo)
-2. **Eficiencia de recursos**: Cada prueba toma ~3-10 segundos en GPU; el dataset completo tomaría ~1 hora por prueba en CPU
-
-**Riesgo de Sobreajuste**: El ajuste de hiperparámetros en un subconjunto pequeño PUEDE causar sobreajuste. Nuestros resultados confirman esto:
-- Subconjunto de ajuste: **90% mejora** (0.79% CER)
-- Dataset completo: **12.8% mejora** (7.72% CER)
-
-La diferencia dramática muestra que los hiperparámetros se sobreajustaron parcialmente a las páginas 5-10. Un subconjunto de ajuste más grande (ej. 15-20 páginas) podría producir parámetros que generalicen mejor, pero aumentaría el tiempo de ajuste proporcionalmente.
-
-## Evaluación del Dataset Completo (45 páginas)
-
-| Métrica | Base | Ajustado | Mejora |
-|---------|------|----------|--------|
-| **CER** | 8.85% | **7.72%** | **12.8%** |
-| **WER** | 13.05% | **11.40%** | **12.6%** |
-| Tiempo/Página | 0.51s | 0.55s | - |
-
-## Resultados del Subconjunto de Ajuste (páginas 5-10)
-
-| Métrica | Base | Ajustado | Mejora |
-|---------|------|----------|--------|
-| **CER** | 7.76% | **0.79%** | **90%** |
-| **WER** | 11.62% | **7.78%** | **33%** |
-
-> Nota: El subconjunto de ajuste mostró mayores mejoras, sugiriendo que algunos hiperparámetros son específicos de la página.
-
-## Mejor Configuración Encontrada
-
-```json
-{
-  "use_doc_orientation_classify": true,
-  "use_doc_unwarping": false,
-  "textline_orientation": true,
-  "text_det_thresh": 0.0462,
-  "text_det_box_thresh": 0.4862,
-  "text_det_unclip_ratio": 0.0,
-  "text_rec_score_thresh": 0.5658
-}
-```
-
-## Hallazgos Clave
-
-1. **textline_orientation: true** - Crítico para la precisión
-2. **use_doc_orientation_classify: true** - Ayuda con la detección de orientación de página
-3. **use_doc_unwarping: false** - El enderezamiento de documentos perjudica la precisión en este dataset
-4. **Bajo text_det_thresh (0.0462)** - Detección de texto más sensible ayuda
-5. **Mayor text_rec_score_thresh (0.5658)** - Filtra reconocimientos de baja confianza
-
-## Impacto de Parámetros
-
-Parámetros que mejoraron la precisión:
-- `textline_orientation=True` consistentemente en los mejores resultados
-- `use_doc_orientation_classify=True` en las mejores pruebas
-- Valores más bajos de `text_det_thresh` (0.04-0.10)
-
-Parámetros que perjudicaron la precisión:
-- `use_doc_unwarping=True` aumentó el CER significativamente
-- `text_det_box_thresh` muy bajo (<0.01) causó problemas
-
-## Evaluación del Dataset Completo
-
-**Estado:** Completado
-
-```bash
-curl -X POST http://localhost:8002/evaluate_full \
-  -H "Content-Type: application/json" \
-  -d '{
-    "pdf_folder": "/app/dataset",
-    "use_doc_orientation_classify": true,
-    "use_doc_unwarping": false,
-    "textline_orientation": true,
-    "text_det_thresh": 0.0462,
-    "text_det_box_thresh": 0.4862,
-    "text_det_unclip_ratio": 0.0,
-    "text_rec_score_thresh": 0.5658,
-    "save_output": true
-  }'
-```
-
-**Resultado:** CER 7.72%, WER 11.40%, 0.55s/página
-
-## Configuración del Modelo
-
-### Modelo Actual (Correcto para Español)
-
-| Componente | Modelo | Estado |
-|------------|--------|--------|
-| Detección | `PP-OCRv5_mobile_det` | Correcto |
-| Reconocimiento | `PP-OCRv5_mobile_rec` | Correcto |
-
-Los modelos PP-OCRv5 mobile soportan múltiples idiomas incluyendo español con buen manejo de diacríticos.
-
-### Nota sobre Modelos Server
-
-PaddleOCR ofrece modelos "server" más precisos:
-- `PP-OCRv5_server_det` + `PP-OCRv5_server_rec`
-- Requieren ~5.3 GB VRAM
-
-**Limitación:** En la RTX 3060 (5.66 GB VRAM) los modelos server causan **OOM (Out of Memory)** en la página 2. Los modelos mobile usados (7.72% CER) son la mejor opción práctica para este hardware.
-
-Para hardware con más VRAM (8+ GB), los modelos server podrían mejorar la precisión.
-
-## Análisis de Errores del Debugset
-
-### Errores Observados
-
-| Ground Truth | PaddleOCR | Tipo de Error |
-|--------------|-----------|---------------|
-| `bibliografía` | `bibliografia` | Acento omitido |
-| `amplían` | `amplian` | Acento omitido |
-| `, debes` | `， debes` | Coma Unicode china |
-| Líneas separadas | Footer fusionado | Estructura menor |
-
-### Fortalezas
-
-- **Preserva estructura de líneas**: Mantiene saltos de línea correctamente
-- **Buen manejo de español**: La mayoría de acentos se reconocen bien
-- **Bajo ruido**: No inserta caracteres espurios
-
-### ¿Fine-tuning Recomendado?
-
-**No.** Con 7.72% CER, PaddleOCR ya tiene excelente precisión para documentos españoles. Los errores observados son menores:
-
-- Acentos omitidos: ~5% de casos
-- Puntuación Unicode: Muy ocasional
-- Impacto en legibilidad: Mínimo
-
-El esfuerzo de fine-tuning no se justifica para ganancias marginales. Para casos de uso críticos donde se requiera <5% CER, considerar post-procesamiento con corrector ortográfico
+# Resultados de Ajuste de Hiperparámetros PaddleOCR
+
+> **Resultados principales del TFM:**
+> - Mejor trial (5 páginas): **CER 0.79%** ✓ cumple objetivo CER < 2%
+> - Dataset completo (45 páginas): **CER 7.72%** (mejora del 12.8% respecto a baseline)
+
+**Fecha de Ajuste:** 2026-01-19
+**Plataforma:** NVIDIA RTX 3060 Laptop GPU
+**Muestras:** 64
+**Páginas de Prueba:** 5-10 (primer documento)
+
+### ¿Por Qué Solo 5 Páginas?
+
+Usamos solo 5 páginas (páginas 5-10) para el ajuste de hiperparámetros porque:
+
+1. **Velocidad**: 64 pruebas x 5 páginas = 320 evaluaciones de página. Con 45 páginas, serían 2,880 evaluaciones (~9x más tiempo)
+2. **Eficiencia de recursos**: Cada prueba toma ~3-10 segundos en GPU; el dataset completo tomaría ~1 hora por prueba en CPU
+
+**Riesgo de Sobreajuste**: El ajuste de hiperparámetros en un subconjunto pequeño PUEDE causar sobreajuste. Nuestros resultados confirman esto:
+- Subconjunto de ajuste: **90% mejora** (0.79% CER)
+- Dataset completo: **12.8% mejora** (7.72% CER)
+
+La diferencia dramática muestra que los hiperparámetros se sobreajustaron parcialmente a las páginas 5-10. Un subconjunto de ajuste más grande (ej. 15-20 páginas) podría producir parámetros que generalicen mejor, pero aumentaría el tiempo de ajuste proporcionalmente.
+
+## Evaluación del Dataset Completo (45 páginas)
+
+| Métrica | Base | Ajustado | Mejora |
+|---------|------|----------|--------|
+| **CER** | 8.85% | **7.72%** | **12.8%** |
+| **WER** | 13.05% | **11.40%** | **12.6%** |
+| Tiempo/Página | 0.51s | 0.55s | - |
+
+## Resultados del Subconjunto de Ajuste (páginas 5-10)
+
+| Métrica | Base | Ajustado | Mejora |
+|---------|------|----------|--------|
+| **CER** | 7.76% | **0.79%** | **90%** |
+| **WER** | 11.62% | **7.78%** | **33%** |
+
+> Nota: El subconjunto de ajuste mostró mayores mejoras, sugiriendo que algunos hiperparámetros son específicos de la página.
+
+*Fuente: [https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv*](https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv*)
+
+## Mejor Configuración Encontrada
+
+```json
+{
+  "use_doc_orientation_classify": true,
+  "use_doc_unwarping": false,
+  "textline_orientation": true,
+  "text_det_thresh": 0.0462,
+  "text_det_box_thresh": 0.4862,
+  "text_det_unclip_ratio": 0.0,
+  "text_rec_score_thresh": 0.5658
+}
+```
+
+## Hallazgos Clave
+
+1. **textline_orientation: true** - Crítico para la precisión
+2. **use_doc_orientation_classify: true** - Ayuda con la detección de orientación de página
+3. **use_doc_unwarping: false** - El enderezamiento de documentos perjudica la precisión en este dataset
+4. **Bajo text_det_thresh (0.0462)** - Detección de texto más sensible ayuda
+5. **Mayor text_rec_score_thresh (0.5658)** - Filtra reconocimientos de baja confianza
+
+## Impacto de Parámetros
+
+Parámetros que mejoraron la precisión:
+- `textline_orientation=True` consistentemente en los mejores resultados
+- `use_doc_orientation_classify=True` en las mejores pruebas
+- Valores más bajos de `text_det_thresh` (0.04-0.10)
+
+Parámetros que perjudicaron la precisión:
+- `use_doc_unwarping=True` aumentó el CER significativamente
+- `text_det_box_thresh` muy bajo (<0.01) causó problemas
+
+## Evaluación del Dataset Completo
+
+**Estado:** Completado
+
+```bash
+curl -X POST http://localhost:8002/evaluate_full \
+  -H "Content-Type: application/json" \
+  -d '{
+    "pdf_folder": "/app/dataset",
+    "use_doc_orientation_classify": true,
+    "use_doc_unwarping": false,
+    "textline_orientation": true,
+    "text_det_thresh": 0.0462,
+    "text_det_box_thresh": 0.4862,
+    "text_det_unclip_ratio": 0.0,
+    "text_rec_score_thresh": 0.5658,
+    "save_output": true
+  }'
+```
+
+**Resultado:** CER 7.72%, WER 11.40%, 0.55s/página
+
+## Configuración del Modelo
+
+### Modelo Actual (Correcto para Español)
+
+| Componente | Modelo | Estado |
+|------------|--------|--------|
+| Detección | `PP-OCRv5_mobile_det` | Correcto |
+| Reconocimiento | `PP-OCRv5_mobile_rec` | Correcto |
+
+Los modelos PP-OCRv5 mobile soportan múltiples idiomas incluyendo español con buen manejo de diacríticos.
+
+### Nota sobre Modelos Server
+
+PaddleOCR ofrece modelos "server" más precisos:
+- `PP-OCRv5_server_det` + `PP-OCRv5_server_rec`
+- Requieren ~5.3 GB VRAM
+
+**Limitación:** En la RTX 3060 (5.66 GB VRAM) los modelos server causan **OOM (Out of Memory)** en la página 2. Los modelos mobile usados (7.72% CER) son la mejor opción práctica para este hardware.
+
+Para hardware con más VRAM (8+ GB), los modelos server podrían mejorar la precisión.
+
+## Análisis de Errores del Debugset
+
+### Errores Observados
+
+| Ground Truth | PaddleOCR | Tipo de Error |
+|--------------|-----------|---------------|
+| `bibliografía` | `bibliografia` | Acento omitido |
+| `amplían` | `amplian` | Acento omitido |
+| `, debes` | `， debes` | Coma Unicode china |
+| Líneas separadas | Footer fusionado | Estructura menor |
+
+### Fortalezas
+
+- **Preserva estructura de líneas**: Mantiene saltos de línea correctamente
+- **Buen manejo de español**: La mayoría de acentos se reconocen bien
+- **Bajo ruido**: No inserta caracteres espurios
+
+### ¿Fine-tuning Recomendado?
+
+**No.** Con 7.72% CER, PaddleOCR ya tiene excelente precisión para documentos españoles. Los errores observados son menores:
+
+- Acentos omitidos: ~5% de casos
+- Puntuación Unicode: Muy ocasional
+- Impacto en legibilidad: Mínimo
+
+El esfuerzo de fine-tuning no se justifica para ganancias marginales. Para casos de uso críticos donde se requiera <5% CER, considerar post-procesamiento con corrector ortográfico
diff --git a/generate_mermaid_figures.py b/generate_mermaid_figures.py
index 6e484e6..7f1506d 100644
--- a/generate_mermaid_figures.py
+++ b/generate_mermaid_figures.py
@@ -12,7 +12,8 @@ BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 DOCS_DIR = os.path.join(BASE_DIR, 'docs')
 OUTPUT_DIR = os.path.join(BASE_DIR, 'thesis_output/figures')
 MMDC = os.path.join(BASE_DIR, 'node_modules/.bin/mmdc')
-CONFIG_FILE = os.path.join(BASE_DIR, 'mermaid.config.json')
+CONFIG_FILE = os.path.join(BASE_DIR, 'mermaid.config.json')
+PUPPETEER_CONFIG = os.path.join(BASE_DIR, 'tem/scripts/puppeteer_config.json')
 
 # Light blue color for bar charts
 BAR_COLOR = '#0098CD'
@@ -82,12 +83,15 @@ def convert_to_png(diagrams):
                 # For bar charts: generate SVG, fix colors, convert to PNG
                 svg_file = os.path.join(OUTPUT_DIR, f'temp_{diagram["index"]}.svg')
 
-                result = subprocess.run(
-                    [MMDC, '-i', temp_file, '-o', svg_file, '-b', 'white', '-w', '1600', '-c', CONFIG_FILE],
-                    capture_output=True,
-                    text=True,
-                    timeout=60
-                )
+                cmd = [MMDC, '-i', temp_file, '-o', svg_file, '-b', 'white', '-w', '1600', '-c', CONFIG_FILE]
+                if os.path.exists(PUPPETEER_CONFIG):
+                    cmd += ['--puppeteerConfigFile', PUPPETEER_CONFIG]
+                result = subprocess.run(
+                    cmd,
+                    capture_output=True,
+                    text=True,
+                    timeout=60
+                )
 
                 if os.path.exists(svg_file):
                     # Read SVG and replace bar color
@@ -110,12 +114,15 @@ def convert_to_png(diagrams):
                     os.remove(svg_file)
             else:
                 # For other diagrams: direct PNG generation
-                result = subprocess.run(
-                    [MMDC, '-i', temp_file, '-o', output_file, '-b', 'white', '-w', '1600', '-s', '3', '-c', CONFIG_FILE],
-                    capture_output=True,
-                    text=True,
-                    timeout=60
-                )
+                cmd = [MMDC, '-i', temp_file, '-o', output_file, '-b', 'white', '-w', '1600', '-s', '3', '-c', CONFIG_FILE]
+                if os.path.exists(PUPPETEER_CONFIG):
+                    cmd += ['--puppeteerConfigFile', PUPPETEER_CONFIG]
+                result = subprocess.run(
+                    cmd,
+                    capture_output=True,
+                    text=True,
+                    timeout=60
+                )
 
             if os.path.exists(output_file):
                 print(f"✓ Generated: figura_{diagram['index']}.png - {diagram['title']}")
diff --git a/src/README.md b/src/README.md
index 678a54c..b9096c4 100644
--- a/src/README.md
+++ b/src/README.md
@@ -95,6 +95,25 @@ Results are saved to `src/results/` as CSV files:
 - `raytune_doctr_results_<timestamp>.csv`
 - `raytune_easyocr_results_<timestamp>.csv`
 
+### Correlation Analysis
+
+Correlation tables used in the thesis are derived from the CSV results with a local script:
+
+```bash
+source .venv/bin/activate
+python tem/scripts/compute_correlations_all.py
+```
+
+Outputs are written to `src/results/correlations/`:
+- `paddle_correlations.csv`
+- `doctr_correlations.csv`
+- `easyocr_correlations.csv`
+
+These files are computed from the corresponding inputs:
+- `src/results/raytune_paddle_results_20260119_122609.csv`
+- `src/results/raytune_doctr_results_20260119_121445.csv`
+- `src/results/raytune_easyocr_results_20260119_120204.csv`
+
 ## Directory Structure
 
 ```
diff --git a/src/dataset_manager.py b/src/archived/dataset_manager.py
similarity index 100%
rename from src/dataset_manager.py
rename to src/archived/dataset_manager.py
diff --git a/src/doctr_raytune_rest.ipynb b/src/archived/doctr_raytune_rest.ipynb
similarity index 100%
rename from src/doctr_raytune_rest.ipynb
rename to src/archived/doctr_raytune_rest.ipynb
diff --git a/src/easyocr_raytune_rest.ipynb b/src/archived/easyocr_raytune_rest.ipynb
similarity index 100%
rename from src/easyocr_raytune_rest.ipynb
rename to src/archived/easyocr_raytune_rest.ipynb
diff --git a/ocr_benchmark_notebook.ipynb b/src/archived/ocr_benchmark_notebook.ipynb
similarity index 100%
rename from ocr_benchmark_notebook.ipynb
rename to src/archived/ocr_benchmark_notebook.ipynb
diff --git a/paddle_ocr_fine_tune_unir.ipynb b/src/archived/paddle_ocr_fine_tune_unir.ipynb
similarity index 100%
rename from paddle_ocr_fine_tune_unir.ipynb
rename to src/archived/paddle_ocr_fine_tune_unir.ipynb
diff --git a/src/paddle_ocr_fine_tune_unir_raytune.ipynb b/src/archived/paddle_ocr_fine_tune_unir_raytune.ipynb
similarity index 100%
rename from src/paddle_ocr_fine_tune_unir_raytune.ipynb
rename to src/archived/paddle_ocr_fine_tune_unir_raytune.ipynb
diff --git a/src/paddle_ocr_raytune_rest.ipynb b/src/archived/paddle_ocr_raytune_rest.ipynb
similarity index 100%
rename from src/paddle_ocr_raytune_rest.ipynb
rename to src/archived/paddle_ocr_raytune_rest.ipynb
diff --git a/src/paddle_ocr_tuning.py b/src/archived/paddle_ocr_tuning.py
similarity index 100%
rename from src/paddle_ocr_tuning.py
rename to src/archived/paddle_ocr_tuning.py
diff --git a/src/raytune_ocr.py b/src/archived/raytune_ocr.py
similarity index 100%
rename from src/raytune_ocr.py
rename to src/archived/raytune_ocr.py
diff --git a/src/run_tuning.py b/src/archived/run_tuning.py
similarity index 100%
rename from src/run_tuning.py
rename to src/archived/run_tuning.py
diff --git a/src/docker-compose.tuning.yml b/src/docker-compose.tuning.yml
deleted file mode 100644
index 796d4d0..0000000
--- a/src/docker-compose.tuning.yml
+++ /dev/null
@@ -1,82 +0,0 @@
-# docker-compose.tuning.yml - Ray Tune with all OCR services (PaddleOCR + DocTR)
-# Usage:
-#   docker compose -f docker-compose.tuning.yml up -d paddle-ocr-gpu doctr-gpu
-#   docker compose -f docker-compose.tuning.yml run raytune --service paddle --samples 64
-#   docker compose -f docker-compose.tuning.yml run raytune --service doctr --samples 64
-#   docker compose -f docker-compose.tuning.yml down
-#
-# Note: EasyOCR uses port 8002 (same as PaddleOCR). Use docker-compose.tuning.easyocr.yml separately.
-
-services:
-  raytune:
-    image: seryus.ddns.net/unir/raytune:latest
-    network_mode: host
-    shm_size: '5gb'
-    volumes:
-      - ./results:/app/results:rw
-    environment:
-      - PYTHONUNBUFFERED=1
-
-  paddle-ocr-gpu:
-    image: seryus.ddns.net/unir/paddle-ocr-gpu:latest
-    container_name: paddle-ocr-gpu-tuning
-    ports:
-      - "8002:8000"
-    volumes:
-      - ./dataset:/app/dataset:ro
-      - ./debugset:/app/debugset:rw
-      - paddlex-cache:/root/.paddlex
-    environment:
-      - PYTHONUNBUFFERED=1
-      - CUDA_VISIBLE_DEVICES=0
-      - PADDLE_DET_MODEL=PP-OCRv5_mobile_det
-      - PADDLE_REC_MODEL=PP-OCRv5_mobile_rec
-    deploy:
-      resources:
-        reservations:
-          devices:
-            - driver: nvidia
-              count: 1
-              capabilities: [gpu]
-    restart: unless-stopped
-    healthcheck:
-      test: ["CMD", "python", "-c", "import urllib.request; urllib.request.urlopen('http://localhost:8000/health')"]
-      interval: 30s
-      timeout: 10s
-      retries: 3
-      start_period: 60s
-
-  doctr-gpu:
-    image: seryus.ddns.net/unir/doctr-gpu:latest
-    container_name: doctr-gpu-tuning
-    ports:
-      - "8003:8000"
-    volumes:
-      - ./dataset:/app/dataset:ro
-      - ./debugset:/app/debugset:rw
-      - doctr-cache:/root/.cache/doctr
-    environment:
-      - PYTHONUNBUFFERED=1
-      - CUDA_VISIBLE_DEVICES=0
-      - DOCTR_DET_ARCH=db_resnet50
-      - DOCTR_RECO_ARCH=crnn_vgg16_bn
-    deploy:
-      resources:
-        reservations:
-          devices:
-            - driver: nvidia
-              count: 1
-              capabilities: [gpu]
-    restart: unless-stopped
-    healthcheck:
-      test: ["CMD", "python", "-c", "import urllib.request; urllib.request.urlopen('http://localhost:8000/health')"]
-      interval: 30s
-      timeout: 10s
-      retries: 3
-      start_period: 180s
-
-volumes:
-  paddlex-cache:
-    name: paddlex-model-cache
-  doctr-cache:
-    name: doctr-model-cache
diff --git a/src/results/correlations/doctr_correlations.csv b/src/results/correlations/doctr_correlations.csv
new file mode 100644
index 0000000..54ae5fd
--- /dev/null
+++ b/src/results/correlations/doctr_correlations.csv
@@ -0,0 +1,19 @@
+parameter,metric,pearson
+straighten_pages,CER,0.9998131749398365
+symmetric_pad,CER,0.5261495908818205
+disable_page_orientation,CER,-0.49338806188002227
+disable_crop_orientation,CER,0.3470400052300961
+paragraph_break,CER,-0.28710190683729514
+resolve_blocks,CER,-0.2307325611083525
+preserve_aspect_ratio,CER,0.12408787013954682
+assume_straight_pages,CER,-0.11904725618816066
+resolve_lines,CER,0.060358529330885535
+straighten_pages,WER,0.9997423603542454
+symmetric_pad,WER,0.5288569133407047
+disable_page_orientation,WER,-0.49788185337361895
+disable_crop_orientation,WER,0.35150041517456027
+paragraph_break,WER,-0.2867204522845194
+resolve_blocks,WER,-0.23363320696739256
+assume_straight_pages,WER,-0.12980061688173894
+preserve_aspect_ratio,WER,0.1289984520450311
+resolve_lines,WER,0.06486504638919248
diff --git a/src/results/correlations/doctr_correlations.json b/src/results/correlations/doctr_correlations.json
new file mode 100644
index 0000000..8413366
--- /dev/null
+++ b/src/results/correlations/doctr_correlations.json
@@ -0,0 +1,92 @@
+[
+  {
+    "parameter": "straighten_pages",
+    "metric": "CER",
+    "pearson": 0.9998131749398365
+  },
+  {
+    "parameter": "symmetric_pad",
+    "metric": "CER",
+    "pearson": 0.5261495908818205
+  },
+  {
+    "parameter": "disable_page_orientation",
+    "metric": "CER",
+    "pearson": -0.49338806188002227
+  },
+  {
+    "parameter": "disable_crop_orientation",
+    "metric": "CER",
+    "pearson": 0.3470400052300961
+  },
+  {
+    "parameter": "paragraph_break",
+    "metric": "CER",
+    "pearson": -0.28710190683729514
+  },
+  {
+    "parameter": "resolve_blocks",
+    "metric": "CER",
+    "pearson": -0.2307325611083525
+  },
+  {
+    "parameter": "preserve_aspect_ratio",
+    "metric": "CER",
+    "pearson": 0.12408787013954682
+  },
+  {
+    "parameter": "assume_straight_pages",
+    "metric": "CER",
+    "pearson": -0.11904725618816066
+  },
+  {
+    "parameter": "resolve_lines",
+    "metric": "CER",
+    "pearson": 0.060358529330885535
+  },
+  {
+    "parameter": "straighten_pages",
+    "metric": "WER",
+    "pearson": 0.9997423603542454
+  },
+  {
+    "parameter": "symmetric_pad",
+    "metric": "WER",
+    "pearson": 0.5288569133407047
+  },
+  {
+    "parameter": "disable_page_orientation",
+    "metric": "WER",
+    "pearson": -0.49788185337361895
+  },
+  {
+    "parameter": "disable_crop_orientation",
+    "metric": "WER",
+    "pearson": 0.35150041517456027
+  },
+  {
+    "parameter": "paragraph_break",
+    "metric": "WER",
+    "pearson": -0.2867204522845194
+  },
+  {
+    "parameter": "resolve_blocks",
+    "metric": "WER",
+    "pearson": -0.23363320696739256
+  },
+  {
+    "parameter": "assume_straight_pages",
+    "metric": "WER",
+    "pearson": -0.12980061688173894
+  },
+  {
+    "parameter": "preserve_aspect_ratio",
+    "metric": "WER",
+    "pearson": 0.1289984520450311
+  },
+  {
+    "parameter": "resolve_lines",
+    "metric": "WER",
+    "pearson": 0.06486504638919248
+  }
+]
\ No newline at end of file
diff --git a/src/results/correlations/easyocr_correlations.csv b/src/results/correlations/easyocr_correlations.csv
new file mode 100644
index 0000000..0a59fee
--- /dev/null
+++ b/src/results/correlations/easyocr_correlations.csv
@@ -0,0 +1,25 @@
+parameter,metric,pearson
+contrast_ths,CER,0.40885606429688176
+ycenter_ths,CER,0.3052506223332593
+slope_ths,CER,-0.3007836023513022
+width_ths,CER,0.2820622927402215
+beamWidth,CER,0.24551397803020547
+add_margin,CER,0.23419721611930053
+height_ths,CER,-0.22762064209067434
+low_text,CER,-0.2127914870290739
+adjust_contrast,CER,-0.14938336246670267
+text_threshold,CER,-0.12089385052834749
+link_threshold,CER,-0.09553910777087017
+min_size,CER,0.04597421017746789
+contrast_ths,WER,0.38684315732406244
+slope_ths,WER,-0.32504213142289984
+ycenter_ths,WER,0.28738383141120705
+add_margin,WER,0.24148232685944232
+width_ths,WER,0.23869424685132606
+height_ths,WER,-0.23743923240967893
+beamWidth,WER,0.2286079838179018
+adjust_contrast,WER,-0.17842640649533945
+low_text,WER,-0.1772397092408802
+text_threshold,WER,-0.12733512825321042
+min_size,WER,0.10070615378426818
+link_threshold,WER,-0.04425190559911718
diff --git a/src/results/correlations/easyocr_correlations.json b/src/results/correlations/easyocr_correlations.json
new file mode 100644
index 0000000..f9a442b
--- /dev/null
+++ b/src/results/correlations/easyocr_correlations.json
@@ -0,0 +1,122 @@
+[
+  {
+    "parameter": "contrast_ths",
+    "metric": "CER",
+    "pearson": 0.40885606429688176
+  },
+  {
+    "parameter": "ycenter_ths",
+    "metric": "CER",
+    "pearson": 0.3052506223332593
+  },
+  {
+    "parameter": "slope_ths",
+    "metric": "CER",
+    "pearson": -0.3007836023513022
+  },
+  {
+    "parameter": "width_ths",
+    "metric": "CER",
+    "pearson": 0.2820622927402215
+  },
+  {
+    "parameter": "beamWidth",
+    "metric": "CER",
+    "pearson": 0.24551397803020547
+  },
+  {
+    "parameter": "add_margin",
+    "metric": "CER",
+    "pearson": 0.23419721611930053
+  },
+  {
+    "parameter": "height_ths",
+    "metric": "CER",
+    "pearson": -0.22762064209067434
+  },
+  {
+    "parameter": "low_text",
+    "metric": "CER",
+    "pearson": -0.2127914870290739
+  },
+  {
+    "parameter": "adjust_contrast",
+    "metric": "CER",
+    "pearson": -0.14938336246670267
+  },
+  {
+    "parameter": "text_threshold",
+    "metric": "CER",
+    "pearson": -0.12089385052834749
+  },
+  {
+    "parameter": "link_threshold",
+    "metric": "CER",
+    "pearson": -0.09553910777087017
+  },
+  {
+    "parameter": "min_size",
+    "metric": "CER",
+    "pearson": 0.04597421017746789
+  },
+  {
+    "parameter": "contrast_ths",
+    "metric": "WER",
+    "pearson": 0.38684315732406244
+  },
+  {
+    "parameter": "slope_ths",
+    "metric": "WER",
+    "pearson": -0.32504213142289984
+  },
+  {
+    "parameter": "ycenter_ths",
+    "metric": "WER",
+    "pearson": 0.28738383141120705
+  },
+  {
+    "parameter": "add_margin",
+    "metric": "WER",
+    "pearson": 0.24148232685944232
+  },
+  {
+    "parameter": "width_ths",
+    "metric": "WER",
+    "pearson": 0.23869424685132606
+  },
+  {
+    "parameter": "height_ths",
+    "metric": "WER",
+    "pearson": -0.23743923240967893
+  },
+  {
+    "parameter": "beamWidth",
+    "metric": "WER",
+    "pearson": 0.2286079838179018
+  },
+  {
+    "parameter": "adjust_contrast",
+    "metric": "WER",
+    "pearson": -0.17842640649533945
+  },
+  {
+    "parameter": "low_text",
+    "metric": "WER",
+    "pearson": -0.1772397092408802
+  },
+  {
+    "parameter": "text_threshold",
+    "metric": "WER",
+    "pearson": -0.12733512825321042
+  },
+  {
+    "parameter": "min_size",
+    "metric": "WER",
+    "pearson": 0.10070615378426818
+  },
+  {
+    "parameter": "link_threshold",
+    "metric": "WER",
+    "pearson": -0.04425190559911718
+  }
+]
\ No newline at end of file
diff --git a/src/results/correlations/paddle_correlations.csv b/src/results/correlations/paddle_correlations.csv
new file mode 100644
index 0000000..e0a754d
--- /dev/null
+++ b/src/results/correlations/paddle_correlations.csv
@@ -0,0 +1,15 @@
+parameter,metric,pearson
+use_doc_unwarping,CER,0.8791236551817551
+use_doc_orientation_classify,CER,-0.7119850615039771
+textline_orientation,CER,-0.5347452891182014
+text_det_thresh,CER,0.4280438958428758
+text_det_box_thresh,CER,0.3113152196833144
+text_rec_score_thresh,CER,-0.2681957118190106
+text_det_unclip_ratio,CER,
+use_doc_unwarping,WER,0.743651897463081
+use_doc_orientation_classify,WER,-0.6018981292243886
+textline_orientation,WER,-0.5906753653336065
+text_det_thresh,WER,0.39917807081409956
+text_det_box_thresh,WER,0.2555315418488065
+text_rec_score_thresh,WER,-0.08030912963602418
+text_det_unclip_ratio,WER,
diff --git a/src/results/correlations/paddle_correlations.json b/src/results/correlations/paddle_correlations.json
new file mode 100644
index 0000000..78223df
--- /dev/null
+++ b/src/results/correlations/paddle_correlations.json
@@ -0,0 +1,72 @@
+[
+  {
+    "parameter": "use_doc_unwarping",
+    "metric": "CER",
+    "pearson": 0.8791236551817551
+  },
+  {
+    "parameter": "use_doc_orientation_classify",
+    "metric": "CER",
+    "pearson": -0.7119850615039771
+  },
+  {
+    "parameter": "textline_orientation",
+    "metric": "CER",
+    "pearson": -0.5347452891182014
+  },
+  {
+    "parameter": "text_det_thresh",
+    "metric": "CER",
+    "pearson": 0.4280438958428758
+  },
+  {
+    "parameter": "text_det_box_thresh",
+    "metric": "CER",
+    "pearson": 0.3113152196833144
+  },
+  {
+    "parameter": "text_rec_score_thresh",
+    "metric": "CER",
+    "pearson": -0.2681957118190106
+  },
+  {
+    "parameter": "text_det_unclip_ratio",
+    "metric": "CER",
+    "pearson": NaN
+  },
+  {
+    "parameter": "use_doc_unwarping",
+    "metric": "WER",
+    "pearson": 0.743651897463081
+  },
+  {
+    "parameter": "use_doc_orientation_classify",
+    "metric": "WER",
+    "pearson": -0.6018981292243886
+  },
+  {
+    "parameter": "textline_orientation",
+    "metric": "WER",
+    "pearson": -0.5906753653336065
+  },
+  {
+    "parameter": "text_det_thresh",
+    "metric": "WER",
+    "pearson": 0.39917807081409956
+  },
+  {
+    "parameter": "text_det_box_thresh",
+    "metric": "WER",
+    "pearson": 0.2555315418488065
+  },
+  {
+    "parameter": "text_rec_score_thresh",
+    "metric": "WER",
+    "pearson": -0.08030912963602418
+  },
+  {
+    "parameter": "text_det_unclip_ratio",
+    "metric": "WER",
+    "pearson": NaN
+  }
+]
\ No newline at end of file
diff --git a/thesis_output/figures/figura_1.png b/thesis_output/figures/figura_1.png
index efea371..99ee5a3 100644
Binary files a/thesis_output/figures/figura_1.png and b/thesis_output/figures/figura_1.png differ
diff --git a/thesis_output/figures/figura_10.png b/thesis_output/figures/figura_10.png
index 37ef151..5b9dd5f 100644
Binary files a/thesis_output/figures/figura_10.png and b/thesis_output/figures/figura_10.png differ
diff --git a/thesis_output/figures/figura_11.png b/thesis_output/figures/figura_11.png
index 43a6865..176b1bb 100644
Binary files a/thesis_output/figures/figura_11.png and b/thesis_output/figures/figura_11.png differ
diff --git a/thesis_output/figures/figura_13.png b/thesis_output/figures/figura_13.png
index 792aef4..ff072bc 100644
Binary files a/thesis_output/figures/figura_13.png and b/thesis_output/figures/figura_13.png differ
diff --git a/thesis_output/figures/figura_14.png b/thesis_output/figures/figura_14.png
index 38106cd..ca5d45b 100644
Binary files a/thesis_output/figures/figura_14.png and b/thesis_output/figures/figura_14.png differ
diff --git a/thesis_output/figures/figura_16.png b/thesis_output/figures/figura_16.png
index 632960f..5658345 100644
Binary files a/thesis_output/figures/figura_16.png and b/thesis_output/figures/figura_16.png differ
diff --git a/thesis_output/figures/figura_17.png b/thesis_output/figures/figura_17.png
new file mode 100644
index 0000000..fd6d563
Binary files /dev/null and b/thesis_output/figures/figura_17.png differ
diff --git a/thesis_output/figures/figura_18.png b/thesis_output/figures/figura_18.png
new file mode 100644
index 0000000..943a64b
Binary files /dev/null and b/thesis_output/figures/figura_18.png differ
diff --git a/thesis_output/figures/figura_2.png b/thesis_output/figures/figura_2.png
index a9e5b97..79b6fa8 100644
Binary files a/thesis_output/figures/figura_2.png and b/thesis_output/figures/figura_2.png differ
diff --git a/thesis_output/figures/figura_3.png b/thesis_output/figures/figura_3.png
index 731deea..12ed475 100644
Binary files a/thesis_output/figures/figura_3.png and b/thesis_output/figures/figura_3.png differ
diff --git a/thesis_output/figures/figura_4.png b/thesis_output/figures/figura_4.png
index b066143..22d1925 100644
Binary files a/thesis_output/figures/figura_4.png and b/thesis_output/figures/figura_4.png differ
diff --git a/thesis_output/figures/figura_5.png b/thesis_output/figures/figura_5.png
index d000196..bcb1c15 100644
Binary files a/thesis_output/figures/figura_5.png and b/thesis_output/figures/figura_5.png differ
diff --git a/thesis_output/figures/figura_6.png b/thesis_output/figures/figura_6.png
index a8ae6bf..d2bfc1e 100644
Binary files a/thesis_output/figures/figura_6.png and b/thesis_output/figures/figura_6.png differ
diff --git a/thesis_output/figures/figura_7.png b/thesis_output/figures/figura_7.png
index 69494c9..c9da017 100644
Binary files a/thesis_output/figures/figura_7.png and b/thesis_output/figures/figura_7.png differ
diff --git a/thesis_output/figures/figura_8.png b/thesis_output/figures/figura_8.png
index d41acc4..52b96be 100644
Binary files a/thesis_output/figures/figura_8.png and b/thesis_output/figures/figura_8.png differ
diff --git a/thesis_output/figures/figura_9.png b/thesis_output/figures/figura_9.png
index a1cd25e..fd6d563 100644
Binary files a/thesis_output/figures/figura_9.png and b/thesis_output/figures/figura_9.png differ
diff --git a/thesis_output/figures/figures_manifest.json b/thesis_output/figures/figures_manifest.json
index 411ab22..5eeab5c 100644
--- a/thesis_output/figures/figures_manifest.json
+++ b/thesis_output/figures/figures_manifest.json
@@ -78,5 +78,15 @@
     "file": "figura_16.png",
     "title": "Estructura del repositorio MastersThesis",
     "index": 16
+  },
+  {
+    "file": "figura_17.png",
+    "title": "Distribución de trials por rango de CER (PaddleOCR)",
+    "index": 17
+  },
+  {
+    "file": "figura_18.png",
+    "title": "Tiempo de procesamiento: CPU vs GPU (segundos/página)",
+    "index": 18
   }
 ]
\ No newline at end of file
diff --git a/thesis_output/plantilla_individual.htm b/thesis_output/plantilla_individual.htm
index 5c3cf74..daaabfb 100644
--- a/thesis_output/plantilla_individual.htm
+++ b/thesis_output/plantilla_individual.htm
@@ -4149,13 +4149,11 @@ mso-fareast-font-family:"Times New Roman";mso-hansi-theme-font:major-latin;
 mso-bidi-font-family:Arial;color:#0098CD;mso-ansi-language:ES;mso-fareast-language:
 EN-US;mso-bidi-language:AR-SA'><br clear="all" style="page-break-before:always"/>
 </span>
-<p class="Ttulondices"><span lang="ES">Resumen </span></p><p class="MsoNormal"><span lang="ES">El presente Trabajo Fin de Máster aborda la optimización de sistemas de Reconocimiento Óptico de Caracteres (OCR) basados en inteligencia artificial para documentos en español. El objetivo principal es identificar la configuración óptima de hiperparámetros que maximice la precisión del reconocimiento de texto sin requerir fine-tuning de los modelos base.
-
-Se realizó un estudio comparativo de tres soluciones OCR de código abierto: EasyOCR, PaddleOCR (PP-OCRv5) y DocTR, evaluando su rendimiento mediante las métricas estándar CER (Character Error Rate) y WER (Word Error Rate) sobre un corpus de 45 páginas de documentos académicos en español. Tras identificar PaddleOCR como la solución más prometedora, se procedió a una optimización sistemática de hiperparámetros utilizando Ray Tune con el algoritmo de búsqueda Optuna, ejecutando 64 configuraciones diferentes con aceleración GPU (NVIDIA RTX 3060).
-
-Los resultados demuestran que la optimización de hiperparámetros logró mejoras significativas: el mejor trial individual alcanzó un CER de 0.79% (precisión del 99.21%), cumpliendo el objetivo de CER &lt; 2%. Al validar la configuración optimizada sobre el dataset completo de 45 páginas, se obtuvo una mejora del 12.8% en CER (de 8.85% a 7.72%). El hallazgo más relevante fue que el parámetro `textline_orientation` (clasificación de orientación de línea de texto) tiene un impacto crítico en el rendimiento. Adicionalmente, se identificó que el umbral de detección (`text_det_thresh`) presenta una correlación negativa moderada (-0.52) con el error.
-
-Este trabajo demuestra que la optimización de hiperparámetros es una alternativa viable al fine-tuning, especialmente útil cuando se dispone de modelos preentrenados para el idioma objetivo. La infraestructura dockerizada desarrollada permite reproducir los experimentos y facilita la evaluación sistemática de configuraciones OCR.</span></p>
+<p class="Ttulondices"><span lang="ES">Resumen </span></p><p class="MsoNormal"><span lang="ES">El presente Trabajo Fin de Máster aborda la optimización de sistemas de Reconocimiento Óptico de Caracteres (OCR) basados en inteligencia artificial para documentos en español. El objetivo principal es identificar la configuración óptima de hiperparámetros que maximice la precisión del reconocimiento de texto sin requerir fine-tuning de los modelos base.</span></p>
+<p class="MsoNormal"><span lang="ES">Se realizó un estudio comparativo de tres soluciones OCR de código abierto: EasyOCR, PaddleOCR (PP-OCRv5) y DocTR. Se evaluó su rendimiento mediante las métricas estándar CER (Character Error Rate) y WER (Word Error Rate) sobre un corpus de 45 páginas de documentos académicos en español. Tras identificar PaddleOCR como la solución más prometedora, se procedió a una optimización sistemática de hiperparámetros utilizando Ray Tune con el algoritmo de búsqueda Optuna, ejecutando 64 configuraciones diferentes con aceleración GPU (NVIDIA RTX 3060).</span></p>
+<p class="MsoNormal"><span lang="ES">Los resultados demuestran que la optimización de hiperparámetros logró mejoras significativas: el mejor trial individual alcanzó un CER de 0.79% (precisión del 99.21%), cumpliendo el objetivo de CER &lt; 2%. Al validar la configuración optimizada sobre el dataset completo de 45 páginas, se obtuvo una mejora del 12.8% en CER (de 8.85% a 7.72%). El hallazgo más relevante fue que el parámetro <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> (clasificación de orientación de línea de texto) tiene un impacto crítico en el rendimiento. Adicionalmente, se identificó que el umbral de detección (<span style="font-family:Consolas;font-size:10pt">text_det_thresh</span>) presenta una correlación positiva moderada (0.43) con el error, lo que indica que valores más bajos tienden a mejorar el rendimiento.</span></p>
+<p class="MsoNormal"><span lang="ES"><b>Fuente:</b> <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">src/results/correlations/paddle_correlations.csv</span></a>.</span></p>
+<p class="MsoNormal"><span lang="ES">Este trabajo demuestra que la optimización de hiperparámetros es una alternativa viable al fine-tuning, especialmente útil cuando se dispone de modelos preentrenados para el idioma objetivo. La infraestructura dockerizada desarrollada permite reproducir los experimentos y facilita la evaluación sistemática de configuraciones OCR.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><b><span lang="ES">Palabras clave:</span></b><span lang="ES"> OCR, Reconocimiento Óptico de Caracteres, PaddleOCR, Optimización de Hiperparámetros, Ray Tune, Procesamiento de Documentos, Inteligencia Artificial</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
@@ -4169,13 +4167,11 @@ Este trabajo demuestra que la optimización de hiperparámetros es una alternati
 
 
 
-<p class="Ttulondices"><span style="mso-bookmark:_Toc437509152"><span class="SpellE"><span lang="ES">Abstract</span></span></span></p><p class="MsoNormal"><span lang="EN-US">This Master's Thesis addresses the optimization of Artificial Intelligence-based Optical Character Recognition (OCR) systems for Spanish documents. The main objective is to identify the optimal hyperparameter configuration that maximizes text recognition accuracy without requiring fine-tuning of the base models.
-
-A comparative study of three open-source OCR solutions was conducted: EasyOCR, PaddleOCR (PP-OCRv5), and DocTR, evaluating their performance using standard CER (Character Error Rate) and WER (Word Error Rate) metrics on a corpus of 45 pages of academic documents in Spanish. After identifying PaddleOCR as the most promising solution, systematic hyperparameter optimization was performed using Ray Tune with the Optuna search algorithm, executing 64 different configurations with GPU acceleration (NVIDIA RTX 3060).
-
-Results demonstrate that hyperparameter optimization achieved significant improvements: the best individual trial reached a CER of 0.79% (99.21% accuracy), meeting the CER &lt; 2% objective. When validating the optimized configuration on the full 45-page dataset, a 12.8% CER improvement was obtained (from 8.85% to 7.72%). The most relevant finding was that the `textline_orientation` parameter (text line orientation classification) has a critical impact on performance. Additionally, the detection threshold (`text_det_thresh`) was found to have a moderate negative correlation (-0.52) with error.
-
-This work demonstrates that hyperparameter optimization is a viable alternative to fine-tuning, especially useful when pre-trained models for the target language are available. The dockerized infrastructure developed enables experiment reproducibility and facilitates systematic evaluation of OCR configurations.</span></p>
+<p class="Ttulondices"><span style="mso-bookmark:_Toc437509152"><span class="SpellE"><span lang="ES">Abstract</span></span></span></p><p class="MsoNormal"><span lang="EN-US">This Master's Thesis addresses the optimization of Artificial Intelligence-based Optical Character Recognition (OCR) systems for Spanish documents. The main objective is to identify the optimal hyperparameter configuration that maximizes text recognition accuracy without requiring fine-tuning of the base models.</span></p>
+<p class="MsoNormal"><span lang="EN-US">A comparative study of three open-source OCR solutions was conducted with EasyOCR, PaddleOCR (PP-OCRv5), and DocTR. Their performance was evaluated using standard CER (Character Error Rate) and WER (Word Error Rate) metrics on a corpus of 45 pages of academic documents in Spanish. After identifying PaddleOCR as the most promising solution, systematic hyperparameter optimization was performed using Ray Tune with the Optuna search algorithm, executing 64 different configurations with GPU acceleration (NVIDIA RTX 3060).</span></p>
+<p class="MsoNormal"><span lang="EN-US">Results demonstrate that hyperparameter optimization achieved significant improvements. The best individual trial reached a CER of 0.79% (99.21% accuracy), meeting the CER &lt; 2% objective. When validating the optimized configuration on the full 45-page dataset, a 12.8% CER improvement was obtained (from 8.85% to 7.72%). The most relevant finding was that the <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> parameter (text line orientation classification) has a critical impact on performance. Additionally, the detection threshold (<span style="font-family:Consolas;font-size:10pt">text_det_thresh</span>) showed a moderate positive correlation (0.43) with error, indicating that lower values tend to improve performance.</span></p>
+<p class="MsoNormal"><span lang="EN-US">Sources: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">src/results/correlations/paddle_correlations.csv</span></a>.</span></p>
+<p class="MsoNormal"><span lang="EN-US">This work demonstrates that hyperparameter optimization is a viable alternative to fine-tuning, especially useful when pre-trained models for the target language are available. The dockerized infrastructure developed enables experiment reproducibility and facilitates systematic evaluation of OCR configurations.</span></p>
 <p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
 <p class="MsoNormal"><b><span lang="EN-US">Keywords:</span></b><span lang="EN-US"> OCR, Optical Character Recognition, PaddleOCR, Hyperparameter Optimization, Ray Tune, Document Processing, Artificial Intelligence</span></p>
 <p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
@@ -4539,34 +4535,34 @@ mso-ansi-language:ES;mso-fareast-language:EN-US;mso-bidi-language:AR-SA'><br cle
 mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span style="mso-list:Ignore">1.<span style='font:7.0pt "Times New Roman"'>  
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Introducción</span></span></span></span></a><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="text-transform:none"> </span></span></span></h1><p class="MsoNormal"><span lang="ES">¿Es posible mejorar significativamente un sistema OCR sin reentrenarlo? Esta pregunta, aparentemente simple, encierra un desafío práctico que afecta a investigadores, instituciones educativas y empresas que necesitan digitalizar documentos pero carecen de los recursos para realizar fine-tuning de modelos neuronales. A lo largo de este capítulo se desarrolla la motivación del trabajo, se identifica el problema a resolver y se plantean las preguntas de investigación que guiarán el desarrollo experimental.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Motivación</span></h2>
-<p class="MsoNormal"><span lang="ES">El Reconocimiento Óptico de Caracteres (OCR) es una tecnología fundamental en la era de la digitalización documental. Su capacidad para convertir imágenes de texto en datos editables y procesables ha transformado sectores como la administración pública, el ámbito legal, la banca y la educación. Según estimaciones del sector, el mercado global de OCR alcanzó los 13.4 mil millones de dólares en 2023, con proyecciones de crecimiento continuo impulsado por la transformación digital empresarial (Grand View Research, 2023). Sin embargo, a pesar de los avances significativos impulsados por el aprendizaje profundo, la implementación práctica de sistemas OCR de alta precisión sigue presentando desafíos considerables.</span></p>
+<p class="MsoNormal"><span lang="ES">El Reconocimiento Óptico de Caracteres (OCR) es una tecnología fundamental en la era de la digitalización documental. Su capacidad para convertir imágenes de texto en datos editables y procesables ha transformado sectores como la administración pública, el ámbito legal, la banca y la educación. La expansión de la transformación digital empresarial ha impulsado su adopción, aunque la implementación práctica de sistemas OCR de alta precisión sigue presentando desafíos considerables.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">El contexto de la digitalización documental</span></h3>
 <p class="MsoNormal"><span lang="ES">La digitalización de documentos ha pasado de ser una opción a una necesidad estratégica para organizaciones de todos los tamaños. Los beneficios son múltiples: reducción del espacio físico de almacenamiento, facilidad de búsqueda y recuperación, preservación del patrimonio documental, y habilitación de flujos de trabajo automatizados. Sin embargo, la mera conversión de papel a imagen digital no aprovecha plenamente estas ventajas; es necesario extraer el texto contenido en los documentos para permitir su indexación, análisis y procesamiento automatizado.</span></p>
-<p class="MsoNormal"><span lang="ES">El OCR actúa como puente entre el mundo físico del documento impreso y el mundo digital del texto procesable. Su precisión determina directamente la calidad de los procesos downstream: un error de reconocimiento en un nombre propio puede invalidar una búsqueda; un dígito mal reconocido en una factura puede causar discrepancias contables; una palabra mal interpretada en un contrato puede alterar su significado legal.</span></p>
+<p class="MsoNormal"><span lang="ES">El OCR actúa como puente entre el mundo físico del documento impreso y el mundo digital del texto procesable. Su precisión determina directamente la calidad de los procesos downstream. Un error de reconocimiento en un nombre propio puede invalidar una búsqueda; un dígito mal reconocido en una factura puede causar discrepancias contables. Una palabra mal interpretada en un contrato puede alterar su significado legal.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Desafíos específicos del español</span></h3>
-<p class="MsoNormal"><span lang="ES">El procesamiento de documentos en español presenta particularidades que complican el reconocimiento automático de texto. Los caracteres especiales propios del idioma (la letra ñ, las vocales acentuadas á, é, í, ó, ú, la diéresis ü, y los signos de puntuación invertidos ¿ y ¡) no están presentes en muchos conjuntos de entrenamiento internacionales, lo que puede degradar el rendimiento de modelos preentrenados predominantemente en inglés.</span></p>
+<p class="MsoNormal"><span lang="ES">El procesamiento de documentos en español presenta particularidades que complican el reconocimiento automático de texto. Los caracteres especiales propios del idioma (la letra ñ, las vocales acentuadas á, é, í, ó, ú, la diéresis ü, y los signos de puntuación invertidos ¿, ¡) no están presentes en muchos conjuntos de entrenamiento internacionales, lo que puede degradar el rendimiento de modelos preentrenados predominantemente en inglés.</span></p>
 <p class="MsoNormal"><span lang="ES">La Tabla 1 resume los principales desafíos lingüísticos del OCR en español:</span></p>
-<a name="_Ref_Tab1"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->1<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Desafíos lingüísticos específicos del OCR en español.</span></i></p>
+<a name="_Ref_Tab1"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->1<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Desafíos lingüísticos específicos del OCR en español.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Desafío</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Descripción</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Impacto en OCR</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Caracteres especiales</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">ñ, á, é, í, ó, ú, ü, ¿, ¡</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Confusión con caracteres similares (n/ñ, a/á)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Palabras largas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Español permite compuestos largos</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mayor probabilidad de error por carácter</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Abreviaturas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Dr., Sra., Ud., etc.</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Puntos internos confunden segmentación</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Nombres propios</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tildes en apellidos (García, Martínez)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Bases de datos sin soporte Unicode</span></p></td></tr></table></div>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES">Además de los aspectos lingüísticos, los documentos académicos y administrativos en español presentan características tipográficas que complican el reconocimiento: variaciones en fuentes entre encabezados, cuerpo y notas al pie; presencia de tablas con bordes y celdas; logotipos institucionales; marcas de agua; y elementos gráficos como firmas o sellos. Estos elementos generan ruido que puede propagarse en aplicaciones downstream como la extracción de entidades nombradas o el análisis semántico.</span></p>
+<p class="MsoNormal"><span lang="ES">Además de los aspectos lingüísticos, los documentos académicos y administrativos en español presentan características tipográficas que complican el reconocimiento: variaciones en fuentes entre encabezados, cuerpo y notas al pie; presencia de índices, listas numeradas y cambios frecuentes de estilo; y saltos de línea que rompen la continuidad del texto. Estos elementos generan ruido que puede propagarse en aplicaciones downstream como la extracción de entidades nombradas o el análisis semántico.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">La brecha entre investigación y práctica</span></h3>
-<p class="MsoNormal"><span lang="ES">Los modelos OCR basados en redes neuronales profundas, como los empleados en PaddleOCR, EasyOCR o DocTR, ofrecen un rendimiento impresionante en benchmarks estándar. PaddleOCR, por ejemplo, reporta tasas de precisión superiores al 97% en conjuntos de datos como ICDAR 2015 (Du et al., 2020). No obstante, estos resultados en condiciones controladas no siempre se trasladan a documentos del mundo real.</span></p>
-<p class="MsoNormal"><span lang="ES">La adaptación de modelos preentrenados a dominios específicos típicamente requiere fine-tuning con datos etiquetados del dominio objetivo y recursos computacionales significativos. El fine-tuning de un modelo de reconocimiento de texto puede requerir decenas de miles de imágenes etiquetadas y días de entrenamiento en GPUs de alta capacidad. Esta barrera técnica y económica excluye a muchos investigadores y organizaciones de beneficiarse plenamente de estas tecnologías.</span></p>
+<p class="MsoNormal"><span lang="ES">Los modelos OCR basados en redes neuronales profundas, como los empleados en PaddleOCR, EasyOCR o DocTR, ofrecen un rendimiento competitivo en benchmarks estándar. No obstante, estos resultados en condiciones controladas no siempre se trasladan a documentos del mundo real.</span></p>
+<p class="MsoNormal"><span lang="ES">La adaptación de modelos preentrenados a dominios específicos típicamente requiere fine-tuning con datos etiquetados del dominio objetivo y recursos computacionales significativos. Esta barrera técnica y económica excluye a muchos investigadores y organizaciones de beneficiarse plenamente de estas tecnologías.</span></p>
 <p class="MsoNormal"><span lang="ES">La Tabla 2 ilustra los requisitos típicos para diferentes estrategias de mejora de OCR:</span></p>
-<a name="_Ref_Tab2"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->2<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparación de estrategias de mejora de modelos OCR.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Estrategia</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Datos requeridos</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Hardware</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tiempo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Expertise</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fine-tuning completo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&gt;10,000 imágenes etiquetadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU (≥16GB VRAM)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Días-Semanas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fine-tuning parcial</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&gt;1,000 imágenes etiquetadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU (≥8GB VRAM)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Horas-Días</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio-Alto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Transfer learning</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&gt;500 imágenes etiquetadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU (≥8GB VRAM)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Horas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Optimización de hiperparámetros</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>&lt;100 imágenes de validación</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>CPU suficiente</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Horas</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Bajo-Medio</b></span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab2"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->2<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparación de estrategias de mejora de modelos OCR.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Estrategia</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Datos requeridos</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Hardware</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tiempo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Expertise</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fine-tuning completo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Miles de imágenes etiquetadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU de alta memoria</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Días o semanas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fine-tuning parcial</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Cientos o miles de imágenes etiquetadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU dedicada</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Horas o días</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio-Alto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Transfer learning</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Centenas de imágenes etiquetadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU dedicada</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Horas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Optimización de hiperparámetros</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Subconjunto de validación</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>CPU o GPU (CUDA 12.2+ en Docker DocTR)</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Horas</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Bajo-Medio</b></span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/07_anexo_a.md"><span style="font-family:Consolas;font-size:10pt">docs/07_anexo_a.md</span></a>, sección A.9.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">La oportunidad: optimización sin fine-tuning</span></h3>
-<p class="MsoNormal"><span lang="ES">La presente investigación surge de una necesidad práctica: optimizar un sistema OCR para documentos académicos en español sin disponer de recursos GPU para realizar fine-tuning. Esta restricción, lejos de ser una limitación excepcional, representa la realidad de muchos entornos académicos y empresariales donde el acceso a infraestructura de cómputo avanzada es limitado.</span></p>
-<p class="MsoNormal"><span lang="ES">La hipótesis central de este trabajo es que los modelos OCR preentrenados contienen capacidades latentes que pueden activarse mediante la configuración adecuada de sus hiperparámetros de inferencia. Parámetros como los umbrales de detección de texto, las opciones de preprocesamiento de imagen, y los filtros de confianza de reconocimiento pueden tener un impacto significativo en el rendimiento final, y su optimización sistemática puede aproximarse a los beneficios del fine-tuning sin sus costes asociados.</span></p>
+<p class="MsoNormal"><span lang="ES">La presente investigación surge de una necesidad práctica: optimizar un sistema OCR para documentos académicos en español sin disponer de infraestructura de entrenamiento dedicada para fine-tuning. Esta restricción, lejos de ser una limitación excepcional, representa la realidad de muchos entornos académicos y empresariales donde el acceso a cómputo avanzado es limitado.</span></p>
+<p class="MsoNormal"><span lang="ES">La hipótesis central de este trabajo es que los modelos OCR preentrenados contienen capacidades latentes que pueden activarse mediante la configuración adecuada de sus hiperparámetros de inferencia. Parámetros como los umbrales de detección de texto, las opciones de preprocesamiento de imagen, y los filtros de confianza de reconocimiento pueden tener un impacto significativo en el rendimiento final. Su optimización sistemática puede aproximarse a los beneficios del fine-tuning sin sus costes asociados.</span></p>
 <p class="MsoNormal"><span lang="ES">Esta oportunidad se ve reforzada por la disponibilidad de frameworks modernos de optimización de hiperparámetros como Ray Tune (Liaw et al., 2018) y algoritmos de búsqueda eficientes como Optuna (Akiba et al., 2019), que permiten explorar espacios de configuración de manera sistemática y eficiente.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Planteamiento del trabajo</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Formulación del problema</span></h3>
 <p class="MsoNormal"><span lang="ES">Las observaciones anteriores conducen a formular el problema central de este trabajo:</span></p>
-<p class="MsoQuote"><i><span lang="ES">¿Es posible mejorar significativamente el rendimiento de modelos OCR preentrenados para documentos en español mediante la optimización sistemática de hiperparámetros, sin requerir fine-tuning ni recursos GPU?</span></i></p>
+<p class="MsoQuote"><i><span lang="ES">¿Es posible mejorar significativamente el rendimiento de modelos OCR preentrenados para documentos en español mediante la optimización sistemática de hiperparámetros, sin requerir fine-tuning y con recursos computacionales de consumo?</span></i></p>
 <p class="MsoNormal"><span lang="ES">Este planteamiento parte de una observación fundamental: los sistemas OCR modernos exponen múltiples parámetros configurables que afectan su comportamiento durante la inferencia. Estos parámetros incluyen umbrales de detección, opciones de preprocesamiento, y filtros de calidad. En la práctica habitual, estos parámetros se dejan en sus valores por defecto, asumiendo que fueron optimizados por los desarrolladores del modelo. Sin embargo, los valores por defecto representan compromisos generales que pueden no ser óptimos para dominios específicos.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Preguntas de investigación</span></h3>
 <p class="MsoNormal"><span lang="ES">Este planteamiento se descompone en las siguientes cuestiones específicas:</span></p>
@@ -4575,13 +4571,13 @@ mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span styl
 <p class="MsoNormal"><span lang="ES"><b>PI2. Impacto de hiperparámetros</b>: ¿Qué hiperparámetros del pipeline OCR tienen mayor influencia en las métricas de error (CER, WER)?</span></p>
 <p class="MsoNormal"><span lang="ES">Identificar los parámetros más influyentes permite focalizar el esfuerzo de optimización y proporciona insights sobre el funcionamiento interno del sistema. Parámetros con alta correlación con las métricas de error son candidatos prioritarios para ajuste.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>PI3. Optimización automatizada</b>: ¿Puede un proceso de búsqueda automatizada de hiperparámetros (mediante Ray Tune/Optuna) encontrar configuraciones que superen significativamente los valores por defecto?</span></p>
-<p class="MsoNormal"><span lang="ES">Esta pregunta evalúa la viabilidad práctica de la metodología propuesta. "Significativamente" se define operacionalmente como una reducción del CER de al menos 50% respecto al baseline, un umbral que representaría una mejora sustancial en la calidad del texto reconocido.</span></p>
+<p class="MsoNormal"><span lang="ES">Esta pregunta evalúa la viabilidad práctica de la metodología propuesta. "Significativamente" se define como una mejora sustancial respecto al baseline, con impacto observable en la calidad del texto reconocido.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>PI4. Viabilidad práctica</b>: ¿Son los tiempos de inferencia y los recursos requeridos compatibles con un despliegue en entornos con recursos limitados?</span></p>
 <p class="MsoNormal"><span lang="ES">Una solución técnicamente superior pero impracticable tiene valor limitado. Esta pregunta ancla la investigación en consideraciones del mundo real.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Alcance y delimitación</span></h3>
 <p class="MsoNormal"><span lang="ES">Este trabajo se centra específicamente en:</span></p>
-<a name="_Ref_Tab3"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->3<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Delimitación del alcance del trabajo.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Aspecto</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Dentro del alcance</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Fuera del alcance</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Tipo de documento</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Documentos académicos digitales (PDF)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Documentos escaneados, manuscritos</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Idioma</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Español</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Otros idiomas</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Modelos</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR, PaddleOCR, DocTR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Soluciones comerciales (Google Cloud Vision, AWS Textract)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Método de mejora</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización de hiperparámetros</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fine-tuning, aumento de datos</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Hardware</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ejecución en CPU</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Aceleración GPU</span></p></td></tr></table></div>
+<a name="_Ref_Tab3"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->3<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Delimitación del alcance del trabajo.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Aspecto</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Dentro del alcance</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Fuera del alcance</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Tipo de documento</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Documentos académicos digitales (PDF)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Documentos escaneados, manuscritos</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Idioma</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Español</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Otros idiomas</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Modelos</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR, PaddleOCR, DocTR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Soluciones comerciales (Google Cloud Vision, AWS Textract)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Método de mejora</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización de hiperparámetros</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fine-tuning, aumento de datos</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Hardware</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU de consumo y CPU para referencia de tiempos</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Infraestructura multi-GPU</span></p></td></tr></table></div>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Relevancia y beneficiarios</span></h3>
@@ -4591,19 +4587,19 @@ mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span styl
 <p class="MsoNormal"><span lang="ES"><b>Pequeñas y medianas empresas</b>: Organizaciones que automatizan flujos documentales (facturas, contratos, correspondencia) sin presupuesto para soluciones enterprise o infraestructura GPU.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Desarrolladores de software</b>: Quienes integran OCR en aplicaciones con restricciones de recursos, como dispositivos móviles o servidores compartidos, y necesitan maximizar el rendimiento sin costes adicionales de hardware.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Estructura del trabajo</span></h2>
-<p class="MsoNormal"><span lang="ES">El documento sigue una estructura que refleja el proceso investigador. Tras esta introducción, el <b>Capítulo 2</b> sitúa el trabajo en su contexto técnico, revisando las tecnologías OCR basadas en aprendizaje profundo —desde las arquitecturas de detección hasta los modelos de reconocimiento— y los trabajos previos en optimización de estos sistemas.</span></p>
-<p class="MsoNormal"><span lang="ES">El <b>Capítulo 3</b> traduce las preguntas de investigación en objetivos concretos siguiendo la metodología SMART, y describe con detalle el enfoque experimental: preparación del dataset, métricas de evaluación y configuración del proceso de optimización con Ray Tune y Optuna.</span></p>
-<p class="MsoNormal"><span lang="ES">El núcleo del trabajo se desarrolla en el <b>Capítulo 4</b>, que presenta el estudio comparativo y la optimización de hiperparámetros estructurados en tres fases: planteamiento de la comparativa con evaluación de EasyOCR, PaddleOCR y DocTR; desarrollo de la optimización mediante 64 trials con Ray Tune; y análisis crítico de los resultados obtenidos.</span></p>
+<p class="MsoNormal"><span lang="ES">El documento sigue una estructura que refleja el proceso investigador. Tras esta introducción, el <b>Capítulo 2</b> sitúa el trabajo en su contexto técnico y revisa las tecnologías OCR basadas en aprendizaje profundo. Se describen las arquitecturas de detección, los modelos de reconocimiento y los trabajos previos en optimización de estos sistemas.</span></p>
+<p class="MsoNormal"><span lang="ES">El <b>Capítulo 3</b> traduce las preguntas de investigación en objetivos concretos, siguiendo la metodología SMART. Además, describe con detalle el enfoque experimental: preparación del dataset, métricas de evaluación y configuración del proceso de optimización con Ray Tune y Optuna.</span></p>
+<p class="MsoNormal"><span lang="ES">El núcleo del trabajo se desarrolla en el <b>Capítulo 4</b>, que presenta el estudio comparativo y la optimización de hiperparámetros en tres fases: planteamiento de la comparativa con evaluación de EasyOCR, PaddleOCR y DocTR; desarrollo de la optimización mediante 64 trials con Ray Tune; y análisis crítico de los resultados obtenidos.</span></p>
 <p class="MsoNormal"><span lang="ES">Finalmente, el <b>Capítulo 5</b> sintetiza las contribuciones, evalúa el grado de cumplimiento de los objetivos y propone líneas de trabajo futuro. Los <b>Anexos</b> proporcionan acceso al repositorio de código fuente y datos, así como tablas detalladas de resultados experimentales.</span></p><h1 style="mso-list:l22 level1 lfo18"><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><a name="_Toc147741195"></a><a name="_Toc160619809"><span style="mso-bookmark:_Toc147741195"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
 major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin;
 text-transform:none'><span style="mso-list:Ignore">2.<span style='font:7.0pt "Times New Roman"'>  
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Contexto
 y estado del arte</span></span></a></span></span><span style="mso-bookmark:
-_Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="text-transform:none"><o:p></o:p></span></span></span></h1><p class="MsoNormal"><span lang="ES">Para comprender el alcance y las decisiones tomadas en este trabajo, es necesario situarlo en su contexto tecnológico. El Reconocimiento Óptico de Caracteres ha recorrido un largo camino desde los primeros sistemas de plantillas de los años 50 hasta las sofisticadas arquitecturas de aprendizaje profundo actuales. A lo largo de este capítulo se revisan los fundamentos técnicos del OCR moderno, se analizan las principales soluciones de código abierto y se identifican los vacíos en la literatura que motivan la contribución de este trabajo.</span></p>
+_Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="text-transform:none"><o:p></o:p></span></span></span></h1><p class="MsoNormal"><span lang="ES">Para comprender el alcance y las decisiones tomadas en este trabajo, es necesario situarlo en su contexto tecnológico. El Reconocimiento Óptico de Caracteres ha recorrido un largo camino desde los primeros sistemas de plantillas de los años 50 hasta las sofisticadas arquitecturas de aprendizaje profundo actuales. A lo largo de este capítulo se revisan los fundamentos técnicos del OCR moderno. Se analizan las principales soluciones de código abierto y se identifican los vacíos en la literatura que motivan la contribución de este trabajo.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Contexto del problema</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Definición y Evolución Histórica del OCR</span></h3>
 <p class="MsoNormal"><span lang="ES">El Reconocimiento Óptico de Caracteres (OCR) es el proceso de conversión de imágenes de texto manuscrito, mecanografiado o impreso en texto codificado digitalmente. Esta tecnología permite la digitalización masiva de documentos, facilitando su búsqueda, edición y almacenamiento electrónico. La tecnología OCR ha evolucionado significativamente desde sus orígenes en la década de 1950, atravesando cuatro generaciones claramente diferenciadas:</span></p>
-<h4><span lang="ES">Primera Generación (1950-1970): Sistemas basados en plantillas</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Primera Generación (1950-1970): Sistemas basados en plantillas</span></h4>
 <p class="MsoNormal"><span lang="ES">Los primeros sistemas OCR surgieron en la década de 1950 con el objetivo de automatizar la lectura de documentos bancarios y postales. Estos sistemas utilizaban técnicas de correspondencia de plantillas (<i>template matching</i>), donde cada carácter de entrada se comparaba píxel a píxel con un conjunto predefinido de plantillas (Mori et al., 1992).</span></p>
 <p class="MsoNormal"><span lang="ES">Las principales limitaciones de esta generación incluían:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Dependencia de fuentes tipográficas específicas (OCR-A, OCR-B)</span></p>
@@ -4611,14 +4607,14 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Alto coste computacional para la época</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Sensibilidad extrema al ruido y degradación de la imagen</span></p>
 <p class="MsoNormal"><span lang="ES">A pesar de sus limitaciones, estos sistemas sentaron las bases para el desarrollo posterior del campo y demostraron la viabilidad comercial del reconocimiento automático de texto.</span></p>
-<h4><span lang="ES">Segunda Generación (1970-1990): Extracción de características</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Segunda Generación (1970-1990): Extracción de características</span></h4>
 <p class="MsoNormal"><span lang="ES">La segunda generación introdujo técnicas más sofisticadas basadas en la extracción de características geométricas y estructurales de los caracteres. En lugar de comparar imágenes completas, estos sistemas extraían propiedades como:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Número y posición de trazos</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Proporciones geométricas (altura, anchura, relación de aspecto)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Momentos estadísticos de la distribución de píxeles</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Características topológicas (bucles, intersecciones, terminaciones)</span></p>
 <p class="MsoNormal"><span lang="ES">Los clasificadores estadísticos, como el análisis discriminante lineal y los k-vecinos más cercanos (k-NN), se utilizaban para asignar cada vector de características a una clase de carácter (Trier et al., 1996). Esta aproximación permitió mayor robustez frente a variaciones tipográficas, aunque seguía requiriendo un diseño manual cuidadoso de las características a extraer.</span></p>
-<h4><span lang="ES">Tercera Generación (1990-2010): Redes neuronales y modelos probabilísticos</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Tercera Generación (1990-2010): Redes neuronales y modelos probabilísticos</span></h4>
 <p class="MsoNormal"><span lang="ES">La tercera generación marcó la introducción de técnicas de aprendizaje automático más avanzadas. Los Modelos Ocultos de Markov (HMM) se convirtieron en el estándar para el reconocimiento de secuencias de caracteres, especialmente en el reconocimiento de escritura manuscrita (Plamondon &amp; Srihari, 2000).</span></p>
 <p class="MsoNormal"><span lang="ES">Las Redes Neuronales Artificiales (ANN) también ganaron popularidad en esta época, con arquitecturas como el Perceptrón Multicapa (MLP) demostrando capacidades superiores de generalización. El trabajo seminal de LeCun et al. (1998) con las redes convolucionales (CNN) para el reconocimiento de dígitos manuscritos (dataset MNIST) estableció los fundamentos para la siguiente revolución.</span></p>
 <p class="MsoNormal"><span lang="ES">Las características de esta generación incluían:</span></p>
@@ -4626,7 +4622,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Modelado probabilístico de secuencias de caracteres</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Mayor robustez frente a ruido y degradación</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Capacidad de incorporar conocimiento lingüístico mediante modelos de lenguaje</span></p>
-<h4><span lang="ES">Cuarta Generación (2010-presente): Aprendizaje profundo</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Cuarta Generación (2010-presente): Aprendizaje profundo</span></h4>
 <p class="MsoNormal"><span lang="ES">La cuarta y actual generación está dominada por arquitecturas de aprendizaje profundo que han superado ampliamente el rendimiento de los métodos tradicionales. Los avances clave incluyen:</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Redes Convolucionales Profundas (Deep CNNs)</b>: Arquitecturas como VGGNet, ResNet e Inception permiten la extracción automática de características jerárquicas a múltiples escalas, eliminando la necesidad de diseño manual de características (Krizhevsky et al., 2012).</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Redes Recurrentes (RNN/LSTM)</b>: Las redes Long Short-Term Memory (LSTM) permiten modelar dependencias a largo plazo en secuencias de caracteres, siendo fundamentales para el reconocimiento de texto de longitud variable (Graves et al., 2009).</span></p>
@@ -4634,17 +4630,17 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoNormal"><span lang="ES"><b>Connectionist Temporal Classification (CTC)</b>: La función de pérdida CTC (Graves et al., 2006) permite entrenar modelos de reconocimiento de secuencias sin necesidad de alineamiento carácter por carácter, simplificando enormemente el proceso de entrenamiento.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Pipeline Moderno de OCR</span></h3>
 <p class="MsoNormal"><span lang="ES">Los sistemas OCR modernos siguen típicamente un pipeline de dos etapas principales, precedidas opcionalmente por una fase de preprocesamiento:</span></p>
-<a name="_Ref_Fig1"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->1<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Pipeline de un sistema OCR moderno</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Pipeline de un sistema OCR moderno" height="101" src="figures/figura_1.png" style="width:424.5pt;height:75.75pt;display:block;margin:0 auto" width="566"/></span></p>
+<a name="_Ref_Fig1"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->1<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Pipeline de un sistema OCR moderno</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Pipeline de un sistema OCR moderno" height="101" src="figures/figura_1.png" style="width:424.5pt;height:75.75pt;display:block;margin:0 auto" width="566"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Etapa de Preprocesamiento</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Etapa de Preprocesamiento</span></h4>
 <p class="MsoNormal"><span lang="ES">Antes de la detección, muchos sistemas aplican técnicas de preprocesamiento para mejorar la calidad de la imagen de entrada:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Binarización</b>: Conversión a imagen binaria (blanco/negro) mediante técnicas como Otsu o Sauvola</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Corrección de inclinación (deskewing)</b>: Alineamiento horizontal del texto</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Eliminación de ruido</b>: Filtros morfológicos y de suavizado</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Normalización de contraste</b>: Mejora de la legibilidad mediante ecualización de histograma</span></p>
-<h4><span lang="ES">Etapa 1: Detección de Texto (Text Detection)</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Etapa 1: Detección de Texto (Text Detection)</span></h4>
 <p class="MsoNormal"><span lang="ES">La detección de texto tiene como objetivo localizar todas las regiones de una imagen que contienen texto. Esta tarea es particularmente desafiante debido a la variabilidad en:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Tamaño y orientación del texto</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Fondos complejos y oclusiones parciales</span></p>
@@ -4654,11 +4650,11 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoNormal"><span lang="ES"><b>EAST (Efficient and Accurate Scene Text Detector)</b>: Propuesto por Zhou et al. (2017), EAST es un detector de una sola etapa que predice directamente cuadriláteros rotados o polígonos que encierran el texto. Su arquitectura FCN (Fully Convolutional Network) permite procesamiento eficiente de imágenes de alta resolución.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>CRAFT (Character Region Awareness for Text Detection)</b>: Desarrollado por Baek et al. (2019), CRAFT detecta regiones de caracteres individuales y las agrupa en palabras mediante el análisis de mapas de afinidad. Esta aproximación bottom-up es especialmente efectiva para texto con espaciado irregular.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>DB (Differentiable Binarization)</b>: Propuesto por Liao et al. (2020), DB introduce una operación de binarización diferenciable que permite entrenar end-to-end un detector de texto basado en segmentación. Esta arquitectura es la utilizada por PaddleOCR y destaca por su velocidad y precisión.</span></p>
-<a name="_Ref_Tab4"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->4<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de arquitecturas de detección de texto.</span></i></p>
+<a name="_Ref_Tab4"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->4<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de arquitecturas de detección de texto.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Arquitectura</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Salida</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Fortalezas</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Limitaciones</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EAST</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Single-shot</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Cuadriláteros rotados</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Rápido, simple</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Dificultad con texto curvo</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CRAFT</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Bottom-up</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Polígonos de palabra</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Robusto a espaciado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mayor coste computacional</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DB</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Segmentación</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Polígonos arbitrarios</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Rápido, preciso</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sensible a parámetros</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia a partir de Zhou et al. (2017), Baek et al. (2019), Liao et al. (2020).</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Etapa 2: Reconocimiento de Texto (Text Recognition)</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Etapa 2: Reconocimiento de Texto (Text Recognition)</span></h4>
 <p class="MsoNormal"><span lang="ES">Una vez detectadas las regiones de texto, la etapa de reconocimiento transcribe el contenido visual a texto digital. Las arquitecturas predominantes son:</span></p>
 <p class="MsoNormal"><span lang="ES"><b>CRNN (Convolutional Recurrent Neural Network)</b>: Propuesta por Shi et al. (2016), CRNN combina una CNN para extracción de características visuales con una RNN bidireccional (típicamente LSTM) para modelado de secuencias, entrenada con pérdida CTC. Esta arquitectura estableció el paradigma encoder-decoder que domina el campo.</span></p>
 <p class="MsoNormal"><span lang="ES">La arquitectura CRNN consta de tres componentes:</span></p>
@@ -4668,17 +4664,17 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoNormal"><span lang="ES"><b>SVTR (Scene-Text Visual Transformer Recognition)</b>: Desarrollado por Du et al. (2022), SVTR aplica la arquitectura Transformer al reconocimiento de texto, utilizando parches de imagen como tokens de entrada. Esta aproximación elimina la necesidad de RNN y permite capturar dependencias globales de manera más eficiente.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Arquitecturas con Atención</b>: Los modelos encoder-decoder con mecanismos de atención (Bahdanau et al., 2015) permiten al decodificador "enfocarse" en diferentes partes de la imagen mientras genera cada carácter. Esto es especialmente útil para texto largo o con layouts complejos.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>TrOCR (Transformer-based OCR)</b>: Propuesto por Li et al. (2023), TrOCR utiliza un Vision Transformer (ViT) como encoder y un Transformer de lenguaje como decoder, logrando resultados estado del arte en múltiples benchmarks.</span></p>
-<a name="_Ref_Tab5"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->5<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de arquitecturas de reconocimiento de texto.</span></i></p>
+<a name="_Ref_Tab5"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->5<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de arquitecturas de reconocimiento de texto.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Arquitectura</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Encoder</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Decoder</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Pérdida</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Características</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CRNN</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CNN</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">BiLSTM</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CTC</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Rápido, robusto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">SVTR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">ViT</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Linear</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CTC</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sin recurrencia</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Attention-based</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CNN</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">LSTM+Attn</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Cross-entropy</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Flexible longitud</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">TrOCR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">ViT</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Transformer</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Cross-entropy</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Estado del arte</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia a partir de Shi et al. (2016), Du et al. (2022), Li et al. (2023).</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Métricas de Evaluación</span></h3>
 <p class="MsoNormal"><span lang="ES">La evaluación rigurosa de sistemas OCR requiere métricas estandarizadas que permitan comparaciones objetivas. Las métricas fundamentales se basan en la distancia de edición de Levenshtein.</span></p>
-<h4><span lang="ES">Distancia de Levenshtein</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Distancia de Levenshtein</span></h4>
 <p class="MsoNormal"><span lang="ES">La distancia de Levenshtein (Levenshtein, 1966) entre dos cadenas es el número mínimo de operaciones de edición (inserción, eliminación, sustitución) necesarias para transformar una cadena en otra. Formalmente, para dos cadenas <i>a</i> y <i>b</i>:</span></p>
 <p class="MsoNormal" style="text-align:center"><math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>d</mi><mo stretchy="false">(</mo><mi>a</mi><mo>,</mo><mi>b</mi><mo stretchy="false">)</mo><mo>=</mo><mo>min</mo><mo stretchy="false">(</mo><mtext>inserciones</mtext><mo>+</mo><mtext>eliminaciones</mtext><mo>+</mo><mtext>sustituciones</mtext><mo stretchy="false">)</mo></mrow></math></p>
 <p class="MsoNormal"><span lang="ES">Esta métrica es fundamental para calcular tanto CER como WER.</span></p>
-<h4><span lang="ES">Character Error Rate (CER)</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Character Error Rate (CER)</span></h4>
 <p class="MsoNormal"><span lang="ES">El CER mide el error a nivel de carácter y se calcula como:</span></p>
 <p class="MsoNormal" style="text-align:center"><math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>C</mi><mi>E</mi><mi>R</mi><mo>=</mo><mfrac><mrow><mi>S</mi><mo>+</mo><mi>D</mi><mo>+</mo><mi>I</mi></mrow><mrow><mi>N</mi></mrow></mfrac></mrow></math></p>
 <p class="MsoNormal"><span lang="ES">Donde:</span></p>
@@ -4686,22 +4682,18 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">D = número de eliminaciones de caracteres</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">I = número de inserciones de caracteres</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">N = número total de caracteres en el texto de referencia</span></p>
-<p class="MsoNormal"><span lang="ES">Un CER del 1% indica que, en promedio, 1 de cada 100 caracteres contiene un error. Para aplicaciones críticas como:</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Documentos financieros</b>: Se requiere CER &lt; 0.1%</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Documentos médicos</b>: Se requiere CER &lt; 0.5%</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Documentos académicos</b>: CER &lt; 2% es aceptable</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Búsqueda y archivo</b>: CER &lt; 5% puede ser suficiente</span></p>
-<h4><span lang="ES">Word Error Rate (WER)</span></h4>
+<p class="MsoNormal"><span lang="ES">Un CER bajo indica que el sistema comete pocos errores a nivel de carácter. Para aplicaciones críticas se requiere un nivel de error muy reducido, mientras que en tareas de búsqueda o archivo pueden aceptarse errores mayores.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Word Error Rate (WER)</span></h4>
 <p class="MsoNormal"><span lang="ES">El WER mide el error a nivel de palabra, utilizando la misma fórmula pero considerando palabras como unidades:</span></p>
 <p class="MsoNormal" style="text-align:center"><math display="block" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>W</mi><mi>E</mi><mi>R</mi><mo>=</mo><mfrac><mrow><msub><mi>S</mi><mi>w</mi></msub><mo>+</mo><msub><mi>D</mi><mi>w</mi></msub><mo>+</mo><msub><mi>I</mi><mi>w</mi></msub></mrow><mrow><msub><mi>N</mi><mi>w</mi></msub></mrow></mfrac></mrow></math></p>
-<p class="MsoNormal"><span lang="ES">El WER es generalmente mayor que el CER, ya que un solo error de carácter puede invalidar una palabra completa. La relación típica es WER ≈ 2-3 × CER para texto en español.</span></p>
-<h4><span lang="ES">Otras Métricas Complementarias</span></h4>
-<p class="MsoNormal"><span lang="ES"><b>Precision y Recall a nivel de palabra</b>: Útiles cuando se evalúa la capacidad del sistema para detectar palabras específicas.</span></p>
+<p class="MsoNormal"><span lang="ES">El WER es generalmente mayor que el CER, ya que un solo error de carácter puede invalidar una palabra completa. Esta diferencia es relevante cuando se comparan sistemas que preservan caracteres pero pierden palabras completas.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Otras Métricas Complementarias</span></h4>
+<p class="MsoNormal"><span lang="ES"><b>Precisión y Recall a nivel de palabra</b>: Útiles cuando se evalúa la capacidad del sistema para detectar palabras específicas.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Bag-of-Words Accuracy</b>: Mide la proporción de palabras correctamente reconocidas independientemente de su orden.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>BLEU Score</b>: Adaptado de traducción automática, mide la similitud entre el texto predicho y la referencia considerando n-gramas.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Particularidades del OCR para el Idioma Español</span></h3>
 <p class="MsoNormal"><span lang="ES">El español, como lengua romance, presenta características específicas que impactan el rendimiento de los sistemas OCR:</span></p>
-<h4><span lang="ES">Características Ortográficas</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Características Ortográficas</span></h4>
 <p class="MsoNormal"><span lang="ES"><b>Caracteres especiales</b>: El español incluye caracteres no presentes en el alfabeto inglés básico:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">La letra eñe (ñ, Ñ)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Vocales acentuadas (á, é, í, ó, ú, Á, É, Í, Ó, Ú)</span></p>
@@ -4709,10 +4701,10 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Signos de puntuación invertidos (¿, ¡)</span></p>
 <p class="MsoNormal"><span lang="ES">Estos caracteres requieren que los modelos OCR incluyan dichos símbolos en su vocabulario de salida y que el entrenamiento incluya suficientes ejemplos de cada uno.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Diacríticos y acentos</b>: Los acentos gráficos del español son elementos pequeños que pueden confundirse fácilmente con ruido, artefactos de imagen o signos de puntuación. La distinción entre vocales acentuadas y no acentuadas es crucial para el significado (e.g., "él" vs "el", "más" vs "mas").</span></p>
-<h4><span lang="ES">Características Lingüísticas</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Características Lingüísticas</span></h4>
 <p class="MsoNormal"><span lang="ES"><b>Longitud de palabras</b>: Las palabras en español tienden a ser más largas que en inglés debido a la morfología flexiva rica (conjugaciones verbales, géneros, plurales). Esto puede aumentar la probabilidad de error acumulativo.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Vocabulario</b>: El español tiene un vocabulario amplio con muchas variantes morfológicas de cada raíz. Los modelos de lenguaje utilizados para post-corrección deben contemplar esta diversidad.</span></p>
-<h4><span lang="ES">Recursos y Datasets</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Recursos y Datasets</span></h4>
 <p class="MsoNormal"><span lang="ES">Los recursos disponibles para OCR en español son significativamente menores que para inglés o chino:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Menor cantidad de datasets etiquetados de gran escala</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Menos modelos preentrenados específicos para español</span></p>
@@ -4721,7 +4713,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Estado del arte</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Soluciones OCR de Código Abierto</span></h3>
 <p class="MsoNormal"><span lang="ES">En los últimos años han surgido varias soluciones OCR de código abierto que democratizan el acceso a esta tecnología. A continuación se analizan en detalle las tres principales alternativas evaluadas en este trabajo.</span></p>
-<h4><span lang="ES">EasyOCR</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">EasyOCR</span></h4>
 <p class="MsoNormal"><span lang="ES">EasyOCR es una biblioteca de OCR desarrollada por Jaided AI (2020) con el objetivo de proporcionar una solución de fácil uso que soporte múltiples idiomas. Actualmente soporta más de 80 idiomas, incluyendo español.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Arquitectura técnica</b>:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Detector</b>: CRAFT (Character Region Awareness for Text Detection)</span></p>
@@ -4738,7 +4730,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Actualizaciones menos frecuentes que otras alternativas</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Documentación menos exhaustiva</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Caso de uso ideal</b>: Prototipado rápido, aplicaciones con restricciones de memoria, proyectos que requieren soporte multilingüe inmediato.</span></p>
-<h4><span lang="ES">PaddleOCR</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">PaddleOCR</span></h4>
 <p class="MsoNormal"><span lang="ES">PaddleOCR es el sistema OCR desarrollado por Baidu como parte del ecosistema PaddlePaddle (2024). Representa una de las soluciones más completas y activamente mantenidas en el ecosistema de código abierto. La versión PP-OCRv5, utilizada en este trabajo, incorpora los últimos avances en el campo.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Arquitectura técnica</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">El pipeline de PaddleOCR consta de tres módulos principales:</span></p>
@@ -4750,17 +4742,17 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoNormal"><span lang="ES">   - Encoder: Vision Transformer modificado    - Decoder: CTC o Attention-based    - Vocabulario: Configurable por idioma</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Hiperparámetros configurables</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">PaddleOCR expone numerosos hiperparámetros que permiten ajustar el comportamiento del sistema. Los más relevantes para este trabajo son:</span></p>
-<a name="_Ref_Tab6"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->6<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Hiperparámetros de detección de PaddleOCR.</span></i></p>
+<a name="_Ref_Tab6"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->6<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Hiperparámetros de detección de PaddleOCR.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Descripción</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Rango</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Defecto</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral de probabilidad para píxeles de texto</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[0.0, 1.0]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.3</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral de confianza para cajas detectadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[0.0, 1.0]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.6</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Factor de expansión de cajas detectadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[0.0, 3.0]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.5</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_limit_side_len</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tamaño máximo del lado de imagen</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[320, 2560]</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">960</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Documentación oficial de PaddleOCR (PaddlePaddle, 2024).</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Tab7"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->7<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Hiperparámetros de reconocimiento de PaddleOCR.</span></i></p>
+<a name="_Ref_Tab7"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->7<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Hiperparámetros de reconocimiento de PaddleOCR.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Descripción</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Rango</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Defecto</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral de confianza para resultados</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[0.0, 1.0]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.5</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Activar clasificación de orientación de línea</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">{True, False}</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">rec_batch_size</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tamaño de batch para reconocimiento</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[1, 64]</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">6</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Documentación oficial de PaddleOCR (PaddlePaddle, 2024).</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Tab8"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->8<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Hiperparámetros de preprocesamiento de PaddleOCR.</span></i></p>
+<a name="_Ref_Tab8"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->8<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Hiperparámetros de preprocesamiento de PaddleOCR.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Descripción</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Impacto</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Clasificación de orientación del documento</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alto para documentos escaneados</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Corrección de deformación/curvatura</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alto para fotos de documentos</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_angle_cls</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Clasificador de ángulo 0°/180°</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio para documentos rotados</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Documentación oficial de PaddleOCR (PaddlePaddle, 2024).</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Fortalezas de PaddleOCR</b>:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Alta precisión en múltiples benchmarks</span></p>
@@ -4773,7 +4765,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Dependencia del framework PaddlePaddle (menos popular que PyTorch/TensorFlow)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Curva de aprendizaje más pronunciada</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Documentación en inglés menos completa que en chino</span></p>
-<h4><span lang="ES">DocTR</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">DocTR</span></h4>
 <p class="MsoNormal"><span lang="ES">DocTR (Document Text Recognition) es una biblioteca desarrollada por Mindee (2021), empresa especializada en procesamiento inteligente de documentos. Está orientada a la comunidad de investigación y ofrece una API limpia basada en TensorFlow/PyTorch.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Arquitectura técnica</b>:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Detectores disponibles</b>: DB (db_resnet50), LinkNet (linknet_resnet18)</span></p>
@@ -4788,17 +4780,17 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Menor rendimiento en español comparado con PaddleOCR según pruebas preliminares</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Comunidad más pequeña</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Menos opciones de modelos preentrenados para idiomas no ingleses</span></p>
-<h4><span lang="ES">Comparativa Detallada de Soluciones</span></h4>
-<a name="_Ref_Tab9"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->9<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa técnica de soluciones OCR de código abierto.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Aspecto</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">EasyOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">PaddleOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">DocTR</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Framework</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PyTorch</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddlePaddle</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">TF/PyTorch</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Detector</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CRAFT</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DB</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DB/LinkNet</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Reconocedor</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CRNN</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">SVTR/CRNN</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CRNN/SAR/ViTSTR</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Idiomas</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">80+</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">80+</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">9</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Configurabilidad</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Baja</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Documentación</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta (CN)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta (EN)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Actividad</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Licencia</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Apache 2.0</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Apache 2.0</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Apache 2.0</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Comparativa Detallada de Soluciones</span></h4>
+<a name="_Ref_Tab9"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->9<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa técnica de soluciones OCR de código abierto.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Aspecto</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">EasyOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">PaddleOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">DocTR</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Framework</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PyTorch</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddlePaddle</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">TF/PyTorch</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Detector</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CRAFT</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DB</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DB/LinkNet</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Reconocedor</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CRNN</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">SVTR/CRNN</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CRNN/SAR/ViTSTR</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Idiomas</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Multilingüe</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Multilingüe</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Limitado</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Configurabilidad</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Baja</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Documentación</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta (CN)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta (EN)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Actividad</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Licencia</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Apache 2.0</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Apache 2.0</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Apache 2.0</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia a partir de documentación oficial (2024).</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Tab10"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->10<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de facilidad de uso.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Aspecto</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">EasyOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">PaddleOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">DocTR</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Instalación</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">pip install</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">pip install</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">pip install</span></span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Líneas para OCR básico</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">6</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU requerida</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Opcional</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Opcional</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Opcional</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Memoria mínima</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2 GB</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4 GB</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4 GB</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab10"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->10<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de facilidad de uso.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Aspecto</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">EasyOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">PaddleOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">DocTR</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Instalación</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">pip install</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">pip install</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">pip install</span></span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Complejidad de uso</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Baja</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU requerida</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Opcional</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Opcional</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Opcional</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Requisitos de memoria</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Bajos</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medios</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medios</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia a partir de documentación oficial.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Optimización de Hiperparámetros</span></h3>
-<h4><span lang="ES">Fundamentos Teóricos</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Fundamentos Teóricos</span></h4>
 <p class="MsoNormal"><span lang="ES">La optimización de hiperparámetros (HPO, <i>Hyperparameter Optimization</i>) es el proceso de encontrar la configuración óptima de los parámetros que controlan el proceso de aprendizaje o inferencia de un modelo, pero que no se aprenden directamente de los datos (Feurer &amp; Hutter, 2019).</span></p>
 <p class="MsoNormal"><span lang="ES">A diferencia de los parámetros del modelo (como los pesos de una red neuronal), los hiperparámetros se establecen antes del entrenamiento e incluyen:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Tasa de aprendizaje, tamaño de batch, número de épocas</span></p>
@@ -4813,7 +4805,7 @@ _Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style="te
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><msub><mi>M</mi><mi>λ</mi></msub></mrow></math> es el modelo configurado con <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>λ</mi></mrow></math></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>ℒ</mi></mrow></math> es la función de pérdida</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><msub><mi>D</mi><mrow><mi>v</mi><mi>a</mi><mi>l</mi></mrow></msub></mrow></math> es el conjunto de validación</span></p>
-<h4><span lang="ES">Métodos de Optimización</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Métodos de Optimización</span></h4>
 <p class="MsoNormal"><span lang="ES"><b>Grid Search (Búsqueda en rejilla)</b>:</span></p>
 
 El método más simple consiste en evaluar todas las combinaciones posibles de valores discretizados de los hiperparámetros. Para <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>k</mi></mrow></math> hiperparámetros con <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>n</mi></mrow></math> valores cada uno, requiere <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><msup><mi>n</mi><mi>k</mi></msup></mrow></math> evaluaciones.
@@ -4840,7 +4832,7 @@ El método más simple consiste en evaluar todas las combinaciones posibles de v
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Procesos Gaussianos (GP)</b>: Proporcionan incertidumbre bien calibrada pero escalan pobremente</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Random Forests</b>: Manejan bien espacios de alta dimensión y variables categóricas</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Tree-structured Parzen Estimator (TPE)</b>: Modela densidades en lugar de la función objetivo</span></p>
-<h4><span lang="ES">Tree-structured Parzen Estimator (TPE)</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Tree-structured Parzen Estimator (TPE)</span></h4>
 
 TPE, propuesto por Bergstra et al. (2011) e implementado en Optuna, es particularmente efectivo para HPO. En lugar de modelar <math display="inline" xmlns="http://www.w3.org/1998/Math/MathML"><mrow><mi>p</mi><mo stretchy="false">(</mo><mi>y</mi><mo stretchy="false">|</mo><mi>λ</mi><mo stretchy="false">)</mo></mrow></math> directamente, TPE modela:
 
@@ -4858,7 +4850,7 @@ Configuraciones con alta probabilidad bajo <math display="inline" xmlns="http://
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Eficiente para espacios de alta dimensión</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">No requiere derivadas de la función objetivo</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Implementación eficiente en Optuna</span></p>
-<h4><span lang="ES">Ray Tune</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Ray Tune</span></h4>
 <p class="MsoNormal"><span lang="ES">Ray Tune (Liaw et al., 2018) es un framework de optimización de hiperparámetros escalable construido sobre Ray, un sistema de computación distribuida. Sus características principales incluyen:</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Escalabilidad</b>:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Ejecución paralela de múltiples trials</span></p>
@@ -4877,11 +4869,11 @@ Configuraciones con alta probabilidad bajo <math display="inline" xmlns="http://
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Paralelizar la evaluación de trials</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>Beneficiarse de la infraestructura de Ray para distribución</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span>Acceder a las visualizaciones de Optuna</span></p>
-<a name="_Ref_Fig2"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->2<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Ciclo de optimización con Ray Tune y Optuna</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Ciclo de optimización con Ray Tune y Optuna" height="111" src="figures/figura_2.png" style="width:424.5pt;height:83.25pt;display:block;margin:0 auto" width="566"/></span></p>
+<a name="_Ref_Fig2"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->2<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Ciclo de optimización con Ray Tune y Optuna</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Ciclo de optimización con Ray Tune y Optuna" height="111" src="figures/figura_2.png" style="width:424.5pt;height:83.25pt;display:block;margin:0 auto" width="566"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">HPO en Sistemas OCR</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">HPO en Sistemas OCR</span></h4>
 <p class="MsoNormal"><span lang="ES">La aplicación de HPO a sistemas OCR ha sido explorada en varios contextos:</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Optimización de preprocesamiento</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">Liang et al. (2005) propusieron optimizar parámetros de binarización adaptativa para mejorar el OCR de documentos degradados. Los parámetros optimizados incluían tamaño de ventana, factor de corrección y umbral local.</span></p>
@@ -4896,35 +4888,35 @@ Configuraciones con alta probabilidad bajo <math display="inline" xmlns="http://
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Post-procesamiento lingüístico</span></p>
 <p class="MsoNormal"><span lang="ES">La optimización de umbrales de detección y reconocimiento en tiempo de inferencia ha recibido poca atención, especialmente para idiomas diferentes del inglés y chino.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Datasets y Benchmarks para Español</span></h3>
-<h4><span lang="ES">Datasets Públicos</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Datasets Públicos</span></h4>
 <p class="MsoNormal"><span lang="ES">Los principales recursos para evaluación de OCR en español incluyen:</span></p>
 <p class="MsoNormal"><span lang="ES"><b>FUNSD-ES</b>: Versión en español del Form Understanding in Noisy Scanned Documents dataset. Contiene formularios escaneados con anotaciones de texto y estructura.</span></p>
-<p class="MsoNormal"><span lang="ES"><b>MLT (ICDAR Multi-Language Text)</b>: Dataset multilingüe de las competiciones ICDAR que incluye muestras en español. Las ediciones 2017 y 2019 contienen texto en escenas naturales.</span></p>
+<p class="MsoNormal"><span lang="ES"><b>MLT (ICDAR Multi-Language Text)</b>: Dataset multilingüe de las competiciones ICDAR que incluye muestras en español. Las ediciones recientes contienen texto en escenas naturales.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>XFUND</b>: Dataset de comprensión de formularios en múltiples idiomas, incluyendo español, con anotaciones de entidades y relaciones.</span></p>
-<a name="_Ref_Tab11"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->11<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Datasets públicos con contenido en español.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Dataset</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Idiomas</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tamaño</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Uso principal</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">FUNSD-ES</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Formularios</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">ES</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~200 docs</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Document understanding</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">MLT 2019</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Escenas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Multi (incl. ES)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">10K imgs</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Text detection</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">XFUND</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Formularios</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7 (incl. ES)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.4K docs</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Information extraction</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab11"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->11<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Datasets públicos con contenido en español.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Dataset</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Idiomas</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tamaño</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Uso principal</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">FUNSD-ES</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Formularios</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">ES</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Pequeño</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Document understanding</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">MLT</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Escenas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Multi (incl. ES)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Text detection</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">XFUND</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Formularios</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Multi (incl. ES)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Information extraction</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia a partir de repositorios oficiales.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Limitaciones de Recursos para Español</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Limitaciones de Recursos para Español</span></h4>
 <p class="MsoNormal"><span lang="ES">Comparado con inglés y chino, el español cuenta con:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Menor cantidad de datasets etiquetados de gran escala</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Menos benchmarks estandarizados</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Menor representación en competiciones internacionales (ICDAR)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Pocos modelos preentrenados específicos</span></p>
 <p class="MsoNormal"><span lang="ES">Esta escasez de recursos específicos para español motivó la creación de un dataset propio basado en documentos académicos de UNIR para este trabajo.</span></p>
-<h4><span lang="ES">Trabajos Previos en OCR para Español</span></h4>
+<p class="MsoNormal"><span lang="ES">Además, se priorizó un dataset propio aunque fuera de tamaño reducido porque el objetivo era evaluar texto académico en un formato sencillo y reproducible (texto plano con índice), sin tablas ni estructuras complejas. Ese perfil no está bien cubierto por datasets públicos centrados en formularios o escenas naturales, por lo que se optó por un corpus controlado y alineado con el dominio del TFM.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Trabajos Previos en OCR para Español</span></h4>
 <p class="MsoNormal"><span lang="ES">Los trabajos previos en OCR para español se han centrado principalmente en:</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Digitalización de archivos históricos</b>: Múltiples proyectos han abordado el reconocimiento de manuscritos coloniales y documentos históricos en español, utilizando técnicas de HTR (Handwritten Text Recognition) adaptadas (Romero et al., 2013).</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Procesamiento de documentos de identidad</b>: Sistemas OCR especializados para DNI, pasaportes y documentos oficiales españoles y latinoamericanos (Bulatov et al., 2020).</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Reconocimiento de texto en escenas</b>: Participaciones en competiciones ICDAR para detección y reconocimiento de texto en español en imágenes naturales.</span></p>
-<a name="_Ref_Tab12"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->12<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Trabajos previos relevantes en OCR para español.</span></i></p>
+<a name="_Ref_Tab12"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->12<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Trabajos previos relevantes en OCR para español.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Trabajo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Enfoque</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Contribución</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Romero et al. (2013)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">HTR histórico</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelos HMM para manuscritos</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Bulatov et al. (2020)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Documentos ID</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Pipeline especializado</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fischer et al. (2012)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Multilingual</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Transferencia entre idiomas</span></p></td></tr></table></div>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES">La optimización de hiperparámetros para documentos académicos en español representa una contribución original de este trabajo, abordando un nicho no explorado en la literatura.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Conclusiones del capítulo</span></h2>
-<p class="MsoNormal"><span lang="ES">La revisión del estado del arte revela un panorama en el que las herramientas técnicas están maduras, pero su aplicación óptima para dominios específicos permanece poco explorada. Los sistemas OCR modernos —PaddleOCR, EasyOCR, DocTR— ofrecen arquitecturas sofisticadas basadas en aprendizaje profundo que alcanzan resultados impresionantes en benchmarks estándar. Sin embargo, estos resultados no siempre se trasladan a documentos del mundo real, especialmente en idiomas con menos recursos como el español.</span></p>
-<p class="MsoNormal"><span lang="ES">La evolución desde los sistemas de plantillas de los años 50 hasta los Transformers actuales ha sido espectacular, pero ha generado sistemas con decenas de hiperparámetros configurables cuyos valores por defecto representan compromisos generales, no configuraciones óptimas para dominios específicos. La literatura abunda en trabajos sobre entrenamiento y fine-tuning de modelos OCR, pero dedica poca atención a la optimización sistemática de los parámetros de inferencia —umbrales de detección, opciones de preprocesamiento, filtros de confianza— que pueden marcar la diferencia entre un sistema usable y uno que requiere corrección manual extensiva.</span></p>
+<p class="MsoNormal"><span lang="ES">En síntesis, la revisión del estado del arte revela un panorama en el que las herramientas técnicas están maduras, pero su aplicación óptima para dominios específicos permanece poco explorada. Los sistemas OCR modernos, como PaddleOCR, EasyOCR y DocTR, ofrecen arquitecturas sofisticadas basadas en aprendizaje profundo que alcanzan resultados impresionantes en benchmarks estándar. Sin embargo, estos resultados no siempre se trasladan a documentos del mundo real, especialmente en idiomas con menos recursos como el español.</span></p>
+<p class="MsoNormal"><span lang="ES">La evolución desde los sistemas de plantillas de los años 50 hasta los Transformers actuales ha sido espectacular, pero ha generado sistemas con decenas de hiperparámetros configurables cuyos valores por defecto representan compromisos generales, no configuraciones óptimas para dominios específicos. La literatura abunda en trabajos sobre entrenamiento y fine-tuning de modelos OCR, pero dedica poca atención a la optimización sistemática de los parámetros de inferencia, como umbrales de detección, opciones de preprocesamiento y filtros de confianza, que pueden marcar la diferencia entre un sistema usable y uno que requiere corrección manual extensiva.</span></p>
 <p class="MsoNormal"><span lang="ES">Este vacío, combinado con las particularidades del español (acentos, eñes, signos invertidos) y la escasez de recursos específicos para este idioma, define el espacio de contribución del presente trabajo. Frameworks como Ray Tune y Optuna proporcionan las herramientas para abordar esta optimización de manera sistemática; PaddleOCR, con su pipeline altamente configurable, ofrece el sustrato técnico adecuado. El siguiente capítulo traduce esta oportunidad en objetivos concretos y una metodología experimental rigurosa.</span></p><h1 style="mso-list:l22 level1 lfo18"><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><a name="_Toc147741196"></a><a name="_Toc160619813"><span style="mso-bookmark:_Toc147741196"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
 major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin;
 text-transform:none'><span style="mso-list:Ignore">3.<span style='font:7.0pt "Times New Roman"'>  
@@ -4933,9 +4925,9 @@ concretos y metodología de trabajo</span></span></a></span></span><span style="
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Objetivo general</span></h2>
 <p class="MsoQuote"><i><span lang="ES"><b>Optimizar el rendimiento de PaddleOCR para documentos académicos en español mediante ajuste de hiperparámetros, alcanzando un CER inferior al 2% sin requerir fine-tuning del modelo.</b></span></i></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Justificación SMART del Objetivo General</span></h3>
-<a name="_Ref_Tab13"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->13<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Justificación SMART del objetivo general.</span></i></p>
+<a name="_Ref_Tab13"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->13<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Justificación SMART del objetivo general.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Criterio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Cumplimiento</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Específico (S)</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Se define claramente qué se quiere lograr: optimizar PaddleOCR mediante ajuste de hiperparámetros para documentos en español</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Medible (M)</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Se establece una métrica cuantificable: CER &lt; 2%</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Alcanzable (A)</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Es viable dado que: (1) PaddleOCR permite configuración de hiperparámetros, (2) Ray Tune posibilita búsqueda automatizada, (3) Aceleración GPU disponible para experimentación eficiente</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Relevante (R)</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">El impacto es demostrable: mejora la extracción de texto en documentos académicos sin costes adicionales de infraestructura</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Temporal (T)</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">El plazo es un cuatrimestre, correspondiente al TFM</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Objetivos específicos</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">OE1: Comparar soluciones OCR de código abierto</span></h3>
@@ -4950,9 +4942,9 @@ concretos y metodología de trabajo</span></span></a></span></span><span style="
 <p class="MsoQuote"><i><span lang="ES"><b>Comparar el rendimiento de la configuración baseline versus la configuración optimizada sobre el dataset completo, documentando la mejora obtenida.</b></span></i></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Metodología del trabajo</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Visión General</span></h3>
-<p class="MsoNormal"><span lang="ES">La metodología se estructura en cinco fases secuenciales, cada una de las cuales produce resultados que alimentan la siguiente. Desde la preparación del dataset hasta la validación final, el proceso sigue un diseño experimental que permite reproducir y verificar cada paso.</span></p>
-<a name="_Ref_Fig3"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->3<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Fases de la metodología experimental</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Fases de la metodología experimental" height="93" src="figures/figura_3.png" style="width:424.5pt;height:69.75pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="MsoNormal"><span lang="ES">La metodología se estructura en cinco fases secuenciales, cada una de las cuales produce resultados que alimentan la siguiente. Desde la preparación del dataset hasta la validación final, el proceso sigue un diseño experimental. Esto permite reproducir y verificar cada paso.</span></p>
+<a name="_Ref_Fig3"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->3<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Fases de la metodología experimental</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Fases de la metodología experimental" height="93" src="figures/figura_3.png" style="width:424.5pt;height:69.75pt;display:block;margin:0 auto" width="566"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Descripción de las fases:</b></span></p>
@@ -4962,42 +4954,53 @@ concretos y metodología de trabajo</span></span></a></span></span><span style="
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Fase 4 - Optimización</b>: Ejecución de 64 trials con paralelización (2 concurrentes)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Fase 5 - Validación</b>: Comparación baseline vs optimizado, análisis de correlaciones</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 1: Preparación del Dataset</span></h3>
-<h4><span lang="ES">Fuente de Datos</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Fuente de Datos</span></h4>
 <p class="MsoNormal"><span lang="ES">Se utilizaron documentos PDF académicos de UNIR (Universidad Internacional de La Rioja), específicamente las instrucciones para la elaboración del TFE del Máster en Inteligencia Artificial.</span></p>
-<h4><span lang="ES">Proceso de Conversión</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Proceso de Conversión</span></h4>
 <p class="MsoNormal"><span lang="ES">El script <span style="font-family:Consolas;font-size:10pt">prepare_dataset.ipynb</span> implementa:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Conversión PDF a imágenes</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">   - Biblioteca: PyMuPDF (fitz)    - Resolución: 300 DPI    - Formato de salida: PNG</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Extracción de texto de referencia</b>:</span></p>
 <p class="MsoNormal"><span lang="ES">   - Método: <span style="font-family:Consolas;font-size:10pt">page.get_text("dict")</span> de PyMuPDF    - Preservación de estructura de líneas    - Tratamiento de texto vertical/marginal    - Normalización de espacios y saltos de línea</span></p>
-<h4><span lang="ES">Estructura del Dataset</span></h4>
-<a name="_Ref_Fig4"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->4<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Estructura del dataset de evaluación</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Estructura del dataset de evaluación" height="505" src="figures/figura_4.png" style="width:424.5pt;height:378.75pt;display:block;margin:0 auto" width="566"/></span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Estructura del Dataset</span></h4>
+<a name="_Ref_Fig4"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->4<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Estructura del dataset de evaluación</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Estructura del dataset de evaluación" height="505" src="figures/figura_4.png" style="width:424.5pt;height:378.75pt;display:block;margin:0 auto" width="566"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Clase ImageTextDataset</span></h4>
-<p class="MsoNormal"><span lang="ES">Se implementó una clase Python para cargar pares imagen-texto que retorna tuplas (PIL.Image, str) desde carpetas pareadas. La implementación completa está disponible en <span style="font-family:Consolas;font-size:10pt">src/ocr_benchmark_notebook.ipynb</span> (ver Anexo A).</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Clase ImageTextDataset</span></h4>
+<p class="MsoNormal"><span lang="ES">Se implementó una clase Python para cargar pares imagen-texto que retorna tuplas (PIL.Image, str) desde carpetas pareadas. La implementación se encuentra en:</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/prepare_dataset.ipynb"><span style="font-family:Consolas;font-size:10pt">src/prepare_dataset.ipynb</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/dataset_manager.py"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr/dataset_manager.py</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/dataset_manager.py"><span style="font-family:Consolas;font-size:10pt">src/easyocr_service/dataset_manager.py</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/dataset_manager.py"><span style="font-family:Consolas;font-size:10pt">src/doctr_service/dataset_manager.py</span></a></span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 2: Benchmark Comparativo</span></h3>
-<h4><span lang="ES">Modelos Evaluados</span></h4>
-<a name="_Ref_Tab14"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->14<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Modelos OCR evaluados en el benchmark inicial.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Modelo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Versión</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Configuración</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Idiomas: ['es', 'en']</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PP-OCRv5</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelos server_det + server_rec</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">db_resnet50 + sar_resnet31</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Modelos Evaluados</span></h4>
+<a name="_Ref_Tab14"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->14<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Modelos OCR evaluados en el benchmark inicial.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Modelo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Versión</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Configuración</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Idiomas: ['es', 'en']</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PP-OCRv5</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelos Mobile (limitación de VRAM)</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">db_resnet50 + sar_resnet31</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Métricas de Evaluación</span></h4>
-<p class="MsoNormal"><span lang="ES">Se utilizó la biblioteca <span style="font-family:Consolas;font-size:10pt">jiwer</span> para calcular CER y WER comparando el texto de referencia con la predicción del modelo OCR. La implementación está disponible en <span style="font-family:Consolas;font-size:10pt">src/ocr_benchmark_notebook.ipynb</span> (ver Anexo A).</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Métricas de Evaluación</span></h4>
+<p class="MsoNormal"><span lang="ES">Se utilizó la biblioteca <span style="font-family:Consolas;font-size:10pt">jiwer</span> para calcular CER y WER comparando el texto de referencia con la predicción del modelo OCR. La implementación se encuentra en:</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/paddle_ocr_tuning_rest.py"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr/paddle_ocr_tuning_rest.py</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/easyocr_tuning_rest.py"><span style="font-family:Consolas;font-size:10pt">src/easyocr_service/easyocr_tuning_rest.py</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/doctr_tuning_rest.py"><span style="font-family:Consolas;font-size:10pt">src/doctr_service/doctr_tuning_rest.py</span></a></span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 3: Espacio de Búsqueda</span></h3>
-<h4><span lang="ES">Hiperparámetros Seleccionados</span></h4>
-<a name="_Ref_Tab15"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->15<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Hiperparámetros seleccionados para optimización.</span></i></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Hiperparámetros Seleccionados</span></h4>
+<a name="_Ref_Tab15"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->15<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Hiperparámetros seleccionados para optimización.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Rango/Valores</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Descripción</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Booleano</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[True, False]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Clasificación de orientación del documento</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Booleano</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[True, False]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Corrección de deformación del documento</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Booleano</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[True, False]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Clasificación de orientación de línea de texto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Continuo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[0.0, 0.7]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral de detección de píxeles de texto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Continuo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[0.0, 0.7]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral de caja de detección</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fijo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.0</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Coeficiente de expansión (fijado)</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Continuo</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[0.0, 0.7]</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral de confianza de reconocimiento</span></p></td></tr></table></div>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Configuración de Ray Tune</span></h4>
-<p class="MsoNormal"><span lang="ES">El espacio de búsqueda se definió utilizando <span style="font-family:Consolas;font-size:10pt">tune.choice()</span> para parámetros booleanos y <span style="font-family:Consolas;font-size:10pt">tune.uniform()</span> para parámetros continuos, con OptunaSearch como algoritmo de optimización configurado para minimizar CER en 64 trials. La implementación completa está disponible en <span style="font-family:Consolas;font-size:10pt">src/raytune/raytune_ocr.py</span> (ver Anexo A).</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Configuración de Ray Tune</span></h4>
+<p class="MsoNormal"><span lang="ES">El espacio de búsqueda se definió utilizando <span style="font-family:Consolas;font-size:10pt">tune.choice()</span> para parámetros booleanos y <span style="font-family:Consolas;font-size:10pt">tune.uniform()</span> para parámetros continuos, con OptunaSearch como algoritmo de optimización configurado para minimizar CER en 64 trials. La implementación completa está disponible en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/raytune_ocr.py"><span style="font-family:Consolas;font-size:10pt">src/raytune/raytune_ocr.py</span></a> (ver Anexo A).</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 4: Ejecución de Optimización</span></h3>
-<h4><span lang="ES">Arquitectura de Ejecución</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Arquitectura de Ejecución</span></h4>
 <p class="MsoNormal"><span lang="ES">Se implementó una arquitectura basada en contenedores Docker para aislar los servicios OCR y facilitar la reproducibilidad (ver sección 4.2.3 para detalles de la arquitectura).</span></p>
-<h4><span lang="ES">Ejecución con Docker Compose</span></h4>
-<p class="MsoNormal"><span lang="ES">Los servicios se orquestan mediante Docker Compose (<span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.*.yml</span>):</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Ejecución con Docker Compose</span></h4>
+<p class="MsoNormal"><span lang="ES">Los servicios se orquestan mediante Docker Compose:</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.paddle.yml</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.doctr.yml</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.easyocr.yml</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.yml</span></a></span></p>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word"># Iniciar servicio OCR
 docker compose -f docker-compose.tuning.doctr.yml up -d doctr-gpu
@@ -5008,43 +5011,41 @@ docker compose -f docker-compose.tuning.doctr.yml run raytune --service doctr --
 # Detener servicios
 docker compose -f docker-compose.tuning.doctr.yml down</pre>
 </div>
-<p class="MsoNormal"><span lang="ES">El servicio OCR expone una API REST que retorna métricas en formato JSON:</span></p>
+<p class="MsoNormal"><span lang="ES">El servicio OCR expone una API REST que retorna métricas en formato JSON. Ejemplo real de un trial con mejor CER:</span></p>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word">{
-    "CER": 0.0149,
-    "WER": 0.0762,
-    "TIME": 15.8,
-    "PAGES": 5,
-    "TIME_PER_PAGE": 3.16
+    "CER": 0.007884,
+    "WER": 0.077848,
+    "TIME_PER_PAGE": 0.5895
 }</pre>
 </div>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Fase 5: Validación</span></h3>
-<h4><span lang="ES">Protocolo de Validación</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Protocolo de Validación</span></h4>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Baseline</b>: Ejecución con configuración por defecto de PaddleOCR</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Optimizado</b>: Ejecución con mejor configuración encontrada</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Comparación</b>: Evaluación sobre las 45 páginas del dataset completo</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span><b>Métricas reportadas</b>: CER, WER, tiempo de procesamiento</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Entorno de Ejecución</span></h3>
-<h4><span lang="ES">Hardware</span></h4>
-<a name="_Ref_Tab16"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->16<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Especificaciones de hardware del entorno de desarrollo.</span></i></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Hardware</span></h4>
+<a name="_Ref_Tab16"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->16<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Especificaciones de hardware del entorno de desarrollo.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Componente</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Especificación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">AMD Ryzen 7 5800H</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RAM</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">16 GB DDR4</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NVIDIA RTX 3060 Laptop (5.66 GB VRAM)</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Almacenamiento</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">SSD</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Software</span></h4>
-<a name="_Ref_Tab17"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->17<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Versiones de software utilizadas.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Componente</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Versión</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sistema Operativo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ubuntu 24.04.3 LTS</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Python</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.12.3</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.3.2</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddlePaddle</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.2.2</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ray</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2.52.1</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optuna</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4.7.0</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Software</span></h4>
+<a name="_Ref_Tab17"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->17<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Software utilizado en el entorno de desarrollo.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Componente</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Versión</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddlePaddle</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.2.2</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.3.2</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ray Tune</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2.52.1</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optuna</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4.7.0</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR (python-doctr)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&gt;= 0.8.0</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&gt;= 1.7.0</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr/requirements.txt</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/raytune/requirements.txt</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/doctr_service/requirements.txt</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/easyocr_service/requirements.txt</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Justificación de Ejecución Local vs Cloud</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Justificación de Ejecución Local vs Cloud</span></h4>
 <p class="MsoNormal"><span lang="ES">La decisión de ejecutar los experimentos en hardware local en lugar de utilizar servicios cloud se fundamenta en un análisis de costos y beneficios operativos.</span></p>
-<a name="_Ref_Tab18"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->18<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Costos de GPU en plataformas cloud.</span></i></p>
+<a name="_Ref_Tab18"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->18<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Costos de GPU en plataformas cloud.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Plataforma</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">GPU</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Costo/Hora</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Costo Mensual</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">AWS EC2 g4dn.xlarge</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NVIDIA T4 (16 GB)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">$0.526</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$384</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Google Colab Pro</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">T4/P100</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$1.30</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">$10 + CU extras</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Google Colab Pro+</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">T4/V100/A100</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$1.30</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">$50 + CU extras</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Precios públicos de AWS y Google Cloud. Ver Anexo A, sección de fuentes de precios cloud (enero 2026).</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES">Para las tareas específicas de este proyecto, los costos estimados en cloud serían:</span></p>
-<a name="_Ref_Tab19"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->19<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Análisis de costos del proyecto en plataformas cloud.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tarea</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tiempo GPU</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Costo AWS</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Costo Colab Pro</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ajuste hiperparámetros (64×3 trials)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~3 horas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$1.58</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$3.90</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Evaluación completa (45 páginas)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~5 min</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$0.04</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$0.11</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Desarrollo y depuración (20 horas/mes)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">20 horas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$10.52</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$26.00</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab19"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->19<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Análisis de costos del proyecto en plataformas cloud.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tarea</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tiempo GPU</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Costo AWS</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Costo Colab Pro</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ajuste hiperparámetros (64x3 trials)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~3 horas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$1.58</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$3.90</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Evaluación completa (45 páginas)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~5 min</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$0.04</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$0.11</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Desarrollo y depuración (20 horas/mes)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">20 horas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$10.52</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~$26.00</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia a partir de precios públicos. Ver Anexo A, sección de fuentes de precios cloud (enero 2026).</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES">Las ventajas de la ejecución local incluyen:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Costo cero de GPU</b>: La RTX 3060 ya está disponible en el equipo de desarrollo</span></p>
@@ -5052,15 +5053,15 @@ docker compose -f docker-compose.tuning.doctr.yml down</pre>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Acceso instantáneo</b>: Sin tiempo de aprovisionamiento de instancias cloud</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span><b>Almacenamiento local</b>: Dataset y resultados en disco sin costos de transferencia</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">5.<span style="font-size:7pt">   </span><b>Iteración rápida</b>: Reinicio inmediato de contenedores Docker para depuración</span></p>
-<p class="MsoNormal"><span lang="ES">Para un proyecto de investigación con múltiples iteraciones de ajuste de hiperparámetros, la ejecución local ahorra aproximadamente $50-100 mensuales comparado con servicios cloud, además de ofrecer mayor flexibilidad en la velocidad de iteración durante el desarrollo.</span></p>
+<p class="MsoNormal"><span lang="ES">Para un proyecto de investigación con múltiples iteraciones de ajuste de hiperparámetros, la ejecución local reduce costos frente a servicios cloud. Este análisis se detalla en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.)</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Limitaciones Metodológicas</span></h3>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Tamaño del dataset</b>: El dataset contiene 45 páginas de documentos académicos UNIR. Resultados pueden no generalizar a otros formatos.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Subconjunto de optimización</b>: El ajuste de hiperparámetros se realizó sobre 5 páginas (páginas 5-10), lo que contribuyó al sobreajuste observado en la validación del dataset completo.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Texto de referencia imperfecto</b>: El texto de referencia extraído de PDF puede contener errores en documentos con diseños complejos.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Parámetro fijo</b>: <span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span> quedó fijado en 0.0 durante todo el experimento por decisión de diseño inicial.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Síntesis del capítulo</span></h2>
-<p class="MsoNormal"><span lang="ES">Los objetivos y la metodología definidos en este capítulo establecen el marco para la experimentación. El objetivo general —alcanzar un CER inferior al 2% mediante optimización de hiperparámetros— se descompone en cinco objetivos específicos que abarcan desde la comparativa inicial de soluciones hasta la validación final de la configuración optimizada.</span></p>
-<p class="MsoNormal"><span lang="ES">La metodología experimental en cinco fases garantiza un proceso sistemático y reproducible: preparación de un dataset de 45 páginas, benchmark comparativo de tres motores OCR, definición del espacio de búsqueda, ejecución de 64 trials con Ray Tune y Optuna, y validación de la configuración resultante. Las limitaciones metodológicas —tamaño del dataset, subconjunto de optimización reducido, texto de referencia automático— se reconocen explícitamente para contextualizar la interpretación de resultados.</span></p>
+<p class="MsoNormal"><span lang="ES">Los objetivos y la metodología definidos en este capítulo establecen el marco para la experimentación. El objetivo general, alcanzar un CER inferior al 2% mediante optimización de hiperparámetros, se descompone en cinco objetivos específicos que abarcan desde la comparativa inicial de soluciones hasta la validación final de la configuración optimizada.</span></p>
+<p class="MsoNormal"><span lang="ES">La metodología experimental en cinco fases garantiza un proceso sistemático y reproducible: preparación de un dataset de 45 páginas, benchmark comparativo de tres motores OCR, definición del espacio de búsqueda, ejecución de 64 trials con Ray Tune y Optuna, y validación de la configuración resultante. Las limitaciones metodológicas, como el tamaño del dataset, el subconjunto de optimización reducido y el texto de referencia automático, se reconocen explícitamente para contextualizar la interpretación de resultados.</span></p>
 <p class="MsoNormal"><span lang="ES">El capítulo siguiente pone en práctica esta metodología, presentando el desarrollo experimental completo con sus resultados y análisis.</span></p><p class="MsoNormal" style="margin-left:18.0pt;text-indent:-18.0pt;page-break-after:
 avoid;mso-outline-level:1;mso-list:l22 level1 lfo18"><span style="mso-bookmark:
 _Toc14106979"><span style="mso-bookmark:_Toc437515557"><a name="_Toc160619817"></a><a name="_Toc100036217"><span style="mso-bookmark:_Toc160619817"><?if !supportLists?><span lang="ES" style='font-size:18.0pt;mso-bidi-font-size:16.0pt;line-height:150%;
@@ -5082,20 +5083,20 @@ color:#0098CD;mso-font-kerning:16.0pt;mso-bidi-font-weight:bold'>arrollo
 específico de la contribución</span></span></span></span><span style="mso-bookmark:_Toc14106979"><span style="mso-bookmark:_Toc437515557"><span lang="ES" style='font-size:18.0pt;mso-bidi-font-size:16.0pt;line-height:150%;
 font-family:"Calibri Light",sans-serif;mso-ascii-theme-font:major-latin;
 mso-hansi-theme-font:major-latin;mso-bidi-font-family:"Times New Roman";
-color:#0098CD;mso-font-kerning:16.0pt;mso-bidi-font-weight:bold'><o:p></o:p></span></span></span></p><p class="MsoNormal"><span lang="ES">El presente capítulo constituye el núcleo técnico de este trabajo fin de máster. Siguiendo la estructura de "Comparativa de soluciones" establecida por las instrucciones de UNIR, se desarrollan tres fases interrelacionadas: el planteamiento y ejecución del benchmark comparativo, el proceso de optimización de hiperparámetros mediante Ray Tune, y finalmente el análisis e interpretación de los resultados obtenidos.</span></p>
+color:#0098CD;mso-font-kerning:16.0pt;mso-bidi-font-weight:bold'><o:p></o:p></span></span></span></p><p class="MsoNormal"><span lang="ES">El presente capítulo constituye el núcleo técnico de este trabajo fin de máster. Siguiendo la estructura de "Comparativa de soluciones" establecida por las instrucciones de UNIR, se desarrollan tres fases interrelacionadas. Estas fases son tres: planteamiento y ejecución del benchmark comparativo, optimización de hiperparámetros mediante Ray Tune, y análisis e interpretación de los resultados.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Planteamiento de la comparativa</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Introducción</span></h3>
-<p class="MsoNormal"><span lang="ES">Antes de abordar la optimización de hiperparámetros, era necesario seleccionar el motor OCR que serviría como base para la experimentación. Para ello, se realizó un estudio comparativo entre tres soluciones de código abierto representativas del estado del arte: EasyOCR, PaddleOCR y DocTR. Los experimentos, documentados en el notebook <span style="font-family:Consolas;font-size:10pt">ocr_benchmark_notebook.ipynb</span> del repositorio, permitieron identificar el modelo más prometedor para la fase de optimización posterior.</span></p>
+<p class="MsoNormal"><span lang="ES">Antes de abordar la optimización de hiperparámetros, era necesario seleccionar el motor OCR que serviría como base para la experimentación. Para ello, se realizó un estudio comparativo entre tres soluciones de código abierto representativas del estado del arte: EasyOCR, PaddleOCR y DocTR. Los experimentos, documentados en los informes de métricas y en los CSV de resultados del repositorio, permitieron identificar el modelo más prometedor para la fase de optimización posterior.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Identificación del Problema</span></h3>
-<p class="MsoNormal"><span lang="ES">El reconocimiento óptico de caracteres en documentos académicos en español presenta desafíos específicos que la literatura no ha abordado en profundidad. A diferencia de los benchmarks estándar en inglés, los documentos académicos hispanohablantes combinan características ortográficas propias —acentos, eñes, diéresis y signos de puntuación invertidos— con layouts estructuralmente complejos.</span></p>
-<p class="MsoNormal"><span lang="ES">Los documentos académicos típicos incluyen texto corrido entremezclado con tablas, listas numeradas, encabezados multinivel y notas al pie, lo que complica significativamente la tarea de ordenación del texto reconocido. A esto se suma el uso de tipografía profesional con múltiples fuentes, tamaños y estilos (negrita, cursiva), que puede confundir a los modelos de reconocimiento. Aunque los PDFs digitales suelen tener alta calidad, pueden contener artefactos de compresión que degradan la legibilidad de caracteres pequeños o de bajo contraste.</span></p>
+<p class="MsoNormal"><span lang="ES">El reconocimiento óptico de caracteres en documentos académicos en español presenta desafíos específicos que la literatura no ha abordado en profundidad. A diferencia de los benchmarks estándar en inglés, los documentos académicos hispanohablantes combinan características ortográficas propias, como acentos, eñes, diéresis y signos de puntuación invertidos, con una estructura sencilla basada en índice y encabezados.</span></p>
+<p class="MsoNormal"><span lang="ES">Los documentos académicos típicos incluyen texto corrido con índice, listas numeradas, encabezados multinivel y notas al pie, lo que complica la tarea de ordenación del texto reconocido. A esto se suma el uso de tipografía profesional con múltiples fuentes, tamaños y estilos (negrita, cursiva), que puede confundir a los modelos de reconocimiento. Aunque los PDFs digitales suelen tener alta calidad, pueden contener artefactos de compresión que degradan la legibilidad de caracteres pequeños o de bajo contraste.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Alternativas Evaluadas</span></h3>
 <p class="MsoNormal"><span lang="ES">Se seleccionaron tres soluciones OCR de código abierto representativas del estado del arte:</span></p>
-<a name="_Ref_Tab20"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->20<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Soluciones OCR evaluadas en el benchmark comparativo.</span></i></p>
+<a name="_Ref_Tab20"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->20<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Soluciones OCR evaluadas en el benchmark comparativo.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Solución</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Desarrollador</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Versión</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Justificación de selección</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Jaided AI</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Última estable</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Popularidad, facilidad de uso</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Baidu</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PP-OCRv5</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Estado del arte industrial</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mindee</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Última estable</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Orientación académica</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><b>Imágenes Docker disponibles en el registro del proyecto:</b></span></p>
+<p class="MsoNormal"><span lang="ES">Imágenes Docker disponibles en el registro del proyecto:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">PaddleOCR: <a href="https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/paddle-ocr-gpu</span></a>, <a href="https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-cpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/paddle-ocr-cpu</span></a></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">EasyOCR: <a href="https://seryus.ddns.net/unir/-/packages/container/easyocr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/easyocr-gpu</span></a></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">DocTR: <a href="https://seryus.ddns.net/unir/-/packages/container/doctr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/doctr-gpu</span></a></span></p>
@@ -5107,42 +5108,42 @@ color:#0098CD;mso-font-kerning:16.0pt;mso-bidi-font-weight:bold'><o:p></o:p></sp
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span><b>Documentación</b>: Calidad de la documentación técnica</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">5.<span style="font-size:7pt">   </span><b>Mantenimiento activo</b>: Actualizaciones recientes y comunidad activa</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Configuración del Experimento</span></h3>
-<h4><span lang="ES">Dataset de Evaluación</span></h4>
-<p class="MsoNormal"><span lang="ES">Se utilizó el documento "Instrucciones para la redacción y elaboración del TFE" del Máster Universitario en Inteligencia Artificial de UNIR, ubicado en la carpeta <span style="font-family:Consolas;font-size:10pt">instructions/</span>.</span></p>
-<a name="_Ref_Tab21"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->21<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Características del dataset de evaluación inicial.</span></i></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Dataset de Evaluación</span></h4>
+<p class="MsoNormal"><span lang="ES">Se utilizó el documento "Instrucciones para la redacción y elaboración del TFE" del Máster Universitario en Inteligencia Artificial de UNIR, ubicado en la carpeta <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/instructions/"><span style="font-family:Consolas;font-size:10pt">instructions/</span></a>.</span></p>
+<a name="_Ref_Tab21"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->21<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Características del dataset de evaluación inicial.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Característica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Documento fuente</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Instrucciones TFE UNIR</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Número de páginas evaluadas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5 (benchmark inicial)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Formato</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PDF digital (no escaneado)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Idioma principal</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Español</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Resolución de conversión</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">300 DPI</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Formato de imagen</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PNG</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Proceso de Conversión</span></h4>
-<p class="MsoNormal"><span lang="ES">La conversión del PDF a imágenes se realizó mediante PyMuPDF (fitz) a 300 DPI, resolución estándar para OCR que proporciona suficiente detalle para caracteres pequeños sin generar archivos excesivamente grandes. La implementación está disponible en <span style="font-family:Consolas;font-size:10pt">src/ocr_benchmark_notebook.ipynb</span> (ver Anexo A).</span></p>
-<h4><span lang="ES">Extracción del Ground Truth</span></h4>
-<p class="MsoNormal"><span lang="ES">El texto de referencia se extrajo directamente del PDF mediante PyMuPDF, preservando la estructura de líneas del documento original. Esta aproximación puede introducir errores en layouts muy complejos (tablas anidadas, texto en columnas). La implementación está disponible en <span style="font-family:Consolas;font-size:10pt">src/ocr_benchmark_notebook.ipynb</span> (ver Anexo A).</span></p>
-<h4><span lang="ES">Configuración de los Modelos</span></h4>
-<p class="MsoNormal"><span lang="ES">La configuración de cada modelo se detalla en <span style="font-family:Consolas;font-size:10pt">src/ocr_benchmark_notebook.ipynb</span> (ver Anexo A):</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Proceso de Conversión</span></h4>
+<p class="MsoNormal"><span lang="ES">La conversión del PDF a imágenes se realizó mediante PyMuPDF (fitz) a 300 DPI, resolución estándar para OCR que proporciona suficiente detalle para caracteres pequeños sin generar archivos excesivamente grandes. La implementación está disponible en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/prepare_dataset.ipynb"><span style="font-family:Consolas;font-size:10pt">src/prepare_dataset.ipynb</span></a>.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Extracción del Ground Truth</span></h4>
+<p class="MsoNormal"><span lang="ES">El texto de referencia se extrajo directamente del PDF mediante PyMuPDF, preservando la estructura de líneas del documento original. Esta aproximación puede introducir errores en el orden de lectura cuando hay secciones con encabezados, listas o saltos de línea, por lo que se documenta junto al pipeline de preparación en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/prepare_dataset.ipynb"><span style="font-family:Consolas;font-size:10pt">src/prepare_dataset.ipynb</span></a>. Para la comparación entre motores, las salidas se guardan en <span style="font-family:Consolas;font-size:10pt">debugset/</span> al activar <span style="font-family:Consolas;font-size:10pt">save_output=True</span>, y el flujo de trabajo se describe en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/README.md"><span style="font-family:Consolas;font-size:10pt">src/README.md</span></a> y en los README de cada servicio: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/README.md"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr/README.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/README.md"><span style="font-family:Consolas;font-size:10pt">src/easyocr_service/README.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/README.md"><span style="font-family:Consolas;font-size:10pt">src/doctr_service/README.md</span></a>.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Configuración de los Modelos</span></h4>
+<p class="MsoNormal"><span lang="ES">La configuración de cada modelo se detalla en los README de cada servicio y sus ficheros de dependencias:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>EasyOCR</b>: Configurado con soporte para español e inglés, permitiendo reconocer palabras en ambos idiomas que puedan aparecer en documentos académicos (referencias, términos técnicos).</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>PaddleOCR (PP-OCRv5)</b>: Se utilizaron los modelos "server" (PP-OCRv5_server_det y PP-OCRv5_server_rec) que ofrecen mayor precisión a costa de mayor tiempo de inferencia. La versión utilizada fue PaddleOCR 3.2.0.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>PaddleOCR (PP-OCRv5)</b>: Se utilizaron los modelos Mobile, adecuados para la VRAM disponible. Los modelos Server se probaron y produjeron OOM en este hardware. La versión utilizada fue PaddleOCR 3.3.2.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>DocTR</b>: Se seleccionaron las arquitecturas db_resnet50 para detección y sar_resnet31 para reconocimiento, representando una configuración de alta precisión.</span></p>
-<h4><span lang="ES">Métricas de Evaluación</span></h4>
-<p class="MsoNormal"><span lang="ES">Se utilizó la biblioteca <span style="font-family:Consolas;font-size:10pt">jiwer</span> para calcular CER y WER de manera estandarizada. La normalización a minúsculas y eliminación de espacios extremos asegura una comparación justa que no penaliza diferencias de capitalización. La implementación está disponible en <span style="font-family:Consolas;font-size:10pt">src/ocr_benchmark_notebook.ipynb</span> (ver Anexo A).</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Métricas de Evaluación</span></h4>
+<p class="MsoNormal"><span lang="ES">Se utilizó la biblioteca <span style="font-family:Consolas;font-size:10pt">jiwer</span> para calcular CER y WER de manera estandarizada. La normalización a minúsculas y eliminación de espacios extremos asegura una comparación justa que no penaliza diferencias de capitalización. La implementación está disponible en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/paddle_ocr_tuning_rest.py"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr/paddle_ocr_tuning_rest.py</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/easyocr_tuning_rest.py"><span style="font-family:Consolas;font-size:10pt">src/easyocr_service/easyocr_tuning_rest.py</span></a> y <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/doctr_tuning_rest.py"><span style="font-family:Consolas;font-size:10pt">src/doctr_service/doctr_tuning_rest.py</span></a>.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Resultados del Benchmark</span></h3>
-<h4><span lang="ES">Resultados de PaddleOCR (Configuración Baseline)</span></h4>
-<p class="MsoNormal"><span lang="ES">Durante el benchmark inicial se evaluó PaddleOCR con configuración por defecto en un subconjunto del dataset. Los resultados preliminares mostraron variabilidad significativa entre páginas, con CER entre 1.54% y 6.40% dependiendo de la complejidad del layout.</span></p>
-<a name="_Ref_Tab22"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->22<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Variabilidad del CER por tipo de contenido.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo de contenido</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER aproximado</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Observaciones</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Texto corrido</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~1.5-2%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mejor rendimiento</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Texto con listas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~3-4%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Rendimiento medio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tablas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~5-6%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mayor dificultad</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Encabezados + notas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~4-5%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Layouts mixtos</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Resultados de PaddleOCR (Configuración Baseline)</span></h4>
+<p class="MsoNormal"><span lang="ES">Durante el benchmark inicial se evaluó PaddleOCR con configuración por defecto en un subconjunto del dataset. Los resultados preliminares mostraron variabilidad significativa entre páginas, en función de los cambios de formato y de la estructura del texto.</span></p>
+<a name="_Ref_Tab22"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->22<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Variabilidad del error por tipo de contenido.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo de contenido</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Nivel de error</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Observaciones</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Texto corrido</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Bajo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mejor rendimiento</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Texto con listas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Rendimiento intermedio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Índice y encabezados</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Orden de lectura sensible</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Encabezados + notas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Variación tipográfica</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia a partir del benchmark.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Observaciones del benchmark inicial:</b></span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Las páginas con tablas y layouts complejos presentaron mayor error debido a la dificultad de ordenar correctamente las líneas de texto.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>La página con texto corrido continuo obtuvo el mejor resultado (CER ~1.5%), demostrando la capacidad del modelo para texto estándar.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>El promedio general se situó en CER ~5-6%, superando el umbral de aceptabilidad para documentos académicos pero con margen de mejora.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Las páginas con más cambios de formato y listados presentaron mayor error debido a la dificultad de ordenar correctamente las líneas de texto.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>La página con texto corrido continuo obtuvo el mejor resultado, demostrando la capacidad del modelo para texto estándar.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>El promedio general se situó en un rango medio de error, con margen de mejora.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Los errores más frecuentes fueron: confusión de acentos, caracteres duplicados, y errores en signos de puntuación.</span></p>
-<h4><span lang="ES">Comparativa de Modelos</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Comparativa de Modelos</span></h4>
 <p class="MsoNormal"><span lang="ES">Los tres modelos evaluados representan diferentes paradigmas de OCR:</span></p>
-<a name="_Ref_Tab23"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->23<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de arquitecturas OCR evaluadas.</span></i></p>
+<a name="_Ref_Tab23"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->23<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de arquitecturas OCR evaluadas.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Modelo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Componentes</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Fortalezas Clave</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>EasyOCR</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">End-to-end (det + rec)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CRAFT + CRNN/Transformer</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ligero, fácil de usar, multilingüe</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>PaddleOCR</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">End-to-end (det + rec + cls)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DB + SVTR/CRNN</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Soporte multilingüe robusto, pipeline configurable</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>DocTR</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">End-to-end (det + rec)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DB/LinkNet + CRNN/SAR/ViTSTR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Orientado a investigación, API limpia</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Documentación oficial de cada herramienta (JaidedAI, 2020; PaddlePaddle, 2024; Mindee, 2021).</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Análisis Cualitativo de Errores</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Análisis Cualitativo de Errores</span></h4>
 <p class="MsoNormal"><span lang="ES">Un análisis cualitativo de los errores producidos reveló patrones específicos:</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Errores de acentuación:</b></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">información</span> → <span style="font-family:Consolas;font-size:10pt">informacion</span> (pérdida de acento)</span></p>
@@ -5160,13 +5161,13 @@ color:#0098CD;mso-font-kerning:16.0pt;mso-bidi-font-weight:bold'><o:p></o:p></sp
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">titulacióon</span> en lugar de <span style="font-family:Consolas;font-size:10pt">titulación</span> (carácter duplicado)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">Apa</span> en lugar de <span style="font-family:Consolas;font-size:10pt">APA</span> (capitalización)</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Justificación de la Selección de PaddleOCR</span></h3>
-<h4><span lang="ES">Criterios de Selección</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Criterios de Selección</span></h4>
 <p class="MsoNormal"><span lang="ES">La selección de PaddleOCR para la fase de optimización se basó en los siguientes criterios:</span></p>
-<a name="_Ref_Tab24"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->24<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Evaluación de criterios de selección.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Criterio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">EasyOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">PaddleOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">DocTR</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CER benchmark</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~6-8%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~5-6%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~7-9%</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Configurabilidad</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Baja (3 params)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Alta (&gt;10 params)</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media (5 params)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Soporte español</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sí</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Sí (dedicado)</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Limitado</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Documentación</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Alta</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mantenimiento</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Alto</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab24"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->24<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Evaluación de criterios de selección (cualitativa).</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Criterio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">EasyOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">PaddleOCR</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">DocTR</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CER benchmark</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Mejor</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Configurabilidad</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Baja</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Alta</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Soporte español</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sí</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Sí (dedicado)</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Limitado</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Documentación</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Alta</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mantenimiento</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Alto</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia a partir del benchmark y la documentación de cada herramienta.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Hiperparámetros Disponibles en PaddleOCR</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Hiperparámetros Disponibles en PaddleOCR</span></h4>
 <p class="MsoNormal"><span lang="ES">PaddleOCR expone múltiples hiperparámetros ajustables, clasificados por etapa del pipeline:</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Detección:</b></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span>: Umbral de probabilidad para píxeles de texto</span></p>
@@ -5179,46 +5180,44 @@ color:#0098CD;mso-font-kerning:16.0pt;mso-bidi-font-weight:bold'><o:p></o:p></sp
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span>: Clasificación de orientación de documento</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span>: Corrección de deformación</span></p>
 <p class="MsoNormal"><span lang="ES">Esta riqueza de configuración permite explorar sistemáticamente el espacio de hiperparámetros mediante técnicas de optimización automática.</span></p>
-<h4><span lang="ES">Decisión Final</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Decisión Final</span></h4>
 <p class="MsoNormal"><span lang="ES"><b>Se selecciona PaddleOCR (PP-OCRv5)</b> para la fase de optimización debido a:</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Resultados iniciales prometedores</b>: CER ~5% en configuración por defecto, con potencial de mejora</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Alta configurabilidad</b>: Más de 10 hiperparámetros ajustables en tiempo de inferencia</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Resultados iniciales prometedores</b>: Rendimiento base competitivo con margen de mejora</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Alta configurabilidad</b>: Múltiples hiperparámetros ajustables en tiempo de inferencia</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Pipeline modular</b>: Permite aislar el impacto de cada componente</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span><b>Soporte activo para español</b>: Modelos específicos y actualizaciones frecuentes</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">5.<span style="font-size:7pt">   </span><b>Documentación técnica</b>: Descripción detallada de cada parámetro</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Limitaciones del Benchmark</span></h3>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Tamaño reducido</b>: Solo 5 páginas evaluadas en el benchmark comparativo inicial. Esto limita la generalización de las conclusiones.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Único tipo de documento</b>: Documentos académicos de UNIR únicamente. Otros tipos de documentos (facturas, formularios, contratos) podrían presentar resultados diferentes.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Ground truth automático</b>: El texto de referencia se extrajo programáticamente del PDF, lo cual puede introducir errores en layouts complejos donde el orden de lectura no es evidente.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Ejecución en CPU</b>: Todos los experimentos se realizaron en CPU, limitando la exploración de configuraciones que podrían beneficiarse de aceleración GPU.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Ground truth automático</b>: El texto de referencia se extrajo programáticamente del PDF, lo cual puede introducir errores en el orden de lectura cuando hay secciones con encabezados y saltos de línea.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Referencia CPU separada</b>: Los tiempos en CPU se midieron en un experimento independiente y solo se usan como comparación de rendimiento frente a GPU.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Síntesis del Benchmark</span></h3>
-<p class="MsoNormal"><span lang="ES">El benchmark comparativo ha permitido identificar PaddleOCR como la solución más prometedora para la fase de optimización, gracias a su combinación de rendimiento base aceptable (~5-6% CER), alta configurabilidad del pipeline y documentación técnica completa. Sin embargo, el análisis también reveló limitaciones importantes: el tamaño reducido del benchmark (5 páginas), la restricción a un único tipo de documento, y la extracción automática del ground truth que puede introducir errores en layouts complejos. Estas limitaciones se tendrán en cuenta al interpretar los resultados de la fase de optimización.</span></p>
-<p class="MsoNormal"><span lang="ES"><b>Fuentes de datos:</b> <span style="font-family:Consolas;font-size:10pt">ocr_benchmark_notebook.ipynb</span> y documentación oficial de PaddleOCR.</span></p>
+<p class="MsoNormal"><span lang="ES">El benchmark comparativo ha permitido identificar PaddleOCR como la solución más prometedora para la fase de optimización, gracias a su combinación de rendimiento base competitivo, alta configurabilidad del pipeline y documentación técnica completa. Sin embargo, el análisis también reveló limitaciones importantes: el tamaño reducido del benchmark (5 páginas), la restricción a un único tipo de documento, y la extracción automática del ground truth que puede introducir errores en el orden de lectura cuando hay secciones con encabezados y saltos de línea. Estas limitaciones se tendrán en cuenta al interpretar los resultados de la fase de optimización.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Desarrollo de la comparativa: Optimización de hiperparámetros</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Introducción</span></h3>
-<p class="MsoNormal"><span lang="ES">Una vez seleccionado PaddleOCR como motor base, el siguiente paso fue explorar sistemáticamente su espacio de configuración para identificar los hiperparámetros que maximizan el rendimiento en documentos académicos en español. Para ello se empleó Ray Tune con el algoritmo de búsqueda Optuna, una combinación que permite explorar eficientemente espacios de búsqueda mixtos (parámetros continuos y categóricos). Los experimentos se implementaron en <a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py"><span style="font-family:Consolas;font-size:10pt">src/run_tuning.py</span></a> con apoyo de la librería <a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/raytune_ocr.py"><span style="font-family:Consolas;font-size:10pt">src/raytune_ocr.py</span></a>, almacenándose los resultados en <a href="https://seryus.ddns.net/unir/MastersThesis/-/tree/main/src/results"><span style="font-family:Consolas;font-size:10pt">src/results/</span></a>.</span></p>
-<p class="MsoNormal"><span lang="ES">Esta aproximación ofrece ventajas significativas frente al fine-tuning tradicional: no requiere datasets de entrenamiento etiquetados, no modifica los pesos del modelo preentrenado, y puede ejecutarse con hardware de consumo cuando se dispone de aceleración GPU.</span></p>
+<p class="MsoNormal"><span lang="ES">Una vez seleccionado PaddleOCR como motor base, el siguiente paso fue explorar sistemáticamente su espacio de configuración para identificar los hiperparámetros que maximizan el rendimiento en documentos académicos en español. Para ello se empleó Ray Tune con el algoritmo de búsqueda Optuna, una combinación que permite explorar eficientemente espacios de búsqueda mixtos (parámetros continuos y categóricos). Los experimentos se implementaron en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/run_tuning.py"><span style="font-family:Consolas;font-size:10pt">src/run_tuning.py</span></a> con apoyo de la librería <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_ocr.py"><span style="font-family:Consolas;font-size:10pt">src/raytune_ocr.py</span></a>, almacenándose los resultados en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results"><span style="font-family:Consolas;font-size:10pt">src/results</span></a>. Esta aproximación ofrece ventajas significativas frente al fine-tuning tradicional: no requiere datasets de entrenamiento etiquetados, no modifica los pesos del modelo preentrenado, y puede ejecutarse con hardware de consumo cuando se dispone de aceleración GPU.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Configuración del Experimento</span></h3>
-<h4><span lang="ES">Entorno de Ejecución</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Entorno de Ejecución</span></h4>
 <p class="MsoNormal"><span lang="ES">El experimento se ejecutó en el siguiente entorno:</span></p>
-<a name="_Ref_Tab25"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->25<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Entorno de ejecución del experimento.</span></i></p>
+<a name="_Ref_Tab25"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->25<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Entorno de ejecución del experimento.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Componente</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Versión/Especificación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sistema operativo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ubuntu 24.04.3 LTS</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Python</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.12.3</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddlePaddle</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.2.2</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.3.2</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ray</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2.52.1</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optuna</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4.7.0</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">AMD Ryzen 7 5800H</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RAM</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">16 GB DDR4</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NVIDIA RTX 3060 Laptop (5.66 GB VRAM)</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr/requirements.txt</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/raytune/requirements.txt</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Arquitectura de Ejecución</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Arquitectura de Ejecución</span></h4>
 <p class="MsoNormal"><span lang="ES">La arquitectura basada en contenedores Docker es fundamental para este proyecto debido a los conflictos de dependencias inherentes entre los diferentes componentes:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Conflictos entre motores OCR</b>: PaddleOCR, DocTR y EasyOCR tienen dependencias mutuamente incompatibles (diferentes versiones de PyTorch/PaddlePaddle, OpenCV, etc.)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Incompatibilidades CUDA/cuDNN</b>: Cada motor OCR requiere versiones específicas de CUDA y cuDNN que no pueden coexistir en un mismo entorno virtual</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Aislamiento de Ray Tune</b>: Ray Tune tiene sus propias dependencias que pueden entrar en conflicto con las librerías de inferencia OCR</span></p>
-<p class="MsoNormal"><span lang="ES">Esta arquitectura containerizada permite ejecutar cada componente en su entorno aislado óptimo, comunicándose via API REST:</span></p>
-<a name="_Ref_Fig5"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->5<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Arquitectura de ejecución con Docker Compose</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Arquitectura de ejecución con Docker Compose" height="327" src="figures/figura_5.png" style="width:424.5pt;height:245.25pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="MsoNormal"><span lang="ES">Esta arquitectura containerizada permite ejecutar cada componente en su entorno aislado óptimo, comunicándose vía API REST:</span></p>
+<a name="_Ref_Fig5"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->5<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Arquitectura de ejecución con Docker Compose</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Arquitectura de ejecución con Docker Compose" height="327" src="figures/figura_5.png" style="width:424.5pt;height:245.25pt;display:block;margin:0 auto" width="566"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES">La arquitectura containerizada (<span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.*.yml</span>) ofrece:</span></p>
+<p class="MsoNormal"><span lang="ES">La arquitectura containerizada <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.paddle.yml</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.doctr.yml</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.easyocr.yml</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.yml</span></a> ofrece:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Aislamiento de dependencias entre Ray Tune y los motores OCR</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Health checks automáticos para asegurar disponibilidad del servicio</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>Comunicación via API REST (endpoints <span style="font-family:Consolas;font-size:10pt">/health</span> y <span style="font-family:Consolas;font-size:10pt">/evaluate</span>)</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>Comunicación vía API REST (endpoints <span style="font-family:Consolas;font-size:10pt">/health</span> y <span style="font-family:Consolas;font-size:10pt">/evaluate</span>)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">4.<span style="font-size:7pt">   </span>Soporte para GPU mediante nvidia-docker</span></p>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word"># Iniciar servicio OCR con GPU
@@ -5240,41 +5239,41 @@ docker compose -f docker-compose.tuning.doctr.yml down</pre>
     "TIME_PER_PAGE": 3.16
 }</pre>
 </div>
-<h4><span lang="ES">Infraestructura Docker</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Infraestructura Docker</span></h4>
 <p class="MsoNormal"><span lang="ES">La infraestructura del proyecto se basa en contenedores Docker para garantizar reproducibilidad y aislamiento de dependencias. Se generaron seis imágenes Docker, cada una optimizada para su propósito específico.</span></p>
-<a name="_Ref_Tab26"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->26<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Imágenes Docker generadas para el proyecto.</span></i></p>
+<a name="_Ref_Tab26"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->26<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Imágenes Docker generadas para el proyecto.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Imagen</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Propósito</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Base</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Puerto</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/paddle-ocr-gpu</span></a></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR con aceleración GPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">nvidia/cuda:12.4.1-cudnn-runtime</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8002</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-cpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/paddle-ocr-cpu</span></a></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR para entornos sin GPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">python:3.11-slim</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8002</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/easyocr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/easyocr-gpu</span></a></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR con aceleración GPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">nvidia/cuda:13.0.2-cudnn-runtime</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8002*</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/doctr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/doctr-gpu</span></a></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR con aceleración GPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">nvidia/cuda:13.0.2-cudnn-runtime</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8003</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/raytune/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/raytune</span></a></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Orquestador Ray Tune</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">python:3.12-slim</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia. Dockerfiles disponibles en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service"><span style="font-family:Consolas;font-size:10pt">src/easyocr_service</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service"><span style="font-family:Consolas;font-size:10pt">src/doctr_service</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune"><span style="font-family:Consolas;font-size:10pt">src/raytune</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Arquitectura de Microservicios</span></h4>
-<a name="_Ref_Fig6"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->6<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Arquitectura de microservicios para optimización OCR</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Arquitectura de microservicios para optimización OCR" height="313" src="figures/figura_6.png" style="width:424.5pt;height:234.75pt;display:block;margin:0 auto" width="566"/></span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Arquitectura de Microservicios</span></h4>
+<a name="_Ref_Fig6"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->6<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Arquitectura de microservicios para optimización OCR</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Arquitectura de microservicios para optimización OCR" height="313" src="figures/figura_6.png" style="width:424.5pt;height:234.75pt;display:block;margin:0 auto" width="566"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Estrategia de Build Multi-Stage</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Estrategia de Build Multi-Stage</span></h4>
 <p class="MsoNormal"><span lang="ES">Los Dockerfiles utilizan una estrategia de build multi-stage para optimizar tiempos de construcción y tamaño de imágenes:</span></p>
-<a name="_Ref_Fig7"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->7<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Estrategia de build multi-stage</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Estrategia de build multi-stage" height="438" src="figures/figura_7.png" style="width:424.5pt;height:328.5pt;display:block;margin:0 auto" width="566"/></span></p>
+<a name="_Ref_Fig7"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->7<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Estrategia de build multi-stage</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Estrategia de build multi-stage" height="438" src="figures/figura_7.png" style="width:424.5pt;height:328.5pt;display:block;margin:0 auto" width="566"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Ventajas de esta estrategia:</b></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Caché de dependencias</b>: La etapa base (CUDA + dependencias) se cachea y reutiliza</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Builds rápidos</b>: Los cambios de código solo reconstruyen la etapa de deploy (~10 segundos)</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span><b>Builds rápidos</b>: Los cambios de código solo reconstruyen la etapa de deploy</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span><b>Imágenes optimizadas</b>: Solo se incluyen los archivos necesarios para ejecución</span></p>
-<h4><span lang="ES">Docker Compose Files</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Docker Compose Files</span></h4>
 <p class="MsoNormal"><span lang="ES">El proyecto incluye múltiples archivos Docker Compose para diferentes escenarios de uso:</span></p>
-<a name="_Ref_Tab27"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->27<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Archivos Docker Compose del proyecto.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Archivo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Propósito</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicios</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/docker-compose.tuning.yml"><span style="font-family:Consolas;font-size:10pt">docker-compose.tuning.yml</span></a></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización principal</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RayTune + PaddleOCR + DocTR</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/docker-compose.tuning.easyocr.yml"><span style="font-family:Consolas;font-size:10pt">docker-compose.tuning.easyocr.yml</span></a></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización EasyOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RayTune + EasyOCR</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/docker-compose.tuning.paddle.yml"><span style="font-family:Consolas;font-size:10pt">docker-compose.tuning.paddle.yml</span></a></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RayTune + PaddleOCR</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/docker-compose.tuning.doctr.yml"><span style="font-family:Consolas;font-size:10pt">docker-compose.tuning.doctr.yml</span></a></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización DocTR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RayTune + DocTR</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab27"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->27<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Archivos Docker Compose del proyecto.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Archivo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Propósito</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicios</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.yml</span></a></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización principal</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RayTune + PaddleOCR + DocTR</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.easyocr.yml</span></a></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización EasyOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RayTune + EasyOCR</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.paddle.yml</span></a></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RayTune + PaddleOCR</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.doctr.yml</span></a></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización DocTR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RayTune + DocTR</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.yml</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.easyocr.yml</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.paddle.yml</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.doctr.yml</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoQuote"><i><span lang="ES"><b>Nota:</b> EasyOCR y PaddleOCR utilizan el mismo puerto (8002). Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez durante los experimentos. Por esta razón, EasyOCR tiene su propio archivo Docker Compose separado.</span></i></p>
-<h4><span lang="ES">Gestión de Volúmenes</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Gestión de Volúmenes</span></h4>
 <p class="MsoNormal"><span lang="ES">Se utilizan volúmenes Docker nombrados para persistir los modelos descargados entre ejecuciones:</span></p>
-<a name="_Ref_Tab28"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->28<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Volúmenes Docker para caché de modelos.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Volumen</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Contenido</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">paddlex-model-cache</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelos PP-OCRv5 (~500 MB)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">easyocr-model-cache</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelos CRAFT + CRNN (~400 MB)</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">doctr-model-cache</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelos db_resnet50 + crnn_vgg16_bn (~300 MB)</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab28"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->28<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Volúmenes Docker para caché de modelos.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Volumen</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Contenido</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">paddlex-model-cache</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelos PP-OCRv5</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">easyocr-model-cache</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelos CRAFT + CRNN</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">doctr-model-cache</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelos db_resnet50 + crnn_vgg16_bn</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.yml</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.easyocr.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.easyocr.yml</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.paddle.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.paddle.yml</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/docker-compose.tuning.doctr.yml"><span style="font-family:Consolas;font-size:10pt">src/docker-compose.tuning.doctr.yml</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Health Checks y Monitorización</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Health Checks y Monitorización</span></h4>
 <p class="MsoNormal"><span lang="ES">Todos los servicios implementan health checks para garantizar disponibilidad antes de iniciar la optimización:</span></p>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word">healthcheck:
@@ -5288,12 +5287,12 @@ docker compose -f docker-compose.tuning.doctr.yml down</pre>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>PaddleOCR</b>: 60 segundos (modelos más ligeros)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>EasyOCR</b>: 120 segundos (carga de modelos CRAFT)</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>DocTR</b>: 180 segundos (modelos ResNet más pesados)</span></p>
-<h4><span lang="ES">Flujo de Ejecución Completo</span></h4>
-<a name="_Ref_Fig8"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->8<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Flujo de ejecución de optimización con Ray Tune</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Flujo de ejecución de optimización con Ray Tune" height="455" src="figures/figura_8.png" style="width:424.5pt;height:341.25pt;display:block;margin:0 auto" width="566"/></span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Flujo de Ejecución Completo</span></h4>
+<a name="_Ref_Fig8"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->8<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Flujo de ejecución de optimización con Ray Tune</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Flujo de ejecución de optimización con Ray Tune" height="468" src="figures/figura_8.png" style="width:424.5pt;height:351.0pt;display:block;margin:0 auto" width="566"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Reproducibilidad</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Reproducibilidad</span></h4>
 <p class="MsoNormal"><span lang="ES">Para reproducir los experimentos:</span></p>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word"># 1. Clonar repositorio
@@ -5317,66 +5316,63 @@ ls -la results/raytune_paddle_results_*.csv
 docker compose -f docker-compose.tuning.paddle.yml down</pre>
 </div>
 <p class="MsoNormal"><span lang="ES">Los resultados de los experimentos están disponibles en:</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a></span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_easyocr_results_20260119_120204.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_easyocr_results_20260119_120204.csv</span></a></span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_doctr_results_20260119_121445.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_doctr_results_20260119_121445.csv</span></a></span></p>
-<h4><span lang="ES">Dataset Extendido</span></h4>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_easyocr_results_20260119_120204.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_easyocr_results_20260119_120204.csv</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_doctr_results_20260119_121445.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_doctr_results_20260119_121445.csv</span></a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv"><span style="font-family:Consolas;font-size:10pt">src/raytune_paddle_subproc_results_20251207_192320.csv</span></a></span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Dataset Extendido</span></h4>
 <p class="MsoNormal"><span lang="ES">Para la fase de optimización se extendió el dataset:</span></p>
-<a name="_Ref_Tab29"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->29<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Características del dataset de optimización.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Característica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Páginas totales</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">24</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Páginas por trial</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5 (páginas 5-10)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Estructura</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Carpetas <span style="font-family:Consolas;font-size:10pt">img/</span> y <span style="font-family:Consolas;font-size:10pt">txt/</span> pareadas</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Resolución</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">300 DPI</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Formato imagen</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PNG</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab29"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->29<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Características del dataset de optimización.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Característica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Páginas del dataset completo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">45</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Páginas por trial</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5 (páginas 5-10)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Estructura</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Carpetas <span style="font-family:Consolas;font-size:10pt">img/</span> y <span style="font-family:Consolas;font-size:10pt">txt/</span> pareadas</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Resolución</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">300 DPI</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Formato imagen</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PNG</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/prepare_dataset.ipynb"><span style="font-family:Consolas;font-size:10pt">src/prepare_dataset.ipynb</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES">La clase <span style="font-family:Consolas;font-size:10pt">ImageTextDataset</span> gestiona la carga de pares imagen-texto desde la estructura de carpetas pareadas. La implementación está disponible en el repositorio (ver Anexo A).</span></p>
-<h4><span lang="ES">Espacio de Búsqueda</span></h4>
-<p class="MsoNormal"><span lang="ES">El espacio de búsqueda se definió considerando los hiperparámetros más relevantes identificados en la documentación de PaddleOCR, utilizando <span style="font-family:Consolas;font-size:10pt">tune.choice()</span> para parámetros booleanos y <span style="font-family:Consolas;font-size:10pt">tune.uniform()</span> para umbrales continuos. La implementación está disponible en <span style="font-family:Consolas;font-size:10pt">src/raytune/raytune_ocr.py</span> (ver Anexo A).</span></p>
-<a name="_Ref_Tab30"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->30<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Descripción detallada del espacio de búsqueda.</span></i></p>
+<p class="MsoNormal"><span lang="ES">La clase <span style="font-family:Consolas;font-size:10pt">ImageTextDataset</span> gestiona la carga de pares imagen-texto desde la estructura de carpetas pareadas. La implementación está disponible en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/dataset_manager.py"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr/dataset_manager.py</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/dataset_manager.py"><span style="font-family:Consolas;font-size:10pt">src/easyocr_service/dataset_manager.py</span></a> y <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/dataset_manager.py"><span style="font-family:Consolas;font-size:10pt">src/doctr_service/dataset_manager.py</span></a>.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Espacio de Búsqueda</span></h4>
+<p class="MsoNormal"><span lang="ES">El espacio de búsqueda se definió considerando los hiperparámetros más relevantes identificados en la documentación de PaddleOCR, utilizando <span style="font-family:Consolas;font-size:10pt">tune.choice()</span> para parámetros booleanos y <span style="font-family:Consolas;font-size:10pt">tune.uniform()</span> para umbrales continuos. La implementación está disponible en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/raytune_ocr.py"><span style="font-family:Consolas;font-size:10pt">src/raytune/raytune_ocr.py</span></a> (ver Anexo A).</span></p>
+<a name="_Ref_Tab30"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->30<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Descripción detallada del espacio de búsqueda.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Rango</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Descripción</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Booleano</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">{True, False}</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Clasificación de orientación del documento completo</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Booleano</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">{True, False}</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Corrección de deformación/curvatura</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Booleano</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">{True, False}</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Clasificación de orientación por línea de texto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Continuo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[0.0, 0.7]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral de probabilidad para píxeles de texto</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Continuo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[0.0, 0.7]</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral de confianza para cajas detectadas</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fijo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.0</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Coeficiente de expansión (no explorado)</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Continuo</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">[0.0, 0.7]</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral de confianza de reconocimiento</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Documentación de PaddleOCR.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Justificación del espacio:</b></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Rango [0.0, 0.7] para umbrales</b>: Se evitan valores extremos (&gt;0.7) que podrían filtrar demasiado texto válido, y se incluye 0.0 para evaluar el impacto de desactivar el filtrado.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b><span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span> fijo</b>: Por decisión de diseño inicial, este parámetro se mantuvo constante para reducir la dimensionalidad del espacio de búsqueda.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Parámetros booleanos completos</b>: Los tres parámetros de preprocesamiento se exploran completamente para identificar cuáles son necesarios para documentos digitales.</span></p>
-<h4><span lang="ES">Configuración de Ray Tune</span></h4>
-<p class="MsoNormal"><span lang="ES">Se configuró Ray Tune con OptunaSearch como algoritmo de búsqueda, optimizando CER en 64 trials con 2 ejecuciones concurrentes. La implementación está disponible en <span style="font-family:Consolas;font-size:10pt">src/raytune/raytune_ocr.py</span> (ver Anexo A).</span></p>
-<a name="_Ref_Tab31"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->31<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Parámetros de configuración de Ray Tune.</span></i></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Configuración de Ray Tune</span></h4>
+<p class="MsoNormal"><span lang="ES">Se configuró Ray Tune con OptunaSearch como algoritmo de búsqueda, optimizando CER en 64 trials con 2 ejecuciones concurrentes. La implementación está disponible en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/raytune_ocr.py"><span style="font-family:Consolas;font-size:10pt">src/raytune/raytune_ocr.py</span></a> (ver Anexo A).</span></p>
+<a name="_Ref_Tab31"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->31<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Parámetros de configuración de Ray Tune.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Justificación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Métrica objetivo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CER</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Métrica estándar para OCR</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">min</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Minimizar tasa de error</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Algoritmo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">OptunaSearch (TPE)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Eficiente para espacios mixtos</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Número de trials</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">64</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Balance entre exploración y tiempo</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Trials concurrentes</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Limitado por memoria disponible</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/raytune_ocr.py"><span style="font-family:Consolas;font-size:10pt">src/raytune/raytune_ocr.py</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><b>Elección de 64 trials:</b></span></p>
-<p class="MsoNormal"><span lang="ES">El número de trials se eligió considerando:</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Espacio de búsqueda de 7 dimensiones (3 booleanas + 4 continuas)</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Tiempo estimado por trial: ~6 minutos</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Tiempo total objetivo: &lt;8 horas</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Regla empírica: 10× dimensiones = 70 trials mínimo recomendado</span></p>
+<p class="MsoNormal"><span lang="ES">Elección de 64 trials:</span></p>
+<p class="MsoNormal"><span lang="ES">El número de trials se eligió buscando un equilibrio entre exploración del espacio de búsqueda y tiempo total de ejecución.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Resultados de la Optimización</span></h3>
-<h4><span lang="ES">Ejecución del Experimento</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Ejecución del Experimento</span></h4>
 <p class="MsoNormal"><span lang="ES">El experimento se ejecutó exitosamente con los siguientes resultados globales:</span></p>
-<a name="_Ref_Tab32"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->32<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Resumen de la ejecución del experimento.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Métrica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Trials completados</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">64/64</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Trials fallidos</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo total</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~6.4 horas</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo medio por trial</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">367.72 segundos</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Páginas procesadas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">320 (64 trials × 5 páginas)</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab32"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->32<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Resumen de la ejecución del experimento (referencia CPU).</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Métrica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Trials completados</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">64/64</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Trials fallidos</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo total (CPU)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">6.2 horas</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo medio por trial (CPU)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">347.6 segundos</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Páginas procesadas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">320 (64 trials x 5 páginas)</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv"><span style="font-family:Consolas;font-size:10pt">src/raytune_paddle_subproc_results_20251207_192320.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Estadísticas Descriptivas</span></h4>
-<p class="MsoNormal"><span lang="ES">Del archivo CSV de resultados (<span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span>):</span></p>
-<a name="_Ref_Tab33"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->33<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Estadísticas descriptivas de los 64 trials.</span></i></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Estadísticas Descriptivas</span></h4>
+<p class="MsoNormal"><span lang="ES">Del archivo CSV de resultados <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>:</span></p>
+<a name="_Ref_Tab33"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->33<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Estadísticas descriptivas de los 64 trials.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Estadística</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">WER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tiempo/Página (s)</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>count</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">64</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">64</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">64</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>mean</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2.30%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">9.25%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.84</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>std</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2.20%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.78%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.53</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>min</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.79%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">6.80%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.56</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>50%</b> (mediana)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.87%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8.39%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.59</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>max</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.30%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">13.20%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2.22</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><b>Observaciones:</b></span></p>
+<p class="MsoNormal"><span lang="ES">Observaciones:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Baja varianza en CER</b>: La desviación estándar (2.20%) es similar a la media (2.30%), indicando una distribución relativamente consistente sin valores extremos catastróficos.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Mediana vs Media</b>: La mediana del CER (0.87%) es menor que la media (2.30%), confirmando una distribución ligeramente sesgada hacia valores bajos.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Velocidad GPU</b>: El tiempo de ejecución promedio es de 0.84 s/página, lo que representa una aceleración significativa respecto a la ejecución en CPU (~69 s/página, 82x más rápido).</span></p>
-<h4><span lang="ES">Distribución de Resultados</span></h4>
-<a name="_Ref_Tab34"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->34<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Distribución de trials por rango de CER.</span></i></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Distribución de Resultados</span></h4>
+<a name="_Ref_Tab34"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->34<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Distribución de trials por rango de CER.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Rango CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Número de trials</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Porcentaje</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&lt; 2%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">43</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">67.2%</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2% - 5%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">10</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">15.6%</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5% - 10%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">11</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">17.2%</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&gt; 10%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.0%</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Fig9"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->9<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Distribución de trials por rango de CER</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Distribución de trials por rango de CER" height="407" src="figures/figura_9.png" style="width:424.5pt;height:305.25pt;display:block;margin:0 auto" width="566"/></span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Fig9"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->9<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Distribución de trials por rango de CER</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Distribución de trials por rango de CER" height="407" src="figures/figura_9.png" style="width:424.5pt;height:305.25pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES">La mayoría de trials (67.2%) alcanzaron CER &lt; 2%, cumpliendo el objetivo establecido. Ningún trial presentó fallos catastróficos (CER &gt; 10%), demostrando la estabilidad de la optimización con GPU.</span></p>
-<h4><span lang="ES">Mejor Configuración Encontrada</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Mejor Configuración Encontrada</span></h4>
 <p class="MsoNormal"><span lang="ES">La configuración que minimizó el CER fue:</span></p>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word">Best CER: 0.007884 (0.79%)
@@ -5391,146 +5387,127 @@ Configuración óptima:
   text_det_unclip_ratio: 0.0
   text_rec_score_thresh: 0.5658</pre>
 </div>
-<a name="_Ref_Tab35"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->35<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Configuración óptima identificada.</span></i></p>
+<a name="_Ref_Tab35"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->35<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Configuración óptima identificada.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor óptimo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor por defecto</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Cambio</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">textline_orientation</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>True</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Activado</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">use_doc_orientation_classify</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>True</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Activado</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">use_doc_unwarping</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sin cambio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">text_det_thresh</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>0.0462</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.3</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.254</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">text_det_box_thresh</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>0.4862</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.6</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.114</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">text_det_unclip_ratio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.0</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.5</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-1.5 (fijado)</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">text_rec_score_thresh</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>0.5658</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.5</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">+0.066</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Análisis de Correlación</span></h4>
-<p class="MsoNormal"><span lang="ES">Se calculó la correlación de Pearson entre los parámetros continuos y las métricas de error:</span></p>
-<a name="_Ref_Tab36"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->36<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Correlación de parámetros con CER.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Correlación con CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Interpretación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>-0.523</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada negativa</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">+0.226</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación débil positiva</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.161</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación débil negativa</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NaN</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Varianza cero (valor fijo)</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Análisis de Correlación</span></h4>
+<p class="MsoNormal"><span lang="ES">Se calculó la correlación de Pearson entre los parámetros de configuración (codificados como 0/1 en el caso de booleanos) y las métricas de error:</span></p>
+<a name="_Ref_Tab36"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->36<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Correlación de parámetros con CER.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Correlación con CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Interpretación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>+0.879</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación alta positiva</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.712</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación alta negativa</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.535</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada negativa</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">+0.428</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada positiva</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">+0.311</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada positiva</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.268</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada negativa</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NaN</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Varianza cero (valor fijo)</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">src/results/correlations/paddle_correlations.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Tab37"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->37<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Correlación de parámetros con WER.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Correlación con WER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Interpretación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>-0.521</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada negativa</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">+0.227</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación débil positiva</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.173</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación débil negativa</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab37"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->37<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Correlación de parámetros con WER.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Correlación con WER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Interpretación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>+0.744</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación alta positiva</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.602</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación alta negativa</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.591</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada negativa</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">+0.399</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada positiva</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">+0.256</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada positiva</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.080</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación débil negativa</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NaN</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Varianza cero (valor fijo)</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">src/results/correlations/paddle_correlations.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Fig10"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->10<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Correlación de hiperparámetros con CER</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Correlación de hiperparámetros con CER" height="404" src="figures/figura_10.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Fig10"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->10<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Correlación de hiperparámetros con CER</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Correlación de hiperparámetros con CER" height="404" src="figures/figura_10.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">src/results/correlations/paddle_correlations.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><i>Leyenda: Valores negativos indican que aumentar el parámetro reduce el CER. El parámetro <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> tiene la correlación más fuerte (-0.52).</i></span></p>
-<p class="MsoNormal"><span lang="ES"><b>Hallazgo clave</b>: El parámetro <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> muestra la correlación más fuerte (-0.52 con ambas métricas), indicando que valores más altos de este umbral tienden a reducir el error. Este umbral controla qué píxeles se consideran "texto" en el mapa de probabilidad del detector.</span></p>
-<h4><span lang="ES">Impacto del Parámetro textline_orientation</span></h4>
+<p class="MsoNormal"><span lang="ES">Leyenda: Valores positivos indican que aumentar el parámetro incrementa el CER. Los parámetros booleanos se codifican como 0/1 para el cálculo de la correlación. Abreviaturas: unwarp = <span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span>, orient_doc = <span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span>, orient_line = <span style="font-family:Consolas;font-size:10pt">textline_orientation</span>, det_thresh = <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span>, box_thresh = <span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span>, rec_score = <span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span>.</span></p>
+<p class="MsoNormal"><span lang="ES"><b>Hallazgo clave</b>: <span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span> presenta la correlación positiva más alta con CER (0.879), lo que indica que activar este módulo incrementa el error en este dataset. En cambio, <span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span> y <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> tienen correlación negativa, asociada a mejoras cuando están activados.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Impacto del Parámetro textline_orientation</span></h4>
 <p class="MsoNormal"><span lang="ES">El parámetro booleano <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> demostró tener el mayor impacto en el rendimiento:</span></p>
-<a name="_Ref_Tab38"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->38<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Impacto del parámetro textline_orientation.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">textline_orientation</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER Medio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER Std</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">WER Medio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">N trials</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.76%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.12%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">12.73%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">32</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">12.40%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">14.93%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">21.71%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">32</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab38"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->38<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Impacto del parámetro textline_orientation.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">textline_orientation</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER Medio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER Std</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">WER Medio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">N trials</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.74%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.94%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8.75%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">52</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4.73%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.37%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">11.42%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">12</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><b>Interpretación:</b></span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Reducción del CER</b>: Con <span style="font-family:Consolas;font-size:10pt">textline_orientation=True</span>, el CER medio es 3.3 veces menor (3.76% vs 12.40%).</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Menor varianza</b>: La desviación estándar también se reduce significativamente (7.12% vs 14.93%), indicando resultados más consistentes.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Reducción del CER</b>: 69.7% cuando se habilita la clasificación de orientación de línea.</span></p>
-<a name="_Ref_Fig11"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->11<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Impacto de textline_orientation en CER</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Impacto de textline_orientation en CER" height="404" src="figures/figura_11.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="MsoNormal"><span lang="ES">Interpretación:</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Reducción del CER</b>: Con <span style="font-family:Consolas;font-size:10pt">textline_orientation=True</span>, el CER medio es 2.7 veces menor (1.74% vs 4.73%).</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Varianza</b>: La desviación estándar es mayor cuando <span style="font-family:Consolas;font-size:10pt">textline_orientation=True</span> (1.94% vs 1.37%), aunque los valores medios siguen siendo mejores.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Reducción del CER</b>: 63.2% cuando se habilita la clasificación de orientación de línea.</span></p>
+<a name="_Ref_Fig11"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->11<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Impacto de textline_orientation en CER</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Impacto de textline_orientation en CER" height="404" src="figures/figura_11.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><b>Explicación técnica:</b></span></p>
-<p class="MsoNormal"><span lang="ES">El parámetro <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> activa un clasificador que determina la orientación de cada línea de texto detectada. Para documentos con layouts mixtos (tablas, encabezados laterales, direcciones postales), este clasificador asegura que el texto se lea en el orden correcto, evitando la mezcla de líneas de diferentes columnas o secciones.</span></p>
-<h4><span lang="ES">Análisis de Fallos Catastróficos</span></h4>
-<p class="MsoNormal"><span lang="ES">Los trials con CER muy alto (&gt;20%) presentaron patrones específicos:</span></p>
-<a name="_Ref_Tab39"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->39<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Características de trials con fallos catastróficos.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Trial</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">text_det_thresh</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">textline_orientation</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Diagnóstico</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">#47</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">51.61%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.017</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral muy bajo</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">#23</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">43.29%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.042</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral bajo + sin orientación</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">#12</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">38.76%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.089</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral bajo + sin orientación</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">#56</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">35.12%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.023</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral muy bajo + sin orientación</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="MsoNormal"><span lang="ES">Explicación técnica:</span></p>
+<p class="MsoNormal"><span lang="ES">El parámetro <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> activa un clasificador que determina la orientación de cada línea de texto detectada. Para documentos con índice, encabezados y listas, este clasificador asegura que el texto se lea en el orden correcto, evitando la mezcla de líneas de diferentes secciones.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Análisis de Trials con Mayor CER</span></h4>
+<p class="MsoNormal"><span lang="ES">No se observaron fallos catastróficos (CER &gt; 10%). El CER máximo fue 7.30%, por lo que el análisis se centra en los trials con peor desempeño relativo:</span></p>
+<a name="_Ref_Tab39"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->39<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Trials con mayor CER.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Trial ID</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">text_det_thresh</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">textline_orientation</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">f699b826</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.30%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.285</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">34bfaecf</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.29%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.030</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8c1998de</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">6.44%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.369</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8b33e2a2</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">6.41%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.664</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><b>Diagnóstico:</b></span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Umbral de detección muy bajo</b> (<span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> &lt; 0.1): Genera exceso de falsos positivos en la detección, incluyendo artefactos, manchas y ruido como "texto".</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Desactivación de orientación</b>: Sin el clasificador de orientación, las líneas de texto pueden mezclarse incorrectamente, especialmente en tablas.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Combinación fatal</b>: La peor combinación es umbral bajo + sin orientación, que produce textos completamente desordenados y con inserciones de ruido.</span></p>
-<p class="MsoNormal"><span lang="ES"><b>Recomendación</b>: Evitar <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> &lt; 0.1 en cualquier configuración.</span></p>
+<p class="MsoNormal"><span lang="ES">Observación: Los peores resultados muestran variabilidad tanto en <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> como en <span style="font-family:Consolas;font-size:10pt">textline_orientation</span>, sin un patrón único dominante en este subconjunto de trials.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Comparación Baseline vs Optimizado</span></h3>
-<h4><span lang="ES">Evaluación sobre Dataset Completo</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Evaluación sobre Dataset Completo</span></h4>
 <p class="MsoNormal"><span lang="ES">La configuración óptima identificada se evaluó sobre el dataset completo de 45 páginas, comparando con la configuración baseline (valores por defecto de PaddleOCR). Los parámetros optimizados más relevantes fueron: <span style="font-family:Consolas;font-size:10pt">textline_orientation=True</span>, <span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify=True</span>, <span style="font-family:Consolas;font-size:10pt">text_det_thresh=0.0462</span>, <span style="font-family:Consolas;font-size:10pt">text_det_box_thresh=0.4862</span>, y <span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh=0.5658</span>.</span></p>
-<a name="_Ref_Tab40"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->40<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparación baseline vs optimizado (45 páginas).</span></i></p>
+<a name="_Ref_Tab40"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->40<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparación baseline vs optimizado (45 páginas).</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Modelo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Precisión Caracteres</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">WER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Precisión Palabras</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR (Baseline)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8.85%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">91.15%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">13.05%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">86.95%</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR-HyperAdjust</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>7.72%</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>92.28%</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>11.40%</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>88.60%</b></span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoQuote"><i><span lang="ES"><b>Nota sobre generalización:</b> El mejor trial individual (5 páginas) alcanzó un CER de 0.79%, cumpliendo el objetivo de CER &lt; 2%. Sin embargo, al aplicar la configuración al dataset completo de 45 páginas, el CER aumentó a 7.72%, evidenciando sobreajuste al subconjunto de entrenamiento. Esta diferencia es un hallazgo importante que se discute en la sección de análisis.</span></i></p>
-<h4><span lang="ES">Métricas de Mejora</span></h4>
-<a name="_Ref_Tab41"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->41<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Análisis cuantitativo de la mejora.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Forma de Medición</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">WER</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Valor baseline</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8.85%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">13.05%</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Valor optimizado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.72%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">11.40%</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mejora absoluta</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-1.13 pp</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-1.65 pp</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Reducción relativa del error</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>12.8%</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>12.6%</b></span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Factor de mejora</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.15×</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.14×</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Mejor trial (5 páginas)</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>0.79%</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>7.78%</b></span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Métricas de Mejora</span></h4>
+<a name="_Ref_Tab41"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->41<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Análisis cuantitativo de la mejora.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Forma de Medición</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">WER</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Valor baseline</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8.85%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">13.05%</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Valor optimizado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.72%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">11.40%</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mejora absoluta</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-1.13 pp</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-1.65 pp</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Reducción relativa del error</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>12.8%</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>12.6%</b></span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Factor de mejora</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.15x</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.14x</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Mejor trial (5 páginas)</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>0.79%</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>7.78%</b></span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Fig12"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->12<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Reducción de errores: Baseline vs Optimizado (45 páginas)</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Reducción de errores: Baseline vs Optimizado (45 páginas)" height="404" src="figures/figura_12.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Fig12"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->12<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Reducción de errores: Baseline vs Optimizado (45 páginas)</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Reducción de errores: Baseline vs Optimizado (45 páginas)" height="404" src="figures/figura_12.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><i>Leyenda: CER = Character Error Rate, WER = Word Error Rate. Baseline = configuración por defecto de PaddleOCR. Optimizado = configuración encontrada por Ray Tune. Los valores corresponden al dataset completo de 45 páginas.</i></span></p>
-<h4><span lang="ES">Impacto Práctico</span></h4>
-<p class="MsoNormal"><span lang="ES"><b>En un documento típico de 10,000 caracteres:</b></span></p>
-<a name="_Ref_Tab42"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->42<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">En un documento típico de 10,000 caracteres</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Configuración</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Caracteres con error</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Palabras con error*</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Baseline</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~885</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~196</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimizada (full dataset)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~772</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~171</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimizada (mejor trial)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~79</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~117</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Reducción (full dataset)</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>113 menos</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>25 menos</b></span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
-<p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES">*Asumiendo longitud media de palabra = 6.6 caracteres en español.</span></p>
-<p class="MsoNormal"><span lang="ES"><b>Interpretación:</b></span></p>
-<p class="MsoQuote"><i><span lang="ES">"La optimización de hiperparámetros logró una mejora del 12.8% en el CER sobre el dataset completo de 45 páginas. Aunque esta mejora es más modesta que la observada en los trials individuales (donde se alcanzó 0.79% CER), demuestra el valor de la optimización sistemática. La diferencia entre el mejor trial (0.79%) y el resultado en dataset completo (7.72%) revela un fenómeno de sobreajuste al subconjunto de 5 páginas usado para evaluación."</span></i></p>
+<p class="MsoNormal"><span lang="ES">Leyenda: CER = Character Error Rate, WER = Word Error Rate. Baseline = configuración por defecto de PaddleOCR. Optimizado = configuración encontrada por Ray Tune. Los valores corresponden al dataset completo de 45 páginas.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Impacto Práctico</span></h4>
+<p class="MsoNormal"><span lang="ES">La reducción de CER y WER implica menos correcciones manuales en el texto reconocido. En conjunto, los resultados muestran una mejora medible en precisión, aunque la generalización depende del tamaño y representatividad del subconjunto de optimización.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Tiempo de Ejecución</span></h3>
-<a name="_Ref_Tab43"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->43<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Métricas de tiempo del experimento (GPU).</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Métrica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo total del experimento</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~1.5 horas</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo medio por trial</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~4.2 segundos</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo medio por página</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.84 segundos</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Variabilidad (std)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.53 segundos/página</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Páginas procesadas totales</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">320</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab42"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->42<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Métricas de tiempo del experimento (GPU).</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Métrica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo total del experimento</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~5.0 minutos</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo medio por trial</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4.64 segundos</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo medio por página</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.84 segundos</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Variabilidad (std)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.53 segundos/página</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Páginas procesadas totales</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">320</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><b>Observaciones:</b></span></p>
+<p class="MsoNormal"><span lang="ES">Observaciones:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>El tiempo por página (~0.84 segundos) corresponde a ejecución con GPU (RTX 3060).</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>La variabilidad del tiempo es moderada (std = 0.53 s/página), con algunos trials más lentos debido a configuraciones con módulos de preprocesamiento activos.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>En comparación, la ejecución en CPU requiere ~69 segundos/página (82× más lento), lo que justifica el uso de GPU para optimización y producción.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>En comparación, la ejecución en CPU requiere ~69 segundos/página (82x más lento), lo que justifica el uso de GPU para optimización y producción.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Síntesis de la Optimización</span></h3>
-<p class="MsoNormal"><span lang="ES">Los 64 trials ejecutados con Ray Tune y aceleración GPU revelaron patrones claros en el comportamiento de PaddleOCR. El hallazgo más significativo es que los parámetros estructurales —<span style="font-family:Consolas;font-size:10pt">textline_orientation</span> y <span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span>— tienen mayor impacto que los umbrales numéricos: activarlos reduce el CER medio de 12.40% a 3.76%. En cuanto a umbrales, valores bajos de <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> (~0.05) benefician el rendimiento, mientras que <span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span> resulta innecesario para PDFs digitales.</span></p>
+<p class="MsoNormal"><span lang="ES">Los 64 trials ejecutados con Ray Tune y aceleración GPU revelaron patrones claros en el comportamiento de PaddleOCR. El hallazgo más significativo es que los parámetros estructurales, <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> y <span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span>, tienen mayor impacto que los umbrales numéricos. Al activarlos se reduce el CER medio de 4.73% a 1.74%. En cuanto a umbrales, valores bajos de <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> (aprox. 0.05) benefician el rendimiento, mientras que <span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span> resulta innecesario para PDFs digitales.</span></p>
 <p class="MsoNormal"><span lang="ES">El mejor trial alcanzó un CER de 0.79%, cumpliendo el objetivo de CER &lt; 2%. No obstante, la validación sobre el dataset completo de 45 páginas arrojó un CER de 7.72%, evidenciando sobreajuste al subconjunto de optimización de 5 páginas. Aun así, esto representa una mejora del 12.8% respecto al baseline (8.85%), demostrando el valor de la optimización sistemática incluso cuando la generalización es imperfecta.</span></p>
-<p class="MsoNormal"><span lang="ES"><b>Fuentes de datos:</b> <a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py"><span style="font-family:Consolas;font-size:10pt">src/run_tuning.py</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/raytune_ocr.py"><span style="font-family:Consolas;font-size:10pt">src/raytune_ocr.py</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Discusión y análisis de resultados</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Introducción</span></h3>
 <p class="MsoNormal"><span lang="ES">Los resultados obtenidos en las secciones anteriores requieren un análisis que trascienda los números individuales para comprender su significado práctico. En esta sección se consolidan los hallazgos del benchmark comparativo y la optimización de hiperparámetros, evaluando hasta qué punto se han cumplido los objetivos planteados y qué limitaciones condicionan la generalización de las conclusiones.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Resumen Consolidado de Resultados</span></h3>
-<h4><span lang="ES">Progresión del Rendimiento</span></h4>
-<a name="_Ref_Tab44"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->44<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Evolución del rendimiento a través del estudio.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Fase</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Configuración</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Mejora vs anterior</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Benchmark inicial</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Baseline (5 páginas)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~7-8%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización (mejor trial)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimizada (5 páginas)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>0.79%</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~90% vs baseline</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Validación final</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimizada (45 páginas)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.72%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">12.8% vs baseline</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Progresión del Rendimiento</span></h4>
+<a name="_Ref_Tab43"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->43<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Evolución del rendimiento a través del estudio.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Fase</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Configuración</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Mejora vs baseline</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Benchmark inicial</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Baseline (5 páginas)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.76%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimización (mejor trial)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimizada (5 páginas)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>0.79%</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">89.8%</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Validación final</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimizada (45 páginas)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.72%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">12.8%</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Fig13"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->13<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Evolución del CER a través del estudio</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Evolución del CER a través del estudio" height="404" src="figures/figura_13.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Fig13"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->13<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Evolución del CER a través del estudio</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Evolución del CER a través del estudio" height="404" src="figures/figura_13.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><i>Leyenda: El mejor trial alcanza CER 0.79% (objetivo cumplido). La validación sobre dataset completo muestra CER 7.72%, evidenciando sobreajuste al subconjunto de optimización.</i></span></p>
-<p class="MsoNormal"><span lang="ES">El incremento del CER de 0.79% (5 páginas) a 7.72% (45 páginas) evidencia sobreajuste al subconjunto de optimización. Este fenómeno es esperado cuando se optimiza sobre un subconjunto pequeño y se valida sobre el dataset completo con mayor diversidad de layouts.</span></p>
-<h4><span lang="ES">Comparación con Objetivo</span></h4>
-<a name="_Ref_Tab45"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->45<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Verificación del objetivo general.</span></i></p>
+<p class="MsoNormal"><span lang="ES">Leyenda: El mejor trial alcanza CER 0.79% (objetivo cumplido). La validación sobre dataset completo muestra CER 7.72%, evidenciando sobreajuste al subconjunto de optimización.</span></p>
+<p class="MsoNormal"><span lang="ES">El incremento del CER de 0.79% (5 páginas) a 7.72% (45 páginas) evidencia sobreajuste al subconjunto de optimización. Este fenómeno es esperado cuando se optimiza sobre un subconjunto pequeño y se valida sobre el dataset completo con mayor diversidad de secciones y estilos.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Comparación con Objetivo</span></h4>
+<a name="_Ref_Tab44"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->44<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Verificación del objetivo general.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Aspecto</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Objetivo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Resultado (trial)</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Resultado (full)</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Cumplimiento</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Métrica</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CER</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CER</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CER</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✓</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Umbral</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&lt; 2%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>0.79%</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.72%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Parcial</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Método</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sin fine-tuning</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Solo hiperparámetros</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Solo hiperparámetros</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✓</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Hardware</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RTX 3060</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RTX 3060</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✓</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoQuote"><i><span lang="ES"><b>Análisis del cumplimiento:</b> El objetivo de CER &lt; 2% se cumple en el mejor trial individual (0.79%), demostrando que la optimización de hiperparámetros puede alcanzar la precisión objetivo. Sin embargo, la validación sobre el dataset completo (7.72%) muestra que la generalización requiere trabajo adicional, como un subconjunto de optimización más representativo o técnicas de regularización.</span></i></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Análisis Detallado de Hiperparámetros</span></h3>
-<h4><span lang="ES">Jerarquía de Importancia</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Jerarquía de Importancia</span></h4>
 <p class="MsoNormal"><span lang="ES">Basándose en el análisis de los resultados de optimización:</span></p>
-<a name="_Ref_Tab46"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->46<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Ranking de importancia de hiperparámetros.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Rank</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Impacto</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Evidencia</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Crítico</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Presente en todos los mejores trials</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Alto</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Activado en configuración óptima</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>Alto</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Valor óptimo bajo (0.0462)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Moderado (0.4862)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Moderado (0.5658)</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">6</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Nulo</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Desactivado en configuración óptima</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab45"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->45<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Ranking de importancia de hiperparámetros.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Rank</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Pearson (CER)</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Signo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Evidencia</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.879</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Positivo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación más alta con CER</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.712</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Negativo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación alta con CER</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.535</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Negativo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación alta con CER</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.428</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Positivo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada con CER</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.311</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Positivo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada con CER</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">6</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-0.268</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Negativo</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Correlación moderada con CER</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">src/results/correlations/paddle_correlations.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Fig14"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->14<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Ranking de importancia de hiperparámetros</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Ranking de importancia de hiperparámetros" height="404" src="figures/figura_14.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Fig14"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->14<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Ranking de importancia de hiperparámetros</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Ranking de importancia de hiperparámetros" height="404" src="figures/figura_14.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">src/results/correlations/paddle_correlations.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><i>Leyenda: Impacto relativo estimado basado en análisis de correlación y presencia en configuraciones óptimas. <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> es el parámetro más crítico.</i></span></p>
-<h4><span lang="ES">Análisis del Parámetro textline_orientation</span></h4>
+<p class="MsoNormal"><span lang="ES">Leyenda: Impacto relativo basado en |Pearson| (CER), normalizado respecto al valor máximo.</span></p>
+<p class="MsoNormal"><span lang="ES">En términos de correlación lineal, <span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span> es el parámetro con mayor relación absoluta con el CER y su signo positivo indica que activarlo incrementa el error en este dataset. En cambio, <span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span> y <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> presentan correlación negativa, lo que sugiere mejoras cuando están activados.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Análisis del Parámetro textline_orientation</span></h4>
 <p class="MsoNormal"><span lang="ES"><b>Por qué es tan importante:</b></span></p>
-<p class="MsoNormal"><span lang="ES">El clasificador de orientación de línea resuelve un problema fundamental en documentos con layouts complejos: determinar el orden correcto de lectura. Sin este clasificador:</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Las líneas de una tabla pueden mezclarse con texto adyacente</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Los encabezados laterales pueden insertarse en posiciones incorrectas</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>El texto en columnas puede leerse en orden incorrecto</span></p>
-<p class="MsoNormal"><span lang="ES">Para documentos académicos que típicamente incluyen tablas, listas y encabezados multinivel, este clasificador es esencial.</span></p>
+<p class="MsoNormal"><span lang="ES">El clasificador de orientación de línea resuelve un problema fundamental en documentos con secciones y cambios de formato: determinar el orden correcto de lectura. Sin este clasificador:</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span>Las líneas del índice pueden mezclarse con el cuerpo del texto</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">2.<span style="font-size:7pt">   </span>Los encabezados pueden insertarse en posiciones incorrectas</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">3.<span style="font-size:7pt">   </span>Las listas numeradas pueden leerse en orden incorrecto</span></p>
+<p class="MsoNormal"><span lang="ES">Para documentos académicos que típicamente incluyen índice, listas y encabezados multinivel, este clasificador es esencial.</span></p>
 <p class="MsoNormal"><span lang="ES"><b>Recomendación</b>: Siempre activar <span style="font-family:Consolas;font-size:10pt">textline_orientation=True</span> para documentos estructurados.</span></p>
-<h4><span lang="ES">Análisis del Parámetro text_det_thresh</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Análisis del Parámetro text_det_thresh</span></h4>
 <p class="MsoNormal"><span lang="ES"><b>Comportamiento observado:</b></span></p>
-<a name="_Ref_Tab47"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->47<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comportamiento observado</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Rango</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER típico</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Comportamiento</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.0 - 0.1</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1-3%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Detecta más texto, incluyendo bordes</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.1 - 0.3</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2-5%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Rendimiento variable</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.3 - 0.5</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3-7%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Balance precisión/recall</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.5 - 0.7</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4-7%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Más conservador</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
-<p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><b>Interpretación:</b></span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">En ejecución GPU con modelos Mobile, valores bajos de <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> funcionan bien</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">El valor óptimo (0.0462) indica que una detección más sensible beneficia el rendimiento</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">A diferencia de CPU, no se observaron fallos catastróficos con valores bajos</span></p>
-<p class="MsoNormal"><span lang="ES"><b>Valor óptimo encontrado</b>: 0.0462</span></p>
-<h4><span lang="ES">Análisis de Parámetros de Preprocesamiento</span></h4>
+<p class="MsoNormal"><span lang="ES">El análisis de correlación muestra que valores más bajos de <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> favorecen el rendimiento en este dataset. El valor óptimo encontrado en los trials fue 0.0462, lo que sugiere que una detección más sensible beneficia el resultado.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Análisis de Parámetros de Preprocesamiento</span></h4>
 <p class="MsoNormal"><span lang="ES"><b><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span>:</b></span></p>
 <p class="MsoNormal"><span lang="ES">En la configuración óptima GPU, este parámetro está <b>activado</b> (True), a diferencia de lo observado en experimentos anteriores. Esto sugiere que la clasificación de orientación del documento puede beneficiar incluso documentos digitales cuando se combina con <span style="font-family:Consolas;font-size:10pt">textline_orientation=True</span>.</span></p>
 <p class="MsoNormal"><span lang="ES"><b><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span>:</b></span></p>
@@ -5540,105 +5517,105 @@ Configuración óptima:
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Documentos curvados o deformados</span></p>
 <p class="MsoNormal"><span lang="ES">Para documentos PDF digitales como los evaluados, este módulo es innecesario y puede introducir artefactos.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Análisis de Casos de Fallo</span></h3>
-<h4><span lang="ES">Clasificación de Errores</span></h4>
-<a name="_Ref_Tab48"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->48<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Tipología de errores observados.</span></i></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Clasificación de Errores</span></h4>
+<a name="_Ref_Tab46"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->46<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Tipología de errores observados.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo de error</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Frecuencia</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Ejemplo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Causa probable</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Pérdida de acentos</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alta</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">más → mas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelo de reconocimiento</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Duplicación de caracteres</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">titulación → titulacióon</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Solapamiento de detecciones</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Confusión de puntuación</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Media</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">¿ → ?</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Caracteres similares</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Pérdida de eñe</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Baja</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">año → ano</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelo de reconocimiento</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Texto desordenado</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Variable</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mezcla de líneas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Fallo de orientación</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Análisis cualitativo.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Patrones de Fallo por Tipo de Contenido</span></h4>
-<a name="_Ref_Tab49"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->49<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Tasa de error por tipo de contenido.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo de contenido</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER estimado</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Factor de riesgo</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Párrafos de texto</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~1%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Bajo</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Listas numeradas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~2%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tablas simples</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~3%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Encabezados + pie de página</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~2%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tablas complejas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~5%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alto</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Texto en columnas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~4%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alto</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Patrones de Fallo por Tipo de Contenido</span></h4>
+<a name="_Ref_Tab47"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->47<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Tasa de error por tipo de contenido (cualitativa).</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tipo de contenido</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Nivel de error</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Factor de riesgo</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Párrafos de texto</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Bajo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Bajo</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Listas numeradas</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Índice y encabezados</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Encabezados + pie de página</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Texto con cambios tipográficos</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Medio</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Listas con numeración densa</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alto</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Alto</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Estimación cualitativa.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Comparación con Objetivos Específicos</span></h3>
-<a name="_Ref_Tab50"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->50<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Cumplimiento de objetivos específicos.</span></i></p>
+<a name="_Ref_Tab48"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->48<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Cumplimiento de objetivos específicos.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Objetivo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Descripción</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Resultado</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Estado</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">OE1</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Comparar soluciones OCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR, PaddleOCR, DocTR evaluados; PaddleOCR seleccionado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✓ Cumplido</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">OE2</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Preparar dataset de evaluación</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">45 páginas con ground truth</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✓ Cumplido</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">OE3</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Identificar hiperparámetros críticos</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span>, <span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span>, <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> identificados</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✓ Cumplido</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">OE4</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optimizar con Ray Tune (≥50 trials)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">64 trials ejecutados con GPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✓ Cumplido</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">OE5</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Validar configuración optimizada</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CER: 8.85% → 7.72% (dataset), 0.79% (mejor trial)</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✓ Parcial</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">src/results/correlations/paddle_correlations.csv</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoQuote"><i><span lang="ES"><b>Nota sobre OE5:</b> El objetivo de CER &lt; 2% se cumple en el mejor trial individual (0.79%). La validación sobre el dataset completo (7.72%) muestra que la generalización requiere mayor trabajo, identificándose como línea de trabajo futuro.</span></i></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Limitaciones del Estudio</span></h3>
-<h4><span lang="ES">Limitaciones de Generalización</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Limitaciones de Generalización</span></h4>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Tipo de documento único</b>: Solo se evaluaron documentos académicos de UNIR. La configuración óptima puede no ser transferible a otros tipos de documentos (facturas, formularios, contratos).</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Idioma único</b>: El estudio se centró en español. Otros idiomas con diferentes características ortográficas podrían requerir configuraciones diferentes.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Formato único</b>: Solo se evaluaron PDFs digitales. Documentos escaneados o fotografías de documentos podrían beneficiarse de diferentes configuraciones.</span></p>
-<h4><span lang="ES">Limitaciones Metodológicas</span></h4>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Ground truth automático</b>: El texto de referencia se extrajo programáticamente del PDF, lo cual puede introducir errores en layouts complejos donde el orden de lectura no es evidente.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Limitaciones Metodológicas</span></h4>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Ground truth automático</b>: El texto de referencia se extrajo programáticamente del PDF, lo cual puede introducir errores en el orden de lectura cuando hay secciones con encabezados y saltos de línea.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Tamaño del dataset</b>: 45 páginas es un dataset limitado. Un dataset más amplio proporcionaría estimaciones más robustas.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Parámetro fijo</b>: <span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span> se mantuvo en 0.0 durante todo el experimento. Explorar este parámetro podría revelar mejoras adicionales.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Subconjunto de ajuste limitado</b>: El ajuste de hiperparámetros se realizó sobre 5 páginas (páginas 5-10), lo que contribuyó al sobreajuste observado en la validación del dataset completo.</span></p>
-<h4><span lang="ES">Limitaciones de Validación</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Limitaciones de Validación</span></h4>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Sin validación cruzada</b>: No se realizó validación cruzada sobre diferentes subconjuntos del dataset.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Sin test set independiente</b>: El dataset de validación final se solapaba parcialmente con el de optimización.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Implicaciones Prácticas</span></h3>
-<h4><span lang="ES">Guía de Configuración Recomendada</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Guía de Configuración Recomendada</span></h4>
 <p class="MsoNormal"><span lang="ES">Para documentos académicos en español similares a los evaluados:</span></p>
-<a name="_Ref_Tab51"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->51<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Configuración recomendada para PaddleOCR con GPU.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Prioridad</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Justificación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Obligatorio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Crítico para layouts complejos</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Recomendado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mejora orientación de documento</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.05 (rango: 0.04-0.10)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Recomendado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Detección sensible beneficia resultados</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.49 (rango: 0.4-0.6)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Recomendado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Balance de confianza</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.57 (rango: 0.5-0.7)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Opcional</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Filtra reconocimientos poco confiables</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">No recomendado</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Innecesario para PDFs digitales</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Tab49"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->49<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Configuración recomendada para PaddleOCR con GPU.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Parámetro</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Valor</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Prioridad</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Justificación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Obligatorio</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Crítico para documentos con secciones</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">True</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Recomendado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mejora orientación de documento</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.05 (rango: 0.04-0.10)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Recomendado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Detección sensible beneficia resultados</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_box_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.49 (rango: 0.4-0.6)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Recomendado</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Balance de confianza</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_rec_score_thresh</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.57 (rango: 0.5-0.7)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Opcional</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Filtra reconocimientos poco confiables</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">False</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">No recomendado</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Innecesario para PDFs digitales</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h4><span lang="ES">Cuándo Aplicar Esta Metodología</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Cuándo Aplicar Esta Metodología</span></h4>
 <p class="MsoNormal"><span lang="ES">La optimización de hiperparámetros es recomendable cuando:</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>GPU disponible</b>: Acelera significativamente la exploración del espacio de hiperparámetros (82× más rápido que CPU).</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>GPU disponible</b>: Acelera significativamente la exploración del espacio de hiperparámetros (82x más rápido que CPU).</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Modelo preentrenado adecuado</b>: El modelo ya soporta el idioma objetivo (como PaddleOCR para español).</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Dominio específico</b>: Se busca optimizar para un tipo de documento particular.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Mejora incremental</b>: El rendimiento baseline es aceptable pero mejorable.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Sin datos de entrenamiento</b>: No se dispone de datasets etiquetados para fine-tuning.</span></p>
-<h4><span lang="ES">Cuándo NO Aplicar Esta Metodología</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Cuándo NO Aplicar Esta Metodología</span></h4>
 <p class="MsoNormal"><span lang="ES">La optimización de hiperparámetros puede ser insuficiente cuando:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Idioma no soportado</b>: El modelo no incluye el idioma en su vocabulario.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Escritura manuscrita</b>: Requiere fine-tuning o modelos especializados.</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Documentos muy degradados</b>: Escaneos de baja calidad o documentos históricos.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Requisitos de CER &lt; 0.5%</b>: Puede requerir fine-tuning para alcanzar precisiones muy altas.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Requisitos de CER muy bajo</b>: Puede requerir fine-tuning para alcanzar precisiones muy altas.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Síntesis del Capítulo</span></h3>
 <p class="MsoNormal"><span lang="ES">A lo largo de este capítulo se ha desarrollado el proceso completo de evaluación y optimización de sistemas OCR para documentos académicos en español. El benchmark comparativo inicial permitió seleccionar PaddleOCR como motor base gracias a su combinación de rendimiento y configurabilidad. La posterior optimización con Ray Tune y Optuna, ejecutada sobre 64 trials con aceleración GPU, identificó los parámetros críticos para maximizar el rendimiento: <span style="font-family:Consolas;font-size:10pt">textline_orientation</span>, <span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span> y <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span>.</span></p>
 <p class="MsoNormal"><span lang="ES">Los resultados cuantifican tanto los logros como las limitaciones del enfoque. El mejor trial individual alcanzó un CER de 0.79%, cumpliendo holgadamente el objetivo de CER &lt; 2%. Sin embargo, la validación sobre el dataset completo de 45 páginas reveló un CER de 7.72%, lo que representa una mejora del 12.8% respecto al baseline (8.85%) pero evidencia sobreajuste al subconjunto de optimización. Esta observación es valiosa: indica que futuros trabajos deberían emplear subconjuntos de optimización más representativos o aplicar técnicas de regularización.</span></p>
-<p class="MsoNormal"><span lang="ES">Desde el punto de vista práctico, la infraestructura dockerizada desarrollada y la aceleración GPU (82× más rápida que CPU) demuestran la viabilidad de esta metodología tanto para experimentación como para despliegue en producción.</span></p>
-<p class="MsoNormal"><span lang="ES"><b>Fuentes de datos:</b></span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/run_tuning.py"><span style="font-family:Consolas;font-size:10pt">src/run_tuning.py</span></a>: Script principal de optimización</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>: Resultados CSV de PaddleOCR</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_easyocr_results_20260119_120204.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_easyocr_results_20260119_120204.csv</span></a>: Resultados CSV de EasyOCR</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_doctr_results_20260119_121445.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_doctr_results_20260119_121445.csv</span></a>: Resultados CSV de DocTR</span></p>
-<p class="MsoNormal"><span lang="ES"><b>Imágenes Docker:</b></span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/paddle-ocr-gpu</span></a>: PaddleOCR con soporte GPU</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/easyocr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/easyocr-gpu</span></a>: EasyOCR con soporte GPU</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/doctr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/doctr-gpu</span></a>: DocTR con soporte GPU</span></p>
+<p class="MsoNormal"><span lang="ES">Desde el punto de vista práctico, la infraestructura dockerizada desarrollada y la aceleración GPU (82x más rápida que CPU) demuestran la viabilidad de esta metodología tanto para experimentación como para despliegue en producción.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/run_tuning.py"><span style="font-family:Consolas;font-size:10pt">src/run_tuning.py</span></a> - Script principal de optimización</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/raytune/requirements.txt</span></a> - Dependencias del orquestador Ray Tune</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr/requirements.txt</span></a> - Dependencias del servicio PaddleOCR</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/easyocr_service/requirements.txt</span></a> - Dependencias del servicio EasyOCR</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/doctr_service/requirements.txt</span></a> - Dependencias del servicio DocTR</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a> - Resultados CSV de PaddleOCR</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/correlations/paddle_correlations.csv"><span style="font-family:Consolas;font-size:10pt">src/results/correlations/paddle_correlations.csv</span></a> - Correlaciones de hiperparámetros (PaddleOCR)</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_easyocr_results_20260119_120204.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_easyocr_results_20260119_120204.csv</span></a> - Resultados CSV de EasyOCR</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_doctr_results_20260119_121445.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_doctr_results_20260119_121445.csv</span></a> - Resultados CSV de DocTR</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv"><span style="font-family:Consolas;font-size:10pt">src/raytune_paddle_subproc_results_20251207_192320.csv</span></a> - Referencia de tiempos en CPU para PaddleOCR</span></p>
+<p class="MsoNormal"><span lang="ES">Imágenes Docker:</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/paddle-ocr-gpu</span></a> - PaddleOCR con soporte GPU</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/easyocr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/easyocr-gpu</span></a> - EasyOCR con soporte GPU</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><a href="https://seryus.ddns.net/unir/-/packages/container/doctr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/doctr-gpu</span></a> - DocTR con soporte GPU</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Comparativa de Rendimiento CPU vs GPU</span></h3>
 <p class="MsoNormal"><span lang="ES">Esta sección presenta la comparación de rendimiento entre ejecución en CPU y GPU, justificando la elección de GPU para el experimento principal y demostrando el impacto práctico de la aceleración por hardware.</span></p>
-<h4><span lang="ES">Configuración del Entorno GPU</span></h4>
-<a name="_Ref_Tab52"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->52<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Especificaciones del entorno GPU utilizado.</span></i></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Configuración del Entorno GPU</span></h4>
+<a name="_Ref_Tab50"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->50<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Especificaciones del entorno GPU utilizado.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Componente</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Especificación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NVIDIA GeForce RTX 3060 Laptop</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">VRAM</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5.66 GB</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CUDA</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">12.4</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sistema Operativo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ubuntu 24.04.3 LTS</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Kernel</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">6.14.0-37-generic</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
+<p class="MsoNormal"><span lang="ES">Nota: Los requisitos de entorno documentados por dependencias se detallan en <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/07_anexo_a.md"><span style="font-family:Consolas;font-size:10pt">docs/07_anexo_a.md</span></a>, sección A.9.</span></p>
 <p class="MsoNormal"><span lang="ES">Este hardware representa configuración típica de desarrollo, permitiendo evaluar el rendimiento en condiciones realistas de despliegue.</span></p>
-<h4><span lang="ES">Comparación CPU vs GPU</span></h4>
-<p class="MsoNormal"><span lang="ES">Se comparó el tiempo de procesamiento entre CPU y GPU utilizando los datos de <a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/raytune_paddle_subproc_results_20251207_192320.csv"><span style="font-family:Consolas;font-size:10pt">src/raytune_paddle_subproc_results_20251207_192320.csv</span></a> (CPU) y <a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a> (GPU).</span></p>
-<a name="_Ref_Tab53"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->53<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Rendimiento comparativo CPU vs GPU.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Métrica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CPU</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">GPU (RTX 3060)</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Factor de Aceleración</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo/Página (promedio)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">69.4s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.84s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>82x</b></span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Dataset completo (45 páginas)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~52 min</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~38 seg</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>82x</b></span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">64 trials × 5 páginas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~6.4 horas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~1.5 horas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>4.3x</b></span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Comparación CPU vs GPU</span></h4>
+<p class="MsoNormal"><span lang="ES">Se comparó el tiempo de procesamiento entre CPU y GPU utilizando los datos de <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv"><span style="font-family:Consolas;font-size:10pt">src/raytune_paddle_subproc_results_20251207_192320.csv</span></a>(CPU) y <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>(GPU).</span></p>
+<a name="_Ref_Tab51"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->51<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Rendimiento comparativo CPU vs GPU.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Métrica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CPU</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">GPU (RTX 3060)</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Factor de Aceleración</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo/Página (promedio)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">69.4s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.84s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>82x</b></span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Dataset completo (45 páginas)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~52 min</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~38 seg</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>82x</b></span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">64 trials x 5 páginas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">6.2 horas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~5.0 min</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>75x</b></span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv"><span style="font-family:Consolas;font-size:10pt">src/raytune_paddle_subproc_results_20251207_192320.csv</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Fig15"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->15<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Tiempo de procesamiento: CPU vs GPU (segundos/página)</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Tiempo de procesamiento: CPU vs GPU (segundos/página)" height="404" src="figures/figura_15.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
-<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_Fig15"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->15<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Tiempo de procesamiento: CPU vs GPU (segundos/página)</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Tiempo de procesamiento: CPU vs GPU (segundos/página)" height="404" src="figures/figura_15.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv"><span style="font-family:Consolas;font-size:10pt">src/raytune_paddle_subproc_results_20251207_192320.csv</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoNormal"><span lang="ES"><i>Leyenda: Aceleración de <b>82×</b> con GPU. El procesamiento de una página pasa de 69.4s (CPU) a 0.84s (GPU).</i></span></p>
-<p class="MsoNormal"><span lang="ES">La aceleración de 82× obtenida con GPU transforma la viabilidad del enfoque:</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Optimización en CPU (6.4 horas)</b>: Viable pero lento para iteraciones rápidas</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Optimización en GPU (1.5 horas)</b>: Permite explorar más configuraciones y realizar múltiples experimentos</span></p>
+<p class="MsoNormal"><span lang="ES">Leyenda: Aceleración de <b>82x</b> con GPU. El procesamiento de una página pasa de 69.4s (CPU) a 0.84s (GPU).</span></p>
+<p class="MsoNormal"><span lang="ES">La aceleración de 82x obtenida con GPU transforma la viabilidad del enfoque:</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Optimización en CPU (6.2 horas)</b>: Viable pero lento para iteraciones rápidas</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Optimización en GPU (~5.0 minutos)</b>: Permite explorar más configuraciones y realizar múltiples experimentos</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Producción con GPU (0.84s/página)</b>: Habilita procesamiento en tiempo real</span></p>
-<h4><span lang="ES">Comparación de Modelos PaddleOCR</span></h4>
+<h4 style="mso-list:none"><span lang="ES" style="text-transform:none">Comparación de Modelos PaddleOCR</span></h4>
 <p class="MsoNormal"><span lang="ES">PaddleOCR ofrece dos variantes de modelos: Mobile (optimizados para dispositivos con recursos limitados) y Server (mayor precisión a costa de mayor consumo de memoria). Se evaluó la viabilidad de ambas variantes en el hardware disponible.</span></p>
-<a name="_Ref_Tab54"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->54<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparación de modelos Mobile vs Server en RTX 3060.</span></i></p>
+<a name="_Ref_Tab52"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->52<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparación de modelos Mobile vs Server en RTX 3060.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Modelo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">VRAM Requerida</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Resultado</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Recomendación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PP-OCRv5 Mobile</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.06 GB</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Funciona correctamente</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✓ Recomendado</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PP-OCRv5 Server</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5.3 GB</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">OOM en página 2</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✗ Requiere &gt;8 GB VRAM</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES">Los modelos Server, a pesar de ofrecer potencialmente mayor precisión, resultan inviables en hardware con VRAM limitada (≤6 GB) debido a errores de memoria (Out of Memory). Los modelos Mobile, con un consumo de memoria 88 veces menor, funcionan de manera estable y ofrecen rendimiento suficiente para el caso de uso evaluado.</span></p>
-<h4><span lang="ES">Conclusiones de la Validación GPU</span></h4>
-<p class="MsoNormal"><span lang="ES">La validación con aceleración GPU permite extraer las siguientes conclusiones:</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Aceleración significativa</b>: La GPU proporciona una aceleración de 82× sobre CPU, haciendo viable el procesamiento en tiempo real para aplicaciones interactivas.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Modelos Mobile recomendados</b>: Para hardware con VRAM limitada (≤6 GB), los modelos Mobile de PP-OCRv5 ofrecen el mejor balance entre precisión y recursos, funcionando de manera estable sin errores de memoria.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Viabilidad práctica</b>: Con GPU, el procesamiento de un documento completo (45 páginas) toma menos de 30 segundos, validando la aplicabilidad en entornos de producción donde el tiempo de respuesta es crítico.</span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES">1.<span style="font-size:7pt">   </span><b>Escalabilidad</b>: La arquitectura de microservicios dockerizados utilizada para la validación GPU facilita el despliegue horizontal, permitiendo escalar el procesamiento según demanda.</span></p>
-<p class="MsoNormal"><span lang="ES">Esta validación demuestra que la configuración optimizada mediante Ray Tune mejora la precisión (CER: 8.85% → 7.72% en dataset completo, 0.79% en mejor trial individual) y, combinada con aceleración GPU, resulta prácticamente aplicable en escenarios de producción real.</span></p><h1 style="mso-list:l22 level1 lfo18"><a name="_Toc160619818"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
+<p class="MsoNormal"><span lang="ES">La validación con aceleración GPU demuestra que la configuración optimizada mediante Ray Tune mejora la precisión (CER: 8.85% → 7.72% en dataset completo, 0.79% en mejor trial individual) y, combinada con la aceleración de 82x proporcionada por GPU, resulta prácticamente aplicable en escenarios de producción real. Las conclusiones derivadas de esta validación se presentan en el Capítulo 5.</span></p><h1 style="mso-list:l22 level1 lfo18"><a name="_Toc160619818"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
 major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span style="mso-list:Ignore">5.<span style='font:7.0pt "Times New Roman"'>  
 </span></span></span><?endif?><span lang="ES" style="text-transform:none">Conclusiones
 y trabajo futuro</span></a></h1><p class="MsoNormal"><span lang="ES">A lo largo de este trabajo se ha explorado la optimización de hiperparámetros como estrategia para mejorar el rendimiento de sistemas OCR sin necesidad de reentrenamiento. Las siguientes secciones evalúan el grado de cumplimiento de los objetivos planteados, sintetizan los hallazgos más relevantes y proponen direcciones para investigación futura.</span></p>
@@ -5646,36 +5623,37 @@ y trabajo futuro</span></a></h1><p class="MsoNormal"><span lang="ES">A lo largo
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Conclusiones Generales</span></h3>
 <p class="MsoNormal"><span lang="ES">Los resultados obtenidos confirman que la optimización sistemática de hiperparámetros constituye una alternativa viable al fine-tuning para mejorar sistemas OCR preentrenados. La infraestructura dockerizada con aceleración GPU desarrollada en este trabajo no solo facilita la experimentación reproducible, sino que reduce drásticamente los tiempos de ejecución, haciendo viable la exploración exhaustiva de espacios de configuración.</span></p>
 <p class="MsoNormal"><span lang="ES">El objetivo principal del trabajo era alcanzar un CER inferior al 2% en documentos académicos en español. Los resultados obtenidos se resumen a continuación:</span></p>
-<a name="_Ref_Tab55"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->55<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Cumplimiento del objetivo de CER.</span></i></p>
+<a name="_Ref_Tab53"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->53<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Cumplimiento del objetivo de CER.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Métrica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Objetivo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Mejor Trial</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Dataset Completo</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Cumplimiento</span></b></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CER</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&lt; 2%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>0.79%</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>7.72%</b></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">✓ Parcial</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoQuote"><i><span lang="ES"><b>Nota:</b> El objetivo de CER &lt; 2% se cumple en el mejor trial individual (0.79%, 5 páginas). La validación sobre el conjunto de datos completo (45 páginas) muestra un CER de 7.72%, evidenciando sobreajuste al subconjunto de optimización. Esta diferencia se analiza en detalle en el Capítulo 4.</span></i></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Cumplimiento de los Objetivos Específicos</span></h3>
-<p class="MsoNormal"><span lang="ES">La evaluación comparativa de soluciones OCR (OE1) reveló diferencias significativas entre las tres alternativas analizadas. De las tres soluciones de código abierto evaluadas —EasyOCR, PaddleOCR (PP-OCRv5) y DocTR—, PaddleOCR demostró el mejor rendimiento base para documentos en español. Además, su arquitectura modular y la amplia configurabilidad de su pipeline lo convierten en el candidato idóneo para optimización mediante ajuste de hiperparámetros.</span></p>
-<p class="MsoNormal"><span lang="ES">En cuanto a la preparación del conjunto de datos (OE2), se construyó un corpus estructurado con 45 páginas de documentos académicos de UNIR. La implementación de la clase <span style="font-family:Consolas;font-size:10pt">ImageTextDataset</span> permite cargar de forma eficiente pares imagen-texto, mientras que el texto de referencia se extrajo automáticamente del PDF original mediante PyMuPDF, garantizando así la consistencia entre las imágenes y sus transcripciones esperadas.</span></p>
-<p class="MsoNormal"><span lang="ES">El análisis de hiperparámetros (OE3) arrojó resultados particularmente reveladores. El parámetro <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> emergió como el factor más influyente, resultando crítico para obtener buenos resultados en documentos con diseños complejos. Asimismo, <span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span> demostró un impacto positivo en la configuración con GPU. Por otra parte, el umbral <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> presenta una correlación negativa moderada (-0.52) con el CER, lo que indica que valores más bajos tienden a mejorar el rendimiento, aunque con un límite inferior por debajo del cual el sistema falla catastróficamente. Cabe destacar que <span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span> no aporta mejora alguna en documentos digitales, ya que estos no presentan las deformaciones físicas para las que fue diseñado este módulo.</span></p>
-<p class="MsoNormal"><span lang="ES">La experimentación con Ray Tune (OE4) se completó satisfactoriamente mediante 64 trials ejecutados con el algoritmo OptunaSearch y aceleración GPU. El tiempo total del experimento —aproximadamente 1.5 horas con una GPU RTX 3060— demuestra la viabilidad práctica de esta aproximación. La arquitectura basada en contenedores Docker resultó esencial para superar las incompatibilidades entre Ray y los motores OCR, al tiempo que garantiza la portabilidad y reproducibilidad de los experimentos.</span></p>
+<p class="MsoNormal"><span lang="ES">La evaluación comparativa de soluciones OCR (OE1) reveló diferencias significativas entre las tres alternativas analizadas. De las tres soluciones de código abierto evaluadas, EasyOCR, PaddleOCR (PP-OCRv5) y DocTR, PaddleOCR demostró el mejor rendimiento base para documentos en español. Además, su arquitectura modular y la amplia configurabilidad de su pipeline lo convierten en el candidato idóneo para optimización mediante ajuste de hiperparámetros.</span></p>
+<p class="MsoNormal"><span lang="ES">En cuanto a la preparación del conjunto de datos (OE2), se construyó un corpus estructurado con 45 páginas de documentos académicos de UNIR. La implementación de la clase <span style="font-family:Consolas;font-size:10pt">ImageTextDataset</span> permite cargar de forma eficiente pares imagen-texto. El texto de referencia se extrajo automáticamente del PDF original mediante PyMuPDF, garantizando así la consistencia entre las imágenes y sus transcripciones esperadas.</span></p>
+<p class="MsoNormal"><span lang="ES">El análisis de hiperparámetros (OE3) arrojó resultados particularmente reveladores. El parámetro <span style="font-family:Consolas;font-size:10pt">textline_orientation</span> emergió como el factor más influyente, resultando crítico para obtener buenos resultados en documentos con diseños complejos. Asimismo, <span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify</span> demostró un impacto positivo en la configuración con GPU. Por otra parte, el umbral <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> presenta una correlación positiva moderada (0.43) con el CER, lo que indica que valores más bajos tienden a mejorar el rendimiento. Cabe destacar que <span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span> no aporta mejora alguna en documentos digitales, ya que estos no presentan las deformaciones físicas para las que fue diseñado este módulo.</span></p>
+<p class="MsoNormal"><span lang="ES">La experimentación con Ray Tune (OE4) se completó satisfactoriamente mediante 64 trials ejecutados con el algoritmo OptunaSearch y aceleración GPU. El tiempo total del experimento, en torno a 5 minutos con una GPU RTX 3060, demuestra la viabilidad práctica de esta aproximación. La arquitectura basada en contenedores Docker resultó esencial para superar las incompatibilidades entre Ray y los motores OCR, al tiempo que garantiza la portabilidad y reproducibilidad de los experimentos.</span></p>
 <p class="MsoNormal"><span lang="ES">Finalmente, la validación de la configuración óptima (OE5) se realizó sobre el conjunto de datos completo de 45 páginas. El mejor trial individual alcanzó un CER de 0.79%, equivalente a una precisión del 99.21%. Sin embargo, la evaluación sobre el conjunto de datos completo arrojó un CER de 7.72%, lo que representa una mejora del 12.8% respecto al baseline (8.85%), pero queda lejos del resultado del mejor trial. Esta diferencia revela un sobreajuste al subconjunto de optimización de 5 páginas, un fenómeno que se analiza en detalle en la sección de limitaciones.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Hallazgos Clave</span></h3>
-<p class="MsoNormal"><span lang="ES">El hallazgo más significativo de este trabajo es que las decisiones arquitectónicas tienen mayor impacto que los umbrales numéricos. Un único parámetro booleano —<span style="font-family:Consolas;font-size:10pt">textline_orientation</span>— influye más en el rendimiento final que todos los umbrales continuos combinados. Este resultado sugiere que, al optimizar sistemas OCR, conviene priorizar la exploración de configuraciones estructurales antes de ajustar finamente los valores numéricos.</span></p>
-<p class="MsoNormal"><span lang="ES">No obstante, los umbrales presentan límites operativos que deben respetarse. Valores de <span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> inferiores a 0.1 provocan fallos catastróficos, con tasas de error que superan el 40%. Este comportamiento indica la existencia de regiones del espacio de hiperparámetros que deben evitarse, lo cual tiene implicaciones para el diseño de espacios de búsqueda en futuros experimentos.</span></p>
-<p class="MsoNormal"><span lang="ES">Otro hallazgo relevante es la innecesariedad de ciertos módulos para documentos digitales. Los PDF generados directamente desde procesadores de texto no presentan las deformaciones físicas —arrugas, curvaturas, rotaciones— para las que fueron diseñados los módulos de corrección. En estos casos, desactivar <span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span> no solo simplifica el pipeline, sino que puede mejorar el rendimiento al evitar procesamientos innecesarios.</span></p>
+<p class="MsoNormal"><span lang="ES">El hallazgo más significativo de este trabajo es que las decisiones arquitectónicas tienen mayor impacto que los umbrales numéricos. Un único parámetro booleano, <span style="font-family:Consolas;font-size:10pt">textline_orientation</span>, influye más en el rendimiento final que todos los umbrales continuos combinados. Este resultado sugiere que, al optimizar sistemas OCR, conviene priorizar la exploración de configuraciones estructurales antes de ajustar finamente los valores numéricos.</span></p>
+<p class="MsoNormal"><span lang="ES">No obstante, los umbrales presentan límites operativos que deben respetarse. En este estudio no se observaron fallos catastróficos (CER &gt; 10%), pero los peores trials alcanzaron CER de hasta 7.30%, lo que indica que ciertas combinaciones de umbrales degradan el rendimiento. Este comportamiento sugiere la necesidad de acotar el espacio de búsqueda en futuros experimentos.</span></p>
+<p class="MsoNormal"><span lang="ES">Otro hallazgo relevante es la innecesariedad de ciertos módulos para documentos digitales. Los PDF generados directamente desde procesadores de texto no presentan deformaciones físicas, como arrugas, curvaturas o rotaciones, para las que fueron diseñados los módulos de corrección. En estos casos, desactivar <span style="font-family:Consolas;font-size:10pt">use_doc_unwarping</span> no solo simplifica el pipeline, sino que puede mejorar el rendimiento al evitar procesamientos innecesarios.</span></p>
 <p class="MsoNormal"><span lang="ES">Finalmente, los resultados demuestran que es posible mejorar modelos preentrenados mediante ajuste exclusivo de hiperparámetros de inferencia, sin necesidad de reentrenamiento. Sin embargo, esta aproximación requiere validación cuidadosa, ya que las configuraciones optimizadas sobre subconjuntos pequeños pueden no generalizar a conjuntos de datos más amplios o diversos.</span></p>
+<p class="MsoNormal"><span lang="ES">Respecto a la validación con aceleración GPU, la GPU proporciona una aceleración de 82x sobre CPU, haciendo viable el procesamiento en tiempo real para aplicaciones interactivas. Con GPU, el procesamiento de un documento completo (45 páginas) toma aproximadamente 38 segundos, validando la aplicabilidad en entornos de producción donde el tiempo de respuesta es crítico. Para hardware con VRAM limitada (≤6 GB), los modelos Mobile de PP-OCRv5 ofrecen el mejor balance entre precisión y recursos, funcionando de manera estable sin errores de memoria, mientras que los modelos Server resultan inviables debido a errores Out of Memory. Además, la arquitectura de microservicios dockerizados utilizada facilita el despliegue horizontal, permitiendo escalar el procesamiento según demanda.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Contribuciones del Trabajo</span></h3>
-<p class="MsoNormal"><span lang="ES">La principal contribución de este trabajo es una metodología reproducible para la optimización de hiperparámetros OCR. El proceso completo —desde la preparación del conjunto de datos hasta la validación de la configuración óptima— queda documentado y es replicable mediante las herramientas Ray Tune y Optuna.</span></p>
+<p class="MsoNormal"><span lang="ES">La principal contribución de este trabajo es una metodología reproducible para la optimización de hiperparámetros OCR. El proceso completo, desde la preparación del conjunto de datos hasta la validación de la configuración óptima, queda documentado y es replicable mediante las herramientas Ray Tune y Optuna.</span></p>
 <p class="MsoNormal"><span lang="ES">En segundo lugar, el análisis sistemático de los hiperparámetros de PaddleOCR constituye una contribución al conocimiento disponible sobre este motor OCR. Mediante el cálculo de correlaciones y análisis comparativo, se cuantifica el impacto de cada parámetro configurable, información que puede orientar futuros trabajos de optimización.</span></p>
 <p class="MsoNormal"><span lang="ES">Como resultado práctico, se aporta una configuración validada específicamente para documentos académicos en español. Aunque la generalización a otros tipos de documentos requiere validación adicional, esta configuración representa un punto de partida sólido para aplicaciones en el ámbito hispanohablante.</span></p>
 <p class="MsoNormal"><span lang="ES">Por último, todo el código fuente, las imágenes Docker y los datos experimentales están disponibles públicamente en el repositorio del proyecto, facilitando así la reproducción, verificación y extensión de este trabajo por parte de otros investigadores.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Limitaciones del Trabajo</span></h3>
-<p class="MsoNormal"><span lang="ES">Es necesario reconocer varias limitaciones que condicionan el alcance de las conclusiones presentadas. En primer lugar, todos los experimentos se realizaron sobre un único tipo de documento: textos académicos de UNIR. La generalización a otros formatos —facturas, formularios, documentos manuscritos— requeriría validación adicional con conjuntos de datos específicos.</span></p>
+<p class="MsoNormal"><span lang="ES">Es necesario reconocer varias limitaciones que condicionan el alcance de las conclusiones presentadas. En primer lugar, todos los experimentos se realizaron sobre un único tipo de documento, textos académicos de UNIR. La generalización a otros formatos, como facturas, formularios o documentos manuscritos, requeriría validación adicional con conjuntos de datos específicos.</span></p>
 <p class="MsoNormal"><span lang="ES">El tamaño del corpus constituye otra limitación relevante. Con 45 páginas, el conjunto de datos es modesto para extraer conclusiones estadísticamente robustas. Además, el subconjunto de optimización de tan solo 5 páginas resultó insuficiente para evitar el sobreajuste, como evidencia la brecha entre el CER del mejor trial (0.79%) y el resultado sobre el conjunto completo (7.72%).</span></p>
 <p class="MsoNormal"><span lang="ES">Desde el punto de vista metodológico, la extracción automática del texto de referencia mediante PyMuPDF puede introducir errores en documentos con diseños complejos, donde el orden de lectura no es evidente. Asimismo, el parámetro <span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span> permaneció fijo en 0.0 durante todo el experimento, dejando inexplorada una dimensión potencialmente relevante del espacio de hiperparámetros.</span></p>
-<p class="MsoNormal"><span lang="ES">Por último, aunque la GPU RTX 3060 utilizada proporcionó una aceleración de 82× respecto a la ejecución en CPU, se trata de hardware de consumo. Equipamiento empresarial con mayor capacidad de VRAM permitiría ejecutar múltiples servicios OCR simultáneamente y explorar espacios de búsqueda más amplios en menos tiempo.</span></p>
+<p class="MsoNormal"><span lang="ES">Por último, aunque la GPU RTX 3060 utilizada proporcionó una aceleración de 82x respecto a la ejecución en CPU, se trata de hardware de consumo. Equipamiento empresarial con mayor capacidad de VRAM permitiría ejecutar múltiples servicios OCR simultáneamente y explorar espacios de búsqueda más amplios en menos tiempo.</span></p>
 <h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">Líneas de trabajo futuro</span></h2>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Extensiones Inmediatas</span></h3>
 <p class="MsoNormal"><span lang="ES">Las limitaciones identificadas sugieren varias extensiones que podrían abordarse a corto plazo. La más urgente es la validación cruzada de la configuración óptima en otros tipos de documentos en español, como facturas, formularios administrativos o textos manuscritos. Esta validación revelaría el grado de transferibilidad de los hallazgos actuales.</span></p>
-<p class="MsoNormal"><span lang="ES">Para abordar el problema del sobreajuste, futuros experimentos deberían utilizar un subconjunto de optimización más amplio. Un conjunto de 15-20 páginas representativas reduciría la varianza y mejoraría la generalización de las configuraciones encontradas. Complementariamente, sería conveniente construir un corpus más amplio y diverso de documentos en español, incluyendo diferentes tipografías, diseños y calidades de imagen.</span></p>
+<p class="MsoNormal"><span lang="ES">Para abordar el problema del sobreajuste, futuros experimentos deberían utilizar un subconjunto de optimización más amplio. Un conjunto más representativo reduciría la varianza y mejoraría la generalización de las configuraciones encontradas. Complementariamente, sería conveniente construir un corpus más amplio y diverso de documentos en español, incluyendo diferentes tipografías, diseños y calidades de imagen.</span></p>
 <p class="MsoNormal"><span lang="ES">Desde el punto de vista técnico, queda pendiente la exploración del parámetro <span style="font-family:Consolas;font-size:10pt">text_det_unclip_ratio</span>, que permaneció fijo en este trabajo. Incluirlo en el espacio de búsqueda podría revelar interacciones con otros parámetros actualmente desconocidas.</span></p>
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Líneas de Investigación</span></h3>
 <p class="MsoNormal"><span lang="ES">En un horizonte más amplio, surgen varias líneas de investigación prometedoras. Una de las más interesantes es el estudio del transfer learning de hiperparámetros: ¿las configuraciones óptimas para documentos académicos transfieren a otros dominios, o cada tipo de documento requiere optimización específica? La respuesta a esta pregunta tiene implicaciones prácticas significativas.</span></p>
@@ -5688,66 +5666,62 @@ y trabajo futuro</span></a></h1><p class="MsoNormal"><span lang="ES">A lo largo
 <h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Reflexión Final</span></h3>
 <p class="MsoNormal"><span lang="ES">En síntesis, este trabajo ha demostrado que la optimización de hiperparámetros representa una alternativa viable al fine-tuning para mejorar sistemas OCR, especialmente cuando se dispone de modelos preentrenados para el idioma objetivo y recursos limitados de tiempo o datos etiquetados.</span></p>
 <p class="MsoNormal"><span lang="ES">La metodología propuesta cumple los requisitos de reproducibilidad científica: los experimentos pueden replicarse, los resultados son cuantificables y las conclusiones son aplicables a escenarios reales de procesamiento documental. Sin embargo, la experiencia también ha puesto de manifiesto la importancia de diseñar cuidadosamente los experimentos de optimización. Aunque el objetivo de CER inferior al 2% se alcanzó en el mejor trial individual (0.79%), la validación sobre el conjunto de datos completo (7.72%) revela que el tamaño y representatividad del subconjunto de optimización son factores críticos que no deben subestimarse.</span></p>
-<p class="MsoNormal"><span lang="ES">La infraestructura dockerizada desarrollada constituye una aportación práctica que trasciende los resultados numéricos. Al encapsular los motores OCR en contenedores independientes, se resuelven problemas de compatibilidad entre dependencias y se garantiza que cualquier investigador pueda reproducir exactamente las condiciones experimentales. La aceleración de 82× proporcionada por GPU transforma lo que sería un experimento de días en uno de horas, haciendo viable la exploración exhaustiva de espacios de hiperparámetros con hardware de consumo.</span></p>
+<p class="MsoNormal"><span lang="ES">La infraestructura dockerizada desarrollada constituye una aportación práctica que trasciende los resultados numéricos. Al encapsular los motores OCR en contenedores independientes, se resuelven problemas de compatibilidad entre dependencias y se garantiza que cualquier investigador pueda reproducir exactamente las condiciones experimentales. La aceleración de 82x proporcionada por GPU transforma lo que sería un experimento de horas en uno de minutos, haciendo viable la exploración exhaustiva de espacios de hiperparámetros con hardware de consumo.</span></p>
 <p class="MsoNormal"><span lang="ES">El código fuente, las imágenes Docker y los datos experimentales están disponibles públicamente en el <a href="https://seryus.ddns.net/unir/MastersThesis">repositorio del proyecto</a>. Esta apertura busca facilitar no solo la reproducción de los resultados, sino también la extensión de este trabajo hacia nuevos tipos de documentos, idiomas o motores OCR.</span></p><p class="Ttulo1sinnumerar"><a name="_Toc160619821"><span lang="ES">Referencias
-bibliográficas</span></a></p><p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Akiba, T., Sano, S., Yanase, T., Ohta, T., &amp; Koyama, M. (2019). Optuna: A next-generation hyperparameter optimization framework. <i>Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery &amp; Data Mining</i>, 2623-2631. https://doi.org/10.1145/3292500.3330701</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Baek, Y., Lee, B., Han, D., Yun, S., &amp; Lee, H. (2019). Character region awareness for text detection. <i>Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition</i>, 9365-9374. https://doi.org/10.1109/CVPR.2019.00959</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Bergstra, J., &amp; Bengio, Y. (2012). Random search for hyper-parameter optimization. <i>Journal of Machine Learning Research</i>, 13(1), 281-305. https://jmlr.org/papers/v13/bergstra12a.html</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Bergstra, J., Bardenet, R., Bengio, Y., &amp; Kégl, B. (2011). Algorithms for hyper-parameter optimization. <i>Advances in Neural Information Processing Systems</i>, 24, 2546-2554. https://papers.nips.cc/paper/2011/hash/86e8f7ab32cfd12577bc2619bc635690-Abstract.html</span></p>
+bibliográficas</span></a></p><p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Akiba, T., Sano, S., Yanase, T., Ohta, T., &amp; Koyama, M. (2019). Optuna: A next-generation hyperparameter optimization framework. <i>Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery &amp; Data Mining</i>, 2623-2631. <a href="https://doi.org/10.1145/3292500.3330701">https://doi.org/10.1145/3292500.3330701</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Baek, Y., Lee, B., Han, D., Yun, S., &amp; Lee, H. (2019). Character region awareness for text detection. <i>Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition</i>, 9365-9374. <a href="https://doi.org/10.1109/CVPR.2019.00959">https://doi.org/10.1109/CVPR.2019.00959</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Bergstra, J., &amp; Bengio, Y. (2012). Random search for hyper-parameter optimization. <i>Journal of Machine Learning Research</i>, 13(1), 281-305. <a href="https://jmlr.org/papers/v13/bergstra12a.html">https://jmlr.org/papers/v13/bergstra12a.html</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Bergstra, J., Bardenet, R., Bengio, Y., &amp; Kégl, B. (2011). Algorithms for hyper-parameter optimization. <i>Advances in Neural Information Processing Systems</i>, 24, 2546-2554. <a href="https://papers.nips.cc/paper/2011/hash/86e8f7ab32cfd12577bc2619bc635690-Abstract.html">https://papers.nips.cc/paper/2011/hash/86e8f7ab32cfd12577bc2619bc635690-Abstract.html</a></span></p>
 <p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Cohen, J. (1988). <i>Statistical power analysis for the behavioral sciences</i> (2nd ed.). Lawrence Erlbaum Associates.</span></p>
 <p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Doran, G. T. (1981). There's a S.M.A.R.T. way to write management's goals and objectives. <i>Management Review</i>, 70(11), 35-36.</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Du, Y., Li, C., Guo, R., Yin, X., Liu, W., Zhou, J., Bai, Y., Yu, Z., Yang, Y., Dang, Q., &amp; Wang, H. (2020). PP-OCR: A practical ultra lightweight OCR system. <i>arXiv preprint arXiv:2009.09941</i>. https://arxiv.org/abs/2009.09941</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Du, Y., Li, C., Guo, R., Cui, C., Liu, W., Zhou, J., Lu, B., Yang, Y., Liu, Q., Hu, X., Yu, D., &amp; Wang, H. (2023). PP-OCRv4: Mobile scene text detection and recognition. <i>arXiv preprint arXiv:2310.05930</i>. https://arxiv.org/abs/2310.05930</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Feurer, M., &amp; Hutter, F. (2019). Hyperparameter optimization. In F. Hutter, L. Kotthoff, &amp; J. Vanschoren (Eds.), <i>Automated machine learning: Methods, systems, challenges</i> (pp. 3-33). Springer. https://doi.org/10.1007/978-3-030-05318-5_1</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">He, P., Huang, W., Qiao, Y., Loy, C. C., &amp; Tang, X. (2016). Reading scene text in deep convolutional sequences. <i>Proceedings of the AAAI Conference on Artificial Intelligence</i>, 30(1), 3501-3508. https://doi.org/10.1609/aaai.v30i1.10291</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">JaidedAI. (2020). EasyOCR: Ready-to-use OCR with 80+ supported languages. GitHub. https://github.com/JaidedAI/EasyOCR</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Liang, J., Doermann, D., &amp; Li, H. (2005). Camera-based analysis of text and documents: A survey. <i>International Journal of Document Analysis and Recognition</i>, 7(2), 84-104. https://doi.org/10.1007/s10032-004-0138-z</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Liao, M., Wan, Z., Yao, C., Chen, K., &amp; Bai, X. (2020). Real-time scene text detection with differentiable binarization. <i>Proceedings of the AAAI Conference on Artificial Intelligence</i>, 34(07), 11474-11481. https://doi.org/10.1609/aaai.v34i07.6812</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Liaw, R., Liang, E., Nishihara, R., Moritz, P., Gonzalez, J. E., &amp; Stoica, I. (2018). Tune: A research platform for distributed model selection and training. <i>arXiv preprint arXiv:1807.05118</i>. https://arxiv.org/abs/1807.05118</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Mindee. (2021). DocTR: Document Text Recognition. GitHub. https://github.com/mindee/doctr</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Moritz, P., Nishihara, R., Wang, S., Tumanov, A., Liaw, R., Liang, E., Elibol, M., Yang, Z., Paul, W., Jordan, M. I., &amp; Stoica, I. (2018). Ray: A distributed framework for emerging AI applications. <i>13th USENIX Symposium on Operating Systems Design and Implementation (OSDI 18)</i>, 561-577. https://www.usenix.org/conference/osdi18/presentation/moritz</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Morris, A. C., Maier, V., &amp; Green, P. D. (2004). From WER and RIL to MER and WIL: Improved evaluation measures for connected speech recognition. <i>Eighth International Conference on Spoken Language Processing</i>. https://doi.org/10.21437/Interspeech.2004-668</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">PaddlePaddle. (2024). PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle. GitHub. https://github.com/PaddlePaddle/PaddleOCR</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Pearson, K. (1895). Notes on regression and inheritance in the case of two parents. <i>Proceedings of the Royal Society of London</i>, 58, 240-242. https://doi.org/10.1098/rspl.1895.0041</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">PyMuPDF. (2024). PyMuPDF documentation. https://pymupdf.readthedocs.io/</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Shi, B., Bai, X., &amp; Yao, C. (2016). An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition. <i>IEEE Transactions on Pattern Analysis and Machine Intelligence</i>, 39(11), 2298-2304. https://doi.org/10.1109/TPAMI.2016.2646371</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Smith, R. (2007). An overview of the Tesseract OCR engine. <i>Ninth International Conference on Document Analysis and Recognition (ICDAR 2007)</i>, 2, 629-633. https://doi.org/10.1109/ICDAR.2007.4376991</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Zhou, X., Yao, C., Wen, H., Wang, Y., Zhou, S., He, W., &amp; Liang, J. (2017). EAST: An efficient and accurate scene text detector. <i>Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition</i>, 5551-5560. https://doi.org/10.1109/CVPR.2017.283</span></p>
-<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Zoph, B., &amp; Le, Q. V. (2017). Neural architecture search with reinforcement learning. <i>International Conference on Learning Representations (ICLR)</i>. https://arxiv.org/abs/1611.01578</span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Du, Y., Li, C., Guo, R., Yin, X., Liu, W., Zhou, J., Bai, Y., Yu, Z., Yang, Y., Dang, Q., &amp; Wang, H. (2020). PP-OCR: A practical ultra lightweight OCR system. <i>arXiv</i>. <a href="https://arxiv.org/abs/2009.09941">https://arxiv.org/abs/2009.09941</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Du, Y., Li, C., Guo, R., Cui, C., Liu, W., Zhou, J., Lu, B., Yang, Y., Liu, Q., Hu, X., Yu, D., &amp; Wang, H. (2023). PP-OCRv4: Mobile scene text detection and recognition. <i>arXiv</i>. <a href="https://arxiv.org/abs/2310.05930">https://arxiv.org/abs/2310.05930</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Feurer, M., &amp; Hutter, F. (2019). Hyperparameter optimization. In F. Hutter, L. Kotthoff, &amp; J. Vanschoren (Eds.), <i>Automated machine learning: Methods, systems, challenges</i> (pp. 3-33). Springer. <a href="https://doi.org/10.1007/978-3-030-05318-5_1">https://doi.org/10.1007/978-3-030-05318-5_1</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">He, P., Huang, W., Qiao, Y., Loy, C. C., &amp; Tang, X. (2016). Reading scene text in deep convolutional sequences. <i>Proceedings of the AAAI Conference on Artificial Intelligence</i>, 30(1), 3501-3508. <a href="https://doi.org/10.1609/aaai.v30i1.10291">https://doi.org/10.1609/aaai.v30i1.10291</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">JaidedAI. (2020). <i>EasyOCR: Ready-to-use OCR with 80+ supported languages</i> [Computer software]. GitHub. <a href="https://github.com/JaidedAI/EasyOCR">https://github.com/JaidedAI/EasyOCR</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Liang, J., Doermann, D., &amp; Li, H. (2005). Camera-based analysis of text and documents: A survey. <i>International Journal of Document Analysis and Recognition</i>, 7(2), 84-104. <a href="https://doi.org/10.1007/s10032-004-0138-z">https://doi.org/10.1007/s10032-004-0138-z</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Liao, M., Wan, Z., Yao, C., Chen, K., &amp; Bai, X. (2020). Real-time scene text detection with differentiable binarization. <i>Proceedings of the AAAI Conference on Artificial Intelligence</i>, 34(07), 11474-11481. <a href="https://doi.org/10.1609/aaai.v34i07.6812">https://doi.org/10.1609/aaai.v34i07.6812</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Liaw, R., Liang, E., Nishihara, R., Moritz, P., Gonzalez, J. E., &amp; Stoica, I. (2018). Tune: A research platform for distributed model selection and training. <i>arXiv</i>. <a href="https://arxiv.org/abs/1807.05118">https://arxiv.org/abs/1807.05118</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Mindee. (2021). <i>DocTR: Document text recognition</i> [Computer software]. GitHub. <a href="https://github.com/mindee/doctr">https://github.com/mindee/doctr</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Moritz, P., Nishihara, R., Wang, S., Tumanov, A., Liaw, R., Liang, E., Elibol, M., Yang, Z., Paul, W., Jordan, M. I., &amp; Stoica, I. (2018). Ray: A distributed framework for emerging AI applications. <i>13th USENIX Symposium on Operating Systems Design and Implementation (OSDI 18)</i>, 561-577. <a href="https://www.usenix.org/conference/osdi18/presentation/moritz">https://www.usenix.org/conference/osdi18/presentation/moritz</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Morris, A. C., Maier, V., &amp; Green, P. D. (2004). From WER and RIL to MER and WIL: Improved evaluation measures for connected speech recognition. <i>Eighth International Conference on Spoken Language Processing</i>. <a href="https://doi.org/10.21437/Interspeech.2004-668">https://doi.org/10.21437/Interspeech.2004-668</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">PaddlePaddle. (2024). <i>PaddleOCR: Awesome multilingual OCR toolkits based on PaddlePaddle</i> [Computer software]. GitHub. <a href="https://github.com/PaddlePaddle/PaddleOCR">https://github.com/PaddlePaddle/PaddleOCR</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Pearson, K. (1895). Notes on regression and inheritance in the case of two parents. <i>Proceedings of the Royal Society of London</i>, 58, 240-242. <a href="https://doi.org/10.1098/rspl.1895.0041">https://doi.org/10.1098/rspl.1895.0041</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">PyMuPDF. (2024). <i>PyMuPDF documentation</i>. <a href="https://pymupdf.readthedocs.io/">https://pymupdf.readthedocs.io/</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Shi, B., Bai, X., &amp; Yao, C. (2016). An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition. <i>IEEE Transactions on Pattern Analysis and Machine Intelligence</i>, 39(11), 2298-2304. <a href="https://doi.org/10.1109/TPAMI.2016.2646371">https://doi.org/10.1109/TPAMI.2016.2646371</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Smith, R. (2007). An overview of the Tesseract OCR engine. <i>Ninth International Conference on Document Analysis and Recognition (ICDAR 2007)</i>, 2, 629-633. <a href="https://doi.org/10.1109/ICDAR.2007.4376991">https://doi.org/10.1109/ICDAR.2007.4376991</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Zhou, X., Yao, C., Wen, H., Wang, Y., Zhou, S., He, W., &amp; Liang, J. (2017). EAST: An efficient and accurate scene text detector. <i>Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition</i>, 5551-5560. <a href="https://doi.org/10.1109/CVPR.2017.283">https://doi.org/10.1109/CVPR.2017.283</a></span></p>
+<p class="MsoBibliography" style="margin-left:36.0pt;text-indent:-36.0pt"><span lang="ES">Zoph, B., &amp; Le, Q. V. (2017). Neural architecture search with reinforcement learning. <i>International Conference on Learning Representations (ICLR)</i>. <a href="https://arxiv.org/abs/1611.01578">https://arxiv.org/abs/1611.01578</a></span></p>
 <p class="Anexo" style="mso-list:l2 level1 lfo23"><a name="_Toc160619822"><?if !supportLists?><span lang="ES" style='mso-fareast-font-family:"Calibri Light";mso-fareast-theme-font:
 major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin'><span style="mso-list:Ignore">Anexo A.<span style='font:7.0pt "Times New Roman"'>   
 </span></span></span><?endif?><span lang="ES">Código fuente y datos analizados</span></a></p><p class="MsoNormal"><span lang="ES">Este anexo proporciona la información técnica necesaria para reproducir los experimentos descritos en este trabajo. Se incluyen las instrucciones de instalación, configuración de los servicios OCR dockerizados, ejecución de los scripts de optimización y acceso a los resultados experimentales.</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">A.1 Repositorio del Proyecto</span></h2>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.1 Repositorio del Proyecto</span></h2>
 <p class="MsoNormal"><span lang="ES">Todo el código fuente y los datos utilizados en este trabajo están disponibles públicamente en el siguiente repositorio:</span></p>
-<p class="MsoNormal"><span lang="ES"><b>URL del repositorio:</b> https://seryus.ddns.net/unir/MastersThesis</span></p>
+<p class="MsoNormal"><span lang="ES"><b>URL del repositorio:</b> <a href="https://seryus.ddns.net/unir/MastersThesis">https://seryus.ddns.net/unir/MastersThesis</a></span></p>
 <p class="MsoNormal"><span lang="ES">El repositorio incluye:</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Servicios OCR dockerizados</b>: PaddleOCR, DocTR, EasyOCR con soporte GPU</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Scripts de evaluación</b>: Herramientas para evaluar y comparar modelos OCR</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Scripts de ajuste</b>: Ray Tune con Optuna para optimización de hiperparámetros</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Dataset</b>: Imágenes y textos de referencia utilizados</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><b>Resultados</b>: Archivos CSV con los resultados de los 64 trials por servicio</span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">A.2 Estructura del Repositorio</span></h2>
-<a name="_Ref_Fig16"></a><p class="MsoCaption" style="text-align:center"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Figura \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->16<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Estructura del repositorio MastersThesis</span></i></p>
-<p class="MsoNormal" style="text-align:center"><span lang="ES"><img alt="Estructura del repositorio MastersThesis" height="299" src="figures/figura_16.png" style="width:424.5pt;height:224.25pt;display:block;margin:0 auto" width="566"/></span></p>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.2 Estructura del Repositorio</span></h2>
+<a name="_Ref_FigA1"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura A1.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Estructura del repositorio MastersThesis</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Estructura del repositorio MastersThesis" height="480" src="figures/figura_16.png" style="width:424.5pt;height:360.0pt;display:block;margin:0 auto" width="566"/></span></p>
 <p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<a name="_Ref_Tab56"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->56<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Descripción de directorios principales.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Directorio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Contenido</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">docs/</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Capítulos del TFM en Markdown (estructura UNIR)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">docs/metrics/</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Métricas de rendimiento por servicio OCR</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr/</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Servicio PaddleOCR dockerizado</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">src/doctr_service/</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Servicio DocTR dockerizado</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">src/easyocr_service/</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Servicio EasyOCR dockerizado</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">src/raytune/</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Scripts de optimización Ray Tune</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">src/results/</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CSVs con resultados de 64 trials por servicio</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">thesis_output/</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Documento TFM generado + figuras PNG</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">instructions/</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Plantilla e instrucciones UNIR oficiales</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
-<p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">A.3 Requisitos de Software</span></h2>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Sistema de Desarrollo</span></h3>
-<a name="_Ref_Tab57"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->57<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Especificaciones del sistema de desarrollo.</span></i></p>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.3 Requisitos de Software</span></h2>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Sistema de Desarrollo</span></h3>
+<a name="_Ref_TabA1"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A1.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Especificaciones del sistema de desarrollo.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Componente</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Especificación</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sistema Operativo</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ubuntu 24.04.3 LTS</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">AMD Ryzen 7 5800H</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">RAM</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">16 GB DDR4</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NVIDIA RTX 3060 Laptop (5.66 GB VRAM)</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">CUDA</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">12.4</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Dependencias</span></h3>
-<a name="_Ref_Tab58"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->58<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Dependencias del proyecto.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Componente</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Versión</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Python</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.12.3</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Docker</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">29.1.5</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NVIDIA Container Toolkit</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Requerido para GPU</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ray</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2.52.1</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optuna</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4.7.0</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Dependencias</span></h3>
+<a name="_Ref_TabA2"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A2.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Dependencias del proyecto.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Componente</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Versión</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddlePaddle</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.2.2</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">3.3.2</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Ray Tune</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2.52.1</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Optuna</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">4.7.0</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR (python-doctr)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&gt;= 0.8.0</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&gt;= 1.7.0</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Docker</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Requerido para contenedores</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">NVIDIA Container Toolkit</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Requerido para GPU</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/paddle_ocr/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/paddle_ocr/requirements.txt</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/raytune/requirements.txt</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/doctr_service/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/doctr_service/requirements.txt</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/easyocr_service/requirements.txt"><span style="font-family:Consolas;font-size:10pt">src/easyocr_service/requirements.txt</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/README.md"><span style="font-family:Consolas;font-size:10pt">src/README.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">A.4 Instrucciones de Ejecución de Servicios OCR</span></h2>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">PaddleOCR (Puerto 8002)</span></h3>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.4 Instrucciones de Ejecución de Servicios OCR</span></h2>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">PaddleOCR (Puerto 8002)</span></h3>
 <p class="MsoNormal"><span lang="ES"><b>Imágenes Docker:</b></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">GPU: <a href="https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/paddle-ocr-gpu</span></a></span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">CPU: <a href="https://seryus.ddns.net/unir/-/packages/container/paddle-ocr-cpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/paddle-ocr-cpu</span></a></span></p>
@@ -5760,7 +5734,7 @@ docker compose up -d
 # CPU (más lento, 82x)
 docker compose -f docker-compose.cpu-registry.yml up -d</pre>
 </div>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">DocTR (Puerto 8003)</span></h3>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">DocTR (Puerto 8003)</span></h3>
 <p class="MsoNormal"><span lang="ES"><b>Imagen Docker:</b> <a href="https://seryus.ddns.net/unir/-/packages/container/doctr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/doctr-gpu</span></a></span></p>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word">cd src/doctr_service
@@ -5768,7 +5742,7 @@ docker compose -f docker-compose.cpu-registry.yml up -d</pre>
 # GPU
 docker compose up -d</pre>
 </div>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">EasyOCR (Puerto 8002)</span></h3>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">EasyOCR (Puerto 8002)</span></h3>
 <p class="MsoQuote"><i><span lang="ES"><b>Nota:</b> EasyOCR utiliza el mismo puerto (8002) que PaddleOCR. No se pueden ejecutar simultáneamente. Por esta razón, existe un archivo docker-compose separado para EasyOCR.</span></i></p>
 <p class="MsoNormal"><span lang="ES"><b>Imagen Docker:</b> <a href="https://seryus.ddns.net/unir/-/packages/container/easyocr-gpu/latest"><span style="font-family:Consolas;font-size:10pt">seryus.ddns.net/unir/easyocr-gpu</span></a></span></p>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
@@ -5777,7 +5751,7 @@ docker compose up -d</pre>
 # GPU (usar archivo separado para evitar conflicto de puerto)
 docker compose up -d</pre>
 </div>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Verificar Estado del Servicio</span></h3>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Verificar Estado del Servicio</span></h3>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word"># Verificar salud del servicio
 curl http://localhost:8002/health
@@ -5785,8 +5759,8 @@ curl http://localhost:8002/health
 # Respuesta esperada:
 # {"status": "ok", "model_loaded": true, "gpu_name": "NVIDIA GeForce RTX 3060"}</pre>
 </div>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">A.5 Uso de la API OCR</span></h2>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Evaluar Dataset Completo</span></h3>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.5 Uso de la API OCR</span></h2>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Evaluar Dataset Completo</span></h3>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word"># PaddleOCR - Evaluación completa
 curl -X POST http://localhost:8002/evaluate_full \
@@ -5796,7 +5770,7 @@ curl -X POST http://localhost:8002/evaluate_full \
     "save_output": true
   }'</pre>
 </div>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Evaluar con Hiperparámetros Optimizados</span></h3>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Evaluar con Hiperparámetros Optimizados</span></h3>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word"># PaddleOCR con configuración óptima
 curl -X POST http://localhost:8002/evaluate_full \
@@ -5813,8 +5787,8 @@ curl -X POST http://localhost:8002/evaluate_full \
     "save_output": true
   }'</pre>
 </div>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">A.6 Ajuste de Hiperparámetros con Ray Tune</span></h2>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Ejecutar Ajuste</span></h3>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.6 Ajuste de Hiperparámetros con Ray Tune</span></h2>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Ejecutar Ajuste</span></h3>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word">cd src
 
@@ -5832,28 +5806,37 @@ results = run_tuner(trainable, PADDLE_OCR_SEARCH_SPACE, num_samples=64)
 analyze_results(results, prefix='raytune_paddle', config_keys=PADDLE_OCR_CONFIG_KEYS)
 "</pre>
 </div>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Servicios y Puertos</span></h3>
-<a name="_Ref_Tab59"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->59<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Servicios Docker y puertos.</span></i></p>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Servicios y Puertos</span></h3>
+<a name="_Ref_TabA3"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A3.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Servicios Docker y puertos.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Puerto</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Script de Ajuste</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Nota</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8002</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">paddle_ocr_payload</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8003</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">doctr_payload</span></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">-</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8002</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><span style="font-family:Consolas;font-size:10pt">easyocr_payload</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Conflicto con PaddleOCR</span></p></td></tr></table></div>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoQuote"><i><span lang="ES"><b>Nota:</b> Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez. PaddleOCR y EasyOCR comparten el puerto 8002. Para cambiar de servicio, detener el actual con <span style="font-family:Consolas;font-size:10pt">docker compose down</span>.</span></i></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">A.7 Métricas de Rendimiento</span></h2>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.7 Métricas de Rendimiento</span></h2>
 <p class="MsoNormal"><span lang="ES">Esta sección presenta los resultados completos de las evaluaciones comparativas y del ajuste de hiperparámetros realizado con Ray Tune sobre los tres servicios OCR evaluados.</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Comparativa General de Servicios</span></h3>
-<a name="_Ref_Tab60"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->60<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de servicios OCR en dataset de 45 páginas (GPU RTX 3060).</span></i></p>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Comparativa General de Servicios</span></h3>
+<a name="_Ref_TabA4"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A4.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparativa de servicios OCR en dataset de 45 páginas (GPU RTX 3060).</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">WER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tiempo/Página</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Tiempo Total</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">VRAM</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>PaddleOCR (Mobile)</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>7.76%</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>11.62%</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.58s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">32.0s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.06 GB</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">11.23%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">36.36%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.88s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">88.5s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~2 GB</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">12.06%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">42.01%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.50s</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">28.4s</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~1 GB</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_easyocr.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_easyocr.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_doctr.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_doctr.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
 <p class="MsoNormal"><span lang="ES"><b>Ganador:</b> PaddleOCR (Mobile) - Mejor precisión (7.76% CER) con velocidad competitiva y mínimo consumo de VRAM.</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Resultados de Ajuste de Hiperparámetros</span></h3>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Resultados de Ajuste de Hiperparámetros</span></h3>
 <p class="MsoNormal"><span lang="ES">Se ejecutaron 64 trials por servicio utilizando Ray Tune con Optuna sobre las páginas 5-10 del primer documento.</span></p>
-<a name="_Ref_Tab61"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->61<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Resultados del ajuste de hiperparámetros por servicio.</span></i></p>
+<a name="_Ref_TabA5"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A5.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Resultados del ajuste de hiperparámetros por servicio.</span></i></p>
 <div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER Base</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CER Ajustado</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Mejora</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Mejor Trial (5 páginas)</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>PaddleOCR</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">8.85%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>7.72%</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>12.8%</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>0.79%</b> ✓</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">12.06%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">12.07%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">7.43%</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">11.23%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">11.14%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.8%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5.83%</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_paddle.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_paddle.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_easyocr.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_easyocr.md</span></a>, <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/docs/metrics/metrics_doctr.md"><span style="font-family:Consolas;font-size:10pt">docs/metrics/metrics_doctr.md</span></a>.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<p class="MsoQuote"><i><span lang="ES"><b>Nota sobre sobreajuste:</b> La diferencia entre los resultados del mejor trial (subconjunto de 5 páginas) y el dataset completo (45 páginas) indica sobreajuste parcial a las páginas de ajuste. Un subconjunto más grande (15-20 páginas) mejoraría la generalización.</span></i></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Configuración Óptima PaddleOCR</span></h3>
+<p class="MsoQuote"><i><span lang="ES"><b>Nota sobre sobreajuste:</b> La diferencia entre los resultados del mejor trial (subconjunto de 5 páginas) y el dataset completo (45 páginas) indica sobreajuste parcial a las páginas de ajuste. Un subconjunto más amplio mejoraría la generalización.</span></i></p>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Distribución de trials por rango de CER (PaddleOCR)</span></h3>
+<a name="_Ref_TabA6"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A6.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Distribución de trials por rango de CER.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Rango CER</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Número de trials</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Porcentaje</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&lt; 2%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">43</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">67.2%</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">2% - 5%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">10</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">15.6%</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">5% - 10%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">11</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">17.2%</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">&gt; 10%</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.0%</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
+<p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
+<a name="_Ref_FigA2"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura A2.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Distribución de trials por rango de CER (PaddleOCR)</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Distribución de trials por rango de CER (PaddleOCR)" height="407" src="figures/figura_17.png" style="width:424.5pt;height:305.25pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>.</span></p>
+<p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Configuración Óptima PaddleOCR</span></h3>
 <p class="MsoNormal"><span lang="ES">La siguiente configuración logró el mejor rendimiento en el ajuste de hiperparámetros:</span></p>
 <div style="background:#E6F4F9;border-top:solid #0098CD .5pt;border-bottom:solid #0098CD .5pt;padding:8pt 12pt;margin:6pt 0">
 <pre style="font-family:Consolas,monospace;font-size:9pt;color:#333333;margin:0;white-space:pre-wrap;word-wrap:break-word">{
@@ -5867,27 +5850,42 @@ analyze_results(results, prefix='raytune_paddle', config_keys=PADDLE_OCR_CONFIG_
 }</pre>
 </div>
 <p class="MsoNormal"><span lang="ES"><b>Hallazgos clave:</b></span></p>
-<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation=true</span>: Crítico para documentos con layouts mixtos</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">textline_orientation=true</span>: Crítico para documentos con secciones y encabezados</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_orientation_classify=true</span>: Mejora detección de orientación</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">use_doc_unwarping=false</span>: Innecesario para PDFs digitales</span></p>
 <p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES"><span style="font-family:Consolas;font-size:10pt">text_det_thresh</span> bajo (0.0462): Detección más sensible mejora resultados</span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Rendimiento CPU vs GPU</span></h3>
-<a name="_Ref_Tab62"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->62<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparación de rendimiento CPU vs GPU (PaddleOCR).</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Métrica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CPU</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">GPU (RTX 3060)</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Aceleración</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo/Página</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">69.4s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.55s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>126x más rápido</b></span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Mejor CER</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">1.15%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.79%</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">GPU mejor</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">45 páginas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~52 min</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~25 seg</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>126x más rápido</b></span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Rendimiento CPU vs GPU</span></h3>
+<a name="_Ref_TabA7"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A7.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Comparación de rendimiento CPU vs GPU (PaddleOCR).</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Métrica</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">CPU</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">GPU (RTX 3060)</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Aceleración</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Tiempo/Página</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">69.4s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">0.84s</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>82x más rápido</b></span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">45 páginas</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~52 min</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">~38 seg</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>82x más rápido</b></span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Datos de tiempo CPU de <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv"><span style="font-family:Consolas;font-size:10pt">src/raytune_paddle_subproc_results_20251207_192320.csv</span></a> y tiempos de GPU en trials de ajuste. Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Análisis de Errores por Servicio</span></h3>
-<a name="_Ref_Tab63"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->63<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Tipos de errores identificados por servicio OCR.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Fortalezas</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Debilidades</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">¿Fine-tuning recomendado?</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>PaddleOCR</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Preserva estructura, buen manejo de español</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Errores menores de acentos (~5%)</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">No (ya excelente)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Más rápido</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Pierde estructura, omite TODOS los diacríticos</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sí (para diacríticos)</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelo correcto para español</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Caracteres espurios, confunde <span style="font-family:Consolas;font-size:10pt">o</span>/<span style="font-family:Consolas;font-size:10pt">0</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sí (problemas del detector)</span></p></td></tr></table></div>
-<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
+<a name="_Ref_FigA3"></a><p class="MsoCaption" style="text-align:center;mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Figura A3.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Tiempo de procesamiento: CPU vs GPU (segundos/página)</span></i></p>
+<p class="MsoNormal" style="text-align:center;mso-pagination:keep-with-next"><span lang="ES"><img alt="Tiempo de procesamiento: CPU vs GPU (segundos/página)" height="404" src="figures/figura_18.png" style="width:424.5pt;height:303.0pt;display:block;margin:0 auto" width="566"/></span></p>
+<p class="Piedefoto-tabla" style="margin-left:0cm;text-align:center"><span lang="ES">Fuente: <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/raytune_paddle_subproc_results_20251207_192320.csv"><span style="font-family:Consolas;font-size:10pt">src/raytune_paddle_subproc_results_20251207_192320.csv</span></a> y <a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a>. Leyenda: Aceleración de <b>82x</b> con GPU. El procesamiento de una página pasa de 69.4s (CPU) a 0.84s (GPU).</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h3 style="mso-list:l22 level3 lfo18"><span lang="ES" style="text-transform:none">Archivos de Resultados</span></h3>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Análisis de Errores por Servicio</span></h3>
+<a name="_Ref_TabA8"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A8.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Tipos de errores identificados por servicio OCR.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Fortalezas</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Debilidades</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">¿Fine-tuning recomendado?</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><b>PaddleOCR</b></span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Preserva estructura, buen manejo de español</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Errores menores de acentos</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">No (ya excelente)</span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Más rápido</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Pierde estructura, omite TODOS los diacríticos</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sí (para diacríticos)</span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Modelo correcto para español</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Caracteres espurios, confunde <span style="font-family:Consolas;font-size:10pt">o</span>/<span style="font-family:Consolas;font-size:10pt">0</span></span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">Sí (problemas del detector)</span></p></td></tr></table></div>
+<p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Análisis manual del debugset. Elaboración propia.</span></p>
+<p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
+<h3 style="mso-list:none"><span lang="ES" style="text-transform:none">Archivos de Resultados</span></h3>
 <p class="MsoNormal"><span lang="ES">Los resultados crudos de los 64 trials por servicio están disponibles en el repositorio:</span></p>
-<a name="_Ref_Tab64"></a><p class="MsoCaption"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla <!--[if supportFields]><span style='mso-element:field-begin'></span> SEQ Tabla \* ARABIC <span style='mso-element:field-separator'></span><![endif]-->64<!--[if supportFields]><span style='mso-element:field-end'></span><![endif]-->.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Ubicación de archivos de resultados.</span></i></p>
-<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Archivo CSV</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a></span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_doctr_results_20260119_121445.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_doctr_results_20260119_121445.csv</span></a></span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/-/blob/main/src/results/raytune_easyocr_results_20260119_120204.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_easyocr_results_20260119_120204.csv</span></a></span></p></td></tr></table></div>
+<a name="_Ref_TabA9"></a><p class="MsoCaption" style="mso-pagination:keep-with-next"><b><span lang="ES" style="font-size:12.0pt;line-height:150%">Tabla A9.</span></b><span lang="ES" style="font-size:12.0pt;line-height:150%"> </span><i><span lang="ES" style="font-size:12.0pt;line-height:150%">Ubicación de archivos de resultados.</span></i></p>
+<div align="center"><table align="center" border="1" cellpadding="0" cellspacing="0" class="MsoTableGrid" style="border-collapse:collapse;margin-left:auto;margin-right:auto;mso-table-style-name:'Plain Table 1'"><tr><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Servicio</span></b></p></td><td style="border-top:solid windowtext 1.0pt;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><b><span lang="ES">Archivo CSV</span></b></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">PaddleOCR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_paddle_results_20260119_122609.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_paddle_results_20260119_122609.csv</span></a></span></p></td></tr><tr><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">DocTR</span></p></td><td style="border:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_doctr_results_20260119_121445.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_doctr_results_20260119_121445.csv</span></a></span></p></td></tr><tr><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES">EasyOCR</span></p></td><td style="border-top:none;border-bottom:solid windowtext 1.0pt;border-left:none;border-right:none;padding:5px"><p class="MsoNormal" style="margin:0;text-align:center"><span lang="ES"><a href="https://seryus.ddns.net/unir/MastersThesis/src/branch/main/src/results/raytune_easyocr_results_20260119_120204.csv"><span style="font-family:Consolas;font-size:10pt">src/results/raytune_easyocr_results_20260119_120204.csv</span></a></span></p></td></tr></table></div>
 <p class="Piedefoto-tabla" style="margin-left:0cm"><span lang="ES">Fuente: Elaboración propia.</span></p>
 <p class="MsoNormal"><span lang="ES"><o:p> </o:p></span></p>
-<h2 style="mso-list:l22 level2 lfo18"><span lang="ES" style="text-transform:none">A.8 Licencia</span></h2>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.8 Fuentes de precios cloud</span></h2>
+<p class="MsoNormal"><span lang="ES">Las tablas de costos cloud se basan en las páginas oficiales de precios. Se consultaron en enero de 2026.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">AWS EC2 g4dn.xlarge: <a href="https://aws.amazon.com/ec2/instance-types/g4/">https://aws.amazon.com/ec2/instance-types/g4/</a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Google Colab Pro: <a href="https://colab.research.google.com/signup">https://colab.research.google.com/signup</a></span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">Google Colab Pro+: <a href="https://colab.research.google.com/signup">https://colab.research.google.com/signup</a></span></p>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.9 Requisitos documentados por dependencias</span></h2>
+<p class="MsoNormal"><span lang="ES">Requisitos extraídos de la documentación oficial de las dependencias usadas:</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">DocTR: requiere Python 3.10 o superior.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">DocTR Docker: imágenes basadas en CUDA 12.2, el host debe ser al menos 12.2.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">PaddleOCR: soporte de inferencia con CUDA 12.</span></p>
+<p class="MsoListParagraphCxSpMiddle" style="margin-left:36pt;text-indent:-18pt"><span lang="ES" style="font-family:Symbol">·</span><span lang="ES" style="font-size:7pt">     </span><span lang="ES">PaddleOCR: soporte de Python 3.12 en dependencias.</span></p>
+<h2 style="mso-list:none"><span lang="ES" style="text-transform:none">A.10 Licencia</span></h2>
 <p class="MsoNormal"><span lang="ES">El código se distribuye bajo licencia MIT.</span></p></div>
 <div style="mso-element:footnote-list"><?if !supportFootnotes?><br clear="all"/>
 <hr align="left" size="1" width="33%"/>