Files
MastersThesis/thesis_output/presentation/slides/17_script.md

21 lines
1.3 KiB
Markdown
Raw Normal View History

2026-04-21 20:46:05 +02:00
# Slide 17 — Conclusions (~1.5 minutes)
**What to say:**
"En conclusión, este trabajo aporta cuatro contribuciones principales.
Primera: una metodología reproducible para optimización de hiperparámetros OCR, basada en herramientas de código abierto — Ray Tune, Optuna y PaddleOCR.
Segunda: un análisis sistemático de los hiperparámetros de PaddleOCR mediante correlaciones de Pearson, que revela la jerarquía de impacto donde los parámetros arquitectónicos dominan sobre los numéricos.
Tercera: una configuración validada para documentos académicos en español que logra un CER del 0.79% en el mejor ensayo — superando el objetivo del 2%.
Y cuarta: una infraestructura Dockerizada con imágenes públicas que permite reproducir el experimento completo.
En cuanto a las limitaciones, las reconocemos explícitamente: un solo tipo de documento, un corpus modesto de 45 páginas, overfitting al subconjunto de optimización de 5 páginas, y el parámetro text_det_unclip_ratio que no se exploró. Estas limitaciones son, a su vez, oportunidades claras de mejora."
**Tips:**
- Number the contributions clearly — the tribunal is evaluating these
- Balance confidence with honesty about limitations
- "Las limitaciones son oportunidades" — reframe positively