Files
MastersThesis/thesis_output/presentation/slides/17_script.md
sergio 5351d4a57b
Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
pdf
2026-04-21 20:46:05 +02:00

21 lines
1.3 KiB
Markdown

# Slide 17 — Conclusions (~1.5 minutes)
**What to say:**
"En conclusión, este trabajo aporta cuatro contribuciones principales.
Primera: una metodología reproducible para optimización de hiperparámetros OCR, basada en herramientas de código abierto — Ray Tune, Optuna y PaddleOCR.
Segunda: un análisis sistemático de los hiperparámetros de PaddleOCR mediante correlaciones de Pearson, que revela la jerarquía de impacto donde los parámetros arquitectónicos dominan sobre los numéricos.
Tercera: una configuración validada para documentos académicos en español que logra un CER del 0.79% en el mejor ensayo — superando el objetivo del 2%.
Y cuarta: una infraestructura Dockerizada con imágenes públicas que permite reproducir el experimento completo.
En cuanto a las limitaciones, las reconocemos explícitamente: un solo tipo de documento, un corpus modesto de 45 páginas, overfitting al subconjunto de optimización de 5 páginas, y el parámetro text_det_unclip_ratio que no se exploró. Estas limitaciones son, a su vez, oportunidades claras de mejora."
**Tips:**
- Number the contributions clearly — the tribunal is evaluating these
- Balance confidence with honesty about limitations
- "Las limitaciones son oportunidades" — reframe positively