Files
MastersThesis/thesis_output/presentation/slides/17_script.md
sergio 569a7bca4a
Some checks failed
build_docker / essential (push) Successful in 0s
build_docker / build_paddle_ocr (push) Failing after 4m7s
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
build_docker / build_easyocr (push) Has been cancelled
plain image manifests
2026-04-21 20:54:59 +02:00

23 lines
1.8 KiB
Markdown

# Slide 17 — Conclusions (~1.5 minutes)
**What to say:**
"En conclusión, este trabajo aporta cuatro contribuciones principales al campo del AutoML aplicado a sistemas OCR.
Primera: una metodología reproducible de optimización bayesiana de hiperparámetros de inferencia OCR, basada en herramientas de código abierto — Ray Tune, Optuna y PaddleOCR.
Segunda: un análisis automatizado del comportamiento del modelo en inferencia — mediante correlaciones de Pearson sobre 64 ensayos — que revela una jerarquía de impacto donde los parámetros arquitectónicos dominan sobre los numéricos. Esta es una contribución al entendimiento de cómo los hiperparámetros de inferencia afectan el rendimiento de redes neuronales de OCR.
Tercera: una configuración validada para documentos académicos en español que logra un CER del 0.79% en el mejor ensayo — superando ampliamente el objetivo del 2%.
Y cuarta: una infraestructura Dockerizada reproducible que permite replicar el experimento con un solo comando.
En conjunto, este trabajo demuestra que la optimización bayesiana de hiperparámetros de inferencia es una herramienta de AutoML eficaz para mejorar modelos preentrenados sin modificarlos — una capa de optimización complementaria al fine-tuning con un coste significativamente menor.
En cuanto a las limitaciones, las reconocemos explícitamente: un solo tipo de documento, un corpus modesto de 45 páginas, overfitting al subconjunto de 5 páginas, y el parámetro text_det_unclip_ratio sin explorar. Estas limitaciones son, a su vez, líneas claras de trabajo futuro."
**Tips:**
- Number the contributions clearly — the tribunal is evaluating these
- Balance confidence with honesty about limitations
- "Las limitaciones son oportunidades" — reframe positively