Files
sergio 5351d4a57b
Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
pdf
2026-04-21 20:46:05 +02:00

20 lines
1.3 KiB
Markdown

# Slide 14 — Validation: Baseline vs Optimized (~1.5 minutes)
**What to say:**
"Pasamos a la validación sobre el dataset completo de 45 páginas — objetivo específico OE5.
El CER baseline era del 8.85%. Con la configuración optimizada, se reduce a 7.72%, una mejora relativa del 12.8%. El WER pasa de 13.05% a 11.40%, una mejora similar del 12.6%.
Ahora, es importante ser transparente: el mejor ensayo individual sobre las 5 páginas de optimización alcanzó un CER del 0.79%, lo cual contrasta con el 7.72% sobre el dataset completo.
Esta diferencia nos indica que hay un grado de overfitting al subconjunto de optimización. Las 5 páginas utilizadas para la búsqueda no capturan toda la variabilidad del documento completo de 45 páginas.
Esto es una limitación que identificamos honestamente, y la recomendación directa es utilizar un subconjunto mayor — de 15 a 20 páginas — para mejorar la generalización. A pesar de esta limitación, la mejora del 12.8% sobre el dataset completo demuestra que la optimización tiene un efecto positivo real y generalizable."
**Tips:**
- Be honest about the overfitting gap — the tribunal will respect transparency
- "12.8% improvement" is still significant even with the caveat
- Frame the limitation as a clear future improvement, not a failure
- Point to the comparison chart