Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
17 lines
1.1 KiB
Markdown
17 lines
1.1 KiB
Markdown
# Slide 18 — Future Work (~1 minute)
|
|
|
|
**What to say:**
|
|
|
|
"Para trabajo futuro, identificamos tres líneas.
|
|
|
|
En extensiones inmediatas: validación cruzada con otros tipos de documento — facturas, formularios, manuscritos —, un subconjunto de optimización más grande de 15 a 20 páginas para reducir el overfitting, y exploración del parámetro text_det_unclip_ratio.
|
|
|
|
En líneas de investigación: transferencia de hiperparámetros entre dominios documentales, optimización multiobjetivo combinando CER, WER y velocidad de inferencia, y una comparación rigurosa entre optimización de hiperparámetros y fine-tuning.
|
|
|
|
Y en aplicaciones prácticas: una herramienta de configuración automática por tipo de documento, integración en pipelines de producción, y un benchmark público de OCR para español — algo que actualmente no existe y sería una contribución valiosa a la comunidad."
|
|
|
|
**Tips:**
|
|
- Group the three categories clearly
|
|
- "Benchmark público para español" is a strong closing point — highlights a gap in the field
|
|
- Keep it forward-looking and enthusiastic
|