plain image manifests
Some checks failed
build_docker / essential (push) Successful in 0s
build_docker / build_paddle_ocr (push) Failing after 4m7s
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
build_docker / build_easyocr (push) Has been cancelled

This commit is contained in:
2026-04-21 20:54:59 +02:00
parent 5351d4a57b
commit 569a7bca4a
7 changed files with 110 additions and 90 deletions

View File

@@ -2,17 +2,19 @@
**What to say:**
"En conclusión, este trabajo aporta cuatro contribuciones principales.
"En conclusión, este trabajo aporta cuatro contribuciones principales al campo del AutoML aplicado a sistemas OCR.
Primera: una metodología reproducible para optimización de hiperparámetros OCR, basada en herramientas de código abierto — Ray Tune, Optuna y PaddleOCR.
Primera: una metodología reproducible de optimización bayesiana de hiperparámetros de inferencia OCR, basada en herramientas de código abierto — Ray Tune, Optuna y PaddleOCR.
Segunda: un análisis sistemático de los hiperparámetros de PaddleOCR mediante correlaciones de Pearson, que revela la jerarquía de impacto donde los parámetros arquitectónicos dominan sobre los numéricos.
Segunda: un análisis automatizado del comportamiento del modelo en inferencia — mediante correlaciones de Pearson sobre 64 ensayos — que revela una jerarquía de impacto donde los parámetros arquitectónicos dominan sobre los numéricos. Esta es una contribución al entendimiento de cómo los hiperparámetros de inferencia afectan el rendimiento de redes neuronales de OCR.
Tercera: una configuración validada para documentos académicos en español que logra un CER del 0.79% en el mejor ensayo — superando el objetivo del 2%.
Tercera: una configuración validada para documentos académicos en español que logra un CER del 0.79% en el mejor ensayo — superando ampliamente el objetivo del 2%.
Y cuarta: una infraestructura Dockerizada con imágenes públicas que permite reproducir el experimento completo.
Y cuarta: una infraestructura Dockerizada reproducible que permite replicar el experimento con un solo comando.
En cuanto a las limitaciones, las reconocemos explícitamente: un solo tipo de documento, un corpus modesto de 45 páginas, overfitting al subconjunto de optimización de 5 páginas, y el parámetro text_det_unclip_ratio que no se exploró. Estas limitaciones son, a su vez, oportunidades claras de mejora."
En conjunto, este trabajo demuestra que la optimización bayesiana de hiperparámetros de inferencia es una herramienta de AutoML eficaz para mejorar modelos preentrenados sin modificarlos — una capa de optimización complementaria al fine-tuning con un coste significativamente menor.
En cuanto a las limitaciones, las reconocemos explícitamente: un solo tipo de documento, un corpus modesto de 45 páginas, overfitting al subconjunto de 5 páginas, y el parámetro text_det_unclip_ratio sin explorar. Estas limitaciones son, a su vez, líneas claras de trabajo futuro."
**Tips:**
- Number the contributions clearly — the tribunal is evaluating these