Conclusiones

Contribuciones

1
Metodología reproducible para optimización de hiperparámetros OCR con código abierto
2
Análisis sistemático de hiperparámetros PaddleOCR con correlaciones Pearson
3
Configuración validada para documentos académicos en español (CER 0.79%)
4
Infraestructura dockerizada reproducible con imágenes públicas

Limitaciones

!
Un único tipo de documento (académico UNIR)
!
Corpus modesto (45 páginas)
!
Sobreajuste al subconjunto de optimización (5 páginas)
!
text_det_unclip_ratio no explorado