Objetivos
Objetivo general: Optimizar PaddleOCR para documentos académicos en español alcanzando un CER < 2% sin fine-tuning del modelo base.
- OE1: Comparar tres motores OCR open-source (EasyOCR, PaddleOCR, DocTR)
- OE2: Preparar dataset de evaluación de 45 páginas con ground truth
- OE3: Identificar hiperparámetros críticos mediante análisis de correlación
- OE4: Ejecutar 64 trials de optimización con Ray Tune + Optuna
- OE5: Validar la configuración optimizada frente al baseline