unir/MastersThesis

Fork 0

Files

sergio 569a7bca4a

build_docker / essential (push) Successful in 0s

Details

build_docker / build_paddle_ocr (push) Failing after 4m7s

Details

build_docker / build_easyocr_gpu (push) Has been cancelled

Details

build_docker / build_doctr (push) Has been cancelled

Details

build_docker / build_doctr_gpu (push) Has been cancelled

Details

build_docker / build_raytune (push) Has been cancelled

Details

build_docker / build_paddle_ocr_gpu (push) Has been cancelled

Details

build_docker / build_easyocr (push) Has been cancelled

Details

plain image manifests

2026-04-21 20:54:59 +02:00

1.6 KiB

Raw Blame History

Slide 4 — Problem Statement (~1.5 minutes)

What to say:

"La pregunta central de este trabajo es: ¿Se pueden mejorar modelos OCR preentrenados de forma significativa para documentos en español mediante optimización sistemática de hiperparámetros de inferencia?

Es importante entender que el fine-tuning y la optimización de hiperparámetros no son alternativas excluyentes — son capas complementarias de optimización. El fine-tuning modifica los pesos del modelo. La HPO optimiza la configuración del pipeline de inferencia. Son problemas de optimización distintos que actúan en niveles diferentes.

Dicho esto, la tabla muestra las diferencias prácticas. El fine-tuning requiere miles de imágenes etiquetadas, GPUs de alta memoria, días o semanas de entrenamiento, y alta experiencia en ML. La optimización de hiperparámetros necesita solo un subconjunto de validación, funciona con GPUs de consumo, se ejecuta en minutos, y el riesgo es limitado.

Lo que este trabajo investiga es cuánto rendimiento latente existe en la capa de configuración de inferencia — sin tocar los pesos del modelo. Si la ganancia es significativa, como demostraremos, esto tiene implicaciones directas para el despliegue práctico de modelos OCR: cualquier organización puede mejorar sus resultados antes de considerar siquiera el fine-tuning."

Tips:

Emphasize "capas complementarias" — this is the key reframing, not "cheap alternative"
"Rendimiento latente en la capa de inferencia" — the core scientific question
The practical implication (any organization can do this) comes naturally at the end

1.6 KiB Raw Blame History

Slide 4 — Problem Statement (~1.5 minutes)

1.6 KiB

Raw Blame History