unir/MastersThesis

Fork 0

Files

sergio 5351d4a57b

build_docker / essential (push) Successful in 1s

Details

build_docker / build_paddle_ocr (push) Failing after 4m34s

Details

build_docker / build_easyocr (push) Has been cancelled

Details

build_docker / build_easyocr_gpu (push) Has been cancelled

Details

build_docker / build_doctr (push) Has been cancelled

Details

build_docker / build_doctr_gpu (push) Has been cancelled

Details

build_docker / build_raytune (push) Has been cancelled

Details

build_docker / build_paddle_ocr_gpu (push) Has been cancelled

Details

pdf

2026-04-21 20:46:05 +02:00

1.3 KiB

Raw Blame History

Slide 4 — Problem Statement (~1.5 minutes)

What to say:

"Y esa es exactamente la pregunta central de este trabajo: ¿Se pueden mejorar modelos OCR preentrenados de forma significativa para documentos en español mediante optimización sistemática de hiperparámetros, sin necesidad de fine-tuning?

Para entender por qué esta pregunta es relevante, veamos la comparación. El fine-tuning requiere miles de imágenes etiquetadas, GPUs de alta memoria — más de 16 gigabytes —, puede tardar días o semanas, exige alta experiencia en machine learning, y conlleva riesgo de overfitting catastrófico.

En cambio, la optimización de hiperparámetros solo necesita un subconjunto de validación, funciona con CPUs o GPUs eficientes, se ejecuta en minutos u horas, requiere experiencia media, y el riesgo es limitado y reversible.

Es decir, estamos proponiendo una alternativa práctica y accesible, especialmente relevante para organizaciones con recursos limitados que necesitan mejorar su OCR sin invertir en infraestructura de entrenamiento."

Tips:

Read the central question with emphasis — it's the thesis statement
Use the comparison table as a visual anchor: point left (fine-tuning) vs right (HPO)
Stress "accesible" and "recursos limitados" — this is the practical value proposition

1.3 KiB Raw Blame History

Slide 4 — Problem Statement (~1.5 minutes)

1.3 KiB

Raw Blame History