Files
MastersThesis/thesis_output/presentation/slides/05_script.md
sergio 5351d4a57b
Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
pdf
2026-04-21 20:46:05 +02:00

1.2 KiB

Slide 5 — Objectives (~1.5 minutes)

What to say:

"Nuestro objetivo general es optimizar PaddleOCR para documentos académicos en español, alcanzando un CER — Character Error Rate — inferior al 2%, sin modificar el modelo base.

Para conseguirlo, definimos cinco objetivos específicos, todos ellos SMART.

Primero, OE1: realizar una comparativa de tres motores OCR de código abierto — EasyOCR, PaddleOCR y DocTR — para seleccionar el más adecuado.

OE2: preparar un dataset estructurado de 45 páginas con ground truth extraído automáticamente.

OE3: identificar los hiperparámetros críticos mediante análisis de correlación de Pearson.

OE4: ejecutar 64 ensayos automatizados de optimización usando Ray Tune con el algoritmo Optuna TPE.

Y OE5: validar la configuración optimizada contra el baseline en el dataset completo.

Como verán más adelante, todos estos objetivos se cumplieron, y el objetivo de CER menor al 2% se superó ampliamente en el mejor ensayo."

Tips:

  • Don't rush through the objectives — the tribunal wants to hear them clearly
  • Emphasize "SMART" briefly — it shows methodological rigor
  • The anticipation of results ("como verán más adelante") keeps interest