25 lines
1.2 KiB
Markdown
25 lines
1.2 KiB
Markdown
|
|
# Slide 5 — Objectives (~1.5 minutes)
|
||
|
|
|
||
|
|
**What to say:**
|
||
|
|
|
||
|
|
"Nuestro objetivo general es optimizar PaddleOCR para documentos académicos en español, alcanzando un CER — Character Error Rate — inferior al 2%, sin modificar el modelo base.
|
||
|
|
|
||
|
|
Para conseguirlo, definimos cinco objetivos específicos, todos ellos SMART.
|
||
|
|
|
||
|
|
Primero, OE1: realizar una comparativa de tres motores OCR de código abierto — EasyOCR, PaddleOCR y DocTR — para seleccionar el más adecuado.
|
||
|
|
|
||
|
|
OE2: preparar un dataset estructurado de 45 páginas con ground truth extraído automáticamente.
|
||
|
|
|
||
|
|
OE3: identificar los hiperparámetros críticos mediante análisis de correlación de Pearson.
|
||
|
|
|
||
|
|
OE4: ejecutar 64 ensayos automatizados de optimización usando Ray Tune con el algoritmo Optuna TPE.
|
||
|
|
|
||
|
|
Y OE5: validar la configuración optimizada contra el baseline en el dataset completo.
|
||
|
|
|
||
|
|
Como verán más adelante, todos estos objetivos se cumplieron, y el objetivo de CER menor al 2% se superó ampliamente en el mejor ensayo."
|
||
|
|
|
||
|
|
**Tips:**
|
||
|
|
- Don't rush through the objectives — the tribunal wants to hear them clearly
|
||
|
|
- Emphasize "SMART" briefly — it shows methodological rigor
|
||
|
|
- The anticipation of results ("como verán más adelante") keeps interest
|