20 lines
1.4 KiB
Markdown
20 lines
1.4 KiB
Markdown
|
|
# Slide 9 — Search Space: 7 Hyperparameters (~1.5 minutes)
|
||
|
|
|
||
|
|
**What to say:**
|
||
|
|
|
||
|
|
"Ahora entramos en el corazón del trabajo: el espacio de búsqueda. Definimos 7 hiperparámetros de PaddleOCR.
|
||
|
|
|
||
|
|
Tres son booleanos — decisiones arquitectónicas que activan o desactivan módulos del pipeline. textline_orientation controla la detección de orientación de líneas de texto. use_doc_orientation_classify activa la clasificación de orientación del documento. Y use_doc_unwarping controla la corrección de deformaciones.
|
||
|
|
|
||
|
|
Tres son continuos — umbrales numéricos que ajustan la sensibilidad. text_det_thresh es el umbral de binarización, con rango entre 0.01 y 0.50. text_det_box_thresh controla la confianza de las cajas de texto. Y text_rec_score_thresh filtra los resultados del reconocedor.
|
||
|
|
|
||
|
|
El séptimo, text_det_unclip_ratio, se fijó en 0.0 basándonos en pruebas preliminares.
|
||
|
|
|
||
|
|
Lo interesante es que los 3 parámetros booleanos generan solo 8 combinaciones posibles, pero como veremos, son los que más impactan en el rendimiento. El algoritmo TPE de Optuna explora este espacio mixto discreto-continuo de forma inteligente con 64 ensayos y 2 workers concurrentes."
|
||
|
|
|
||
|
|
**Tips:**
|
||
|
|
- This is technical — slow down and let the audience absorb
|
||
|
|
- Point to the table for each parameter
|
||
|
|
- Emphasize the boolean vs continuous distinction — it's a key finding
|
||
|
|
- Reference the optimization cycle diagram
|