Files
MastersThesis/thesis_output/presentation/slides/09_script.md
sergio 569a7bca4a
Some checks failed
build_docker / essential (push) Successful in 0s
build_docker / build_paddle_ocr (push) Failing after 4m7s
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
build_docker / build_easyocr (push) Has been cancelled
plain image manifests
2026-04-21 20:54:59 +02:00

1.8 KiB

Slide 9 — Search Space: 7 Hyperparameters (~1.5 minutes)

What to say:

"Ahora entramos en el corazón del trabajo: el espacio de búsqueda. Definimos 7 hiperparámetros de PaddleOCR.

Tres son booleanos — decisiones arquitectónicas que activan o desactivan módulos del pipeline. textline_orientation controla la detección de orientación de líneas de texto. use_doc_orientation_classify activa la clasificación de orientación del documento. Y use_doc_unwarping controla la corrección de deformaciones.

Tres son continuos — umbrales numéricos que ajustan la sensibilidad. text_det_thresh es el umbral de binarización, con rango entre 0.01 y 0.50. text_det_box_thresh controla la confianza de las cajas de texto. Y text_rec_score_thresh filtra los resultados del reconocedor.

El séptimo, text_det_unclip_ratio, se fijó en 0.0 basándonos en pruebas preliminares.

Lo interesante es que los 3 parámetros booleanos generan solo 8 combinaciones posibles, pero como veremos, son los que más impactan en el rendimiento.

Para explorar este espacio utilizamos el algoritmo TPE — Tree-structured Parzen Estimator — una técnica de optimización bayesiana. A diferencia de grid search o random search, TPE construye un modelo probabilístico que aprende de los ensayos anteriores y propone configuraciones cada vez más prometedoras. Es un ejemplo de SMBO — Sequential Model-Based Optimization — donde cada nuevo ensayo está informado por los resultados previos. Esto permite explorar eficientemente un espacio mixto discreto-continuo con solo 64 ensayos y 2 workers concurrentes."

Tips:

  • This is technical — slow down and let the audience absorb
  • Point to the table for each parameter
  • Emphasize the boolean vs continuous distinction — it's a key finding
  • Reference the optimization cycle diagram