Files
MastersThesis/thesis_output/presentation/slides/12_script.md
sergio 5351d4a57b
Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
pdf
2026-04-21 20:46:05 +02:00

1.5 KiB

Slide 12 — Key Finding: Hyperparameter Impact Hierarchy (~1.5 minutes)

What to say:

"Este es probablemente el hallazgo más importante del trabajo: no todos los hiperparámetros contribuyen igual, y hay una jerarquía clara de impacto.

El parámetro más influyente es use_doc_unwarping, con una correlación de +0.88 con el CER. Esto significa que activarlo PERJUDICA el rendimiento. ¿Por qué? Porque aplica una corrección de deformaciones diseñada para documentos escaneados o fotografiados, que es innecesaria y contraproducente en PDFs digitales.

El segundo es use_doc_orientation_classify, con correlación -0.71. Activarlo mejora significativamente la detección de orientación en documentos con layouts complejos.

El tercero es textline_orientation, con correlación -0.54. Es crítico para documentos con mezcla de orientaciones de texto.

Los umbrales numéricos tienen un impacto menor, con correlaciones de hasta -0.43.

La conclusión clave es que las decisiones arquitectónicas — los booleanos — dominan sobre los ajustes finos numéricos. Y sin una búsqueda sistemática de 64 ensayos, estas interacciones entre parámetros habrían permanecido desconocidas."

Tips:

  • This is your MAIN intellectual contribution — take your time
  • Emphasize the surprise: unwarping HURTS performance on digital PDFs
  • The hierarchy (architectural > numerical) is a generalizable insight
  • "Sin búsqueda sistemática..." drives home the value of the approach