pdf
Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
This commit is contained in:
21
thesis_output/presentation/slides/12_script.md
Normal file
21
thesis_output/presentation/slides/12_script.md
Normal file
@@ -0,0 +1,21 @@
|
||||
# Slide 12 — Key Finding: Hyperparameter Impact Hierarchy (~1.5 minutes)
|
||||
|
||||
**What to say:**
|
||||
|
||||
"Este es probablemente el hallazgo más importante del trabajo: no todos los hiperparámetros contribuyen igual, y hay una jerarquía clara de impacto.
|
||||
|
||||
El parámetro más influyente es use_doc_unwarping, con una correlación de +0.88 con el CER. Esto significa que activarlo PERJUDICA el rendimiento. ¿Por qué? Porque aplica una corrección de deformaciones diseñada para documentos escaneados o fotografiados, que es innecesaria y contraproducente en PDFs digitales.
|
||||
|
||||
El segundo es use_doc_orientation_classify, con correlación -0.71. Activarlo mejora significativamente la detección de orientación en documentos con layouts complejos.
|
||||
|
||||
El tercero es textline_orientation, con correlación -0.54. Es crítico para documentos con mezcla de orientaciones de texto.
|
||||
|
||||
Los umbrales numéricos tienen un impacto menor, con correlaciones de hasta -0.43.
|
||||
|
||||
La conclusión clave es que las decisiones arquitectónicas — los booleanos — dominan sobre los ajustes finos numéricos. Y sin una búsqueda sistemática de 64 ensayos, estas interacciones entre parámetros habrían permanecido desconocidas."
|
||||
|
||||
**Tips:**
|
||||
- This is your MAIN intellectual contribution — take your time
|
||||
- Emphasize the surprise: unwarping HURTS performance on digital PDFs
|
||||
- The hierarchy (architectural > numerical) is a generalizable insight
|
||||
- "Sin búsqueda sistemática..." drives home the value of the approach
|
||||
Reference in New Issue
Block a user