"Este es probablemente el hallazgo más importante del trabajo: no todos los hiperparámetros contribuyen igual, y hay una jerarquía clara de impacto.
El parámetro más influyente es use_doc_unwarping, con una correlación de +0.88 con el CER. Esto significa que activarlo PERJUDICA el rendimiento. ¿Por qué? Porque aplica una corrección de deformaciones diseñada para documentos escaneados o fotografiados, que es innecesaria y contraproducente en PDFs digitales.
El segundo es use_doc_orientation_classify, con correlación -0.71. Activarlo mejora significativamente la detección de orientación en documentos con layouts complejos.
El tercero es textline_orientation, con correlación -0.54. Es crítico para documentos con mezcla de orientaciones de texto.
Los umbrales numéricos tienen un impacto menor, con correlaciones de hasta -0.43.
La conclusión clave es que las decisiones arquitectónicas — los booleanos — dominan sobre los ajustes finos numéricos. Esto constituye una forma de descubrimiento de conocimiento automatizado sobre el comportamiento del modelo en inferencia: la optimización bayesiana no solo encontró la mejor configuración, sino que reveló la estructura interna de cómo los hiperparámetros interactúan y afectan al rendimiento.
Sin una exploración sistemática de 64 ensayos con optimización bayesiana, estas relaciones habrían permanecido ocultas. Este tipo de análisis es una contribución directa al entendimiento de los pipelines de OCR basados en redes neuronales."