Files
sergio 5351d4a57b
Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
pdf
2026-04-21 20:46:05 +02:00

1.1 KiB

Slide 13 — Hyperparameter Analysis (Correlations) (~1 minute)

What to say:

"Aquí vemos las correlaciones de Pearson y la importancia relativa de cada hiperparámetro de forma visual.

En el gráfico de correlación, los valores positivos — como use_doc_unwarping con +0.88 — indican que aumentar el parámetro incrementa el CER, es decir, empeora el rendimiento. Los valores negativos — como use_doc_orientation_classify con -0.71 — indican que activarlos reduce el error.

En el gráfico de importancia relativa, se confirma la jerarquía: los parámetros booleanos — las decisiones de arquitectura del pipeline — acumulan la mayor parte de la varianza explicada, mientras que los umbrales numéricos contribuyen de forma secundaria.

Esto tiene una implicación práctica directa: al optimizar un sistema OCR, primero hay que decidir correctamente qué módulos activar, y solo después ajustar los umbrales de sensibilidad."

Tips:

  • Point to specific bars in the charts as you mention each parameter
  • Keep it visual — let the charts speak
  • The practical implication at the end is important for the tribunal