1.0 KiB
Slide 16 — Optimal Configuration (~1 minute)
What to say:
"Esta es la configuración óptima encontrada — el resultado tangible del trabajo.
Los dos hallazgos más importantes a nivel de configuración: textline_orientation y use_doc_orientation_classify deben estar activados — son críticos para documentos con layouts complejos. Y use_doc_unwarping debe estar desactivado — es un procesamiento innecesario para PDFs digitales que introduce ruido.
En cuanto a los umbrales numéricos: text_det_thresh con un valor bajo de 0.046 permite capturar más regiones de texto, reduciendo omisiones. text_det_box_thresh en 0.486 y text_rec_score_thresh en 0.566 proporcionan un equilibrio entre precisión y recall.
Esta configuración es directamente aplicable a otros documentos académicos en español con layouts similares, y puede servir como punto de partida para la optimización en otros dominios documentales."
Tips:
- Point to the code block
- Highlight the key decisions: True, True, False
- "Directamente aplicable" — emphasize practical value