Files
sergio 5351d4a57b
Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
pdf
2026-04-21 20:46:05 +02:00

1.0 KiB

Slide 16 — Optimal Configuration (~1 minute)

What to say:

"Esta es la configuración óptima encontrada — el resultado tangible del trabajo.

Los dos hallazgos más importantes a nivel de configuración: textline_orientation y use_doc_orientation_classify deben estar activados — son críticos para documentos con layouts complejos. Y use_doc_unwarping debe estar desactivado — es un procesamiento innecesario para PDFs digitales que introduce ruido.

En cuanto a los umbrales numéricos: text_det_thresh con un valor bajo de 0.046 permite capturar más regiones de texto, reduciendo omisiones. text_det_box_thresh en 0.486 y text_rec_score_thresh en 0.566 proporcionan un equilibrio entre precisión y recall.

Esta configuración es directamente aplicable a otros documentos académicos en español con layouts similares, y puede servir como punto de partida para la optimización en otros dominios documentales."

Tips:

  • Point to the code block
  • Highlight the key decisions: True, True, False
  • "Directamente aplicable" — emphasize practical value