pdf
Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled

This commit is contained in:
2026-04-21 20:46:05 +02:00
parent 9c59ff0f6d
commit 5351d4a57b
23 changed files with 921 additions and 210 deletions

View File

@@ -0,0 +1,16 @@
# Slide 16 — Optimal Configuration (~1 minute)
**What to say:**
"Esta es la configuración óptima encontrada — el resultado tangible del trabajo.
Los dos hallazgos más importantes a nivel de configuración: textline_orientation y use_doc_orientation_classify deben estar activados — son críticos para documentos con layouts complejos. Y use_doc_unwarping debe estar desactivado — es un procesamiento innecesario para PDFs digitales que introduce ruido.
En cuanto a los umbrales numéricos: text_det_thresh con un valor bajo de 0.046 permite capturar más regiones de texto, reduciendo omisiones. text_det_box_thresh en 0.486 y text_rec_score_thresh en 0.566 proporcionan un equilibrio entre precisión y recall.
Esta configuración es directamente aplicable a otros documentos académicos en español con layouts similares, y puede servir como punto de partida para la optimización en otros dominios documentales."
**Tips:**
- Point to the code block
- Highlight the key decisions: True, True, False
- "Directamente aplicable" — emphasize practical value