Files
MastersThesis/thesis_output/presentation/slides/16_script.md
sergio 5351d4a57b
Some checks failed
build_docker / essential (push) Successful in 1s
build_docker / build_paddle_ocr (push) Failing after 4m34s
build_docker / build_easyocr (push) Has been cancelled
build_docker / build_easyocr_gpu (push) Has been cancelled
build_docker / build_doctr (push) Has been cancelled
build_docker / build_doctr_gpu (push) Has been cancelled
build_docker / build_raytune (push) Has been cancelled
build_docker / build_paddle_ocr_gpu (push) Has been cancelled
pdf
2026-04-21 20:46:05 +02:00

17 lines
1.0 KiB
Markdown

# Slide 16 — Optimal Configuration (~1 minute)
**What to say:**
"Esta es la configuración óptima encontrada — el resultado tangible del trabajo.
Los dos hallazgos más importantes a nivel de configuración: textline_orientation y use_doc_orientation_classify deben estar activados — son críticos para documentos con layouts complejos. Y use_doc_unwarping debe estar desactivado — es un procesamiento innecesario para PDFs digitales que introduce ruido.
En cuanto a los umbrales numéricos: text_det_thresh con un valor bajo de 0.046 permite capturar más regiones de texto, reduciendo omisiones. text_det_box_thresh en 0.486 y text_rec_score_thresh en 0.566 proporcionan un equilibrio entre precisión y recall.
Esta configuración es directamente aplicable a otros documentos académicos en español con layouts similares, y puede servir como punto de partida para la optimización en otros dominios documentales."
**Tips:**
- Point to the code block
- Highlight the key decisions: True, True, False
- "Directamente aplicable" — emphasize practical value