Configuración Óptima

config_optimizada = {
  "textline_orientation": True,  # CRÍTICO
  "use_doc_orientation_classify": True,
  "use_doc_unwarping": False,  # Innecesario
  "text_det_thresh": 0.0462,
  "text_det_box_thresh": 0.4862,
  "text_det_unclip_ratio": 0.0,
  "text_rec_score_thresh": 0.5658,
}

Insights clave

  • Optimización conjunta: la búsqueda sistemática identificó interacciones críticas entre 6 parámetros
  • use_doc_unwarping = False: Procesamiento innecesario para PDFs digitales
  • text_det_thresh bajo: Captura más regiones de texto, reduce omisiones
  • Parámetros booleanos dominan sobre umbrales numéricos
Esta configuración es directamente aplicable a otros documentos académicos en español con layouts similares.