Slides adjust
Some checks failed
build_docker / essential (push) Successful in 0s
build_docker / build_paddle_ocr (push) Failing after 3m44s
build_docker / build_easyocr (push) Failing after 9m25s
build_docker / build_paddle_ocr_gpu (push) Failing after 19m33s
build_docker / build_easyocr_gpu (push) Failing after 15m50s
build_docker / build_doctr (push) Failing after 10m55s
build_docker / build_raytune (push) Failing after 3m48s
build_docker / build_doctr_gpu (push) Failing after 14m29s

This commit is contained in:
2026-04-19 13:50:51 +02:00
parent 125b16c8f7
commit 9c59ff0f6d
4 changed files with 54 additions and 36 deletions

View File

@@ -16,15 +16,15 @@
</table>
<div style="display: flex; gap: 8px; margin-top: 8px; font-size: 0.5em;">
<div style="flex:1; background: #FFF3E0; border-radius: 6px; padding: 6px 10px; line-height: 1.35;">
<strong style="color:#E65100;">Discretos / Booleanos (3)</strong> <span style="color:#E65100; font-weight: 700;">True | False</span><br>
<strong style="color:#E65100;">Discretos / Booleanos (3):</strong> <span style="color:#E65100; font-weight: 700;">True | False</span><br>
Solo <strong>2 valores</strong> por parámetro (8 combinaciones). Interruptores on/off de módulos del pipeline. Decisiones <em>arquitecturales</em>: cambian <strong>qué</strong> se ejecuta.
</div>
<div style="flex:1; background: #E8F5E9; border-radius: 6px; padding: 6px 10px; line-height: 1.35;">
<strong style="color:#2E7D32;">Continuos / Float (3)</strong> <span style="color:#2E7D32; font-weight: 700;">0.01 ← → 0.99</span><br>
<strong style="color:#2E7D32;">Continuos / Float (3):</strong> <span style="color:#2E7D32; font-weight: 700;">0.01 ← → 0.99</span><br>
Valores reales muestreados uniformemente. <strong>Infinitos valores</strong>, grid search inviable. Ajustan <em>sensibilidad</em> de detección y reconocimiento.
</div>
<div style="flex:0.5; background: var(--unir-gray); border-radius: 6px; padding: 6px 10px; line-height: 1.35;">
<strong style="color:#888;">Fijo (1)</strong> <span style="color:#888; font-weight: 700;">0.0</span><br>
<strong style="color:#888;">Fijo (1):</strong> <span style="color:#888; font-weight: 700;">0.0</span><br>
Constante en todos los trials. Trabajo futuro.
</div>
</div>

View File

@@ -1,20 +1,23 @@
<section data-chart="textline">
<h2>Hallazgo Clave: <code>textline_orientation</code></h2>
<section data-chart="impact">
<h2>Hallazgo: Jerarquía de Impacto de Hiperparámetros</h2>
<div class="two-columns">
<div class="chart-container">
<canvas id="chartTextline"></canvas>
<canvas id="chartImpact"></canvas>
</div>
<div>
<div class="metric-card" style="width:100%; margin-bottom: 15px;">
<div class="number success" style="font-size: 2em;">-63.2%</div>
<div class="label" style="font-size:0.75em;">Reducción en CER</div>
<div class="metric-card" style="width:100%; margin-bottom: 12px;">
<div class="number success" style="font-size: 1.8em;">6 parámetros</div>
<div class="label" style="font-size:0.7em;">contribuyen al resultado óptimo</div>
</div>
<ul class="compact-list">
<li>Un <strong>único parámetro booleano</strong> tiene mayor impacto que todos los umbrales numéricos combinados</li>
<li><strong>Decisiones arquitecturales</strong> &gt; ajustes numéricos finos</li>
<li>Crítico para documentos con <strong>layouts complejos</strong> (índices, listas, encabezados)</li>
<li>52 de 64 trials (81%) lo activaron automáticamente (Optuna aprendió rápido)</li>
<li><strong><code>use_doc_unwarping</code></strong> (correlación +0.88): activarlo <strong>perjudica</strong> en PDFs digitales</li>
<li><strong><code>use_doc_orient_classify</code></strong> (correlación -0.71): mejora la orientación en documentos complejos</li>
<li><strong><code>textline_orientation</code></strong> (correlación -0.54): crítico para layouts mixtos</li>
<li><strong>Umbrales numéricos</strong> aportan ajuste fino adicional (hasta -0.43 correlación)</li>
</ul>
<div class="highlight-box" style="font-size:0.60em; margin-top:10px;">
<strong>Conclusión:</strong> Sin búsqueda sistemática de 64 trials, estas interacciones entre parámetros permanecerían desconocidas. La optimización conjunta es lo que logra CER &lt; 1%.
</div>
</div>
</div>
</section>

View File

@@ -17,7 +17,7 @@
<div>
<h3 style="font-size:0.8em;">Insights clave</h3>
<ul class="compact-list">
<li class="fragment fade-up"><strong><code>textline_orientation = True</code></strong>: Parámetro más impactante (-63.2% CER)</li>
<li class="fragment fade-up"><strong>Optimización conjunta</strong>: la búsqueda sistemática identificó interacciones críticas entre 6 parámetros</li>
<li class="fragment fade-up"><strong><code>use_doc_unwarping = False</code></strong>: Procesamiento innecesario para PDFs digitales</li>
<li class="fragment fade-up"><strong><code>text_det_thresh</code> bajo</strong>: Captura más regiones de texto, reduce omisiones</li>
<li class="fragment fade-up"><strong>Parámetros booleanos</strong> dominan sobre umbrales numéricos</li>