Slides adjust
Some checks failed
build_docker / essential (push) Successful in 0s
build_docker / build_paddle_ocr (push) Failing after 3m44s
build_docker / build_easyocr (push) Failing after 9m25s
build_docker / build_paddle_ocr_gpu (push) Failing after 19m33s
build_docker / build_easyocr_gpu (push) Failing after 15m50s
build_docker / build_doctr (push) Failing after 10m55s
build_docker / build_raytune (push) Failing after 3m48s
build_docker / build_doctr_gpu (push) Failing after 14m29s
Some checks failed
build_docker / essential (push) Successful in 0s
build_docker / build_paddle_ocr (push) Failing after 3m44s
build_docker / build_easyocr (push) Failing after 9m25s
build_docker / build_paddle_ocr_gpu (push) Failing after 19m33s
build_docker / build_easyocr_gpu (push) Failing after 15m50s
build_docker / build_doctr (push) Failing after 10m55s
build_docker / build_raytune (push) Failing after 3m48s
build_docker / build_doctr_gpu (push) Failing after 14m29s
This commit is contained in:
@@ -16,15 +16,15 @@
|
||||
</table>
|
||||
<div style="display: flex; gap: 8px; margin-top: 8px; font-size: 0.5em;">
|
||||
<div style="flex:1; background: #FFF3E0; border-radius: 6px; padding: 6px 10px; line-height: 1.35;">
|
||||
<strong style="color:#E65100;">Discretos / Booleanos (3)</strong> — <span style="color:#E65100; font-weight: 700;">True | False</span><br>
|
||||
<strong style="color:#E65100;">Discretos / Booleanos (3):</strong> <span style="color:#E65100; font-weight: 700;">True | False</span><br>
|
||||
Solo <strong>2 valores</strong> por parámetro (8 combinaciones). Interruptores on/off de módulos del pipeline. Decisiones <em>arquitecturales</em>: cambian <strong>qué</strong> se ejecuta.
|
||||
</div>
|
||||
<div style="flex:1; background: #E8F5E9; border-radius: 6px; padding: 6px 10px; line-height: 1.35;">
|
||||
<strong style="color:#2E7D32;">Continuos / Float (3)</strong> — <span style="color:#2E7D32; font-weight: 700;">0.01 ← → 0.99</span><br>
|
||||
<strong style="color:#2E7D32;">Continuos / Float (3):</strong> <span style="color:#2E7D32; font-weight: 700;">0.01 ← → 0.99</span><br>
|
||||
Valores reales muestreados uniformemente. <strong>Infinitos valores</strong>, grid search inviable. Ajustan <em>sensibilidad</em> de detección y reconocimiento.
|
||||
</div>
|
||||
<div style="flex:0.5; background: var(--unir-gray); border-radius: 6px; padding: 6px 10px; line-height: 1.35;">
|
||||
<strong style="color:#888;">Fijo (1)</strong> — <span style="color:#888; font-weight: 700;">0.0</span><br>
|
||||
<strong style="color:#888;">Fijo (1):</strong> <span style="color:#888; font-weight: 700;">0.0</span><br>
|
||||
Constante en todos los trials. Trabajo futuro.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
@@ -1,20 +1,23 @@
|
||||
<section data-chart="textline">
|
||||
<h2>Hallazgo Clave: <code>textline_orientation</code></h2>
|
||||
<section data-chart="impact">
|
||||
<h2>Hallazgo: Jerarquía de Impacto de Hiperparámetros</h2>
|
||||
<div class="two-columns">
|
||||
<div class="chart-container">
|
||||
<canvas id="chartTextline"></canvas>
|
||||
<canvas id="chartImpact"></canvas>
|
||||
</div>
|
||||
<div>
|
||||
<div class="metric-card" style="width:100%; margin-bottom: 15px;">
|
||||
<div class="number success" style="font-size: 2em;">-63.2%</div>
|
||||
<div class="label" style="font-size:0.75em;">Reducción en CER</div>
|
||||
<div class="metric-card" style="width:100%; margin-bottom: 12px;">
|
||||
<div class="number success" style="font-size: 1.8em;">6 parámetros</div>
|
||||
<div class="label" style="font-size:0.7em;">contribuyen al resultado óptimo</div>
|
||||
</div>
|
||||
<ul class="compact-list">
|
||||
<li>Un <strong>único parámetro booleano</strong> tiene mayor impacto que todos los umbrales numéricos combinados</li>
|
||||
<li><strong>Decisiones arquitecturales</strong> > ajustes numéricos finos</li>
|
||||
<li>Crítico para documentos con <strong>layouts complejos</strong> (índices, listas, encabezados)</li>
|
||||
<li>52 de 64 trials (81%) lo activaron automáticamente (Optuna aprendió rápido)</li>
|
||||
<li><strong><code>use_doc_unwarping</code></strong> (correlación +0.88): activarlo <strong>perjudica</strong> en PDFs digitales</li>
|
||||
<li><strong><code>use_doc_orient_classify</code></strong> (correlación -0.71): mejora la orientación en documentos complejos</li>
|
||||
<li><strong><code>textline_orientation</code></strong> (correlación -0.54): crítico para layouts mixtos</li>
|
||||
<li><strong>Umbrales numéricos</strong> aportan ajuste fino adicional (hasta -0.43 correlación)</li>
|
||||
</ul>
|
||||
<div class="highlight-box" style="font-size:0.60em; margin-top:10px;">
|
||||
<strong>Conclusión:</strong> Sin búsqueda sistemática de 64 trials, estas interacciones entre parámetros permanecerían desconocidas. La optimización conjunta es lo que logra CER < 1%.
|
||||
</div>
|
||||
</div>
|
||||
</div>
|
||||
</section>
|
||||
|
||||
@@ -17,7 +17,7 @@
|
||||
<div>
|
||||
<h3 style="font-size:0.8em;">Insights clave</h3>
|
||||
<ul class="compact-list">
|
||||
<li class="fragment fade-up"><strong><code>textline_orientation = True</code></strong>: Parámetro más impactante (-63.2% CER)</li>
|
||||
<li class="fragment fade-up"><strong>Optimización conjunta</strong>: la búsqueda sistemática identificó interacciones críticas entre 6 parámetros</li>
|
||||
<li class="fragment fade-up"><strong><code>use_doc_unwarping = False</code></strong>: Procesamiento innecesario para PDFs digitales</li>
|
||||
<li class="fragment fade-up"><strong><code>text_det_thresh</code> bajo</strong>: Captura más regiones de texto, reduce omisiones</li>
|
||||
<li class="fragment fade-up"><strong>Parámetros booleanos</strong> dominan sobre umbrales numéricos</li>
|
||||
|
||||
Reference in New Issue
Block a user