14 lines
960 B
HTML
14 lines
960 B
HTML
|
|
<section>
|
||
|
|
<h2>Objetivos</h2>
|
||
|
|
<div class="highlight-box" style="margin-bottom: 15px;">
|
||
|
|
<strong>Objetivo general:</strong> Optimizar PaddleOCR para documentos académicos en español alcanzando un <strong>CER < 2%</strong> sin fine-tuning del modelo base.
|
||
|
|
</div>
|
||
|
|
<ul class="obj-list">
|
||
|
|
<li class="done fragment fade-up"><strong>OE1:</strong> Comparar tres motores OCR open-source (EasyOCR, PaddleOCR, DocTR)</li>
|
||
|
|
<li class="done fragment fade-up"><strong>OE2:</strong> Preparar dataset de evaluación de 45 páginas con ground truth</li>
|
||
|
|
<li class="done fragment fade-up"><strong>OE3:</strong> Identificar hiperparámetros críticos mediante análisis de correlación</li>
|
||
|
|
<li class="done fragment fade-up"><strong>OE4:</strong> Ejecutar 64 trials de optimización con Ray Tune + Optuna</li>
|
||
|
|
<li class="done fragment fade-up"><strong>OE5:</strong> Validar la configuración optimizada frente al baseline</li>
|
||
|
|
</ul>
|
||
|
|
</section>
|