Generation test
This commit is contained in:
@@ -40,37 +40,18 @@ Este capítulo establece los objetivos del trabajo siguiendo la metodología SMA
|
||||
|
||||
|
||||
```mermaid
|
||||
|
||||
flowchart TD
|
||||
A["Fase 1: Preparación del Dataset<br/>
|
||||
• Conversión PDF → Imágenes (300 DPI)<br/>
|
||||
• Extracción de texto de referencia (PyMuPDF)<br/>
|
||||
• Estructura: carpetas img/ y txt/ pareadas"]
|
||||
|
||||
B["Fase 2: Benchmark Comparativo<br/>
|
||||
• Evaluación de EasyOCR, PaddleOCR, DocTR<br/>
|
||||
• Métricas: CER, WER<br/>
|
||||
• Selección del modelo base"]
|
||||
|
||||
C["Fase 3: Definición del Espacio de Búsqueda<br/>
|
||||
• Identificación de hiperparámetros configurables<br/>
|
||||
• Definición de rangos y distribuciones<br/>
|
||||
• Configuración de Ray Tune + Optuna"]
|
||||
|
||||
D["Fase 4: Optimización de Hiperparámetros<br/>
|
||||
• Ejecución de 64 trials con Ray Tune<br/>
|
||||
• Paralelización (2 trials concurrentes)<br/>
|
||||
• Registro de métricas y configuraciones"]
|
||||
|
||||
E["Fase 5: Validación y Análisis<br/>
|
||||
• Comparación baseline vs optimizado<br/>
|
||||
• Análisis de correlaciones<br/>
|
||||
• Documentación de resultados"]
|
||||
|
||||
A --> B --> C --> D --> E
|
||||
|
||||
flowchart LR
|
||||
A["Fase 1<br/>Dataset"] --> B["Fase 2<br/>Benchmark"] --> C["Fase 3<br/>Espacio"] --> D["Fase 4<br/>Optimización"] --> E["Fase 5<br/>Validación"]
|
||||
```
|
||||
|
||||
**Descripción de las fases:**
|
||||
|
||||
- **Fase 1 - Preparación del Dataset**: Conversión PDF a imágenes (300 DPI), extracción de ground truth con PyMuPDF
|
||||
- **Fase 2 - Benchmark Comparativo**: Evaluación de EasyOCR, PaddleOCR, DocTR con métricas CER/WER
|
||||
- **Fase 3 - Espacio de Búsqueda**: Identificación de hiperparámetros y configuración de Ray Tune + Optuna
|
||||
- **Fase 4 - Optimización**: Ejecución de 64 trials con paralelización (2 concurrentes)
|
||||
- **Fase 5 - Validación**: Comparación baseline vs optimizado, análisis de correlaciones
|
||||
|
||||
### Fase 1: Preparación del Dataset
|
||||
|
||||
#### Fuente de Datos
|
||||
|
||||
Reference in New Issue
Block a user