autogen test

This commit is contained in:
2025-12-16 00:07:00 +01:00
parent 5862a69ac2
commit f22ae02ed5
7 changed files with 149 additions and 147 deletions

View File

@@ -1,10 +1,10 @@
# 5. Conclusiones y trabajo futuro
# Conclusiones y trabajo futuro
Este capítulo resume las principales conclusiones del trabajo, evalúa el grado de cumplimiento de los objetivos planteados y propone líneas de trabajo futuro que permitirían ampliar y profundizar los resultados obtenidos.
## 5.1. Conclusiones
## Conclusiones
### 5.1.1. Conclusiones Generales
### Conclusiones Generales
Este Trabajo Fin de Máster ha demostrado que es posible mejorar significativamente el rendimiento de sistemas OCR preentrenados mediante optimización sistemática de hiperparámetros, sin requerir fine-tuning ni recursos GPU dedicados.
@@ -14,7 +14,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|---------|----------|-----------|
| CER | < 2% | **1.49%** |
### 5.1.2. Conclusiones Específicas
### Conclusiones Específicas
**Respecto a OE1 (Comparativa de soluciones OCR)**:
- Se evaluaron tres soluciones OCR de código abierto: EasyOCR, PaddleOCR (PP-OCRv5) y DocTR
@@ -41,7 +41,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
- La mejora obtenida fue del 80.9% en reducción del CER (7.78% → 1.49%)
- La precisión de caracteres alcanzó el 98.51%
### 5.1.3. Hallazgos Clave
### Hallazgos Clave
1. **Arquitectura sobre umbrales**: Un único parámetro booleano (`textline_orientation`) tiene más impacto que todos los umbrales continuos combinados.
@@ -51,7 +51,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
4. **Optimización sin fine-tuning**: Se puede mejorar significativamente el rendimiento de modelos preentrenados mediante ajuste de hiperparámetros de inferencia.
### 5.1.4. Contribuciones del Trabajo
### Contribuciones del Trabajo
1. **Metodología reproducible**: Se documenta un proceso completo de optimización de hiperparámetros OCR con Ray Tune + Optuna.
@@ -61,7 +61,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
4. **Código fuente**: Todo el código está disponible en el repositorio GitHub para reproducción y extensión.
### 5.1.5. Limitaciones del Trabajo
### Limitaciones del Trabajo
1. **Tipo de documento único**: Los experimentos se realizaron únicamente sobre documentos académicos de UNIR. La generalización a otros tipos de documentos requiere validación adicional.
@@ -73,9 +73,9 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
5. **Parámetro no explorado**: `text_det_unclip_ratio` permaneció fijo en 0.0 durante todo el experimento.
## 5.2. Líneas de trabajo futuro
## Líneas de trabajo futuro
### 5.2.1. Extensiones Inmediatas
### Extensiones Inmediatas
1. **Validación cruzada**: Evaluar la configuración óptima en otros tipos de documentos en español (facturas, formularios, textos manuscritos).
@@ -85,7 +85,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
4. **Evaluación con GPU**: Medir tiempos de inferencia con aceleración GPU.
### 5.2.2. Líneas de Investigación
### Líneas de Investigación
1. **Transfer learning de hiperparámetros**: Investigar si las configuraciones óptimas para un tipo de documento transfieren a otros dominios.
@@ -95,7 +95,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
4. **Comparación con fine-tuning**: Cuantificar la brecha de rendimiento entre optimización de hiperparámetros y fine-tuning real.
### 5.2.3. Aplicaciones Prácticas
### Aplicaciones Prácticas
1. **Herramienta de configuración automática**: Desarrollar una herramienta que determine automáticamente la configuración óptima para un nuevo tipo de documento.
@@ -103,7 +103,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
3. **Benchmark público**: Publicar un benchmark de OCR para documentos en español que facilite la comparación de soluciones.
### 5.2.4. Reflexión Final
### Reflexión Final
Este trabajo demuestra que, en un contexto de recursos limitados donde el fine-tuning de modelos de deep learning no es viable, la optimización de hiperparámetros representa una alternativa práctica y efectiva para mejorar sistemas OCR.