autogen test
This commit is contained in:
@@ -1,10 +1,10 @@
|
||||
# 5. Conclusiones y trabajo futuro
|
||||
# Conclusiones y trabajo futuro
|
||||
|
||||
Este capítulo resume las principales conclusiones del trabajo, evalúa el grado de cumplimiento de los objetivos planteados y propone líneas de trabajo futuro que permitirían ampliar y profundizar los resultados obtenidos.
|
||||
|
||||
## 5.1. Conclusiones
|
||||
## Conclusiones
|
||||
|
||||
### 5.1.1. Conclusiones Generales
|
||||
### Conclusiones Generales
|
||||
|
||||
Este Trabajo Fin de Máster ha demostrado que es posible mejorar significativamente el rendimiento de sistemas OCR preentrenados mediante optimización sistemática de hiperparámetros, sin requerir fine-tuning ni recursos GPU dedicados.
|
||||
|
||||
@@ -14,7 +14,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
|---------|----------|-----------|
|
||||
| CER | < 2% | **1.49%** |
|
||||
|
||||
### 5.1.2. Conclusiones Específicas
|
||||
### Conclusiones Específicas
|
||||
|
||||
**Respecto a OE1 (Comparativa de soluciones OCR)**:
|
||||
- Se evaluaron tres soluciones OCR de código abierto: EasyOCR, PaddleOCR (PP-OCRv5) y DocTR
|
||||
@@ -41,7 +41,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
- La mejora obtenida fue del 80.9% en reducción del CER (7.78% → 1.49%)
|
||||
- La precisión de caracteres alcanzó el 98.51%
|
||||
|
||||
### 5.1.3. Hallazgos Clave
|
||||
### Hallazgos Clave
|
||||
|
||||
1. **Arquitectura sobre umbrales**: Un único parámetro booleano (`textline_orientation`) tiene más impacto que todos los umbrales continuos combinados.
|
||||
|
||||
@@ -51,7 +51,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
|
||||
4. **Optimización sin fine-tuning**: Se puede mejorar significativamente el rendimiento de modelos preentrenados mediante ajuste de hiperparámetros de inferencia.
|
||||
|
||||
### 5.1.4. Contribuciones del Trabajo
|
||||
### Contribuciones del Trabajo
|
||||
|
||||
1. **Metodología reproducible**: Se documenta un proceso completo de optimización de hiperparámetros OCR con Ray Tune + Optuna.
|
||||
|
||||
@@ -61,7 +61,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
|
||||
4. **Código fuente**: Todo el código está disponible en el repositorio GitHub para reproducción y extensión.
|
||||
|
||||
### 5.1.5. Limitaciones del Trabajo
|
||||
### Limitaciones del Trabajo
|
||||
|
||||
1. **Tipo de documento único**: Los experimentos se realizaron únicamente sobre documentos académicos de UNIR. La generalización a otros tipos de documentos requiere validación adicional.
|
||||
|
||||
@@ -73,9 +73,9 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
|
||||
5. **Parámetro no explorado**: `text_det_unclip_ratio` permaneció fijo en 0.0 durante todo el experimento.
|
||||
|
||||
## 5.2. Líneas de trabajo futuro
|
||||
## Líneas de trabajo futuro
|
||||
|
||||
### 5.2.1. Extensiones Inmediatas
|
||||
### Extensiones Inmediatas
|
||||
|
||||
1. **Validación cruzada**: Evaluar la configuración óptima en otros tipos de documentos en español (facturas, formularios, textos manuscritos).
|
||||
|
||||
@@ -85,7 +85,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
|
||||
4. **Evaluación con GPU**: Medir tiempos de inferencia con aceleración GPU.
|
||||
|
||||
### 5.2.2. Líneas de Investigación
|
||||
### Líneas de Investigación
|
||||
|
||||
1. **Transfer learning de hiperparámetros**: Investigar si las configuraciones óptimas para un tipo de documento transfieren a otros dominios.
|
||||
|
||||
@@ -95,7 +95,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
|
||||
4. **Comparación con fine-tuning**: Cuantificar la brecha de rendimiento entre optimización de hiperparámetros y fine-tuning real.
|
||||
|
||||
### 5.2.3. Aplicaciones Prácticas
|
||||
### Aplicaciones Prácticas
|
||||
|
||||
1. **Herramienta de configuración automática**: Desarrollar una herramienta que determine automáticamente la configuración óptima para un nuevo tipo de documento.
|
||||
|
||||
@@ -103,7 +103,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
|
||||
3. **Benchmark público**: Publicar un benchmark de OCR para documentos en español que facilite la comparación de soluciones.
|
||||
|
||||
### 5.2.4. Reflexión Final
|
||||
### Reflexión Final
|
||||
|
||||
Este trabajo demuestra que, en un contexto de recursos limitados donde el fine-tuning de modelos de deep learning no es viable, la optimización de hiperparámetros representa una alternativa práctica y efectiva para mejorar sistemas OCR.
|
||||
|
||||
|
||||
Reference in New Issue
Block a user