autogen test
This commit is contained in:
@@ -1,8 +1,8 @@
|
||||
# 3. Objetivos concretos y metodología de trabajo
|
||||
# Objetivos concretos y metodología de trabajo
|
||||
|
||||
Este capítulo establece los objetivos del trabajo siguiendo la metodología SMART (Doran, 1981) y describe la metodología experimental empleada para alcanzarlos. Se define un objetivo general y cinco objetivos específicos, todos ellos medibles y verificables.
|
||||
|
||||
## 3.1. Objetivo general
|
||||
## Objetivo general
|
||||
|
||||
> **Optimizar el rendimiento de PaddleOCR para documentos académicos en español mediante ajuste de hiperparámetros, alcanzando un CER inferior al 2% sin requerir fine-tuning del modelo ni recursos GPU dedicados.**
|
||||
|
||||
@@ -16,7 +16,7 @@ Este capítulo establece los objetivos del trabajo siguiendo la metodología SMA
|
||||
| **Relevante (R)** | El impacto es demostrable: mejora la extracción de texto en documentos académicos sin costes adicionales de infraestructura |
|
||||
| **Temporal (T)** | El plazo es un cuatrimestre, correspondiente al TFM |
|
||||
|
||||
## 3.2. Objetivos específicos
|
||||
## Objetivos específicos
|
||||
|
||||
### OE1: Comparar soluciones OCR de código abierto
|
||||
> **Evaluar el rendimiento base de EasyOCR, PaddleOCR y DocTR en documentos académicos en español, utilizando CER y WER como métricas, para seleccionar el modelo más prometedor.**
|
||||
@@ -33,9 +33,9 @@ Este capítulo establece los objetivos del trabajo siguiendo la metodología SMA
|
||||
### OE5: Validar la configuración optimizada
|
||||
> **Comparar el rendimiento de la configuración baseline versus la configuración optimizada sobre el dataset completo, documentando la mejora obtenida.**
|
||||
|
||||
## 3.3. Metodología del trabajo
|
||||
## Metodología del trabajo
|
||||
|
||||
### 3.3.1. Visión General
|
||||
### Visión General
|
||||
|
||||
|
||||
|
||||
@@ -71,7 +71,7 @@ flowchart TD
|
||||
|
||||
```
|
||||
|
||||
### 3.3.2. Fase 1: Preparación del Dataset
|
||||
### Fase 1: Preparación del Dataset
|
||||
|
||||
#### Fuente de Datos
|
||||
Se utilizaron documentos PDF académicos de UNIR (Universidad Internacional de La Rioja), específicamente las instrucciones para la elaboración del TFE del Máster en Inteligencia Artificial.
|
||||
@@ -124,7 +124,7 @@ class ImageTextDataset:
|
||||
# Retorna (PIL.Image, str)
|
||||
```
|
||||
|
||||
### 3.3.3. Fase 2: Benchmark Comparativo
|
||||
### Fase 2: Benchmark Comparativo
|
||||
|
||||
#### Modelos Evaluados
|
||||
|
||||
@@ -148,7 +148,7 @@ def evaluate_text(reference, prediction):
|
||||
}
|
||||
```
|
||||
|
||||
### 3.3.4. Fase 3: Espacio de Búsqueda
|
||||
### Fase 3: Espacio de Búsqueda
|
||||
|
||||
#### Hiperparámetros Seleccionados
|
||||
|
||||
@@ -190,7 +190,7 @@ tuner = tune.Tuner(
|
||||
)
|
||||
```
|
||||
|
||||
### 3.3.5. Fase 4: Ejecución de Optimización
|
||||
### Fase 4: Ejecución de Optimización
|
||||
|
||||
#### Arquitectura de Ejecución
|
||||
|
||||
@@ -232,7 +232,7 @@ Y retorna métricas en formato JSON:
|
||||
}
|
||||
```
|
||||
|
||||
### 3.3.6. Fase 5: Validación
|
||||
### Fase 5: Validación
|
||||
|
||||
#### Protocolo de Validación
|
||||
|
||||
@@ -241,7 +241,7 @@ Y retorna métricas en formato JSON:
|
||||
3. **Comparación**: Evaluación sobre las 24 páginas del dataset completo
|
||||
4. **Métricas reportadas**: CER, WER, tiempo de procesamiento
|
||||
|
||||
### 3.3.7. Entorno de Ejecución
|
||||
### Entorno de Ejecución
|
||||
|
||||
#### Hardware
|
||||
|
||||
@@ -263,7 +263,7 @@ Y retorna métricas en formato JSON:
|
||||
| Ray | 2.52.1 |
|
||||
| Optuna | 4.6.0 |
|
||||
|
||||
### 3.3.8. Limitaciones Metodológicas
|
||||
### Limitaciones Metodológicas
|
||||
|
||||
1. **Tamaño del dataset**: El dataset contiene 24 páginas de un único tipo de documento. Resultados pueden no generalizar a otros formatos.
|
||||
|
||||
@@ -273,7 +273,7 @@ Y retorna métricas en formato JSON:
|
||||
|
||||
4. **Parámetro fijo**: `text_det_unclip_ratio` quedó fijado en 0.0 durante todo el experimento por decisión de diseño inicial.
|
||||
|
||||
## 3.4. Resumen del capítulo
|
||||
## Resumen del capítulo
|
||||
|
||||
Este capítulo ha establecido:
|
||||
|
||||
|
||||
Reference in New Issue
Block a user