Update generation

This commit is contained in:
2025-12-16 00:31:27 +01:00
parent 3b0f30d79b
commit 6608032f0c
13 changed files with 31 additions and 17 deletions

View File

@@ -18,6 +18,9 @@ El Reconocimiento Óptico de Caracteres (OCR) es el proceso de conversión de im
Los sistemas OCR modernos siguen típicamente un pipeline de dos etapas:
```mermaid
---
title: "Pipeline de un sistema OCR moderno"
---
flowchart LR
subgraph Input
A["Imagen de<br/>documento"]
@@ -43,8 +46,6 @@ flowchart LR
style D fill:#c8e6c9
```
*Figura 1. Pipeline típico de un sistema OCR moderno con etapas de detección y reconocimiento.*
1. **Detección de texto (Text Detection)**: Localización de regiones que contienen texto en la imagen. Las arquitecturas más utilizadas incluyen:
- EAST (Efficient and Accurate Scene Text Detector)
- CRAFT (Character Region Awareness for Text Detection)
@@ -165,6 +166,9 @@ Los métodos de HPO incluyen:
La combinación Ray Tune + Optuna permite búsquedas eficientes en espacios de alta dimensionalidad.
```mermaid
---
title: "Ciclo de optimización con Ray Tune y Optuna"
---
flowchart LR
A["Espacio de<br/>búsqueda"] --> B["Ray Tune<br/>Scheduler"]
B --> C["Trials<br/>paralelos"]
@@ -174,8 +178,6 @@ flowchart LR
F -->|"Nueva config"| B
```
*Figura 2. Ciclo de optimización de hiperparámetros con Ray Tune y Optuna.*
#### HPO en Sistemas OCR
La aplicación de HPO a sistemas OCR ha sido explorada principalmente en el contexto de:

View File

@@ -40,6 +40,9 @@ Este capítulo establece los objetivos del trabajo siguiendo la metodología SMA
```mermaid
---
title: "Fases de la metodología experimental"
---
flowchart LR
A["Fase 1<br/>Dataset"] --> B["Fase 2<br/>Benchmark"] --> C["Fase 3<br/>Espacio"] --> D["Fase 4<br/>Optimización"] --> E["Fase 5<br/>Validación"]
```
@@ -74,6 +77,9 @@ El script `prepare_dataset.ipynb` implementa:
#### Estructura del Dataset
```mermaid
---
title: "Estructura del dataset de evaluación"
---
flowchart LR
dataset["dataset/"] --> d0["0/"]
@@ -178,6 +184,9 @@ tuner = tune.Tuner(
Debido a incompatibilidades entre Ray y PaddleOCR en el mismo proceso, se implementó una arquitectura basada en subprocesos:
```mermaid
---
title: "Arquitectura de ejecución con subprocesos"
---
flowchart LR
A["Ray Tune (proceso principal)"]

View File

@@ -16,6 +16,9 @@ El repositorio incluye:
## A.2 Estructura del Repositorio
```mermaid
---
title: "Estructura del repositorio del proyecto"
---
flowchart LR
root["MastersThesis/"] --> docs["docs/"]
root --> src["src/"]
@@ -30,8 +33,6 @@ flowchart LR
src --> csv["raytune_results_*.csv"]
```
*Figura 8. Estructura del repositorio del proyecto.*
**Descripción de componentes:**
- **docs/**: Capítulos de la tesis en Markdown