Docs aligment on latest metrics.

2026-01-19 13:41:07 +01:00
parent 8bc3b38d46
commit 316ace4d51
11 changed files with 329 additions and 58 deletions
--- a/docs/04_desarrollo_especifico.md
+++ b/docs/04_desarrollo_especifico.md
@@ -1068,3 +1068,67 @@ Este capítulo ha presentado el desarrollo completo de la contribución:
 **Fuentes de datos:**
 - `src/raytune_paddle_subproc_results_20251207_192320.csv`: Resultados de 64 trials
 - `src/paddle_ocr_fine_tune_unir_raytune.ipynb`: Notebook principal del experimento
+
+### Validación con Aceleración GPU
+
+Para evaluar la viabilidad práctica del enfoque optimizado en escenarios de producción, se realizó una validación adicional utilizando aceleración GPU. Esta fase complementa los experimentos en CPU presentados anteriormente y demuestra la aplicabilidad del método cuando se dispone de hardware con capacidad de procesamiento paralelo.
+
+#### Configuración del Entorno GPU
+
+**Tabla 36.** *Especificaciones del entorno de validación GPU.*
+
+| Componente | Especificación |
+|------------|----------------|
+| GPU | NVIDIA GeForce RTX 3060 Laptop |
+| VRAM | 5.66 GB |
+| CUDA | 12.4 |
+| Sistema Operativo | Ubuntu 24.04.3 LTS |
+| Kernel | 6.14.0-37-generic |
+
+*Fuente: Elaboración propia.*
+
+El entorno de validación representa hardware de consumo típico para desarrollo de aplicaciones de machine learning, permitiendo evaluar el rendimiento en condiciones realistas de despliegue.
+
+#### Comparación CPU vs GPU
+
+Se evaluó el tiempo de procesamiento utilizando la configuración optimizada identificada en la fase anterior, comparando el rendimiento entre CPU y GPU.
+
+**Tabla 37.** *Rendimiento comparativo CPU vs GPU.*
+
+| Métrica | CPU | GPU (RTX 3060) | Factor de Aceleración |
+|---------|-----|----------------|----------------------|
+| Tiempo/Página | 69.4s | 0.55s | **126x** |
+| Dataset completo (45 páginas) | ~52 min | ~25 seg | **126x** |
+
+*Fuente: Elaboración propia a partir de experimentos.*
+
+La aceleración de 126x obtenida con GPU transforma la aplicabilidad práctica del sistema. Mientras que el procesamiento en CPU limita el uso a escenarios de procesamiento por lotes sin restricciones de tiempo, la velocidad con GPU habilita casos de uso interactivos y de tiempo real.
+
+#### Comparación de Modelos PaddleOCR
+
+PaddleOCR ofrece dos variantes de modelos: Mobile (optimizados para dispositivos con recursos limitados) y Server (mayor precisión a costa de mayor consumo de memoria). Se evaluó la viabilidad de ambas variantes en el hardware disponible.
+
+**Tabla 38.** *Comparación de modelos Mobile vs Server en RTX 3060.*
+
+| Modelo | VRAM Requerida | Resultado | Recomendación |
+|--------|----------------|-----------|---------------|
+| PP-OCRv5 Mobile | 0.06 GB | Funciona correctamente | ✓ Recomendado |
+| PP-OCRv5 Server | 5.3 GB | OOM en página 2 | ✗ Requiere >8 GB VRAM |
+
+*Fuente: Elaboración propia.*
+
+Los modelos Server, a pesar de ofrecer potencialmente mayor precisión, resultan inviables en hardware con VRAM limitada (≤6 GB) debido a errores de memoria (Out of Memory). Los modelos Mobile, con un consumo de memoria 88 veces menor, funcionan de manera estable y ofrecen rendimiento suficiente para el caso de uso evaluado.
+
+#### Conclusiones de la Validación GPU
+
+La validación con aceleración GPU permite extraer las siguientes conclusiones:
+
+1. **Aceleración significativa**: La GPU proporciona una aceleración de 126x sobre CPU, haciendo viable el procesamiento en tiempo real para aplicaciones interactivas.
+
+2. **Modelos Mobile recomendados**: Para hardware con VRAM limitada (≤6 GB), los modelos Mobile de PP-OCRv5 ofrecen el mejor balance entre precisión y recursos, funcionando de manera estable sin errores de memoria.
+
+3. **Viabilidad práctica**: Con GPU, el procesamiento de un documento completo (45 páginas) toma menos de 30 segundos, validando la aplicabilidad en entornos de producción donde el tiempo de respuesta es crítico.
+
+4. **Escalabilidad**: La arquitectura de microservicios dockerizados utilizada para la validación GPU facilita el despliegue horizontal, permitiendo escalar el procesamiento según demanda.
+
+Esta validación demuestra que la configuración optimizada mediante Ray Tune no solo mejora la precisión (CER: 7.78% → 1.49%) sino que, combinada con aceleración GPU, resulta prácticamente aplicable en escenarios de producción real.