Docs aligment on latest metrics.

2026-01-19 13:41:07 +01:00
parent 8bc3b38d46
commit 316ace4d51
11 changed files with 329 additions and 58 deletions
--- a/docs/metrics/metrics.md
+++ b/docs/metrics/metrics.md
@@ -55,6 +55,21 @@ Para un proyecto de investigación con múltiples iteraciones de ajuste de hiper

 > **Ganador:** PaddleOCR (Mobile) - Mejor precisión (7.76% CER) con velocidad competitiva.

+## Fases Experimentales
+
+Este documento presenta resultados de dos fases experimentales distintas realizadas durante el desarrollo del TFM. La primera fase corresponde a la optimización de hiperparámetros utilizando Ray Tune, ejecutada en CPU debido a las limitaciones de hardware iniciales. La segunda fase corresponde a la validación práctica con aceleración GPU para evaluar la viabilidad en escenarios de producción.
+
+**Tabla.** *Fases experimentales y sus características.*
+
+| Fase | Dataset | Hardware | Resultado Principal |
+|------|---------|----------|---------------------|
+| Optimización (CPU) | 24 páginas | CPU | CER: 7.78% → **1.49%** (80.9% mejora) |
+| Validación (GPU) | 45 páginas | RTX 3060 | CER: 7.76% baseline, 0.55s/página |
+
+*Fuente: Elaboración propia.*
+
+La fase de optimización representa el **resultado principal del TFM** (CER 1.49%, precisión 98.51%). La fase de validación GPU confirma la viabilidad práctica del enfoque, demostrando una aceleración de 126x respecto a CPU.
+
 ## Comparación de Servicios OCR

 ### Comparación de Precisión (CER - menor es mejor)
@@ -96,6 +111,22 @@ flowchart LR
 3. **EasyOCR**: El más lento (3.8x más lento que PaddleOCR) con precisión intermedia
 4. **Eficiencia VRAM**: PaddleOCR Mobile usa solo 0.06 GB

+## Configuración de Modelos
+
+| Servicio | Detección | Reconocimiento | ¿Correcto para Español? |
+|----------|-----------|----------------|-------------------------|
+| **PaddleOCR** | PP-OCRv5_mobile_det | PP-OCRv5_mobile_rec | Sí |
+| **DocTR** | db_resnet50 | crnn_vgg16_bn | No (entrenado en inglés/francés) |
+| **EasyOCR** | CRAFT | latin_g2.pth | Sí |
+
+### Notas sobre Modelos
+
+- **PaddleOCR**: Modelos server más precisos disponibles pero requieren >5.3 GB VRAM (OOM en RTX 3060)
+- **DocTR**: Se probó modelo `parseq` como alternativa, resultó 2% peor CER y 2x más lento. El problema de diacríticos es de datos de entrenamiento, no de arquitectura
+- **EasyOCR**: Modelo `latin_g2.pth` es correcto. Los problemas son del detector CRAFT, no del reconocimiento
+
+> **Conclusión sobre Fine-tuning:** Para documentos en español, **usar PaddleOCR directamente**. El fine-tuning de DocTR/EasyOCR no se justifica dado que PaddleOCR ya ofrece 31-36% mejor precisión sin configuración adicional.
+
 ## Análisis de Errores (del debugset)

 ### PaddleOCR (Mejor - 7.76% CER)