Docs aligment on latest metrics.
Some checks failed
build_docker / essential (pull_request) Successful in 1s
build_docker / build_gpu (pull_request) Has been cancelled
build_docker / build_easyocr (pull_request) Has been cancelled
build_docker / build_cpu (pull_request) Successful in 5m25s
build_docker / build_easyocr_gpu (pull_request) Has been cancelled
build_docker / build_doctr (pull_request) Has been cancelled
build_docker / build_doctr_gpu (pull_request) Has been cancelled
Some checks failed
build_docker / essential (pull_request) Successful in 1s
build_docker / build_gpu (pull_request) Has been cancelled
build_docker / build_easyocr (pull_request) Has been cancelled
build_docker / build_cpu (pull_request) Successful in 5m25s
build_docker / build_easyocr_gpu (pull_request) Has been cancelled
build_docker / build_doctr (pull_request) Has been cancelled
build_docker / build_doctr_gpu (pull_request) Has been cancelled
This commit is contained in:
41
README.md
41
README.md
@@ -113,6 +113,34 @@ MastersThesis/
|
||||
|
||||
---
|
||||
|
||||
## Rendimiento GPU
|
||||
|
||||
Se realizó una validación adicional con aceleración GPU para evaluar la viabilidad práctica del enfoque en escenarios de producción.
|
||||
|
||||
**Tabla.** *Comparación de rendimiento CPU vs GPU.*
|
||||
|
||||
| Métrica | CPU | GPU (RTX 3060) | Aceleración |
|
||||
|---------|-----|----------------|-------------|
|
||||
| Tiempo/Página | 69.4s | 0.55s | **126x** |
|
||||
| Dataset completo (45 páginas) | ~52 min | ~25 seg | **126x** |
|
||||
|
||||
*Fuente: Elaboración propia.*
|
||||
|
||||
### Recomendación de Modelos
|
||||
|
||||
**Tabla.** *Comparación de modelos PaddleOCR en RTX 3060.*
|
||||
|
||||
| Modelo | VRAM | Recomendación |
|
||||
|--------|------|---------------|
|
||||
| **PP-OCRv5 Mobile** | 0.06 GB | ✓ Recomendado |
|
||||
| PP-OCRv5 Server | 5.3 GB | ✗ Causa OOM en RTX 3060 |
|
||||
|
||||
*Fuente: Elaboración propia.*
|
||||
|
||||
**Conclusión:** Para hardware con VRAM limitada (≤6 GB), los modelos Mobile ofrecen el mejor balance entre precisión y recursos. La aceleración GPU hace viable el procesamiento en tiempo real.
|
||||
|
||||
---
|
||||
|
||||
## Requisitos
|
||||
|
||||
| Componente | Versión |
|
||||
@@ -252,12 +280,13 @@ python3 apply_content.py
|
||||
|
||||
## Trabajo Pendiente para Completar el TFM
|
||||
|
||||
### Contexto: Limitaciones de Hardware
|
||||
### Contexto: Hardware
|
||||
|
||||
Este trabajo adoptó la estrategia de **optimización de hiperparámetros** en lugar de **fine-tuning** debido a:
|
||||
- **Sin GPU dedicada**: Ejecución exclusivamente en CPU
|
||||
- **Tiempo de inferencia elevado**: ~69 segundos/página en CPU
|
||||
- **Fine-tuning inviable**: Entrenar modelos de deep learning sin GPU requeriría tiempos prohibitivos
|
||||
Este trabajo adoptó la estrategia de **optimización de hiperparámetros** en lugar de **fine-tuning** debido a que el fine-tuning de modelos OCR requiere datasets etiquetados extensos y tiempos de entrenamiento prohibitivos.
|
||||
|
||||
**Hardware utilizado:**
|
||||
- **Optimización (CPU)**: Los 64 trials de Ray Tune se ejecutaron en CPU (~69s/página)
|
||||
- **Validación (GPU)**: Se validó con RTX 3060 logrando 126x de aceleración (0.55s/página)
|
||||
|
||||
La optimización de hiperparámetros demostró ser una **alternativa efectiva** al fine-tuning, logrando una reducción del 80.9% en el CER sin reentrenar el modelo.
|
||||
|
||||
@@ -278,7 +307,7 @@ La optimización de hiperparámetros demostró ser una **alternativa efectiva**
|
||||
#### 2. Experimentación Adicional (Prioridad Media)
|
||||
- [ ] **Explorar `text_det_unclip_ratio`**: Este parámetro quedó fijado en 0.0. Incluirlo en el espacio de búsqueda podría mejorar resultados
|
||||
- [ ] **Comparativa con fine-tuning** (si se obtiene acceso a GPU): Cuantificar la brecha de rendimiento entre optimización de hiperparámetros y fine-tuning real
|
||||
- [ ] **Evaluación con GPU**: Medir tiempos de inferencia con aceleración GPU para escenarios de producción
|
||||
- [x] **Evaluación con GPU**: Validado con RTX 3060 - 126x más rápido que CPU (0.55s/página vs 69.4s/página)
|
||||
|
||||
#### 3. Documentación y Presentación (Prioridad Alta)
|
||||
- [ ] **Crear presentación**: Preparar slides para la defensa del TFM
|
||||
|
||||
Reference in New Issue
Block a user