Paddle ocr, easyicr and doctr gpu support. (#4)
All checks were successful
build_docker / essential (push) Successful in 0s
build_docker / build_cpu (push) Successful in 5m0s
build_docker / build_gpu (push) Successful in 22m55s
build_docker / build_easyocr (push) Successful in 18m47s
build_docker / build_easyocr_gpu (push) Successful in 19m0s
build_docker / build_raytune (push) Successful in 3m27s
build_docker / build_doctr (push) Successful in 19m42s
build_docker / build_doctr_gpu (push) Successful in 14m49s
All checks were successful
build_docker / essential (push) Successful in 0s
build_docker / build_cpu (push) Successful in 5m0s
build_docker / build_gpu (push) Successful in 22m55s
build_docker / build_easyocr (push) Successful in 18m47s
build_docker / build_easyocr_gpu (push) Successful in 19m0s
build_docker / build_raytune (push) Successful in 3m27s
build_docker / build_doctr (push) Successful in 19m42s
build_docker / build_doctr_gpu (push) Successful in 14m49s
This commit was merged in pull request #4.
This commit is contained in:
@@ -10,10 +10,14 @@ Este Trabajo Fin de Máster ha demostrado que es posible mejorar significativame
|
||||
|
||||
El objetivo principal del trabajo era alcanzar un CER inferior al 2% en documentos académicos en español. Los resultados obtenidos confirman el cumplimiento de este objetivo:
|
||||
|
||||
**Tabla 39.** *Cumplimiento del objetivo de CER.*
|
||||
|
||||
| Métrica | Objetivo | Resultado |
|
||||
|---------|----------|-----------|
|
||||
| CER | < 2% | **1.49%** |
|
||||
|
||||
*Fuente: Elaboración propia.*
|
||||
|
||||
### Conclusiones Específicas
|
||||
|
||||
**Respecto a OE1 (Comparativa de soluciones OCR)**:
|
||||
@@ -34,7 +38,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
**Respecto a OE4 (Optimización con Ray Tune)**:
|
||||
- Se ejecutaron 64 trials con el algoritmo OptunaSearch
|
||||
- El tiempo total del experimento fue aproximadamente 6 horas (en CPU)
|
||||
- La arquitectura basada en subprocesos permitió superar incompatibilidades entre Ray y PaddleOCR
|
||||
- La arquitectura basada en contenedores Docker permitió superar incompatibilidades entre Ray y los motores OCR, facilitando además la portabilidad y reproducibilidad
|
||||
|
||||
**Respecto a OE5 (Validación de la configuración)**:
|
||||
- Se validó la configuración óptima sobre el dataset completo de 24 páginas
|
||||
@@ -69,7 +73,7 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
|
||||
3. **Ground truth automático**: La extracción automática del texto de referencia puede introducir errores en layouts complejos.
|
||||
|
||||
4. **Ejecución en CPU**: Los tiempos de procesamiento (~69s/página) limitan la aplicabilidad en escenarios de alto volumen.
|
||||
4. **Validación en entorno limitado**: Aunque se validó con GPU (126x más rápido que CPU, 0.55s/página), los experimentos se realizaron en hardware de consumo (RTX 3060). Hardware empresarial podría ofrecer mejor rendimiento.
|
||||
|
||||
5. **Parámetro no explorado**: `text_det_unclip_ratio` permaneció fijo en 0.0 durante todo el experimento.
|
||||
|
||||
@@ -83,8 +87,6 @@ El objetivo principal del trabajo era alcanzar un CER inferior al 2% en document
|
||||
|
||||
3. **Dataset ampliado**: Construir un corpus más amplio y diverso de documentos en español.
|
||||
|
||||
4. **Evaluación con GPU**: Medir tiempos de inferencia con aceleración GPU.
|
||||
|
||||
### Líneas de Investigación
|
||||
|
||||
1. **Transfer learning de hiperparámetros**: Investigar si las configuraciones óptimas para un tipo de documento transfieren a otros dominios.
|
||||
|
||||
Reference in New Issue
Block a user