From e2051a0f686f8c32eeaea168a0e30e4c4a74f742 Mon Sep 17 00:00:00 2001 From: sergio Date: Sat, 24 Jan 2026 16:22:07 +0100 Subject: [PATCH] gen --- thesis_output/plantilla_individual.htm | 22 +++++++++++----------- 1 file changed, 11 insertions(+), 11 deletions(-) diff --git a/thesis_output/plantilla_individual.htm b/thesis_output/plantilla_individual.htm index 888c95a..0ac161c 100644 --- a/thesis_output/plantilla_individual.htm +++ b/thesis_output/plantilla_individual.htm @@ -5845,7 +5845,7 @@ bibliográficas

Anexo A.    Código fuente y datos analizados

Este anexo proporciona la información técnica necesaria para reproducir los experimentos descritos en este trabajo. Se incluyen las instrucciones de instalación, configuración de los servicios OCR dockerizados, ejecución de los scripts de optimización y acceso a los resultados experimentales.

-

A.1 Repositorio del Proyecto

+

A.1 Repositorio del Proyecto

Todo el código fuente y los datos utilizados en este trabajo están disponibles públicamente en el siguiente repositorio:

URL del repositorio: https://seryus.ddns.net/unir/MastersThesis

El repositorio incluye:

@@ -5854,7 +5854,7 @@ major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin

·     Scripts de ajuste: Ray Tune con Optuna para optimización de hiperparámetros

·     Dataset: Imágenes y textos de referencia utilizados

·     Resultados: Archivos CSV con los resultados de los 64 trials por servicio

-

A.2 Estructura del Repositorio

+

A.2 Estructura del Repositorio

Figura 16. Estructura del repositorio MastersThesis

Estructura del repositorio MastersThesis

@@ -5867,7 +5867,7 @@ major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin

Fuente: Repositorio del proyecto.

 

-

A.3 Requisitos de Software

+

A.3 Requisitos de Software

Sistema de Desarrollo

Tabla 55. Especificaciones del sistema de desarrollo.

@@ -5883,8 +5883,8 @@ major-latin;mso-bidi-font-family:"Calibri Light";mso-bidi-theme-font:major-latin

Fuente: src/paddle_ocr/requirements.txt, src/raytune/requirements.txt, src/doctr_service/requirements.txt, src/easyocr_service/requirements.txt, src/README.md.

 

-

A.4 Instrucciones de Ejecución de Servicios OCR

-

A.4 Instrucciones de Ejecución de Servicios OCR

+

A.4 Instrucciones de Ejecución de Servicios OCR

+

A.4 Instrucciones de Ejecución de Servicios OCR

PaddleOCR (Puerto 8002)

Imágenes Docker:

·     GPU: seryus.ddns.net/unir/paddle-ocr-gpu

@@ -5923,7 +5923,7 @@ curl http://localhost:8002/health # Respuesta esperada: # {"status": "ok", "model_loaded": true, "gpu_name": "NVIDIA GeForce RTX 3060"} -

A.5 Uso de la API OCR

+

A.5 Uso de la API OCR

Evaluar Dataset Completo

# PaddleOCR - Evaluación completa
@@ -5951,7 +5951,7 @@ curl -X POST http://localhost:8002/evaluate_full \
     "save_output": true
   }'
-

A.6 Ajuste de Hiperparámetros con Ray Tune

+

A.6 Ajuste de Hiperparámetros con Ray Tune

Ejecutar Ajuste

cd src
@@ -5978,7 +5978,7 @@ analyze_results(results, prefix='raytune_paddle', config_keys=PADDLE_OCR_CONFIG_
 

 

Nota: Debido a limitaciones de recursos GPU (VRAM insuficiente para ejecutar múltiples modelos OCR simultáneamente), solo se ejecuta un servicio a la vez. PaddleOCR y EasyOCR comparten el puerto 8002. Para cambiar de servicio, detener el actual con docker compose down.

-

A.7 Métricas de Rendimiento

+

A.7 Métricas de Rendimiento

Esta sección presenta los resultados completos de las evaluaciones comparativas y del ajuste de hiperparámetros realizado con Ray Tune sobre los tres servicios OCR evaluados.

Comparativa General de Servicios

@@ -6056,18 +6056,18 @@ analyze_results(results, prefix='raytune_paddle', config_keys=PADDLE_OCR_CONFIG_

Fuente: Elaboración propia.

 

-

A.8 Fuentes de precios cloud

+

A.8 Fuentes de precios cloud

Las tablas de costos cloud se basan en las páginas oficiales de precios. Se consultaron en enero de 2026.

·     AWS EC2 g4dn.xlarge: https://aws.amazon.com/ec2/instance-types/g4/

·     Google Colab Pro: https://colab.research.google.com/signup

·     Google Colab Pro+: https://colab.research.google.com/signup

-

A.9 Requisitos documentados por dependencias

+

A.9 Requisitos documentados por dependencias

Requisitos extraidos de la documentacion oficial de las dependencias usadas:

·     DocTR: requiere Python 3.10 o superior.

·     DocTR Docker: imagenes basadas en CUDA 12.2, el host debe ser al menos 12.2.

·     PaddleOCR: soporte de inferencia con CUDA 12.

·     PaddleOCR: soporte de Python 3.12 en dependencias.

-

A.10 Licencia

+

A.10 Licencia

El código se distribuye bajo licencia MIT.