2.2 KiB
2.2 KiB
Anexo A. Código fuente y datos analizados
A.1 Repositorio del Proyecto
El código fuente completo y los datos utilizados en este trabajo están disponibles en el siguiente repositorio:
URL del repositorio: https://github.com/seryus/MastersThesis
El repositorio incluye:
- Notebooks de experimentación: Código completo de los experimentos realizados
- Scripts de evaluación: Herramientas para evaluar modelos OCR
- Dataset: Imágenes y textos de referencia utilizados
- Resultados: Archivos CSV con los resultados de los 64 trials de Ray Tune
A.2 Estructura del Repositorio
---
title: "Estructura del repositorio del proyecto"
---
flowchart LR
root["MastersThesis/"] --> docs["docs/"]
root --> src["src/"]
root --> instructions["instructions/"]
root --> scripts["Scripts generación"]
src --> nb1["paddle_ocr_fine_tune_unir_raytune.ipynb"]
src --> py1["paddle_ocr_tuning.py"]
src --> csv["raytune_paddle_subproc_results_*.csv"]
scripts --> gen1["generate_mermaid_figures.py"]
scripts --> gen2["apply_content.py"]
Descripción de componentes:
- docs/: Capítulos de la tesis en Markdown (estructura UNIR)
- src/: Código fuente de experimentación
paddle_ocr_fine_tune_unir_raytune.ipynb: Notebook principal con 64 trials Ray Tunepaddle_ocr_tuning.py: Script CLI para evaluación OCRraytune_paddle_subproc_results_20251207_192320.csv: Resultados de optimización
- instructions/: Plantilla e instrucciones UNIR
- Scripts de generación:
generate_mermaid_figures.pyyapply_content.pypara generar el documento TFM
A.3 Requisitos de Software
Para reproducir los experimentos se requieren las siguientes dependencias:
| Componente | Versión |
|---|---|
| Python | 3.11.9 |
| PaddlePaddle | 3.2.2 |
| PaddleOCR | 3.3.2 |
| Ray | 2.52.1 |
| Optuna | 4.6.0 |
| jiwer | (última versión) |
| PyMuPDF | (última versión) |
A.4 Instrucciones de Ejecución
- Clonar el repositorio
- Instalar dependencias:
pip install -r requirements.txt - Ejecutar el notebook
src/paddle_ocr_fine_tune_unir_raytune.ipynb
A.5 Licencia
El código se distribuye bajo licencia MIT.