Files
MastersThesis/docs/07_anexo_a.md
2025-12-16 00:54:36 +01:00

2.2 KiB

Anexo A. Código fuente y datos analizados

A.1 Repositorio del Proyecto

El código fuente completo y los datos utilizados en este trabajo están disponibles en el siguiente repositorio:

URL del repositorio: https://github.com/seryus/MastersThesis

El repositorio incluye:

  • Notebooks de experimentación: Código completo de los experimentos realizados
  • Scripts de evaluación: Herramientas para evaluar modelos OCR
  • Dataset: Imágenes y textos de referencia utilizados
  • Resultados: Archivos CSV con los resultados de los 64 trials de Ray Tune

A.2 Estructura del Repositorio

---
title: "Estructura del repositorio del proyecto"
---
flowchart LR
    root["MastersThesis/"] --> docs["docs/"]
    root --> src["src/"]
    root --> instructions["instructions/"]
    root --> scripts["Scripts generación"]

    src --> nb1["paddle_ocr_fine_tune_unir_raytune.ipynb"]
    src --> py1["paddle_ocr_tuning.py"]
    src --> csv["raytune_paddle_subproc_results_*.csv"]

    scripts --> gen1["generate_mermaid_figures.py"]
    scripts --> gen2["apply_content.py"]

Descripción de componentes:

  • docs/: Capítulos de la tesis en Markdown (estructura UNIR)
  • src/: Código fuente de experimentación
    • paddle_ocr_fine_tune_unir_raytune.ipynb: Notebook principal con 64 trials Ray Tune
    • paddle_ocr_tuning.py: Script CLI para evaluación OCR
    • raytune_paddle_subproc_results_20251207_192320.csv: Resultados de optimización
  • instructions/: Plantilla e instrucciones UNIR
  • Scripts de generación: generate_mermaid_figures.py y apply_content.py para generar el documento TFM

A.3 Requisitos de Software

Para reproducir los experimentos se requieren las siguientes dependencias:

Componente Versión
Python 3.11.9
PaddlePaddle 3.2.2
PaddleOCR 3.3.2
Ray 2.52.1
Optuna 4.6.0
jiwer (última versión)
PyMuPDF (última versión)

A.4 Instrucciones de Ejecución

  1. Clonar el repositorio
  2. Instalar dependencias: pip install -r requirements.txt
  3. Ejecutar el notebook src/paddle_ocr_fine_tune_unir_raytune.ipynb

A.5 Licencia

El código se distribuye bajo licencia MIT.