clean up datasources

This commit is contained in:
2025-12-16 00:48:14 +01:00
parent 29aef93f63
commit 5220793328
6 changed files with 99 additions and 57 deletions

View File

@@ -22,23 +22,26 @@ title: "Estructura del repositorio del proyecto"
flowchart LR
root["MastersThesis/"] --> docs["docs/"]
root --> src["src/"]
root --> results["results/"]
root --> instructions["instructions/"]
root --> readme["README.md"]
root --> scripts["Scripts generación"]
src --> nb1["paddle_ocr_fine_tune_unir_raytune.ipynb"]
src --> py1["paddle_ocr_tuning.py"]
src --> py2["dataset_manager.py"]
src --> nb2["prepare_dataset.ipynb"]
src --> csv["raytune_results_*.csv"]
src --> csv["raytune_paddle_subproc_results_*.csv"]
scripts --> gen1["generate_mermaid_figures.py"]
scripts --> gen2["apply_content.py"]
```
**Descripción de componentes:**
- **docs/**: Capítulos de la tesis en Markdown
- **src/**: Código fuente (notebooks y scripts)
- **results/**: Resultados de benchmarks en CSV
- **instructions/**: Instrucciones y plantilla UNIR
- **docs/**: Capítulos de la tesis en Markdown (estructura UNIR)
- **src/**: Código fuente de experimentación
- `paddle_ocr_fine_tune_unir_raytune.ipynb`: Notebook principal con 64 trials Ray Tune
- `paddle_ocr_tuning.py`: Script CLI para evaluación OCR
- `raytune_paddle_subproc_results_20251207_192320.csv`: Resultados de optimización
- **instructions/**: Plantilla e instrucciones UNIR
- **Scripts de generación**: `generate_mermaid_figures.py` y `apply_content.py` para generar el documento TFM
## A.3 Requisitos de Software