# ======================== # DATOS PESADOS - NO SUBIR # ======================== # MongoDB (3.2 GB) FLUJOS_DATOS/MONGO/ # Modelo Qwen3-VL (~16GB) FLUJOS_DATOS/IMAGENES/model_cache/ # Imágenes scrapeadas y JSONs de output FLUJOS_DATOS/IMAGENES/output/ # Logs del pipeline FLUJOS_DATOS/pipeline_maestro.log FLUJOS_DATOS/COMPARACIONES/pipeline_mongolo.log* # Datos scrapeados - solo código, no datos FLUJOS_DATOS/NOTICIAS/archivos/ FLUJOS_DATOS/NOTICIAS/articulos/ FLUJOS_DATOS/NOTICIAS/tokenized/ FLUJOS_DATOS/NOTICIAS/noticias_procesadas.txt FLUJOS_DATOS/NOTICIAS/processed_articles.txt FLUJOS_DATOS/WIKIPEDIA/articulos_wikipedia/ FLUJOS_DATOS/WIKIPEDIA/articulos_tokenizados/ FLUJOS_DATOS/TORRENTS/ # Entorno virtual Python (2.1 GB) FLUJOS_DATOS/myenv/ myenv/ venv/ env/ .venv/ # NLTK data (50 MB) nltk_data/ # Bases de datos *.sqlite3 *.db # ======================== # DEPENDENCIAS NODE # ======================== node_modules/ **/node_modules/ # ======================== # SECRETOS Y CONFIG LOCAL # ======================== .env .env.* !.env.example # ======================== # PYTHON # ======================== __pycache__/ *.py[cod] *.pyo *.pyd *.egg-info/ # ======================== # TEMPORALES Y BACKUPS # ======================== *.save *.bak *_COPIA* *~ .DS_Store Thumbs.db # ======================== # LOGS # ======================== logs/ *.log npm-debug.log* # ======================== # IDEs # ======================== .vscode/ .idea/ *.swp *.swo # Parcel cache .cache/ .parcel-cache/