código completo FLUJOS — snapshot limpio sin datos scrapeados
Incluye: backend Node.js/Express, visualización 3D (Three.js/3d-force-graph), scrapers Wikipedia/noticias/imágenes, analizador Qwen3-VL, pipeline maestro con systemd timer, fixes de seguridad (NoSQL injection, XSS, ReDoS, port binding) y documentación técnica completa en docs/. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
parent
013fe673f3
commit
83f67b76b4
190 changed files with 193337 additions and 2 deletions
91
.gitignore
vendored
Normal file
91
.gitignore
vendored
Normal file
|
|
@ -0,0 +1,91 @@
|
|||
# ========================
|
||||
# DATOS PESADOS - NO SUBIR
|
||||
# ========================
|
||||
|
||||
# MongoDB (3.2 GB)
|
||||
FLUJOS_DATOS/MONGO/
|
||||
|
||||
# Modelo Qwen3-VL (~16GB)
|
||||
FLUJOS_DATOS/IMAGENES/model_cache/
|
||||
|
||||
# Imágenes scrapeadas y JSONs de output
|
||||
FLUJOS_DATOS/IMAGENES/output/
|
||||
|
||||
# Logs del pipeline
|
||||
FLUJOS_DATOS/pipeline_maestro.log
|
||||
FLUJOS_DATOS/COMPARACIONES/pipeline_mongolo.log*
|
||||
|
||||
# Datos scrapeados - solo código, no datos
|
||||
FLUJOS_DATOS/NOTICIAS/archivos/
|
||||
FLUJOS_DATOS/NOTICIAS/articulos/
|
||||
FLUJOS_DATOS/NOTICIAS/tokenized/
|
||||
FLUJOS_DATOS/NOTICIAS/noticias_procesadas.txt
|
||||
FLUJOS_DATOS/NOTICIAS/processed_articles.txt
|
||||
FLUJOS_DATOS/WIKIPEDIA/articulos_wikipedia/
|
||||
FLUJOS_DATOS/WIKIPEDIA/articulos_tokenizados/
|
||||
FLUJOS_DATOS/TORRENTS/
|
||||
|
||||
# Entorno virtual Python (2.1 GB)
|
||||
FLUJOS_DATOS/myenv/
|
||||
myenv/
|
||||
venv/
|
||||
env/
|
||||
.venv/
|
||||
|
||||
# NLTK data (50 MB)
|
||||
nltk_data/
|
||||
|
||||
# Bases de datos
|
||||
*.sqlite3
|
||||
*.db
|
||||
|
||||
# ========================
|
||||
# DEPENDENCIAS NODE
|
||||
# ========================
|
||||
node_modules/
|
||||
**/node_modules/
|
||||
|
||||
# ========================
|
||||
# SECRETOS Y CONFIG LOCAL
|
||||
# ========================
|
||||
.env
|
||||
.env.*
|
||||
!.env.example
|
||||
|
||||
# ========================
|
||||
# PYTHON
|
||||
# ========================
|
||||
__pycache__/
|
||||
*.py[cod]
|
||||
*.pyo
|
||||
*.pyd
|
||||
*.egg-info/
|
||||
|
||||
# ========================
|
||||
# TEMPORALES Y BACKUPS
|
||||
# ========================
|
||||
*.save
|
||||
*.bak
|
||||
*_COPIA*
|
||||
*~
|
||||
.DS_Store
|
||||
Thumbs.db
|
||||
|
||||
# ========================
|
||||
# LOGS
|
||||
# ========================
|
||||
logs/
|
||||
*.log
|
||||
npm-debug.log*
|
||||
|
||||
# ========================
|
||||
# IDEs
|
||||
# ========================
|
||||
.vscode/
|
||||
.idea/
|
||||
*.swp
|
||||
*.swo
|
||||
|
||||
# Parcel cache
|
||||
.cache/
|
||||
.parcel-cache/
|
||||
Loading…
Add table
Add a link
Reference in a new issue