código completo FLUJOS — snapshot limpio sin datos scrapeados

Incluye: backend Node.js/Express, visualización 3D (Three.js/3d-force-graph),
scrapers Wikipedia/noticias/imágenes, analizador Qwen3-VL, pipeline maestro
con systemd timer, fixes de seguridad (NoSQL injection, XSS, ReDoS, port
binding) y documentación técnica completa en docs/.

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
CAPITANSITO 2026-04-21 23:45:29 +02:00
parent 013fe673f3
commit 83f67b76b4
190 changed files with 193337 additions and 2 deletions

View file

@ -0,0 +1,27 @@
[Unit]
Description=FLUJOS Pipeline Maestro (scraping → análisis → comparación)
After=network.target mongod.service
Requires=mongod.service
[Service]
Type=oneshot
User=capitansito
WorkingDirectory=/var/www/theflows.net/flujos/FLUJOS_DATOS
Environment=MONGO_URL=mongodb://localhost:27017
Environment=DB_NAME=FLUJOS_DATOS
Environment=HF_HOME=/var/www/theflows.net/flujos/FLUJOS_DATOS/IMAGENES/model_cache
ExecStart=/var/www/theflows.net/flujos/FLUJOS_DATOS/myenv/bin/python3 \
/var/www/theflows.net/flujos/FLUJOS_DATOS/pipeline_maestro.py
# 12h máximo (análisis VLM en CPU puede tardar)
TimeoutStartSec=43200
Restart=no
StandardOutput=journal
StandardError=journal
SyslogIdentifier=flujos-pipeline
[Install]
WantedBy=multi-user.target

View file

@ -0,0 +1,18 @@
[Unit]
Description=Ejecutar FLUJOS Pipeline cada semana (domingo 3am)
Requires=flujos-pipeline.service
[Timer]
# Todos los domingos a las 03:00
OnCalendar=Sun *-*-* 03:00:00
# Si el servidor estaba apagado a las 3am, ejecutar al arrancar
Persistent=true
# Esperar 2 min tras el arranque para que MongoDB esté listo
OnBootSec=2min
Unit=flujos-pipeline.service
[Install]
WantedBy=timers.target