Incluye: backend Node.js/Express, visualización 3D (Three.js/3d-force-graph), scrapers Wikipedia/noticias/imágenes, analizador Qwen3-VL, pipeline maestro con systemd timer, fixes de seguridad (NoSQL injection, XSS, ReDoS, port binding) y documentación técnica completa en docs/. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
23 lines
827 B
Python
23 lines
827 B
Python
# check_mismatches.py
|
|
from pymongo import MongoClient
|
|
|
|
client = MongoClient('mongodb://localhost:27017')
|
|
db = client['FLUJOS_DATOS']
|
|
|
|
# 1) Todos los nombres únicos que aparecen en comparaciones
|
|
comp = db.comparaciones.distinct('noticia1') + db.comparaciones.distinct('noticia2')
|
|
comp = set(comp)
|
|
|
|
# 2) Todos los nombres únicos en las colecciones de nodos
|
|
fuentes = ['noticias','wikipedia','torrents','leaks']
|
|
todos = set()
|
|
for col in fuentes:
|
|
if col in db.list_collection_names():
|
|
todos |= set(db[col].distinct('archivo'))
|
|
|
|
sólo_en_comparaciones = comp - todos
|
|
sólo_en_fuentes = todos - comp
|
|
|
|
print(f"Mismatches comparaciones→fuentes: {len(sólo_en_comparaciones)}")
|
|
print(f"Mismatches fuentes→comparaciones: {len(sólo_en_fuentes)}")
|
|
print("Ejemplos (up to 10):", list(sólo_en_comparaciones)[:10])
|