código completo FLUJOS — snapshot limpio sin datos scrapeados

Incluye: backend Node.js/Express, visualización 3D (Three.js/3d-force-graph), scrapers Wikipedia/noticias/imágenes, analizador Qwen3-VL, pipeline maestro con systemd timer, fixes de seguridad (NoSQL injection, XSS, ReDoS, port binding) y documentación técnica completa en docs/. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-21 23:45:29 +02:00 · 2026-04-21 23:45:29 +02:00 · 83f67b76b4
commit 83f67b76b4
parent 013fe673f3
190 changed files with 193337 additions and 2 deletions
--- a/POCS/BACK_BACK/IMAGENES/debug_wiki.py
+++ b/POCS/BACK_BACK/IMAGENES/debug_wiki.py
@ -0,0 +1,30 @@
+"""Script de debug para ver qué devuelve la API de Wikipedia/Wikimedia."""
+import requests
+from wikipedia_image_scraper import (
+    search_articles, get_article_images, get_image_info, should_skip, SKIP_PATTERNS
+)
+
+# 1. Buscar artículos
+print("=== ARTÍCULOS ===")
+articles = search_articles("cambio climático", lang="es", limit=2)
+for a in articles:
+    print(f"  {a['title']}")
+
+# 2. Imágenes del primer artículo
+print("\n=== IMÁGENES DEL ARTÍCULO ===")
+img_titles = get_article_images(articles[0]["title"], lang="es", limit=10)
+for t in img_titles:
+    print(f"  {t}")
+
+# 3. Info de las primeras 5 imágenes
+print("\n=== INFO DE CADA IMAGEN ===")
+for title in img_titles[:5]:
+    print(f"\n  Título: {title}")
+    info = get_image_info(title)
+    if info is None:
+        print("    → get_image_info devolvió None")
+        continue
+    print(f"    url:    {info.get('url', 'N/A')[:80]}")
+    print(f"    size:   {info.get('width')}x{info.get('height')}  {info.get('size_bytes')}B")
+    skip, motivo = should_skip(title, info)
+    print(f"    skip:   {skip}  ({motivo})")