feat: scraper de imágenes Wikipedia + debug

- wikipedia_image_scraper.py: descarga imágenes de Wikipedia por tema
  usando Wikimedia API, con filtros de tamaño/extensión y metadatos
  (autor, licencia, dimensiones, artículo origen)
- debug_wiki.py: script de diagnóstico para verificar API responses
- .gitignore: excluye output/ y __pycache__

Fix: normalizar prefijo "Archivo:" → "File:" para Wikimedia Commons API

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
SITO 2026-03-29 19:41:11 +02:00
parent b992e25f8f
commit 0975f44a0e
3 changed files with 479 additions and 0 deletions

3
BACK_BACK/IMAGENES/.gitignore vendored Normal file
View file

@ -0,0 +1,3 @@
__pycache__/
output/
*.pyc