feat: scraper de imágenes Wikipedia + debug
- wikipedia_image_scraper.py: descarga imágenes de Wikipedia por tema usando Wikimedia API, con filtros de tamaño/extensión y metadatos (autor, licencia, dimensiones, artículo origen) - debug_wiki.py: script de diagnóstico para verificar API responses - .gitignore: excluye output/ y __pycache__ Fix: normalizar prefijo "Archivo:" → "File:" para Wikimedia Commons API Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This commit is contained in:
parent
b992e25f8f
commit
0975f44a0e
3 changed files with 479 additions and 0 deletions
3
BACK_BACK/IMAGENES/.gitignore
vendored
Normal file
3
BACK_BACK/IMAGENES/.gitignore
vendored
Normal file
|
|
@ -0,0 +1,3 @@
|
|||
__pycache__/
|
||||
output/
|
||||
*.pyc
|
||||
Loading…
Add table
Add a link
Reference in a new issue