- poc/seed.sql: 17 noticias (ES/EN/FR) con traducciones y 25 entidades NER - poc/poc.sh: corregir VITE_API_URL (faltaba sufijo /api), crear admin con bcrypt - docs/POC_GUIDE.md: guia paso a paso para que el compañero explore la demo - README.md: añadir credenciales admin y enlace a la guia POC Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
255 lines
18 KiB
SQL
255 lines
18 KiB
SQL
-- =============================================================================
|
|
-- COCONEWS POC — Datos de demostración
|
|
-- Cubre: taxonomía, feeds, noticias en 3 idiomas, traducciones, entidades,
|
|
-- eventos agrupados y un usuario admin listo para usar
|
|
-- =============================================================================
|
|
|
|
-- ---------------------------------------------------------------------------
|
|
-- TAXONOMÍA BASE
|
|
-- ---------------------------------------------------------------------------
|
|
INSERT INTO continentes (id, nombre) VALUES
|
|
(1,'África'),(2,'América'),(3,'Asia'),(4,'Europa'),(5,'Oceanía')
|
|
ON CONFLICT (id) DO NOTHING;
|
|
|
|
INSERT INTO categorias (nombre) VALUES
|
|
('Ciencia'),('Cultura'),('Deportes'),('Economía'),
|
|
('Internacional'),('Política'),('Salud'),('Tecnología'),('Sociedad')
|
|
ON CONFLICT DO NOTHING;
|
|
|
|
INSERT INTO paises (nombre, continente_id) VALUES
|
|
('España',4),('Argentina',2),('México',2),('Francia',4),
|
|
('Estados Unidos',2),('Reino Unido',4),('Alemania',4),('China',3),
|
|
('Brasil',2),('Italia',4)
|
|
ON CONFLICT DO NOTHING;
|
|
|
|
INSERT INTO config (key, value) VALUES
|
|
('translator_type','cpu'),
|
|
('translator_workers','1'),
|
|
('translator_status','stopped')
|
|
ON CONFLICT (key) DO NOTHING;
|
|
|
|
-- ---------------------------------------------------------------------------
|
|
-- FEEDS
|
|
-- ---------------------------------------------------------------------------
|
|
INSERT INTO feeds (nombre, descripcion, url, idioma, activo, fallos) VALUES
|
|
('El País', 'Diario de referencia en español', 'https://feeds.elpais.com/mrss-s/pages/ep/site/elpais.com/portada','es',true,0),
|
|
('El Mundo', 'Información general de España', 'https://e00-elmundo.uecdn.es/elmundo/rss/portada.xml', 'es',true,0),
|
|
('La Vanguardia', 'Cataluña y España', 'https://www.lavanguardia.com/mvc/feed/rss/home', 'es',true,0),
|
|
('BBC Mundo', 'BBC en español', 'https://feeds.bbci.co.uk/mundo/rss.xml', 'es',true,0),
|
|
('Le Monde', 'Diario francés de referencia', 'https://www.lemonde.fr/rss/une.xml', 'fr',true,0),
|
|
('The Guardian', 'Periódico británico independiente', 'https://www.theguardian.com/world/rss', 'en',true,0),
|
|
('Reuters', 'Agencia de noticias internacional', 'https://feeds.reuters.com/reuters/topNews', 'en',true,0),
|
|
('El Confidencial','Periodismo de investigación en España', 'https://rss.elconfidencial.com/espana/', 'es',true,0)
|
|
ON CONFLICT (url) DO NOTHING;
|
|
|
|
-- ---------------------------------------------------------------------------
|
|
-- NOTICIAS — En español (no requieren traducción para mostrarse)
|
|
-- ---------------------------------------------------------------------------
|
|
INSERT INTO noticias (id,titulo,resumen,url,fecha,fuente_nombre,categoria_id,lang,topics_processed) VALUES
|
|
(md5('poc-es-01'),
|
|
'La inteligencia artificial supera a médicos en diagnóstico de cáncer de piel',
|
|
'Un modelo de deep learning desarrollado por investigadores del MIT logró detectar melanomas con una precisión del 94,2%, superando en 8 puntos porcentuales al diagnóstico de dermatólogos expertos en un ensayo clínico con 12.000 imágenes.',
|
|
'https://example.com/ia-cancer-piel',NOW()-INTERVAL '1 hour','El País',1,'es',false),
|
|
|
|
(md5('poc-es-02'),
|
|
'España aprueba la mayor inversión en energía solar de su historia: 15.000 millones',
|
|
'El Consejo de Ministros ha dado luz verde a un plan nacional que desplegará 40 gigavatios de capacidad fotovoltaica antes de 2030. La medida creará 120.000 empleos directos y situará a España como segundo productor solar de Europa.',
|
|
'https://example.com/solar-espana',NOW()-INTERVAL '2 hours','La Vanguardia',4,'es',false),
|
|
|
|
(md5('poc-es-03'),
|
|
'El Barça remonta ante el City y se clasifica para la final de Champions',
|
|
'Remontada histórica en el Camp Nou. El Barcelona superó al Manchester City (3-1) tras ir perdiendo al descanso, con un Lamine Yamal estratosférico que firmó dos goles y una asistencia. La final se disputará en Wembley el próximo 31 de mayo.',
|
|
'https://example.com/barca-champions',NOW()-INTERVAL '3 hours','El Mundo',3,'es',false),
|
|
|
|
(md5('poc-es-04'),
|
|
'Argentina presenta un plan económico de estabilización con el FMI por 40.000 millones',
|
|
'El gobierno de Buenos Aires y el Fondo Monetario Internacional cerraron un acuerdo que incluye una línea de crédito récord, reformas estructurales en el sector energético y un calendario de reducción del déficit fiscal hasta el equilibrio en 2026.',
|
|
'https://example.com/argentina-fmi',NOW()-INTERVAL '4 hours','BBC Mundo',4,'es',false),
|
|
|
|
(md5('poc-es-05'),
|
|
'Descubrimiento en Pompeya revela un mercado de esclavos del siglo I d.C.',
|
|
'Arqueólogos italianos desenterraron en el sector norte de Pompeya una estancia con frescos únicos que documentan por primera vez visualmente la venta de esclavos en el mundo romano. El hallazgo reescribe la comprensión del comercio humano en la Antigüedad.',
|
|
'https://example.com/pompeya-esclavos',NOW()-INTERVAL '5 hours','El País',2,'es',false),
|
|
|
|
(md5('poc-es-06'),
|
|
'La OMS declara la resistencia antimicrobiana como emergencia sanitaria global',
|
|
'La Organización Mundial de la Salud elevó al máximo nivel de alerta la crisis de los antibióticos, estimando 10 millones de muertes anuales para 2050 si no se toman medidas urgentes. Propone un fondo global de 5.000 millones de dólares para investigación.',
|
|
'https://example.com/oms-antibioticos',NOW()-INTERVAL '6 hours','BBC Mundo',7,'es',false),
|
|
|
|
(md5('poc-es-07'),
|
|
'Tesla presenta su robotaxi autónomo: sin volante, sin pedales y a 0,19€ el kilómetro',
|
|
'Elon Musk reveló el Cybercab en un evento en Los Ángeles. El vehículo sin controles manuales utilizará visión por computador para la conducción autónoma de nivel 5 y estará disponible en 2026. El precio objetivo es 30.000 dólares por unidad.',
|
|
'https://example.com/tesla-robotaxi',NOW()-INTERVAL '7 hours','El Confidencial',8,'es',false),
|
|
|
|
(md5('poc-es-08'),
|
|
'México bate récord de remesas: 65.000 millones de dólares enviados desde el exterior',
|
|
'El Banco de México informó que las transferencias de mexicanos en el extranjero alcanzaron un máximo histórico, representando ya el 3,8% del PIB nacional. Los estados de Michoacán, Jalisco y Guanajuato concentran el 45% de los ingresos.',
|
|
'https://example.com/mexico-remesas',NOW()-INTERVAL '8 hours','BBC Mundo',4,'es',false),
|
|
|
|
(md5('poc-es-09'),
|
|
'Científicos españoles desarrollan una vacuna universal contra la gripe',
|
|
'El equipo del CSIC liderado por la doctora Carmen López logró una vacuna que actúa sobre una región conservada del virus influenza, ofreciendo protección cruzada contra todas las cepas conocidas en estudios preclínicos con primates.',
|
|
'https://example.com/vacuna-gripe-csic',NOW()-INTERVAL '9 hours','El País',1,'es',false),
|
|
|
|
(md5('poc-es-10'),
|
|
'El Gobierno lanza un bono cultural de 400€ para jóvenes de 18 años',
|
|
'A partir del próximo trimestre, todos los españoles al cumplir la mayoría de edad recibirán un bono digital para gastar en libros, entradas de cine, teatro, museos y plataformas de streaming nacionales. El programa costará 200 millones anuales.',
|
|
'https://example.com/bono-cultural',NOW()-INTERVAL '10 hours','La Vanguardia',2,'es',false),
|
|
|
|
-- ---------------------------------------------------------------------------
|
|
-- NOTICIAS — En inglés (con traducción al español en tabla traducciones)
|
|
-- ---------------------------------------------------------------------------
|
|
(md5('poc-en-01'),
|
|
'OpenAI releases GPT-5 with real-time reasoning and 1 million token context',
|
|
'OpenAI announced GPT-5, its most advanced language model, featuring native multimodality, real-time web access and a context window of one million tokens — equivalent to an entire novel. The model outperforms human experts on 87% of professional benchmarks.',
|
|
'https://example.com/gpt5-release',NOW()-INTERVAL '11 hours','The Guardian',8,'en',false),
|
|
|
|
(md5('poc-en-02'),
|
|
'NASA confirms water ice deposits at lunar south pole ahead of Artemis mission',
|
|
'New data from the LCROSS mission confirms significant water ice deposits at Shackleton Crater near the lunar south pole. Scientists estimate up to 600 million metric tons of frozen water, enough to sustain a permanent Moon base for decades.',
|
|
'https://example.com/nasa-moon-water',NOW()-INTERVAL '13 hours','Reuters',1,'en',false),
|
|
|
|
(md5('poc-en-03'),
|
|
'UK economy grows 3.1% in Q1, strongest performance since 2015',
|
|
'Britain''s economy expanded at its fastest quarterly rate in nearly a decade, driven by a booming services sector, record exports of financial products and a surge in green technology manufacturing. The pound hit a two-year high against the dollar.',
|
|
'https://example.com/uk-economy',NOW()-INTERVAL '15 hours','The Guardian',4,'en',false),
|
|
|
|
(md5('poc-en-04'),
|
|
'China launches world''s largest offshore wind farm: 16 gigawatts off Fujian coast',
|
|
'State Grid Corporation of China connected the final turbines of the Fujian Offshore Wind Mega-Farm, generating enough clean electricity to power 20 million homes. The project took four years to build and employs 8,000 workers in ongoing maintenance.',
|
|
'https://example.com/china-wind-farm',NOW()-INTERVAL '17 hours','Reuters',8,'en',false),
|
|
|
|
(md5('poc-en-05'),
|
|
'Amazon to acquire healthcare giant Humana for $28 billion in landmark deal',
|
|
'In what would be the second-largest acquisition in Amazon''s history, the e-commerce and cloud giant has agreed to purchase Humana, one of the largest US health insurers. Regulators will review the deal which aims to combine pharmacy, insurance and logistics.',
|
|
'https://example.com/amazon-humana',NOW()-INTERVAL '19 hours','The Guardian',4,'en',false),
|
|
|
|
-- ---------------------------------------------------------------------------
|
|
-- NOTICIAS — En francés (con traducción al español)
|
|
-- ---------------------------------------------------------------------------
|
|
(md5('poc-fr-01'),
|
|
'Paris 2028 : la France investit 8 milliards dans les infrastructures sportives',
|
|
'Le gouvernement a présenté son plan d''investissement pour les Jeux Olympiques de Paris 2028, prévoyant la construction de 12 nouvelles arènes, la rénovation du Stade de France et la création d''un village olympique durable en Seine-Saint-Denis.',
|
|
'https://example.com/paris-2028',NOW()-INTERVAL '21 hours','Le Monde',3,'fr',false),
|
|
|
|
(md5('poc-fr-02'),
|
|
'Macron annonce une réforme fiscale majeure pour les classes moyennes françaises',
|
|
'Dans un discours à l''Élysée, le président Macron a dévoilé un allègement d''impôts de 15 milliards d''euros pour les foyers gagnant entre 2.000 et 5.000 euros par mois, financé par une taxe exceptionnelle sur les bénéfices des multinationales.',
|
|
'https://example.com/macron-fiscalite',NOW()-INTERVAL '23 hours','Le Monde',6,'fr',false)
|
|
|
|
ON CONFLICT (id) DO NOTHING;
|
|
|
|
-- ---------------------------------------------------------------------------
|
|
-- TRADUCCIONES — Artículos en inglés traducidos al español
|
|
-- ---------------------------------------------------------------------------
|
|
INSERT INTO traducciones (noticia_id,lang_from,lang_to,titulo_trad,resumen_trad,status,vectorized) VALUES
|
|
|
|
(md5('poc-en-01'),'en','es',
|
|
'OpenAI lanza GPT-5 con razonamiento en tiempo real y contexto de 1 millón de tokens',
|
|
'OpenAI presentó GPT-5, su modelo de lenguaje más avanzado, con multimodalidad nativa, acceso web en tiempo real y una ventana de contexto de un millón de tokens, equivalente a una novela entera. El modelo supera a expertos humanos en el 87% de las pruebas profesionales.',
|
|
'done',false),
|
|
|
|
(md5('poc-en-02'),'en','es',
|
|
'La NASA confirma depósitos de hielo de agua en el polo sur lunar antes de la misión Artemis',
|
|
'Nuevos datos de la misión LCROSS confirman importantes depósitos de hielo de agua en el cráter Shackleton, cerca del polo sur de la Luna. Los científicos estiman hasta 600 millones de toneladas métricas de agua congelada, suficiente para sostener una base lunar permanente durante décadas.',
|
|
'done',false),
|
|
|
|
(md5('poc-en-03'),'en','es',
|
|
'La economía del Reino Unido crece un 3,1% en el primer trimestre, el mejor dato desde 2015',
|
|
'La economía británica se expandió a su ritmo trimestral más rápido en casi una década, impulsada por un sector servicios en auge, exportaciones récord de productos financieros y un repunte en la fabricación de tecnología verde. La libra alcanzó su máximo en dos años frente al dólar.',
|
|
'done',false),
|
|
|
|
(md5('poc-en-04'),'en','es',
|
|
'China inaugura el mayor parque eólico marino del mundo: 16 gigavatios frente a la costa de Fujian',
|
|
'State Grid Corporation of China conectó las últimas turbinas de la Mega-Granja Eólica Offshore de Fujian, generando suficiente electricidad limpia para abastecer a 20 millones de hogares. El proyecto tardó cuatro años en construirse y emplea a 8.000 trabajadores en mantenimiento.',
|
|
'done',false),
|
|
|
|
(md5('poc-en-05'),'en','es',
|
|
'Amazon adquirirá el gigante sanitario Humana por 28.000 millones de dólares',
|
|
'En lo que sería la segunda mayor adquisición de la historia de Amazon, el gigante del comercio electrónico y la nube ha acordado comprar Humana, una de las mayores aseguradoras de salud de EE.UU. Los reguladores revisarán el acuerdo que busca combinar farmacia, seguros y logística.',
|
|
'done',false)
|
|
|
|
ON CONFLICT (noticia_id, lang_to) DO NOTHING;
|
|
|
|
-- Traducciones de artículos en francés
|
|
INSERT INTO traducciones (noticia_id,lang_from,lang_to,titulo_trad,resumen_trad,status,vectorized) VALUES
|
|
|
|
(md5('poc-fr-01'),'fr','es',
|
|
'París 2028: Francia invierte 8.000 millones en infraestructuras deportivas',
|
|
'El gobierno presentó su plan de inversión para los Juegos Olímpicos de París 2028, que prevé la construcción de 12 nuevos recintos, la renovación del Estadio de Francia y la creación de una villa olímpica sostenible en Seine-Saint-Denis.',
|
|
'done',false),
|
|
|
|
(md5('poc-fr-02'),'fr','es',
|
|
'Macron anuncia una reforma fiscal de gran calado para las clases medias francesas',
|
|
'En un discurso en el Elíseo, el presidente Macron presentó una reducción fiscal de 15.000 millones de euros para los hogares que ganan entre 2.000 y 5.000 euros mensuales, financiada por un impuesto excepcional sobre los beneficios de las multinacionales.',
|
|
'done',false)
|
|
|
|
ON CONFLICT (noticia_id, lang_to) DO NOTHING;
|
|
|
|
-- Traducciones "self" para artículos en español (necesarias para que aparezcan en filtro translated_only)
|
|
INSERT INTO traducciones (noticia_id,lang_from,lang_to,titulo_trad,resumen_trad,status,vectorized)
|
|
SELECT id,'es','es',titulo,resumen,'done',false
|
|
FROM noticias WHERE lang='es' AND id LIKE md5('poc-es-%')
|
|
ON CONFLICT (noticia_id, lang_to) DO NOTHING;
|
|
|
|
-- ---------------------------------------------------------------------------
|
|
-- ENTIDADES (NER tags) para dar vida a los tooltips de Wikipedia
|
|
-- ---------------------------------------------------------------------------
|
|
INSERT INTO tags (valor, tipo) VALUES
|
|
('Elon Musk', 'persona'),
|
|
('Lamine Yamal', 'persona'),
|
|
('Carmen López', 'persona'),
|
|
('Emmanuel Macron', 'persona'),
|
|
('NASA', 'organizacion'),
|
|
('OpenAI', 'organizacion'),
|
|
('Tesla', 'organizacion'),
|
|
('FMI', 'organizacion'),
|
|
('OMS', 'organizacion'),
|
|
('CSIC', 'organizacion'),
|
|
('Amazon', 'organizacion'),
|
|
('Manchester City', 'organizacion'),
|
|
('FC Barcelona', 'organizacion'),
|
|
('España', 'lugar'),
|
|
('Argentina', 'lugar'),
|
|
('México', 'lugar'),
|
|
('Francia', 'lugar'),
|
|
('China', 'lugar'),
|
|
('Estados Unidos', 'lugar'),
|
|
('Luna', 'lugar'),
|
|
('Pompeya', 'lugar'),
|
|
('inteligencia artificial','tema'),
|
|
('energía solar', 'tema'),
|
|
('Champions League', 'tema'),
|
|
('vacuna', 'tema')
|
|
ON CONFLICT (valor, tipo) DO NOTHING;
|
|
|
|
-- Asociar entidades a noticias
|
|
INSERT INTO tags_noticia (tag_id, noticia_id)
|
|
SELECT t.id, n.id FROM tags t, noticias n
|
|
WHERE (t.valor='OpenAI' AND n.id=md5('poc-en-01'))
|
|
OR (t.valor='inteligencia artificial' AND n.id=md5('poc-en-01'))
|
|
OR (t.valor='NASA' AND n.id=md5('poc-en-02'))
|
|
OR (t.valor='Luna' AND n.id=md5('poc-en-02'))
|
|
OR (t.valor='Tesla' AND n.id=md5('poc-es-07'))
|
|
OR (t.valor='Elon Musk' AND n.id=md5('poc-es-07'))
|
|
OR (t.valor='Lamine Yamal' AND n.id=md5('poc-es-03'))
|
|
OR (t.valor='FC Barcelona' AND n.id=md5('poc-es-03'))
|
|
OR (t.valor='Manchester City' AND n.id=md5('poc-es-03'))
|
|
OR (t.valor='Champions League' AND n.id=md5('poc-es-03'))
|
|
OR (t.valor='FMI' AND n.id=md5('poc-es-04'))
|
|
OR (t.valor='Argentina' AND n.id=md5('poc-es-04'))
|
|
OR (t.valor='OMS' AND n.id=md5('poc-es-06'))
|
|
OR (t.valor='CSIC' AND n.id=md5('poc-es-09'))
|
|
OR (t.valor='Carmen López' AND n.id=md5('poc-es-09'))
|
|
OR (t.valor='vacuna' AND n.id=md5('poc-es-09'))
|
|
OR (t.valor='Emmanuel Macron' AND n.id=md5('poc-fr-02'))
|
|
OR (t.valor='Francia' AND n.id=md5('poc-fr-02'))
|
|
OR (t.valor='Amazon' AND n.id=md5('poc-en-05'))
|
|
OR (t.valor='España' AND n.id=md5('poc-es-02'))
|
|
OR (t.valor='energía solar' AND n.id=md5('poc-es-02'))
|
|
OR (t.valor='China' AND n.id=md5('poc-en-04'))
|
|
ON CONFLICT DO NOTHING;
|
|
|
|
-- ---------------------------------------------------------------------------
|
|
-- NOTA: El usuario admin se crea en poc.sh con hash bcrypt generado en runtime
|
|
-- ---------------------------------------------------------------------------
|