Actualización del 2025-06-15 a las 16:43:02

This commit is contained in:
jlimolina 2025-06-15 16:43:02 +02:00
parent 273bc4e02e
commit d23754d3b8
7 changed files with 333 additions and 63 deletions

View file

@ -1,36 +1,17 @@
#!/bin/bash
# ==============================================================================
# SCRIPT DE REINSTALACIÓN PARA APLICACIÓN RSS (MODO ACCESO WEB DIRECTO)
#
# CARGA LOS DATOS INICIALES DESDE LOS ARCHIVOS .sql EN EL DIRECTORIO.
# SIRVE LA APLICACIÓN DIRECTAMENTE EN EL PUERTO 8000 USANDO GUNICORN.
#
# ACCIONES DESTRUCTIVAS:
# - DETIENE y ELIMINA todos los servicios systemd que empiecen por "rss".
# - ELIMINA (DROP) la base de datos y el usuario de la base de datos.
#
# USO:
# 1. Clona tu repositorio y entra en su directorio.
# 2. Asegúrate de tener los archivos .sql (categorias.sql, etc.) en la raíz.
# 3. Dale permisos de ejecución a este script: chmod +x install.sh
# 4. Ejecútalo con sudo: sudo ./install.sh
# ==============================================================================
set -e # Termina el script si un comando falla
set -e
# ========= CONFIGURACIÓN =========
APP_NAME="rss"
DB_NAME="rss"
DB_USER="rss"
APP_USER="x" # El usuario del sistema que ejecutará la aplicación
APP_DIR=$(pwd) # Asume que el directorio de la app es el directorio actual
APP_USER="x"
APP_DIR=$(pwd)
PYTHON_ENV="$APP_DIR/venv"
WSGI_APP_ENTRY="app:app"
WEB_PORT=8000 # Puerto en el que la aplicación será accesible
WEB_PORT=8000
# ========= 0. COMPROBACIONES Y CONFIRMACIÓN DE SEGURIDAD =========
echo "🟢 Paso 0: Verificaciones y confirmación de seguridad"
if [[ $EUID -ne 0 ]]; then
echo "❌ Este script debe ser ejecutado como root (usa sudo)."
exit 1
@ -55,7 +36,6 @@ if [ -z "$DB_PASS" ]; then
exit 1
fi
# ========= 0.5: LIMPIEZA DE LA INSTALACIÓN ANTERIOR =========
echo "🧹 Paso 0.5: Limpiando instalación anterior..."
echo " -> Buscando y eliminando servicios systemd antiguos..."
for service in $(systemctl list-unit-files | grep "^$APP_NAME" | cut -d' ' -f1); do
@ -67,12 +47,10 @@ rm -f /etc/systemd/system/$APP_NAME*
systemctl daemon-reload
echo " -> Servicios systemd limpiados."
# ========= 1. INSTALAR DEPENDENCIAS DEL SISTEMA =========
echo "🟢 Paso 1: Instalando dependencias del sistema (PostgreSQL, Python, Gunicorn...)"
apt-get update
apt-get install -y wget ca-certificates postgresql postgresql-contrib python3-venv python3-pip python3-dev libpq-dev gunicorn
# ========= 2. RECREAR LA BASE DE DATOS Y EL USUARIO =========
echo "🔥 Paso 2: Eliminando y recreando la base de datos y el usuario..."
sudo -u postgres psql -c "DROP DATABASE IF EXISTS $DB_NAME;"
sudo -u postgres psql -c "DROP USER IF EXISTS $DB_USER;"
@ -81,12 +59,10 @@ sudo -u postgres psql -c "CREATE USER $DB_USER WITH PASSWORD '$DB_PASS';"
sudo -u postgres psql -c "CREATE DATABASE $DB_NAME OWNER $DB_USER;"
echo "✅ Base de datos y usuario recreados con éxito."
# ========= 3. PREPARAR ENTORNO DE LA APP =========
echo "🐍 Paso 3: Configurando el entorno de la aplicación..."
if ! id "$APP_USER" &>/dev/null; then
echo "👤 Creando usuario del sistema '$APP_USER'..."
sudo useradd -m -s /bin/bash "$APP_USER"
echo "✅ Usuario '$APP_USER' creado."
else
echo "✅ Usuario del sistema '$APP_USER' ya existe."
fi
@ -103,23 +79,27 @@ echo " -> Instalando dependencias desde requirements.txt..."
if [ -f "requirements.txt" ]; then
"$PYTHON_ENV/bin/python" -m pip install -r "requirements.txt"
else
echo "⚠️ ADVERTENCIA: No se encontró requirements.txt. La aplicación podría no funcionar."
echo "⚠️ ADVERTENCIA: No se encontró requirements.txt."
fi
EOF
echo "✅ Entorno de Python configurado."
# ========= 4. CREAR ESQUEMA Y SEMBRAR DATOS DESDE ARCHIVOS SQL =========
echo "🧠 Paso 3.5: Descargando modelos de lenguaje para Newspaper3k..."
if [ -f "download_models.py" ]; then
sudo -u "$APP_USER" "$PYTHON_ENV/bin/python" "$APP_DIR/download_models.py"
echo "✅ Modelos NLP verificados/descargados."
else
echo "⚠️ ADVERTENCIA: No se encontró download_models.py. El scraping de URLs puede fallar."
fi
echo "📐 Paso 4: Creando esquema de BD, configurando FTS y sembrando datos desde archivos .sql..."
export PGPASSWORD="$DB_PASS"
# Crear las tablas primero
psql -U "$DB_USER" -h localhost -d "$DB_NAME" <<SQL
CREATE TABLE IF NOT EXISTS continentes (id SERIAL PRIMARY KEY, nombre VARCHAR(50) NOT NULL UNIQUE);
CREATE TABLE IF NOT EXISTS categorias (id SERIAL PRIMARY KEY, nombre VARCHAR(100) NOT NULL UNIQUE);
CREATE TABLE IF NOT EXISTS paises (id SERIAL PRIMARY KEY, nombre VARCHAR(100) NOT NULL UNIQUE, continente_id INTEGER REFERENCES continentes(id) ON DELETE SET NULL);
CREATE TABLE IF NOT EXISTS feeds (id SERIAL PRIMARY KEY, nombre VARCHAR(255), descripcion TEXT, url TEXT NOT NULL UNIQUE, categoria_id INTEGER REFERENCES categorias(id) ON DELETE SET NULL, pais_id INTEGER REFERENCES paises(id) ON DELETE SET NULL, idioma CHAR(2), activo BOOLEAN DEFAULT TRUE, fallos INTEGER DEFAULT 0, last_etag TEXT, last_modified TEXT);
CREATE TABLE IF NOT EXISTS noticias (id VARCHAR(32) PRIMARY KEY, titulo TEXT, resumen TEXT, url TEXT NOT NULL UNIQUE, fecha TIMESTAMP, imagen_url TEXT, categoria_id INTEGER REFERENCES categorias(id) ON DELETE SET NULL, pais_id INTEGER REFERENCES paises(id) ON DELETE SET NULL, tsv tsvector);
ALTER TABLE noticias ADD COLUMN IF NOT EXISTS tsv tsvector;
CREATE OR REPLACE FUNCTION noticias_tsv_trigger() RETURNS trigger AS \$\$ BEGIN new.tsv := setweight(to_tsvector('spanish', coalesce(new.titulo,'')), 'A') || setweight(to_tsvector('spanish', coalesce(new.resumen,'')), 'B'); return new; END \$\$ LANGUAGE plpgsql;
DROP TRIGGER IF EXISTS tsvectorupdate ON noticias;
@ -127,30 +107,20 @@ CREATE TRIGGER tsvectorupdate BEFORE INSERT OR UPDATE ON noticias FOR EACH ROW E
CREATE INDEX IF NOT EXISTS noticias_tsv_idx ON noticias USING gin(tsv);
SQL
# Sembrado de Datos Iniciales desde archivos .sql
echo " -> Buscando archivos .sql para sembrar datos..."
if [ -f "continentes.sql" ]; then
echo " -> Cargando continentes.sql..."
psql -U "$DB_USER" -h localhost -d "$DB_NAME" -f "continentes.sql"
else
echo " -> ADVERTENCIA: No se encontró continentes.sql"
fi
if [ -f "categorias.sql" ]; then
echo " -> Cargando categorias.sql..."
psql -U "$DB_USER" -h localhost -d "$DB_NAME" -f "categorias.sql"
else
echo " -> ADVERTENCIA: No se encontró categorias.sql"
fi
if [ -f "paises.sql" ]; then
echo " -> Cargando paises.sql..."
psql -U "$DB_USER" -h localhost -d "$DB_NAME" -f "paises.sql"
else
echo " -> ADVERTENCIA: No se encontró paises.sql"
fi
# Reiniciar las secuencias para que los nuevos INSERTs no colisionen
echo " -> Actualizando contadores de secuencias de la base de datos..."
psql -U "$DB_USER" -h localhost -d "$DB_NAME" <<SQL
SELECT setval('categorias_id_seq', (SELECT MAX(id) FROM categorias), true) WHERE (SELECT MAX(id) FROM categorias) IS NOT NULL;
@ -161,7 +131,6 @@ SQL
unset PGPASSWORD
echo "✅ Esquema de base de datos y datos iniciales configurados."
# ========= 5. CREAR SCRIPT PARA EL WORKER =========
echo "👷 Paso 5: Creando script para el worker de captura..."
cat <<EOF > "$APP_DIR/worker.py"
import sys
@ -181,15 +150,11 @@ EOF
chown "$APP_USER":"$APP_USER" "$APP_DIR/worker.py"
echo "✅ Script del worker creado/actualizado."
# ========= 6. CREAR SERVICIOS SYSTEMD =========
echo "⚙️ Paso 6: Creando nuevos archivos de servicio systemd..."
# --- Servicio para la aplicación web (Gunicorn) ---
cat <<EOF > /etc/systemd/system/$APP_NAME.service
[Unit]
Description=Gunicorn instance to serve $APP_NAME
After=network.target
[Service]
User=$APP_USER
Group=$APP_USER
@ -201,18 +166,12 @@ Environment="DB_PORT=5432"
Environment="DB_NAME=$DB_NAME"
Environment="DB_USER=$DB_USER"
Environment="DB_PASS=$DB_PASS"
# --- LÍNEA CLAVE ---
# Gunicorn escucha en todas las IPs (0.0.0.0) en el puerto especificado
ExecStart=$PYTHON_ENV/bin/gunicorn --workers 3 --bind 0.0.0.0:$WEB_PORT $WSGI_APP_ENTRY
Restart=always
[Install]
WantedBy=multi-user.target
EOF
# --- Servicio para el worker ---
cat <<EOF > /etc/systemd/system/$APP_NAME-worker.service
[Unit]
Description=$APP_NAME Feed Fetcher Worker
@ -230,7 +189,6 @@ Environment="DB_PASS=$DB_PASS"
ExecStart=$PYTHON_ENV/bin/python $APP_DIR/worker.py
EOF
# --- Timer para el worker ---
cat <<EOF > /etc/systemd/system/$APP_NAME-worker.timer
[Unit]
Description=Run $APP_NAME worker every 15 minutes
@ -243,7 +201,6 @@ WantedBy=timers.target
EOF
echo "✅ Archivos de servicio y timer creados."
# ========= 7. HABILITAR, ARRANCAR SERVICIOS Y ABRIR FIREWALL =========
echo "🚀 Paso 7: Recargando, habilitando, arrancando servicios y configurando firewall..."
systemctl daemon-reload
systemctl enable $APP_NAME.service
@ -251,7 +208,6 @@ systemctl start $APP_NAME.service
systemctl enable $APP_NAME-worker.timer
systemctl start $APP_NAME-worker.timer
# Abre el puerto en el firewall (UFW), si está activo
if command -v ufw &> /dev/null && ufw status | grep -q 'Status: active'; then
echo " -> Firewall UFW detectado. Abriendo puerto $WEB_PORT..."
ufw allow $WEB_PORT/tcp