mejora de la semantica
This commit is contained in:
parent
d508dc2058
commit
cb8f69fb93
10 changed files with 191 additions and 227 deletions
23
Dockerfile
23
Dockerfile
|
|
@ -1,59 +1,38 @@
|
|||
# Dockerfile
|
||||
# -----------
|
||||
|
||||
# Imagen base Python
|
||||
FROM python:3.11-slim
|
||||
|
||||
# Construcción para CUDA 12.1 por defecto (usa --build-arg TORCH_CUDA=cpu para CPU)
|
||||
ARG TORCH_CUDA=cu121
|
||||
|
||||
WORKDIR /app
|
||||
|
||||
# Paquetes del sistema necesarios
|
||||
# - libpq-dev y gcc: para compilar dependencias que hablen con PostgreSQL (psycopg2)
|
||||
# - git: algunos modelos/liberías pueden tirar de git
|
||||
RUN apt-get update && apt-get install -y --no-install-recommends \
|
||||
libpq-dev \
|
||||
gcc \
|
||||
git \
|
||||
&& rm -rf /var/lib/apt/lists/*
|
||||
|
||||
# Ajustes de pip / runtime
|
||||
ENV PYTHONUNBUFFERED=1 \
|
||||
PIP_DISABLE_PIP_VERSION_CHECK=1 \
|
||||
TOKENIZERS_PARALLELISM=false \
|
||||
HF_HUB_DISABLE_SYMLINKS_WARNING=1
|
||||
|
||||
# Dependencias Python
|
||||
COPY requirements.txt ./
|
||||
RUN python -m pip install --no-cache-dir --upgrade pip setuptools wheel
|
||||
|
||||
# Instala PyTorch:
|
||||
# - Con CUDA 12.1 si TORCH_CUDA=cu121 (requiere runtime nvidia al ejecutar)
|
||||
# - Con ruedas CPU si TORCH_CUDA=cpu
|
||||
RUN if [ "$TORCH_CUDA" = "cu121" ]; then \
|
||||
pip install --no-cache-dir --index-url https://download.pytorch.org/whl/cu121 \
|
||||
torch==2.4.1 torchvision==0.19.1 torchaudio==2.4.1 ; \
|
||||
else \
|
||||
pip install --no-cache-dir \
|
||||
pip install --no-cache-dir --index-url https://download.pytorch.org/whl/cpu \
|
||||
torch==2.4.1 torchvision==0.19.1 torchaudio==2.4.1 ; \
|
||||
fi
|
||||
|
||||
# Instala el resto de dependencias de tu app
|
||||
RUN pip install --no-cache-dir -r requirements.txt
|
||||
|
||||
# Descarga el modelo de spaCy (español) para NER
|
||||
# Si el entorno de build no tiene red, no rompas la build: intenta en runtime.
|
||||
RUN python -m spacy download es_core_news_md || true
|
||||
|
||||
# Copia el código de la app
|
||||
COPY . .
|
||||
|
||||
# Descarga de recursos NLTK que usa newspaper3k (no crítico en build)
|
||||
RUN python download_models.py || true
|
||||
|
||||
# Puerto que usa gunicorn en el servicio web
|
||||
EXPOSE 8000
|
||||
|
||||
# El CMD/entrypoint se define en docker-compose.yml (web, scheduler, workers)
|
||||
|
||||
|
|
|
|||
Loading…
Add table
Add a link
Reference in a new issue