FLUJOS/BACK_BACK/main.py

import pandas as pd
from pymongo import MongoClient
from obsei.source.pandas_source import PandasSource, PandasSourceConfig
from obsei.analyzer.classification_analyzer import ClassificationAnalyzerConfig, ZeroShotClassificationAnalyzer
from obsei.sink.pandas_sink import PandasSink, PandasSinkConfig

# Configura la fuente
source = PandasSource()
source_config = PandasSourceConfig(
    # Proporciona tu configuración aquí
)

# Configura el analizador
analyzer = ZeroShotClassificationAnalyzer(
    # Proporciona tu configuración aquí
)
analyzer_config = ClassificationAnalyzerConfig(
    # Proporciona tu configuración aquí
)

# Configura el sumidero
sink = PandasSink()
sink_config = PandasSinkConfig(
    # Proporciona tu configuración aquí
)

# Ejecuta el flujo de trabajo
source_response_list = source.lookup(source_config)
analyzer_response_list = analyzer.analyze_input(
    source_response_list=source_response_list,
    analyzer_config=analyzer_config
)
sink_response_list = sink.send_data(analyzer_response_list, sink_config)

# Ahora `sink_response_list` es una lista de DataFrames.
# Puedes concatenarlos en un solo DataFrame si es necesario.
df = pd.concat(sink_response_list)

# Realiza cualquier transformación o limpieza de datos necesaria aquí...

# Finalmente, guarda el DataFrame en MongoDB.
client = MongoClient('mongodb://localhost:27017/')
db = client['nombre_de_tu_base_de_datos']
collection = db['nombre_de_tu_coleccion']
collection.insert_many(df.to_dict('records'))