Curso Avanzado de Técnicas de Manejo y Recuperación de Documentos con Langchain

Autor/a

Jesús Vélez Santiago

Fecha de publicación

1 de octubre de 2023

Introducción

Clonación del repositorio

git clone https://github.com/jvelezmagic/langchain-advanced-document-handling-retrieval-techniques-course.git

Configuración de una sola vez

  • Instalación de pyenv.

  • Instalación de Python con:

pyenv install 3.11.2
  • Activación de Python con:
pyenv local 3.11.2
  • Instalación de Poetry.

  • Confuguración de Poetry para crear ambientes virtuales dentro de la raíz del proyecto con:

poetry config virtualenvs.in-project true
  • Instalación de dependencias con:
poetry install
  • Activación del ambiente virtual con:
poetry shell

Ejecución de la aplicación

  • Obtención de las variables de entorno:

    • OPENAI_API_KEY: API Key de OpenAI.
    • DOCUGAMI_API_KEY: API Key de Docugami.
    • CO_API_KEY: API Key de Cohere.
  • Ingesta de datos con:

    python ingest.py

    o

    poetry run python ingest.py
  • Inicialización de la aplicación con:

    streamlit run app.py

    o

    poetry run streamlit run app.py