Requisitos de conocimiento para nuevos desarrolladores
1. Conceptos clave
RAG (Retrieval-Augmented Generation): todo el sistema está basado en un pipeline de chatbot RAG, por lo que es esencial comprender cómo funcionan conjuntamente la recuperación de información, fragmentación, embeddings y generación.
Arquitectura de microservicios: el sistema está compuesto por aproximadamente 8 servicios independientes que se comunican mediante HTTP y colas de mensajes.
2. Python
Python 3.11 (requisito obligatorio para Azure Functions Consumption Plan)
Flask: backend, chunker, converter, connector e image processor están desarrollados en Flask.
FastAPI: el servicio evaluator utiliza FastAPI con soporte asíncrono.
Streamlit: la interfaz de administración está desarrollada en Streamlit.
Poetry: gestión de dependencias en todos los servicios.
uv: utilizado como gestor alternativo de paquetes Python (Azure Functions).
3. Servicios Cloud Azure
Azure Blob Storage: almacenamiento documental, resultados de evaluación y datos rastreados.
Azure AI Search (Cognitive Search): índice vectorial/híbrido para fragmentos documentales.
Azure OpenAI: inferencia LLM (GPT-4, embeddings con text-embedding-3-large).
Azure Document Intelligence (Form Recognizer): procesamiento de PDFs/documentos y OCR.
Azure Container Apps: hosting productivo de microservicios.
Azure Container Registry (ACR): almacenamiento y construcción de imágenes Docker.
Azure Functions: pipeline de indexación activado por colas.
Azure Queue Storage: mensajería asíncrona entre servicios.
Azure EntraID: autenticación y control de acceso basado en roles.
Azure Application Insights: telemetría y logging.
Azure CLI: despliegues e interacciones con Azure.
4. Docker & Contenedores
Docker: todos los servicios disponen de Dockerfile; desarrollo local y producción funcionan con contenedores.
Experiencia construyendo, ejecutando y depurando servicios Python containerizados.
5. Fuentes de datos & Crawling
SharePoint Online: rastreo de librerías documentales con autenticación.
Confluence: scraping de páginas y árboles de páginas mediante PATs.
Web Crawling: rastreo genérico de sitios web con control de profundidad.
6. IA / Evaluación ML
RAGAs Framework: métricas de evaluación (faithfulness, relevance, context precision/recall).
LLM-as-judge: uso de GPT-4 para valorar calidad de respuestas.
Locust: pruebas de carga y rendimiento de la API RAG.
7. Observabilidad
LangFuse: plataforma de trazabilidad y observabilidad LLM.
Application Insights: telemetría nativa Azure.
8. Herramientas de desarrollo
VS Code: configuraciones de lanzamiento, debug y tareas.
Azurite: emulador local de Azure Storage.
Azure Functions Core Tools: entorno local de Azure Functions.
Git: modelo de ramas dev/ → dev/featureX → PR a main.

Intapp

Idego Group - Your Remote IT Experts

Allstate

Blue Prism

GEHA Health

Grupo TECDATA Engineering

Grupo TECDATA Engineering

Grupo TECDATA Engineering