Logo for Stefanini LATAM

Científico de Datos

Roles & Responsibilities

  • Expertise in developing and training deep learning models, including text and image Transformers, in supervised and semi-supervised settings.
  • Proficiency with ML/DL frameworks such as Scikit-learn, PyTorch, XGBoost, Sentence Transformers, Hugging Face, and FAISS.
  • Experience with vector databases (Milvus, Qdrant, Pinecone) and solid data preprocessing using Pandas and Polars.
  • Strong Python and SQL skills (essential); familiarity with BigQuery and PySpark; knowledge of GenAI techniques and prompt engineering is desirable.

Requirements:

  • Design, develop, and train semantic search models to solve text-image matching problems.
  • Diagnose, clean, and enrich datasets for proper model training; leverage generative AI to assist dataset creation.
  • Define appropriate metrics and validation protocols to evaluate model performance aligned with business objectives.
  • Collaborate with ML engineering teams to integrate and deploy developed models into production processes.

Job description

JOB DESCRIPTION


El Científico de Datos especializado en modelos tipo Transformers de texto e imagen será responsable de diseñar, desarrollar, entrenar y optimizar modelos, orientados a resolver problemas de relación e identificación de similitudes entre distintas entidades de texto e imagen, dentro de grandes volúmenes de datos. El rol demanda una comprensión avanzada de técnicas de machine learning y deep learning aplicadas a problemas de emparejamiento y búsqueda semántica, así como la capacidad de traducir requisitos de negocio en soluciones robustas y escalables.


RESPONSIBILITIES AND ASSIGNMENTS


  • Diseñar, desarrollar y entrenar modelos de búsqueda semántica para resolver problemas de emparejamiento entre texto e imágenes.
  • Realizar diagnóstico, limpieza y enriquecimiento de datasets para el correcto entrenamiento de modelos. Uso de IA generativa para ayudar en la creación de dichos datasets.
  • Definir las mejores métricas y validaciones para evaluar el rendimiento de los modelos según los objetivos del negocio.
  • Colaborar con equipos de ingeniería de ML para la integración y despliegue de los modelos desarrollados en los procesos productivos.
  • Documentar todo el proceso de desarrollo e investigación para asegurar la reproducibilidad y mantenibilidad de los modelos.
  • Identificar e investigar nuevas técnicas, algoritmos y herramientas para mejorar la precisión y eficiencia de los modelos.


REQUIREMENTS AND QUALIFICATIONS


Habilidades Técnicas Requeridas:

  • Dominio en desarrollo y entrenamiento de modelos de Deep Learning (modelos Transformers de texto e imágenes, en un contexto supervisado y seimi-supervisado).
  • Conocimiento de técnicas de GenAI y prompt engineering son deseables.
  • Amplia experiencia en el manejo de frameworks de machine learning y deep learning como Scikit-learn, PyTorch, XGBoost, Sentence Transformers, Hugging Face, FAISS.
  • Experiencia en el manejo de bases de datos vectoriales (Milvus, Qdrant, Pinecone).
  • Conocimientos sólidos en procesamiento y limpieza de datos, uso de regex y data wrangling con Pandas y Polars. Conocimiento en técnicas avanzadas de feature engineering son deseables.
  • Experiencia práctica en evaluación de modelos supervisados.
  • Competencia en programación en Python y SQL (indispensable); conocimientos adicionales en BigQuery y PySpark son deseables.
  • Experiencia trabajando con grandes volúmenes de datos y optimización de pipelines de modelado.
  • Deseable: experiencia implementando modelos en ambientes cloud (AWS, GCP, Azure).

 

Habilidades Soft Requeridas:

  • Pensamiento analítico y capacidad de abstracción para estructurar soluciones algorítmicas complejas.
  • Comunicación clara y efectiva para presentar hallazgos técnicos a equipos multidisciplinarios.
  • Uso y adaptabilidad de métricas técnicas como KPI's del negocio.
  • Capacidad de trabajar de manera colaborativa con equipos de ciencia de datos, ingeniería de datos, back-end y front-end; así como con stakeholders del negocio.
  • Proactividad, autonomía y orientación a resultados.
  • Adaptabilidad para trabajar en entornos dinámicos y bajo objetivos desafiantes.


ADDITIONAL INFORMATION


Brindar soporte técnico y asesoramiento en temas relacionados con ciencia de datos a equipos internos.


Creer para co-crear


¿Buscas un lugar donde tus ideas brillen?

Con más de 38 años y una presencia global, en Stefanini transformamos el mañana juntos. Aquí, cada acción cuenta y cada idea puede marcar la diferencia. Únete a un equipo que valora la innovación, el respeto y el compromiso. 


Si eres una persona disruptiva, te mantienes en aprendizaje continuo y la innovación está en tu ADN, entonces somos lo que buscas. ¡Ven y construyamos juntos un futuro mejor!


Related jobs

Other jobs at Stefanini LATAM

We help you get seen. Not ignored.

We help you get seen faster — by the right people.

🚀

Auto-Apply

We apply for you — automatically and instantly.

Save time, skip forms, and stay on top of every opportunity. Because you can't get seen if you're not in the race.

AI Match Feedback

Know your real match before you apply.

Get a detailed AI assessment of your profile against each job posting. Because getting seen starts with passing the filters.

Upgrade to Premium. Apply smarter and get noticed.

Upgrade to Premium

Join thousands of professionals who got noticed and hired faster.