Mid-Level Data Scientist at CESAR

Remote: 
Full Remote
Contract: 
Work from: 

Offer summary

Qualifications:

Bachelor's degree in Computer Science or Information Technology., Knowledge of LLMs, RAG, and generative AI libraries like LangChain and LangGraph., Proficiency in machine learning model experimentation and evaluation processes., Experience with Python and data science libraries such as Pandas, Scikit-learn, and TensorFlow..

Key responsibilities:

  • Define, analyze, and validate hypotheses and models based on data.
  • Collaborate with business teams to map problems into analyses and models.
  • Identify project risks and propose mitigation strategies.
  • Communicate insights through data visualizations and presentations using storytelling techniques.

CESAR logo
CESAR SME http://www.cesar.org.br/
1001 - 5000 Employees
See all jobs

Job description

Olá, nós somos o CESAR!

Somos um centro de inovação e de educação que há quase 30 anos forma pessoas e impulsiona organizações, potencializando suas estratégias digitais. Resolvemos problemas complexos e desafiadores em um ambiente de trabalho descontraído, descentralizado e repleto de benefícios para nossos colaboradores, que atuam como protagonistas, interagindo diretamente com clientes de escala global.

Como Mid-Level Data Scientist, sua missão será de definir, analisar e validar hipóteses e modelos com base em dados, atuando de forma autônoma e em colaboração com as equipes de negócios com o objetivo de indicar insights e gerar valor agregado ao negócio, topa? Vamos nessa!

Esperamos que vocês que você...

  • Atue nas etapas do projeto (Concepção e definição da abordagem, Acessar os dados, Limpeza e tratamento, Exploração, visualização e entendimento dos dados, Modelagem, Avaliação e Testes) buscando conhecimento quando for necessário;
  • Apoie no entendimento dos problemas do domínio do negócio, mapeando-os em análises, modelos e hipóteses para a equipe de dados;
  • Identifique e sinalize possíveis riscos no andamento das atividades do projeto, além de participar da concepção de alternativas para mitigá-los;
  • Colabore na identificação e comunicação de insights para o negócio a partir de visualizações e apresentações com dados, fazendo o uso de storytelling, modelos estatísticos e de machine learning, otimizando recursos e/ou melhorando a experiência do cliente;
  • Colabore com a equipe de engenharia para trazer protótipos analíticos para ambiente de produção;
  • Auxilie na passagem de conhecimento dentro dos times, colaborando com a liderança técnica conforme a necessidade.

É importante que você...

  • Tenha formação no ensino superior em Ciência da Computação ou cursos de Tecnologia da Informação;
  • Tenha conhecimento sobre LLMs, RAG (Retrieval-Augmented Generation) e bibliotecas de IA generativa, como LangChain e LangGraph;
  • Possua domínio do processo de experimentação e avaliação de modelos de Machine Learning (pipeline, holdout, k-fold cross-validation, hiperparametrização);
  • Tenha conhecimento em alguns dos algoritmos de ML, como Regressão Linear e Logística, k-NN, k-Means, Naive-Bayes, Árvore de Decisão, Gradient Boosting, Random Forests, SVM, RNAs etc;
  • Tenha experiência com a linguagem de programação Python e suas bibliotecas para ciência de dados, como Pandas, Seaborn, Plotly, Scikit-learn, TensorFlow, Keras ou PyTorch;
  • Tenha domínio de SQL e Banco de Dados Relacionais e não Relacionais;
  • Possua experiências em ferramentas de visualização de dados e/ou Business Inteligence com exploração e pré-visualização de dados com envolvimento de pelo menos 2 variáveis;
  • Tenha experiência com ferramentas de MLOps, como MLFlow e EvidentlyAI;
  • Entenda de processamento de dados em larga escala;
  • Consiga obter, junto aos times de negócio, os conhecimentos de domínio necessários, propor hipóteses e provas intermediárias e, com isso, assegurar que o trabalho permaneça sob controle para gerar a solução desejada;
  • Entenda problemas de negócio traduzidos em questões técnicas, ou faça perguntas para que esse entendimento aconteça;
  • Explique os cenários de negócio prévios, as questões levantadas e suas respostas a partir de gráficos e dashboards produzidos;
  • Possua boa base em testes estatísticos e testes A/B.
  • Tenha experiência com metodologias de desenvolvimento ágil, como SCRUM.

É legal que você...

  • Tenha inglês intermediário leitura, escrita, escuta e fala.
  • Tenha conhecimento sobre orientação à objetos e padrões de projetos;
  • Tenha conhecimento sobre TDD;
  • Tenha conhecimento sobre APIs, e bibliotecas de desenvolvimento como FastAPI, Flask ou Django;
  • Tenha conhecimento em ferramentas e estratégias de versionamento de código como o Git e GitFlow;

Aqui no CESAR, nós temos algumas práticas que proporcionam uma rotina mais positiva para a pessoa colaboradora:

  • Horário flexível;
  • Estrutura horizontal;
  • Programas de treinamento e desenvolvimento;
  • Cultura voltada para a Diversidade & Inclusão, onde você pode ser livre pra ser quem é!

Gostou? Espera só para conferir nosso pacote variado de benefícios:

  • Plano de saúde e odontológico;
  • Vale Refeição / Alimentação;
  • Auxílio Idiomas;
  • Auxílio Creche;
  • Auxílio Lentes de Contato;
  • Seguro de Vida;
  • Descontos em cursos da CESAR School;
  • DayOff (no mês do Aniversário);
  • Wellhub (Gympass);
  • Moodar;
  • Cíngulo.

Quer conhecer melhor o CESAR? Clica aqui e vem com a gente!

#inovacaocesar #vemprocesar #soucesar

Required profile

Experience

Spoken language(s):
PortugueseEnglish
Check out the description to know which languages are mandatory.

Other Skills

  • Teamwork
  • Communication
  • Problem Solving

Data Scientist Related jobs