Experience with message queues (RabbitMQ, Pub/Sub, Kafka) and Spring Boot platforms., Familiarity with cloud platforms, preferably Google Cloud., Knowledge of monitoring tools such as Dynatrace, Grafana, and Cloud Monitoring., Basic understanding of development in Python and Java, and API integration (Apigee)..
Key responsabilities:
Lead the emergency response team as Incident Commander during critical incident resolution.
Conduct war room sessions to troubleshoot and reduce MTTR, MTTD, and MTBF.
Perform root cause analysis during crises using monitoring tools like Datadog and Grafana.
Maintain and enhance observability for the relational database and generate knowledge base documentation.
Report This Job
Help us maintain the quality of our job listings. If you find any issues with this job post, please let us know.
Select the reason you're reporting this job:
Um banco nacional, o 5º maior banco privado do Brasil (ranking Banco Central). Estamos em constante evolução e construímos #parcerias de sucesso para entregarmos nosso propósito de tornar mais tranquila a vida financeira de pessoas e empresas. A nossa cultura é simples e ágil. Somos informais nas relações, valorizamos a inovação e atuamos em um ambiente descontraído, cada vez mais colaborativo e com intencionalidade no avanço da diversidade e inclusão. Se identificou? Então venha trabalhar com a gente!
Se você tem interesse em conhecer e trabalhar para garantir que ele seja desdobrado nas diversas áreas do banco, nosso papo é com você!
O BV atua intencionalmente em prol da aceleração da equidade e representatividade no mercado financeiro, respeitando e apoiando a diversidade em toda sua pluralidade e interseccionalidade, garantindo uma transformação social positiva. Por isso, convidamos pessoas negras, mulheres, profissionais com deficiência, comunidade LGBTQIA+ e pessoas de qualquer idade a conhecerem a gente um pouco mais e a se inscreverem nesta vaga.
Dá uma olhada nos desafios que te esperam como Incident Commander:
Atuar no time de resposta a emergências (ERT) como incident commander conduzindo a resolução de incidentes críticos;
Atuar na condução de war room, colaborando no troubleshooting, visando a redução do MTTR, MTTD, MTBF e redução dos impactos aos clientes;
Realizar o troubleshooting identificando a causa raiz durante crises utilizando das ferramentas de monitoração e troubleshoot Datadog, Grafana, Cloud monitoring, Kibana, Crashlytics, etc;
Zelar pelos painéis e dashs para acompanhamento do Banco Relacional;
Apoiar no processo de resposta a incidentes gerando insigths e melhoria de processos e retroalimentar as necessidades de Observabilidade;
Manter e evoluir a observabilidade do Banco Relacional;
Curadoria dos procedimentos e geração de base de conhecimento;
Investigar o ambiente em busca de pontos de falha, gargalos e oportunidades de melhoria de estabilidade.
E aí, se identificou? Agora gostaríamos de saber se você tem o perfil e os conhecimentos abaixo: