Logo for Grupo Elemento RH

RINGA - EL 4945625/3 - SRE SENIOR

Key Facts

Remote From: 
Full time
Portuguese

Other Skills

  • Decision Making
  • Leadership Development
  • Open Mindset
  • Problem Solving

Roles & Responsibilities

  • Extensive experience as a Site Reliability Engineer or similar, focusing on availability, performance, and security
  • Proficiency with observability tooling and practices (Grafana, Prometheus, logs, tracing)
  • Strong incident management, root cause analysis (RCA), and post-incident review skills
  • Experience with AWS cloud architecture, security best practices, reliability, and cost optimization

Requirements:

  • Configure and evolve monitoring and observability across logs, metrics, and traces to ensure real-time service health
  • Lead end-to-end high-impact incident management, including investigation, mitigation, recovery, and technical communication
  • Perform root cause analyses and implement definitive fixes; focus on predictive failure prevention and business impact mitigation
  • Drive performance, resilience, and automation improvements; create and standardize runbooks and incident response procedures; leverage AWS best practices

Job description

Você está em busca de novos e empolgantes desafios? Quer atuar com uma missão de desenvolver soluções inovadoras, trabalhando sempre com as melhores tecnologias e as metodologias em alta no mercado, buscando superar as expectativas de quem nos cerca?

Quer conhecer o que nos move, como trabalhamos, e efetivamente o que fazemos? Dá um view em nosso propósito.

Aqui na Ringa, cuidamos das pessoas e construímos equipes vencedoras.

Temos horários flexíveis e um ambiente para você crescer cada vez mais em sua carreira, afinal, sabemos que para atender a demanda de inovação precisamos trabalhar com os melhores profissionais, e queremos que VOCÊ venha ser um Ninja. Junte-se a nós!

Ficou curioso e quer saber mais sobre a Ringa? Clique Aqui! 

 

SRE SENIOR

Local de atuação: 100% remoto

 

QUAL SERÁ SEU DESAFIO:

Você será a peça-chave para garantir a disponibilidade, segurança e desempenho da plataforma, atuando na estabilidade e evolução dos serviços, com alta observabilidade e resposta rápida a incidentes, focando na prevenção de falhas, mitigação de impactos ao negócio e melhoria contínua dos ambientes.

 

AS PRINCIPAIS ATIVIDADES QUE VOCÊ IRÁ REALIZAR SÃO:

Configurar e evoluir sistemas de monitoramento e observabilidade (logs, métricas e traces), acompanhando a saúde dos serviços em tempo real
Atuar no acompanhamento, investigação e resolução de falhas dos ambientes
Conduzir análises de causa raiz (RCA) e propor correções definitivas
Atuar de forma preventiva, com foco em predição de falhas e mitigação de impactos ao negócio
Apoiar e liderar melhorias de performance, resiliência e automação dos ambientes
Conduzir incidentes de alto impacto de ponta a ponta, incluindo investigação, mitigação, recuperação do serviço e comunicação técnica
Tomar decisões técnicas sob pressão, avaliando riscos e impactos em ambientes produtivos
Criar, revisar e padronizar playbooks operacionais e procedimentos de resposta a incidentes
Identificar oportunidades de automação e melhoria contínua dos fluxos operacionais
Atuar com ferramentas de observabilidade (Grafana, Prometheus, ferramentas de logs e tracing) para garantir visibilidade e resposta rápida a incidentes
Atuar em ambientes cloud AWS, aplicando boas práticas de arquitetura, segurança, disponibilidade e custo

Related jobs

We help you get seen. Not ignored.

We help you get seen faster — by the right people.

🚀

Auto-Apply

We apply for you — automatically and instantly.

Save time, skip forms, and stay on top of every opportunity. Because you can't get seen if you're not in the race.

AI Match Feedback

Know your real match before you apply.

Get a detailed AI assessment of your profile against each job posting. Because getting seen starts with passing the filters.

Upgrade to Premium. Apply smarter and get noticed.

Upgrade to Premium

Join thousands of professionals who got noticed and hired faster.