Logo for Gauge

Site Reliability Engineer (SRE) - Network Focus |AWS

Roles & Responsibilities

  • Experience with networks in enterprise or distributed environments and production network troubleshooting.
  • Advanced knowledge of network protocols (TCP/IP, DNS, BGP, OSPF, NAT).
  • Experience with VPNs, firewalls, load balancers and network segmentation.
  • Experience with cloud networking (AWS VPC, subnets, routing tables, NAT Gateway) and hybrid environments (cloud + on-premise).

Requirements:

  • Ensure reliability, performance and availability of connectivity between systems, operating, diagnosing and evolving networks in distributed, hybrid and cloud environments with focus on traffic analysis and advanced troubleshooting and service communication architecture.
  • Manage AWS environments: operate and evolve complex, highly available, horizontally scalable architectures using services such as EC2, ECS, Lambda, RDS and S3.
  • Observability and incident response: define and evolve end-to-end observability (SLIs, SLOs, SLAs) with tools like New Relic, CloudWatch and custom dashboards; proactively identify bottlenecks and incidents.
  • Automation, CI/CD and DevSecOps: design, maintain and optimize robust and secure pipelines (Jenkins, Bitbucket, GitOps) for continuous delivery of microservices and serverless workloads; integrate security practices and governance throughout the lifecycle.

Job description

JOB DESCRIPTION


Somos uma empresa do Grupo Stefanini, especializados em marketing digital, utilizamos uma abordagem integrada que combina tecnologia, inteligência de dados, design e profundo conhecimento do comportamento do consumidor. Nosso foco está em potencializar os resultados de nossos parceiros, oferecendo soluções que vão desde consultoria estratégica até a execução e acompanhamento dos projetos.

Com forte presença na América Latina e em expansão nos Estados Unidos, estamos sempre na vanguarda, aplicando as últimas tendências de mercado e mantendo um olhar atento à inovação contínua. 


RESPONSIBILITIES AND ASSIGNMENTS


Garantir a confiabilidade, performance e disponibilidade da conectividade entre sistemas, atuando na operação, diagnóstico e evolução de redes em ambientes distribuídos, híbridos e cloud, com foco em análise de tráfego, troubleshooting avançado e arquitetura de comunicação entre serviços.


Gestão estratégica de ambientes AWS: 

  • Operar e evoluir ambientes complexos e replicáveis com alta disponibilidade, performance e escalabilidade horizontal, utilizando serviços como EC2, ECS, Lambda, RDS e S3.  


Confiabilidade e observabilidade: 

  • Definir, implementar e evoluir práticas de observabilidade de ponta a ponta (SLIs, SLOs, SLAs) com ferramentas como New Relic, CloudWatch e dashboards customizados;
  • Atuar proativamente na identificação de gargalos e incidentes.  


Conectividade e performance de rede: 

  • Diagnosticar e resolver problemas de latência, packet loss e throughput em ambientes distribuídos; 
  • Atuar em troubleshooting de DNS, VPN, firewalls e balanceadores de carga (L4/L7); 
  • Analisar fluxos de comunicação entre serviços (cloud, on-premise e integrações externas); 
  • Apoiar definição e evolução da arquitetura de conectividade entre sistemas.  


Automação e CI/CD: 

  • Projetar, manter e otimizar pipelines robustos e seguros (Jenkins, Bitbucket, GitOps) para entregas contínuas de microserviços e workloads serverless.  


Cultura de SRE e melhoria contínua: 

  • Promover post-mortems blameless, chaos engineering e automação de tarefas operacionais para reduzir toil e elevar a eficiência do time.  


Segurança e governança (DevSecOps): 

  • Integrar boas práticas de IAM, redes seguras, criptografia, controle de tráfego, monitoramento de vulnerabilidades e conformidade ao ciclo de vida das aplicações, incluindo troubleshooting de conectividade e análise de comunicação entre serviços.  


Documentação e compartilhamento de conhecimento: 

  • Criar e manter documentação clara sobre arquitetura, automações, incidentes e runbooks, impulsionando autonomia e onboarding.

REQUIREMENTS AND QUALIFICATIONS


  • Experiência com redes em ambientes corporativos ou distribuídos  
  • Atuação prática em troubleshooting de rede em ambientes de produção  
  • Experiência com análise de tráfego, identificação de gargalos e resolução de incidentes críticos 
  • Conhecimento avançado em protocolos de rede (TCP/IP, DNS, BGP, OSPF, NAT)  
  • Experiência com VPNs, firewalls, load balancers e segmentação de rede  
  • Experiência com redes em cloud (AWS VPC, subnets, routing tables, NAT Gateway, etc.)  
  • Vivência com ambientes híbridos (integração cloud + on-premise) 

 

Desejável: 

  • Experiência com CDN e edge (Cloudflare, Akaincidentes mai, etc.)  
  • Experiência com Direct Connect ou soluções equivalentes  
  • Conhecimento em automação de rede (Infraestrutura como Código, scripts)  
  • Experiência com ferramentas de observabilidade de rede  
  • Noções de SRE (SLI/SLO, disponibilidade, resiliência)


Competências Comportamentais: 

  • Proatividade, iniciativa e senso de dono.  
  • Comunicação clara com diferentes stakeholders e colaboração multifuncional.  
  • Orientação a resultados e melhoria contínua.  
  • Cultura blameless, capacidade de priorização e tomada de decisão em incidentes. 


Certificações desejáveis:

  • AWS Certified Advanced Networking
  • AWS Certified Solutions Architect

ADDITIONAL INFORMATION


🥳 Benefícios:

• Vale Refeição/Vale Alimentação 

• Assistência médica  

• Assistência odontológica 

• Day Off

• Gympass/ Totalpass

• Auxílio Creche 

• Assistência Pet

• Auxílio Combustível

• Auxílio Home Office

• Reembolso Educacional 

• Plataforma de saúde online e gratuita

• E-learning - Academia Stefanini com diversos cursos 

• Mentoring - Plataforma de Mentoria (Essa é uma oportunidade para conhecer pessoas, desenvolver habilidades e compartilhar experiências.) 

• Descontos em instituições para Graduação, Pós Graduação, Idiomas e Cursos

• Vantagens e descontos nos melhores estabelecimentos


Conheça a Gauge


Sobre a GAUGE


Nosso propósito é revolucionar o Marketing Digital, com soluções integradas, potencializando resultados e solucionando desafios. 🚀


QUEM SOMOS

 

Somos uma empresa do Grupo Stefanini. Especializados em marketing digital, utilizamos uma abordagem integrada que combina tecnologia, inteligência de dados, design e profundo conhecimento do comportamento do consumidor. Nosso foco está em potencializar os resultados de nossos parceiros, oferecendo soluções que vão desde consultoria estratégica até a execução e acompanhamento dos projetos. Com um time dedicado e altamente qualificado, a Gauge se destaca por sua capacidade de entender as necessidades específicas de cada cliente e entregar resultados de alta performance. 

Com forte presença na América Latina e em expansão nos Estados Unidos, estamos sempre na vanguarda, aplicando as últimas tendências de mercado e mantendo um olhar atento à inovação contínua. 

 

Dentre nossas disciplinas:

 

Consultoria de Performance Digital

Growth e CX (Customer Experience)

Design (UX/UI)

Digital Commerce

Martech (Marketing Technology)

Analytics

Mensuração e Otimização de MROI

Inovação e Desenvolvimento de Produtos Digitais


Site Reliability Engineer (SRE) Related jobs

Other jobs at Gauge

We help you get seen. Not ignored.

We help you get seen faster — by the right people.

🚀

Auto-Apply

We apply for you — automatically and instantly.

Save time, skip forms, and stay on top of every opportunity. Because you can't get seen if you're not in the race.

AI Match Feedback

Know your real match before you apply.

Get a detailed AI assessment of your profile against each job posting. Because getting seen starts with passing the filters.

Upgrade to Premium. Apply smarter and get noticed.

Upgrade to Premium

Join thousands of professionals who got noticed and hired faster.