Match score not available

Site reliability engineer pleno

72% Flex
Remote: 
Full Remote
Experience: 
Mid-level (2-5 years)
Work from: 

Offer summary

Qualifications:

Experience with AWS Cloud, Knowledge of Kubernetes, Docker, CI/CD.

Key responsabilities:

  • Maintain AWS cloud environments
  • Optimize system performance and reliability
  • Collaborate on incident management and automation initiatives
Netvagas logo
Netvagas Information Technology & Services Startup https://www.netvagas.com.br/
2 - 10 Employees
See more Netvagas offers

Job description

Logo Jobgether

Your missions

NOSSO JEITO DE SER E FAZER

O time da Appmax é feito por pessoas que encantam os parceiros e valorizam a entrega de resultados. Trabalham lado a lado para ampliar o potencial dos negócios digitais e desta forma, maximizam o seu desenvolvimento profissional. Em um ambiente inovador e colaborativo, impulsionado pelos nossos valores e atitudes, estamos revolucionando o mercado digital por meio da nossa plataforma de pagamentos online.

E aí, quer construir o seu futuro com a gente?

O time de SRE da Appmax existe para assegurar a alta disponibilidade e confiabilidade dos sistemas e serviços, melhorando continuamente a infraestrutura e os processos de operações. Este papel envolve trabalhar de perto com as equipes de desenvolvimento para garantir que as práticas de engenharia de software sejam integradas com a operacionalidade, promovendo a entrega de software de forma eficaz e alinhada com os objetivos de negócio da empresa.

Buscamos uma pessoa apaixonada por trabalhar com arquiteturas e aplicações Cloud Native, ferramentas Open Source e tudo que existe no mundo SRE, além de ter disposição para se desenvolver e aprender constantemente(Lifelong learning), atuando em projetos inovadores!

Você Terá Entre Suas Responsabilidades

  • Administrar ambientes que estão na nuvem da AWS;
  • Documentação e treinamento: Criar e manter documentação detalhada sobre a infraestrutura e os processos operacionais, além de fornecer treinamento para outros membros da equipe. Obter conhecimentos técnicos na área SRE e aplicar na melhoria contínua dos produtos da Appmax. Ajudar a replicar o conhecimento e boas práticas com outros times;
  • Otimização de desempenho: identifique gargalos de desempenho, conduza análises de desempenho e otimize o desempenho de sistemas e aplicativos. Configurar e manter sistemas de monitoramento para detectar e alertar sobre problemas de desempenho, disponibilidade e latência;
  • Atuar de forma analítica, organizada, com senso de urgência, discernimento das prioridades, com bom relacionamento interpessoal e espírito de dono;
  • Gestão de incidentes: Atuar na resposta a incidentes, identificar a causa-raíz e implementar medidas preventivas para minimizar incidentes futuros. Colaborar com outras equipes para resolver incidentes que abrangem vários sistemas ou departamentos. Responder a incidentes de forma rápida e eficaz para minimizar o impacto nos usuários;
  • Trabalhar com outras equipes para melhorar a confiabilidade geral dos sistemas da Appmax;
  • Criar e manter painéis e relatórios para comunicar o status dos sistemas às partes interessadas;
  • Automação e ferramentas: impulsione iniciativas de automação, desenvolva e mantenha ferramentas, scripts e estruturas para agilizar processos de implantação, monitoramento e solução de problemas;
  • Implementar práticas de DevOps: Colaborar com equipes de desenvolvimento para integrar práticas de DevOps, como CI/CD (Integração Contínua/Implantação Contínua) e automação de testes.

Você Poderá Agregar Bastante Ao Nosso Time Se Possuir

  • Experiência com Cloud AWS;
  • Kubernetes (EKS);
  • Observabilidade (Elastic Search, Zabbix, New Relic, AWS CloudWatch);
  • Automação & Infra como Código: Ansible e Terraform;
  • Sistemas operacionais Windows e Linux;
  • Docker;
  • CI/CD;
  • Banco de dados (MySQL, PostgreSQL Aurora MySQL, DynamoDB, Elasticache Redis, ElasticSearch ou DocumentDB);
  • Containers;
  • Perfil colaborativo;
  • Boa capacidade na resolução de problemas;
  • Programação & Scripting: Python e/ou Shellscript.

Você Vai Se Destacar Se Possuir Alguns Destes Requisitos

  • Experiência em ambientes PCI Compliant;
  • Certificações(AWS, Kubernetes, Terraform, FinOps);
  • Experiência como DBA e/ou DBRE;
  • Experiência com Helm;
  • Experiência em práticas SRE;
  • Pipelines com Bitbucket Pipelines;
  • Segurança: HTTPS, SSL, SAST e DAST, PCI, segurança defensiva.
  • FinOps;
  • Experiência com serviços de missão crítica com alta disponibilidade;
  • Ensino Superior em andamento/completo em Ti ou áreas correlatas;
  • Experiência em ambientes Multi-account(AWS).

Aqui Na Appmax, Os Nossos Maxters Encontram

Todos os equipamentos e recursos necessários para realizar o trabalho em modelo híbrido ou remoto.

Ajuda de custo para despesas de trabalho remoto.

Flexfood, assim você não precisa escolher entre VR ou VA.

Plano de saúde médico e odontológico.

Gympass.

Zenklub.

Convênio farmácia.

Vale transporte.

Seguro de vida.

Day off de aniversário.

Um ambiente que favorece e incentiva o desenvolvimento e alta performance com Ciclos de Avaliação de Desempenho semestrais, práticas de 1:1, rotinas de feedbacks contínuos, acompanhamento do PDI e muito mais.

Required profile

Experience

Level of experience: Mid-level (2-5 years)
Industry :
Information Technology & Services
Spoken language(s):
Portuguese
Check out the description to know which languages are mandatory.

Soft Skills

  • motivational-skills
  • verbal-communication-skills
  • analytical-skills
  • Teamwork

Site Reliability Engineer Related jobs