Extensive experience in cloud infrastructure, Strong knowledge of SRE practices and tools, Experience with automation and IaC tools, Deep understanding of network protocols and OS.
Key responsabilities:
Define and implement cloud infrastructure solutions
Ensure resilience and optimize performance of environments
Develop applications and APIs for SRE teams
Manage incident response and promote best practices
Report This Job
Help us maintain the quality of our job listings. If you find any issues with this job post, please let us know.
Select the reason you're reporting this job:
A Digisystem é uma empresa que entende de tecnologia e de negócio, por este motivo nós somos o seu melhor parceiro na jornada da Transformação Digital.
A nossa missão é: transformar tecnologia em resultado para a sua empresa!
Estamos atuando no mercado com mais de 30 anos de experiência, mais de 1000 funcionários com alto nível de especialização.
Quando sua história caminha junto à uma das principais inovações do ser humano, dá orgulho de dizer que se reinventar ao longo do processo foi além do necessário. Foi desafiador, curioso e surpreendente.
E assim está sendo nossa jornada com a tecnologia digital no Brasil, estamos expandindo os nossos horizontes e agora temos presença na Colômbia, nos deixando mais próximo do objetivo de virar uma empresa LATAM.
Hoje nós temos inúmeras certificações com as principais tecnologias e contamos com grandes parceiros para irmos muito além.
Acesse o nosso site e saiba muito mais sobre nós!
Estamos à procura de um Engenheiro de Sistemas Sênior (SRE) para se juntar à nossa equipe. O candidato ideal terá vasta experiência em infraestrutura em nuvem, automação, e práticas de SRE, com forte conhecimento em ferramentas e tecnologias essenciais para garantir a alta disponibilidade e desempenho dos nossos sistemas. Definir e implementar e sustentar a arquitetura de infraestrutura, incluindo redes, servidores de computer e database, storage, firewall, segurança e acessos.
Principais Responsabilidades:
Infraestrutura em Nuvem: Definir e implementar soluções de infraestrutura em nuvem, abrangendo todo o ciclo de vida dos serviços.
Resiliência e Performance: Garantir resiliência dos ambientes e otimizar performance, escalabilidade e disponibilidade.
Processos e Soluções: Planejar e executar processos tecnológicos, com foco em dados e decisões baseadas em detalhes.
Desenvolvimento e Suporte: Desenvolver aplicações e APIs para suportar as equipes e melhorar a gestão do time de SRE.
Gestão de Incidentes: Participar na resolução de crises e incidentes.
Boas Práticas: Construir e promover processos e boas práticas para garantir a confiabilidade.
Segurança: Identificar e entender os requisitos de segurança para evolução contínua do produto.
DevOps: Acompanhar e gerir a entrega contínua da esteira DevOps, promovendo a integração entre ferramentas e provisionamento.
Experiência Necessária:
1. Sistemas Operacionais e Redes
Profundo conhecimento em sistemas operacionais Windows, especialmente Linux/Unix.
Compreensão de protocolos de rede (TCP/IP, HTTP, DNS).
Experiência com administração de servidores e gerenciamento de infraestrutura.
2. Automação e Infraestrutura como Código (IaC)
Conhecimento em ferramentas de automação (Ansible, Puppet, Chef).
Habilidade com infraestrutura como código (Terraform, AWS CloudFormation).
Scripting (PowerShell, ShellScript, Bash, Python, Ruby) para automação de tarefas rotineiras.
3. Cloud e Contêineres
Experiência com plataformas de nuvem (AWS, Google Cloud, Azure, Oracle OCI).
Conhecimento em tecnologias de virtualização como VMware, Hyper-V, KVM.
Uso de contêineres e orquestração (Docker, Kubernetes).
Gerenciamento de sistemas distribuídos e microserviços.
Conhecimento em servidores de aplicação Nginx, Weblogic, Jboss/Tomcat;
4. Monitoramento e Observabilidade
Conhecimento em observabilidade e ferramentas como de monitoramento (Prometheus, Grafana, Nagios, Zabbix);
Configuração de alertas e logs centralizados (Elastic Stack, Datadog, Splunk).
Entendimento de métricas e SLOs/SLIs.
5. Banco de Dados e Armazenamento
Capacidade de administrar e otimizar bancos de dados (SQL e NoSQL).
Gerenciamento de clusters de bancos de dados Oracle, Mysql, SQLServer, Postgresql e replicação.
6. DevOps e CI/CD
Conhecimento de pipelines de integração e entrega contínua (Jenkins, GitLab CI, CircleCI).
Automação de deploys e rollback seguro.
7. Segurança
Implementação de práticas de segurança, incluindo autenticação e controle de acesso.
Proteção de infraestrutura e redes contra vulnerabilidades.
8. Resiliência e Recuperação
Design de sistemas para alta disponibilidade e tolerância a falhas.
Planejamento e testes de disaster recovery.
Certificações Desejáveis:
Linux: LPIC-1, LPIC-2, LPIC-3
AWS
Oracle Cloud
Microsoft Certified: Windows Server, Azure
VMware Certified Professional (VCP)
Required profile
Experience
Level of experience:Senior (5-10 years)
Spoken language(s):
Portuguese
Check out the description to know which languages are mandatory.