Match score not available

Site Reliability Engineer (SRE)

fully flexible
Remote: 
Full Remote
Contract: 
Work from: 

Offer summary

Qualifications:

Advanced experience with AWS services such as EKS, Lambda, and CloudWatch., Proficient in Kubernetes cluster management and infrastructure as code practices like Terraform., Knowledge of observability tools like Grafana and Prometheus, and CI/CD automation with GitOps., Experience in hybrid infrastructure management with VMware Tanzu or similar solutions..

Key responsabilities:

  • Ensure the stability, resilience, and efficiency of systems managed by the DevOps team.
  • Optimize cloud costs and resolve complex infrastructure issues.
  • Automate key processes and manage CI/CD pipelines effectively.
  • Implement security policies and manage secrets in Kubernetes environments.

redbee logo
redbee SME https://www.redbee.io/
51 - 200 Employees
See all jobs

Job description

¿Te apasiona el desarrollo y buscás un lugar donde puedas cambiar la vida de las personas con tecnología? En redbee te estamos buscando.

Sobre Redbee
En redbee somos un equipo diverso, unido por la curiosidad y la pasión por la tecnología. Nos encanta enfrentar desafíos, aprender de las últimas tendencias y construir soluciones innovadoras que generen un impacto real. Nuestra cultura A.C.T.I.VA nos lleva a cuestionar, colaborar y trabajar en equipo para que cada persona pueda ser su mejor versión. Creemos en el balance entre el desarrollo de negocio y la excelencia técnica, viendo a ambos como motores que se impulsan mutuamente.

Que buscamos? 
Buscamos un Site Reliability Engineer (SRE) con experiencia en soporte y mantenimiento de infraestructura en AWS y Tanzu. Este perfil será responsable de garantizar la estabilidad, resiliencia y eficiencia de los sistemas levantados por el equipo DevOps, así como de optimizar costos en la nube, resolver problemas complejos relacionados con infraestructura y automatizar procesos clave.

Requisitos Técnicos (Excluyentes):
Experiencia avanzada en servicios de AWS: EKS, Cognito, Lambda, ALB, IAM, CloudWatch, VPC.
Gestión de clústeres de Kubernetes en AWS (EKS): configuración, escalabilidad, monitoreo y mantenimiento.
Prácticas de infraestructura como código: Terraform, Terragrunt, CloudFormation.
Observabilidad y monitoreo con herramientas como Grafana, OpenSearch, Prometheus, ELK Stack, CloudWatch.
Experiencia en la implementación y gestión de infraestructuras híbridas con VMware Tanzu o soluciones similares (OpenShift, Rancher, etc.).
Seguridad: encripción, authentication & authorization, OAuth, JWT, OIDC, HTTPS.
GitOps (ArgoCD) y automatización de pipelines CI/CD con herramientas como Jenkins, GitLab CI, CircleCI, GitHub Actions.
Experiencia en despliegues productivos y gestión de flujos de CI/CD, incluyendo estrategias de branches y configuración de pipelines.
Resiliencia: manejo de reintentos, transaccionalidad distribuida, timeouts, caídas y recuperación.

Conocimientos deseables (no excluyentes) 
Conocimientos en lenguajes de scripting y automatización como Bash y Python.
Microservicios, arquitecturas distribuidas, bases de datos (Aurora, Dynamo), caché, message brokers, logging.
Implementación de políticas de seguridad en Kubernetes (RBAC, Network Policies, Pod Security Policies).
Gestión de secretos con HashiCorp Vault, AWS Secrets Manager o Kubernetes Secrets.
Implementación de estrategias de escalabilidad automática (Horizontal Pod Autoscaler, Cluster Autoscaler).
Conocimientos Deseables:
Experiencia en Web servers & API Gateways (nginx, Apache, AWS API Gateway, Apigee, etc.).
Conocimientos generales en optimización de costos en la nube.

¿Qué te ofrecemos?
Un entorno colaborativo y estimulante, donde cada persona es valorada y puede aprender de sus compañeros.
Proyectos de impacto real, enfocados en innovación, para que puedas desafiar tus propios límites.
Oportunidades de crecimiento continuo en un ambiente que te permite experimentar y aprender con tecnologías avanzadas.

Required profile

Experience

Spoken language(s):
Spanish
Check out the description to know which languages are mandatory.

Other Skills

  • Resilience
  • Teamwork
  • Communication
  • Problem Solving

Site Reliability Engineer (SRE) Related jobs