Logo for Layer7.mx

SRE

Roles & Responsibilities

  • Ingeniero en sistemas o afin
  • 5 años de experiencia en entornos de alta disponibilidad
  • Dominio de herramientas de observabilidad (Datadog, Prometheus, Grafana, Kibana)
  • Conocimiento sólido de automatización, despliegues y cloud
  • Pensamiento sistémico y habilidad para construir cultura operativa

Requirements:

  • Diseñar e implementar el sistema de monitoreo y alertas centralizadas
  • Definir métricas de confiabilidad (SLOs, SLIs, SLAs)
  • Analizar y prevenir incidentes de disponibilidad
  • Colaborar con DevOps y Data para diseñar arquitecturas resilientes
  • Documentar runbooks, dashboards y protocolos de respuesta a incidentes
  • Liderar revisiones postmortem con foco en mejora continua

Job description

Este es un puesto de trabajo remoto.

SOBRE LAYER7

En Layer7 estamos construyendo tecnología en hiperescala, donde cada decisión de ingeniería impacta a millones de usuarios y a las operaciones críticas de bancos, retailers y grandes empresas.

Somos más de 100 profesionales apasionados enfrentando problemas de alta complejidad técnica: desde sistemas distribuidos resilientes hasta plataformas capaces de procesar miles de millones de interacciones al año.

Aquí cultivamos una cultura de alto rendimiento, curiosidad técnica y camaradería real, con espacio para crecer, aprender y mantener un balance sano entre vida
personal y profesional.

Si disfrutas resolver problemas difíciles, diseñar sistemas que escalan sin límites y atreverte a innovar con impacto, este es tu lugar.

Objetivo del puesto

Diseñar e implementar estrategias de observabilidad, resiliencia y confiabilidad que aseguren la continuidad operativa de las plataformas de comunicación y datos de Layer7.

Responsabilidades principales

·        Diseñar e implementar el sistema de monitoreo y alertas centralizadas (la alerta debe llegar al sistema, no al cliente).

·        Definir métricas de confiabilidad (SLOs, SLIs, SLAs) y garantizar su cumplimiento.

·        Analizar y prevenir incidentes de disponibilidad, identificando patrones y causas raíz.

·        Colaborar con DevOps y Data para diseñar arquitecturas que sean resilientes por diseño.

·        Documentar runbooks, dashboards y protocolos de respuesta a incidentes.

·        Liderar revisiones postmortem con foco en mejora continua y aprendizaje organizacional.



Requirements

·        Ingeniero en sistemas o afin

·        5 años de experiencia en entornos de alta disponibilidad

·        Dominio de herramientas de observabilidad (Datadog, Prometheus, Grafana, Kibana)

·        Conocimiento sólido de automatización, despliegues y cloud.

·        Pensamiento sistémico y habilidad para construir cultura operativa, no solo mantener infraestructura.



Benefits

  • Salario competitivo 
  • Empleo 100% Remoto. Postúlate independientemente del país donde vivas.
  • Ambiente de trabajo dinámico y colaborativo



Salary: De acuerdo a experiencia

Related jobs

Other jobs at Layer7.mx

We help you get seen. Not ignored.

We help you get seen faster — by the right people.

🚀

Auto-Apply

We apply for you — automatically and instantly.

Save time, skip forms, and stay on top of every opportunity. Because you can't get seen if you're not in the race.

AI Match Feedback

Know your real match before you apply.

Get a detailed AI assessment of your profile against each job posting. Because getting seen starts with passing the filters.

Upgrade to Premium. Apply smarter and get noticed.

Upgrade to Premium

Join thousands of professionals who got noticed and hired faster.