Key Facts

Remote From:

Full time

Senior (5-10 years)

Hard Skills

High Availability Design Systems Design Observability Incident Management Datadog Automated Information Systems Cloud Computing Prometheus (Software) Grafana Kibana Continuous Improvement Process Internal Documentation

Other Skills

•
Collaboration

Roles & Responsibilities

Ingeniero en sistemas o afin
5 años de experiencia en entornos de alta disponibilidad
Dominio de herramientas de observabilidad (Datadog, Prometheus, Grafana, Kibana)
Conocimiento sólido de automatización, despliegues y cloud
Pensamiento sistémico y habilidad para construir cultura operativa

Requirements:

Diseñar e implementar el sistema de monitoreo y alertas centralizadas
Definir métricas de confiabilidad (SLOs, SLIs, SLAs)
Analizar y prevenir incidentes de disponibilidad
Colaborar con DevOps y Data para diseñar arquitecturas resilientes
Documentar runbooks, dashboards y protocolos de respuesta a incidentes
Liderar revisiones postmortem con foco en mejora continua

Job description

Este es un puesto de trabajo remoto.

SOBRE LAYER7

En Layer7 estamos construyendo tecnología en hiperescala, donde cada decisión de ingeniería impacta a millones de usuarios y a las operaciones críticas de bancos, retailers y grandes empresas.

Somos más de 100 profesionales apasionados enfrentando problemas de alta complejidad técnica: desde sistemas distribuidos resilientes hasta plataformas capaces de procesar miles de millones de interacciones al año.

Aquí cultivamos una cultura de alto rendimiento, curiosidad técnica y camaradería real, con espacio para crecer, aprender y mantener un balance sano entre vida

personal y profesional.

Si disfrutas resolver problemas difíciles, diseñar sistemas que escalan sin límites y atreverte a innovar con impacto, este es tu lugar.

Objetivo del puesto

Diseñar e implementar estrategias de observabilidad, resiliencia y confiabilidad que aseguren la continuidad operativa de las plataformas de comunicación y datos de Layer7.

Responsabilidades principales

· Diseñar e implementar el sistema de monitoreo y alertas centralizadas (la alerta debe llegar al sistema, no al cliente).

· Definir métricas de confiabilidad (SLOs, SLIs, SLAs) y garantizar su cumplimiento.

· Analizar y prevenir incidentes de disponibilidad, identificando patrones y causas raíz.

· Colaborar con DevOps y Data para diseñar arquitecturas que sean resilientes por diseño.

· Documentar runbooks, dashboards y protocolos de respuesta a incidentes.

· Liderar revisiones postmortem con foco en mejora continua y aprendizaje organizacional.

Requirements

· Ingeniero en sistemas o afin

· 5 años de experiencia en entornos de alta disponibilidad

· Dominio de herramientas de observabilidad (Datadog, Prometheus, Grafana, Kibana)

· Conocimiento sólido de automatización, despliegues y cloud.

· Pensamiento sistémico y habilidad para construir cultura operativa, no solo mantener infraestructura.

Benefits

Salario competitivo
Empleo 100% Remoto. Postúlate independientemente del país donde vivas.
Ambiente de trabajo dinámico y colaborativo

Salary: De acuerdo a experiencia

Ready to apply?

APPLY

Share ·

Related jobs

Delaware (USA)

Mesa West - Morgan Stanley, Real Estate Private Credit – Loan Originations, Analyst/Associate

30+ days ago

Morgan Stanley

Full time

Queer-Affirming Therapist (Fully Licensed, 1099, Remote/Telehealth)

30+ days ago

Edges Wellness Center LLC

Fixed term

Cognitive Behavioral Therapy

Technicien(ne) Concepteur(trice) Instrumentation et Contrôle

30+ days ago

WSP in Canada

Full time

Equipment Specification DevelopmentElectrical EngineeringAutoCADControl System Design

Rekryterare till Datalenta

30+ days ago

Digitalenta

Full time

Data EngineeringData ArchitectureData Science

Mobile Vehicle Inspector II, Manheim Express, Las Vegas, NV

30+ days ago

Cox Automotive Inc.

Full time

Damage AssessmentsMechanical Inspection

Other jobs at Layer7.mx

SDR

6 days ago

Layer7.mx

Full time
Mid-level (2-5 years)

Lead Generation

CHIEF SALES OFFICER (Growth-Focused)

29 days ago

Layer7.mx

Full time

Demand GenerationSales FunnelGo-to-Market Strategy

Backed Engineer Python

30+ days ago

Layer7.mx

Full time

WebSocketFreeSWITCHReal-Time Operating SystemsPython (Programming Language)

We help you get seen. Not ignored.

We help you get seen faster — by the right people.

🚀

Auto-Apply

We apply for you — automatically and instantly.

Save time, skip forms, and stay on top of every opportunity. Because you can't get seen if you're not in the race.

✨

AI Match Feedback

Know your real match before you apply.

Get a detailed AI assessment of your profile against each job posting. Because getting seen starts with passing the filters.

Upgrade to Premium. Apply smarter and get noticed.

Upgrade to Premium

Join thousands of professionals who got noticed and hired faster.

SRE

Key Facts

Hard Skills

Other Skills

Roles & Responsibilities

Requirements:

Job description

Objetivo del puesto

Responsabilidades principales

Requirements

Benefits

Related jobs

Mesa West - Morgan Stanley, Real Estate Private Credit – Loan Originations, Analyst/Associate

Queer-Affirming Therapist (Fully Licensed, 1099, Remote/Telehealth)

Technicien(ne) Concepteur(trice) Instrumentation et Contrôle

Rekryterare till Datalenta

Mobile Vehicle Inspector II, Manheim Express, Las Vegas, NV

Other jobs at Layer7.mx

SDR

CHIEF SALES OFFICER (Growth-Focused)

Backed Engineer Python

We help you get seen. Not ignored.

Auto-Apply

AI Match Feedback