Match score not available

Site Reliability Engineering Senior

Remote:

Full Remote

Contract:

Full time

Experience:

Senior (5-10 years)

Work from:

Chile

Offer summary

Qualifications:

Expert in Datadog and advanced monitoring tools., High proficiency in Python, Golang, and Shell scripting., Advanced experience with stress testing using Artillery, K6, and JMeter., Expert knowledge of GithubActions and CI/CD practices focused on SRE..

Key responsabilities:

Lead the implementation of monitoring tools.
Work closely with development teams for application reliability.

Xepelin Financial Services Scaleup https://bit.ly/

501 - 1000 Employees

See more Xepelin offers

Job description

🔎 ¿Qué estamos buscamos?

En Xepelin estamos buscando personas creativas y visionarias que piensen fuera de la caja para sumarse a nuestro equipo. Si te apasiona resolver desafíos interesantes de alto impacto y quieres ser parte de un entorno dinámico que está transformando la industria financiera, ¡Esta oportunidad es para ti!

El rol se integrará a nuestro equipo de Platform-SRE. Si te motiva el desafío de construir soluciones innovadoras en un entorno de rápido cambio, queremos conocerte.

Unete a nosotros, crezcamos juntos!

🎯 Principales responsabilidades

Liderar la implementación y evolución de herramientas de monitoreo y observabilidad, como Datadog.

Diseñar, implementar y evaluar estrategias avanzadas de monitoreo y alerta.

Trabajar estrechamente con equipos de desarrollo para garantizar la fiabilidad y rendimiento óptimos de las aplicaciones.

Desarrollar y ejecutar planes avanzados de recuperación ante desastres y continuidad del negocio.

Dirigir análisis post-mortem complejos de incidentes y garantizar la implementación de soluciones.

Definir y supervisar métricas avanzadas (SLI/SLO/SLA) y asegurar su alineación con los objetivos del negocio.

Automate complex operational tasks using Python, Golang, and Shell scripting.

Planificar, ejecutar y analizar pruebas de carga y estrés complejas utilizando herramientas como Artillery, K6 y JMeter.

Implementar y liderar pruebas de caos con Chaos Monkey y otras herramientas, proponiendo mejoras significativas.

Gestionar y optimizar infraestructuras complejas utilizando Terraform.

Diseñar, implementar y mantener pipelines de CI/CD complejos utilizando GithubActions enfocado en SRE.

🏆 ¿Qué necesitas para brillar?

Datadog: Dominio de Datadog y otras herramientas de monitoreo avanzadas.

Lenguajes de Scripting: Alta experiencia en Python, Golang y Shell para scripting avanzado.

Pruebas de Carga y Estrés: Experiencia avanzada con Artillery, K6 y JMeter para pruebas de carga y estrés.

Pruebas de Caos: Experiencia avanzada con Chaos Monkey y otras herramientas de pruebas de caos.

IaC: Alta competencia en el uso de Terraform para la gestión y optimización de infraestructura compleja.

CI/CD: Conocimiento experto de GithubActions y prácticas de CI/CD avanzadas enfocado en SRE.

#LI-AG1

Required profile

Experience

Level of experience: Senior (5-10 years)

Industry :

Financial Services

Spoken language(s):

Spanish

Check out the description to know which languages are mandatory.

Hard Skills

Datadog Python (Programming Language)Terraform Chaos Monkey (Software)Field Artillery Apache JMeter Shell Script

Are you interested?

Site Reliability Engineer (SRE) Related jobs

Senior Site Reliability Engineer, Data Science and ML Platforms

30+ days ago

NVIDIA

Full time
Remote: India

Senior Site Reliability Engineer

1 day ago

Rootly

Remote: North America

Senior Reliability Engineer

30+ days ago

Flinks

Full time
Remote: Canada

Site Reliability Engineer

16 day ago

Experian

Remote: India

Site Reliability Engineer (Remote, Scotland)

1 day ago

Ivanti

Remote: United Kingdom

See more Site Reliability Engineer (SRE) jobs