Logo for Sofka Technologies

SRE Remoto

Roles & Responsibilities

  • Strong experience implementing observability and resiliency strategies; championing automation, visibility, and incident response practices within agile teams.
  • Proficiency in SRE, DevOps principles and Cloud architectures; solid understanding of distributed, resilient systems (e.g., circuit breakers, fallbacks, retries).
  • Hands-on experience with observability tools (Dynatrace with custom extensions, Grafana, Zabbix, Elasticsearch, Fluentd, Prometheus) and automation/infrastructure tools (Python, Ansible, Monaco, Terraform).
  • Desirable certifications such as Observability Practitioner, Grafana Labs, Datadog, or Chaos Engineering (or similar).

Requirements:

  • Understand and translate tribe initiatives and their technical implications to ensure technological alignment.
  • Configure and maintain dashboards, metrics, alerts, and controls for proactive monitoring.
  • Implement resilience patterns such as circuit breakers, fallbacks, and retries to strengthen the architecture.
  • Implement self-healing workflows to reduce Mean Time to Recovery (MTTR).

Job description


¿Estás buscando nuevos desafíos y un lugar donde puedas disfrutar de un ambiente cercano mientras aprendes constantemente?

¡Bienvenido a un equipo con un propósito claro: "TRANSFORMAR la vida de las personas siendo el aliado TECNOLÓGICO más confiable"! 🚀

¡Prepárate y únete a esta aventura! 

¿Qué encontrarás?

  • Retos técnicos y personales que te mantendrán en constante crecimiento.🤝 Un equipo conectado, enfocado en tu bienestar físico y mental.

  • Cultura de mejora continua, fresca y colaborativa, con oportunidades de aprendizaje y gente dispuesta a apoyarte.

  • KaizenHub, un programa diseñado para potenciar tus talentos, con feedback, mentorías y coaching a través de Sofka U. ¡Será un reto y un juego a la vez! 🧠🎮

  • Programas como Happy Kaizen y WeSofka que cuidan tu bienestar físico y emocional. 

¿Qué buscamos?

Solida experiencia en la implementación de estrategias de observabilidad y resiliencia. Eres el candidato/a ideal si te apasiona actuar como un embajador tecnológico, promoviendo las mejores prácticas en automatización, visibilidad y capacidad de respuesta ante fallas dentro de equipos ágiles y dinámicos. Tu dominio de los principios SRE, DevOps y arquitecturas Cloud será fundamental para el éxito.

Este rol es una oportunidad única para liderar la evolución de nuestras plataformas, asegurando que nuestros sistemas no solo sean robustos y escalables, sino que también cuenten con una capacidad de recuperación excepcional. Tu trabajo tendrá un impacto directo en la fiabilidad de nuestros servicios críticos, mejorando la experiencia de nuestros usuarios y fortaleciendo la columna vertebral tecnológica de nuestro negocio.

Responsabilidades

  • Comprender y traducir las iniciativas de cada tribu y sus implicancias técnicas para asegurar la alineación tecnológica.

  • Adaptar las necesidades de observabilidad a cada solución, garantizando una cobertura y visibilidad completas.

  • Configurar y mantener dashboards, métricas, alertas y controles relevantes para una monitorización proactiva.

  • Asegurar la calidad técnica de la observabilidad en los journeys críticos, validando la eficiencia y escalabilidad.

  • Implementar patrones de resiliencia como circuit breakers, fallbacks y retries para fortalecer la arquitectura.

  • Utilizar herramientas como Ansible y Terraform para automatizar tareas operativas y de infraestructura.

  • Implementar flujos de autoremediación para reducir el Tiempo Medio de Recuperación (MTTR).

  • Evangelizar y formar a los equipos sobre las mejores prácticas SRE, observabilidad y resiliencia.

Conocimientos Técnicos

  • Herramientas de Observabilidad: Dynatrace (incluyendo extensiones custom), Grafana, Zabbix, ElasticSearch, Fluentd, Prometheus.

  • Lenguajes y Automatización: Python, Ansible, Monaco, Terraform.

  • Plataformas y Principios: ServiceNow CMDB, ITSM. Sólidos conocimientos en principios de arquitectura distribuida y resiliente (circuit breakers, fallbacks).

  • Certificaciones (deseables): Observability Practitioner, Grafana Labs, Datadog, Chaos Engineering, o similares.

¡PRESENTATE y sé parte de esta historia! 


Condiciones

  • Contrato a término indefinido ¡Queremos relaciones a largo plazo y que seas parte de nuestra familia por mucho tiempo!

  • ¿Buscas crecimiento profesional? En Sofka, te ofrecemos un ecosistema de aprendizaje con múltiples herramientas para cerrar brechas y potenciar tus habilidades. ¡Tú decides cómo quieres crecer! 📚

Related jobs

Other jobs at Sofka Technologies

We help you get seen. Not ignored.

We help you get seen faster — by the right people.

🚀

Auto-Apply

We apply for you — automatically and instantly.

Save time, skip forms, and stay on top of every opportunity. Because you can't get seen if you're not in the race.

AI Match Feedback

Know your real match before you apply.

Get a detailed AI assessment of your profile against each job posting. Because getting seen starts with passing the filters.

Upgrade to Premium. Apply smarter and get noticed.

Upgrade to Premium

Join thousands of professionals who got noticed and hired faster.