top of page
SRE Practitioner

SRE Practitioner

Descripción

El curso SRE Practitioner℠ introduce formas de escalar servicios de manera económica y confiable dentro de una organización. Explora la colaboración, el diseño, la automatización y las prácticas y herramientas inteligentes de respuesta a incidentes para mejorar la agilidad, la colaboración multifuncional y la transparencia sobre el estado de los servicios con el fin de construir resiliencia.


El curso proporciona a los participantes prácticas, métodos y herramientas para guiar a las personas de toda la organización involucradas en la confiabilidad, utilizando escenarios reales e historias de casos. Al finalizar, los participantes contarán con aprendizajes prácticos que podrán aplicar en su entorno laboral, tales como implementar modelos de SRE (Site Reliability Engineering) adaptados al contexto de su organización, establecer Objetivos de nivel de servicio (SLO) efectivos, incorporar observabilidad avanzada y AIOps en sistemas distribuidos, crear plataformas de autoservicio, diseñar resiliencia desde el inicio y definir estrategias eficaces de respuesta a incidentes.


El curso enseña los principios y las prácticas clave necesarios para iniciar y evolucionar la práctica de SRE y prepara a los estudiantes para optar a la certificación SRE Practitioner℠.

Duración

  • 24 hrs.

Modos de entrega

  • En línea, máximo 12 participantes.

  • En sitio, máximo 16 participantes.

Audiencia

El público objetivo de este curso incluye, pero no se limita a:

  • Profesionales centrados en la escalabilidad y la confiabilidad de servicios a gran escala.

  • Personas interesadas en enfoques modernos de liderazgo en TI y en generar cambios organizacionales.

  • Business Managers y stakeholders de negocio, así como agentes de cambio y consultores.

  • Practicantes DevOps, líderes y gestores de TI, Product Owners y Scrum Masters.

  • Ingenieros SRE, desarrolladores de software, integradores de sistemas y proveedores de herramientas.

Objetivos de aprendizaje

Con este curso el estudiante aprenderá sobre:

  • Cómo implementar de forma práctica una cultura de SRE exitosa en la organización.

  • Los principios fundamentales de SRE, sus anti-patrones más comunes y cómo evitarlos.

  • El impacto organizacional de aplicar prácticas de SRE y cómo medirlo.

  • El uso avanzado de SLI y SLO en entornos distribuidos, extendiendo el uso los presupuestos de error para garantizar que se cumplan las necesidades de los stakeholders.

  • Cómo diseñar seguridad y resiliencia en un entorno distribuido y de confianza cero (zero-trust).

  • La implementación de observabilidad "full-stack", trazabilidad distribuida y una cultura de desarrollo impulsada por la observabilidad.

  • El uso de IA y DataOps para pasar de la gestión reactiva a la gestión proactiva y predictiva de incidentes, asegurando calidad y trazabilidad de los datos.

  • Cómo utilizar la ingeniería de plataformas y las plataformas de gestión de flujos de valor (VSM) para habilitar portales de autoservicio.

  • El papel de la IA generativa en la automatización de tareas de SRE.

  • La aplicación práctica de la ingeniería del caos.

  • Estrategias de respuesta ante incidentes mayores basadas en marcos de comando de incidentes, con ejemplos de incidentes no gestionados.

  • Estrategias de transformación hacia SRE y cómo impulsar su adopción.

  • El rol del SRE y por qué la confiabilidad es una responsabilidad compartida en toda la organización.

  • Lecciones aprendidas de casos de éxito en la implementación de SRE.

Requisitos previos

  • Ninguno en especial. Sin embargo, es recomendable que quienes atiendan este curso:

    • Tengan familiaridad con la terminología, los conceptos y los principios de SRE, así como experiencia práctica en entornos SRE. 

    • Hayan tenido formación formal en SRE y/o cuenten con certificaciones como SRE Foundation℠ del DevOps Institute antes de atender el curso y tomar el examen de certificación.

Materiales del curso

  • Manual del curso en formato electrónico.

  • Guía de referencia rápida.

  • Documentos, plantillas, herramientas y técnicas de muestra.

Contenido programático

  • Módulo 0 - Introducción y bienvenida.

  • Módulo 1: Anti-patrones de SRE.

    • Principios y prácticas de SRE (repaso).

    • Mitos y anti-patrones de SRE.

    • Prácticas de SRE para la respuesta a incidentes.

  • Módulo 2: El SLO como un proxy de la satisfacción del cliente.

    • ¿Qué ha cambiado con los SLO?

    • Identificando los límites del sistema para establecer SLI es crítica.

    • ¿Cómo usar los presupuestos de error más allá del debate entre velocidad y estabilidad?

  • Módulo 3: Construyendo sistemas seguros y confiables.

    • Diseño no abstracto a gran escala.

    • Patrones de diseño tolerantes a fallos.

    • Diseñando para la seguridad.

    • Diseñando para la resiliencia, la escalabilidad, el rendimiento, la confiabilidad y la seguridad.

  • Módulo 4: Observabilidad "full-stack".

    • La complejidad de las aplicaciones modernas.

    • Observabilidad.

    • Monitoreo y telemetría.

  • Módulo 5: Usando ingeniería de plataformas y AIOps.

    • Adoptando una visión centrada en la plataforma.

    • Usando AIOps para mejorar la resiliencia y cómo DataOps puede ayudar.

    • Implementando y midiendo AIOps.

  • Módulo 6: SRE y gestión de la respuesta a incidentes.

    • Responsabilidades clave de SRE en la respuesta a incidentes.

    • Patrones de respuesta a incidentes.

    • IA/ML para una mejor gestión de incidentes.

  • Módulo 7: Ingeniería del caos.

    • Los sistemas modernos son caóticos.

    • Ingeniería del caos.

    • Ingeniería del caos para la seguridad.

  • Módulo 8: SRE es una forma de DevOps.

    • Principios clave de SRE.

    • Métricas para el éxito.

    • Transformando hacia prácticas de SRE.

  • Ejercicios posteriores a clase.

    • Diseño no abstracto a gran escala (después del Día 1).

    • Instrumentación de ingeniería: instrumentando Gremlin (después del Día 2).

  • Apendice - Próximos pasos.

Información del examen

El examen SRE Practitioner℠ es entregado por PeopleCert:

  • Entrega: en línea con supervisión por cámara web.

  • Formato: libro abierto.

  • Duración: 90 minutos.

  • Cantidad de preguntas: 40 preguntas de selección simple.

  • Nota mínima aprobatoria: 65% (de aciertos).

Certificado y badge

  • Certificado SRE Practitioner℠ en pdf una vez aprobado el examen.

  • Badge por PeopleCert previa suscripción a PeopleCert Membership Plus. Aplican condiciones. Más información aquí.

  • Validez del certificado: 3 años.

KESSEL POK SAS

contacto@kesselpok.co

© 2025 Kessel Pok SAS. Creado con Wix.com

 

ITIL®, PRINCE2®, DEVOPS INSTITUTE® and the Swirl logo are registered trademarks of the PeopleCert group. Used under license from PeopleCert. All rights
reserved.

bottom of page