DevOps SRE Foundation℠ : les bases de l'ingénierie DevOps
Dans un paysage informatique qui évolue sans cesse, les entreprises sont exposées en permanence à des risques accrus. Dans ce contexte, l'ingénieur en fiabilité des sites (SRE) joue un rôle crucial dans l'amélioration de la disponibilité et de la résilience des systèmes. Il travaille avec les équipes de développement dans le cadre d'une approche DevOps, automatise les tâches opérationnelles, met en place des systèmes de surveillance et gère les incidents. En forte croissance, ce poste offre donc des opportunités pour les professionnels de l'informatique.
Cette formation DevOps SRE vous permettra de vous familiariser avec les concepts et les pratiques essentiels. Vous découvrirez les fondements du SRE, son lien avec DevOps et d'autres méthodes, puis vous apprendrez à gérer les objectifs de niveau de service (SLO) et les budgets d'erreur. De plus, vous comprendrez comment réduire le Toil, mettre en place une surveillance efficace avec les SLI et automatiser les tâches à l'aide d'outils SRE. Pour finir, vous vous pencherez sur l'antifragilité, l'impact organisationnel du SRE et les tendances futures.
En suivant ce programme de 2 jours, vous serez également préparé pour passer l'examen de certification DevOps SRE Foundation de PeopleCert compris dans notre offre (en savoir plus dans l'onglet certification). Ainsi, vous acquerrez les compétences et les connaissances nécessaires pour booster votre carrière dans le domaine en pleine expansion du DevOps et du SRE.
Objectifs
À l'issue de cette formation DevOps SRE, vous validerez les objectifs suivants :
- connaitre la genèse de l'ingénierie de la fiabilité des sites (SRE) et son apparition chez Google LLC ;
- expliquer la corrélation entre le SRE, l'approche DevOps et d'autres méthodologies en ingénierie informatique ;
- maîtriser les fondamentaux de l'ingénierie de la fiabilité des sites ;
- comprendre les objectifs de niveau de service et leurs intérêts pour les clients ;
- identifier les indicateurs de niveau de service ;
- mettre en œuvre un système de monitoring moderne ;
- établir des budgets d'erreurs et définir des stratégies relatives aux erreurs ;
- appliquer les bonnes pratiques pour réduire le Toil budget ;
- évaluer l’impact des tâches complexes sur la performance d'une entreprise ;
- démontrer que l’observabilité est un facteur déterminant de la qualité d'un service ;
- utiliser les outils modernes d'ingénierie de fiabilité des sites et les bonnes pratiques d'automatisation ;
- intégrer les principes de l’ingénierie de l'anti-fragilité du site ;
- savoir expliquer les avantages organisationnels d’une mise en œuvre de l’approche SRE au sein d’une entreprise ;
- passer l’examen et obtenir la certification SRE Foundation℠.
Programme
Module 1 : comprendre les fondamentaux et les pratiques SRE
- Qu'est-ce que l'ingénierie de la fiabilité des sites ?
- L'histoire de l'émergence du SRE chez Google et son évolution.
- La particularité entre une approche SRE et une approche DevOps ?
- Le positionnement du SRE par rapport à d'autres cadres, tels qu'ITIL et Agile.
- Les principes fondamentaux du SRE (embrasser le risque, le travail en équipe, l'automatisation, le monitoring, etc.)
Module 2 : gérer les objectifs de Niveau de Service et le budget
- L’utilisation des objectifs de niveau de services (SLOs).
- L'établissement d’un budget d’erreur.
- La mise en œuvre d’une politique liée au budget d’erreurs.
- Présentation des méthodes de mesure des SLIs et des outils utilisés.
Module 3 : réduire le Toil Budget
- Que signifie le terme Toil ?
- Les différents types de Toil et leur impact.
- Les raisons pour lesquelles un Toil est négatif.
- Le lien entre le Toil et le burnout des équipes.
- L’équilibrage du Toil budget.
Module 4 : surveiller avec les Indicateurs de Niveau de Service
- L’utilisation des indicateurs de niveau de service (SLI).
- Les différents types de SLIs (latence, taux d'erreur, débit, etc.).
- La mise en place d'un suivi et d'une observation.
- Présentation d'outils de monitoring et d'observabilité (Prometheus, Grafana, ELK stack, etc.).
- La différence entre monitoring, logging et tracing.
Module 5 : automatiser avec les logiciels du SRE
- Que signifie l'automatisation ?
- La conception d'expérience d'automatisation.
- La classification des différents systèmes d’automatisation.
- La sécurité de l'automatisation.
- Les logiciels d’automatisation.
- Le traitement de l'automatisation des tests et des déploiements (CI/CD) et son intégration au SRE.
Module 6 : développer l'anti-fragilité et apprendre par l'échec
- Comment tire-t-on les enseignements des échecs ? (exemples de post-mortem et de blameless post-mortem).
- Les atouts de l'anti-fragilité.
- Les concepts de Chaos Engineering et de GameDays.
- Le rééquilibrage hiérarchique des organisations.
Module 7 : analyser l'incidence organisationnelle du SRE
- L'identification des raisons pour lesquelles les entreprises choisissent l'ingénierie de la fiabilité des sites :
- discussion des aspects culturels de l'adoption du SRE (collaboration, communication, confiance).
- Les modèles applicables à l'adoption.
- Les différents modèles d'organisation SRE (centralisés, décentralisés, hybrides, etc.).
- Les besoins des services de support.
- Les bilans sans failles.
- L’ingénierie de la fiabilité des sites aux différentes échelles.
Module 8 : explorer l'évolution et les autres approches
- Débats et comparatifs des autres approches :
- comparaison du SRE avec d'autres approches, comme ITIL, Agile et Lean.
- L'anticipation de l'évolution du SRE :
- discussion des tendances futures du SRE (l'intégration avec l'IA/ML).
Module 9 : se préparer à l'examen DevOps SRE
- Passage d'un examen blanc avec auto-correction.
- Séance de questions/réponses.
- Conseils pour le passage de l'examen officiel.
Prérequis
Suivre cette formation nécessite les prérequis suivants :
- savoir lire et comprendre l'anglais pour passer l'examen officiel ;
- une compréhension des concepts de base, tels que les systèmes d'exploitation, les réseaux, les bases de données et les architectures logicielles ;
- une connaissance de base des principes et des pratiques DevOps (intégration continue, livraison continue, infrastructure as code, etc.).
- Une expérience dans un rôle tel qu'administrateur système, ingénieur système, développeur, ou responsable d'exploitation (recommandé).
Public
Cette formation s'adresse aux publics suivants :
- les ingénieurs et les administrateurs système qui veulent comprendre en profondeur les pratiques SRE afin d'améliorer la fiabilité et les performances de leur infrastructure ;
- les ingénieurs DevOps qui souhaitent renforcer leurs compétences en matière d'intégration des principes de la SRE dans les pipelines CI/CD et les pratiques d'automatisation :
- les développeurs qui veulent comprendre les principes de la SRE pour concevoir des applications plus robustes et plus faciles à utiliser en production ;
- les responsables IT et les responsables d'exploitation qui souhaitent acquérir une vision stratégique de la mise en œuvre d'une stratégie SRE ;
- les chefs de projet et les Scrum Masters qui veulent apprendre à intégrer des pratiques SRE dans les cycles de développement agiles et à gérer des projets avec une approche orientée vers la fiabilité ;
- toute personne souhaitant comprendre et appliquer les principes de la SRE.
Points forts
• Prêt pour l'examen : mettez toutes les chances de votre côté grâce à un examen blanc et au passage de l'examen officiel inclus dans notre offre.
• Apprentissage par l'expérience : appliquez vos connaissances à des situations réelles grâce à des travaux pratiques et des études de cas.
Certification
Cette formation vous permet de passer la certification professionnelle DevOps Site Reliability Engineering Foundation. Un code coupon vous sera fourni à la fin du cours afin que vous puissiez programmer votre examen en ligne.
Modalité de l'examen DevOps Site Reliability Engineering Foundation :
- Type d’examen : QCM de 40 questions
- Durée : 1 heure
- Lieu : En ligne
- Livre ouvert : oui (support de cours uniquement)
- Langue : Chinois, Anglais, Français, Japonais, Portugais (Brésil) et Espagnol
- Note de passage : 65%.
Une fois cet examen réussi, vous recevrez le titre professionnel de « Certified DevOps Site Reliability Engineering Foundation » valable 3 ans et délivré par PeopleCert.
À savoir : pour maintenir votre certification à jour, vous devez être membre PeopleCert Plus.
Objectifs
À l'issue de cette formation DevOps SRE, vous validerez les objectifs suivants :
- connaitre la genèse de l'ingénierie de la fiabilité des sites (SRE) et son apparition chez Google LLC ;
- expliquer la corrélation entre le SRE, l'approche DevOps et d'autres méthodologies en ingénierie informatique ;
- maîtriser les fondamentaux de l'ingénierie de la fiabilité des sites ;
- comprendre les objectifs de niveau de service et leurs intérêts pour les clients ;
- identifier les indicateurs de niveau de service ;
- mettre en œuvre un système de monitoring moderne ;
- établir des budgets d'erreurs et définir des stratégies relatives aux erreurs ;
- appliquer les bonnes pratiques pour réduire le Toil budget ;
- évaluer l’impact des tâches complexes sur la performance d'une entreprise ;
- démontrer que l’observabilité est un facteur déterminant de la qualité d'un service ;
- utiliser les outils modernes d'ingénierie de fiabilité des sites et les bonnes pratiques d'automatisation ;
- intégrer les principes de l’ingénierie de l'anti-fragilité du site ;
- savoir expliquer les avantages organisationnels d’une mise en œuvre de l’approche SRE au sein d’une entreprise ;
- passer l’examen et obtenir la certification SRE Foundation℠.
Programme
Module 1 : comprendre les fondamentaux et les pratiques SRE
- Qu'est-ce que l'ingénierie de la fiabilité des sites ?
- L'histoire de l'émergence du SRE chez Google et son évolution.
- La particularité entre une approche SRE et une approche DevOps ?
- Le positionnement du SRE par rapport à d'autres cadres, tels qu'ITIL et Agile.
- Les principes fondamentaux du SRE (embrasser le risque, le travail en équipe, l'automatisation, le monitoring, etc.)
Module 2 : gérer les objectifs de Niveau de Service et le budget
- L’utilisation des objectifs de niveau de services (SLOs).
- L'établissement d’un budget d’erreur.
- La mise en œuvre d’une politique liée au budget d’erreurs.
- Présentation des méthodes de mesure des SLIs et des outils utilisés.
Module 3 : réduire le Toil Budget
- Que signifie le terme Toil ?
- Les différents types de Toil et leur impact.
- Les raisons pour lesquelles un Toil est négatif.
- Le lien entre le Toil et le burnout des équipes.
- L’équilibrage du Toil budget.
Module 4 : surveiller avec les Indicateurs de Niveau de Service
- L’utilisation des indicateurs de niveau de service (SLI).
- Les différents types de SLIs (latence, taux d'erreur, débit, etc.).
- La mise en place d'un suivi et d'une observation.
- Présentation d'outils de monitoring et d'observabilité (Prometheus, Grafana, ELK stack, etc.).
- La différence entre monitoring, logging et tracing.
Module 5 : automatiser avec les logiciels du SRE
- Que signifie l'automatisation ?
- La conception d'expérience d'automatisation.
- La classification des différents systèmes d’automatisation.
- La sécurité de l'automatisation.
- Les logiciels d’automatisation.
- Le traitement de l'automatisation des tests et des déploiements (CI/CD) et son intégration au SRE.
Module 6 : développer l'anti-fragilité et apprendre par l'échec
- Comment tire-t-on les enseignements des échecs ? (exemples de post-mortem et de blameless post-mortem).
- Les atouts de l'anti-fragilité.
- Les concepts de Chaos Engineering et de GameDays.
- Le rééquilibrage hiérarchique des organisations.
Module 7 : analyser l'incidence organisationnelle du SRE
- L'identification des raisons pour lesquelles les entreprises choisissent l'ingénierie de la fiabilité des sites :
- discussion des aspects culturels de l'adoption du SRE (collaboration, communication, confiance).
- Les modèles applicables à l'adoption.
- Les différents modèles d'organisation SRE (centralisés, décentralisés, hybrides, etc.).
- Les besoins des services de support.
- Les bilans sans failles.
- L’ingénierie de la fiabilité des sites aux différentes échelles.
Module 8 : explorer l'évolution et les autres approches
- Débats et comparatifs des autres approches :
- comparaison du SRE avec d'autres approches, comme ITIL, Agile et Lean.
- L'anticipation de l'évolution du SRE :
- discussion des tendances futures du SRE (l'intégration avec l'IA/ML).
Module 9 : se préparer à l'examen DevOps SRE
- Passage d'un examen blanc avec auto-correction.
- Séance de questions/réponses.
- Conseils pour le passage de l'examen officiel.
Prérequis
Suivre cette formation nécessite les prérequis suivants :
- savoir lire et comprendre l'anglais pour passer l'examen officiel ;
- une compréhension des concepts de base, tels que les systèmes d'exploitation, les réseaux, les bases de données et les architectures logicielles ;
- une connaissance de base des principes et des pratiques DevOps (intégration continue, livraison continue, infrastructure as code, etc.).
- Une expérience dans un rôle tel qu'administrateur système, ingénieur système, développeur, ou responsable d'exploitation (recommandé).
Public
Cette formation s'adresse aux publics suivants :
- les ingénieurs et les administrateurs système qui veulent comprendre en profondeur les pratiques SRE afin d'améliorer la fiabilité et les performances de leur infrastructure ;
- les ingénieurs DevOps qui souhaitent renforcer leurs compétences en matière d'intégration des principes de la SRE dans les pipelines CI/CD et les pratiques d'automatisation :
- les développeurs qui veulent comprendre les principes de la SRE pour concevoir des applications plus robustes et plus faciles à utiliser en production ;
- les responsables IT et les responsables d'exploitation qui souhaitent acquérir une vision stratégique de la mise en œuvre d'une stratégie SRE ;
- les chefs de projet et les Scrum Masters qui veulent apprendre à intégrer des pratiques SRE dans les cycles de développement agiles et à gérer des projets avec une approche orientée vers la fiabilité ;
- toute personne souhaitant comprendre et appliquer les principes de la SRE.
Points forts
• Prêt pour l'examen : mettez toutes les chances de votre côté grâce à un examen blanc et au passage de l'examen officiel inclus dans notre offre.
• Apprentissage par l'expérience : appliquez vos connaissances à des situations réelles grâce à des travaux pratiques et des études de cas.
Certification
Cette formation vous permet de passer la certification professionnelle DevOps Site Reliability Engineering Foundation. Un code coupon vous sera fourni à la fin du cours afin que vous puissiez programmer votre examen en ligne.
Modalité de l'examen DevOps Site Reliability Engineering Foundation :
- Type d’examen : QCM de 40 questions
- Durée : 1 heure
- Lieu : En ligne
- Livre ouvert : oui (support de cours uniquement)
- Langue : Chinois, Anglais, Français, Japonais, Portugais (Brésil) et Espagnol
- Note de passage : 65%.
Une fois cet examen réussi, vous recevrez le titre professionnel de « Certified DevOps Site Reliability Engineering Foundation » valable 3 ans et délivré par PeopleCert.
À savoir : pour maintenir votre certification à jour, vous devez être membre PeopleCert Plus.
Site Reliability Engineering est une marque de service du DevOps Institute.