#13 Site Reliability Engineering - Live from Bordeaux 📽️🎙️


Details
Bonjour Ă toutes et Ă tous !
Le Tour de France 2022 du meetup SRE est en route !! le prochain meetup sera gentiment hébergé dans les locaux de Mirakl à Bordeaux le mardi 24 mai (merci encore Emmanuel et Romain et à toute l'équipe de Mirakl Labs) il sera en format hybride, présentiel et online, pour les speakers ainsi que pour tous les participants.
Voici le lien pour suivre le meetup online https://mirakl.zoom.us/j/94394462618?pwd=aTFqSFhiSDBrbVQ5TVBzMDVFTktpdz09
A cet occasion et comme d'habitude on partagera des news du groupe SRE France, des actualités SRE et des talks.
Voici le programme de la soirée :
- 19h00-19h05 : Accueil des participants
- 19h05-19h15 : Présentation du programme et du sponsor
- 19h15-19h25 : News du groupe
- 19h25-19h50 : Ne laissez pas vos mauvaises habitudes k8s devenir le cauchemar de vos administrateurs k8s par Henrik Rexed (@hredex)
- 19h50-20h05 : Why only measuring uptime isn't enough to meet user-expectations par Pablo Seminario (@pabluk)
- 20h05-20h15 : Questions et du feedback pour le prochain meetup
- 20h15-21h00 : Apéro/collation sponsorisé par Mirakl
Comme d'habitude, s'il y a des gens motivés pour un lightning talk (~5/10 minutes) ou pour des autres annonces rapides n'hésitez pas à les proposer, les talks sont ouverts à tout type de niveaux et de thématiques SRE: principes, on-call, monitoring, best practices, incident management, post-mortem, outils, retours d'expérience, etc.
A bientĂ´t !
# Détail des présentations
## Ne laissez pas vos mauvaises habitudes k8s devenir le cauchemar de vos administrateurs k8s
author name: Henrik Rexed
author bio: Henrik est Cloud Native Advocate chez Dynatrace, la plateforme leader de l’Observabilité. Avant Dynatrace, Henrik a travaillé en tant que Partner Solution Evangelists, animant de nombreux webinars et conférences, construisant des prototypes pour améliorer le capacités et les intégrations de NeoLoad. Henrik Rexed est également l’un des fondateurs de la conférence Performance Advisory Council et anime la chaîne Youtube IsitObservable
expected time: 15 min
language: fr
Comme toute transformation technologique, l'adoption de k8s commence généralement par de petits "projets domestiques". Un cluster k8s ici, un autre là . Si vous ne regardez pas de près, vous finissez comme de nombreuses organisations de nos jours. Quelque chose qui se répand comme une traînée de poudre : des centaines ou des milliers de clusters k8s, appartenant à des équipes différentes, répartis sur site et dans le cloud. Certains sont partagés. D'autres sont très isolés.
Lorsque nous commençons à créer des applications pour k8s, nous ne nous concentrons pas sur les limites de ressources correctement définies ou nous ignorons complètement les contraintes liées aux nœuds et aux clusters, comme le nombre d'adresses IP disponibles. Ce sont de mauvaises habitudes qui entraînent des travaux non planifiés et empêchent vos applications d'évoluer et de fonctionner comme vous le souhaitez. Au cours des dernières années, la communauté k8s a appris de bonnes habitudes que nous pouvons traduire en validations d'architecture et de performance.
Pour simplifier la gestion de notre cluster et réduire les tâches "non planifiées" pour réduire le coût et augmenter la fiabilité de nos applications, nous devons utiliser les bonnes règles de validation dans le cycle de vie de votre projet...
Au cours de cette présentation, nous utiliserons des histoires réelles de production, sur la façon dont la vie des administrateurs de k8S est devenue un cauchemar en raison de l'absence de validation dans nos processus CICD.
Nous présenterons les différents kpi utilisés par nos opérateurs K8s et comprendrons :
- comment tirer parti de ces mesures au cours de vos premières activités d'ingénierie de la performance.
- Le type d'outils que nous devons mettre en place pour avoir le bon niveau d'observabilité.
- Les processus automatisés qui réduiront les tâches de maintenance
## Why only measuring uptime isn't enough to meet user-expectations
author name: Pablo Seminario (@pabluk)
author bio: SRE at @Resiliencecare, FOSS aficionado and triathlete in my spare time
expected time: 15 min
language: fr
This talk introduces some concepts to explain to non-SRE teams why measuring uptime isn’t enough to meet user-expectations and also provides some ideas about how to start implementing SLOs as a better alternative.

#13 Site Reliability Engineering - Live from Bordeaux 📽️🎙️