LCC 243 - Interview SRE avec Nicolas Helleringer et Maxime Brugidou - partie 1 - podcast episode cover

LCC 243 - Interview SRE avec Nicolas Helleringer et Maxime Brugidou - partie 1

Dec 04, 20201 hr 3 min
--:--
--:--
Download Metacast podcast app
Listen to this episode in Metacast mobile app
Don't just listen to podcasts. Learn from them with transcripts, summaries, and chapters for every episode. Skim, search, and bookmark insights. Learn more

Episode description

Nicolas et Maxime de Critéo partagent avec Emmanuel leur expérience de mise en place d’une organisation SRE (Site Reliability Engineering).

Enregistré le 12 novembre 2020

Téléchargement de l’épisode LesCastCodeurs-Episode–243.mp3

Interview Ta vie, ton oeuvre

Twotter Nicolas
Twitter Maxime
Criteo Labs

SRE en 2 phrases

Site Reliability Engineering C’est une façon de monter un salaire de sysadmin ?

Pourquoi

Ops et dev, pourquoi “merger” ?
DevOps avec un sysadmin dans l’équipe vs SRE
Cela a du sens de le faire sur un “petit projet” ou uniquement si on gère 300k machines ?

SRE au quotidien

Journée type

Dashboard

On code en quoi?

Pager (pendant les horaires travails vs dehors)
Les weekends

Taille SRE pour pour du 24/7

Combien de fois est-on appelé par nuit ? Prod fallback

Le development

Livre: le projet Unicorn

Concepts intéressants

50% eng

SLO SLI SLA
La difficulté de la valeur initiale
Perf passées vs calcul théorique

Error budget
Blast radius
Burn rate

Pré conclusion

C’est la fin de la partie 1 de cette interview

Nous contacter

Faire un crowdcast ou une crowdquestion
Contactez-nous via twitter https://twitter.com/lescastcodeurs
sur le groupe Google https://groups.google.com/group/lescastcodeurs
ou sur le site web https://lescastcodeurs.com/
Flattr-ez nous (dons) sur https://lescastcodeurs.com/
En savoir plus sur le sponsoring? sponsors@lescastcodeurs.com

For the best experience, listen in Metacast app for iOS or Android