Site Reliability Engineering (SRE) – saidi töökindluse tagamine – on põhimõtete ja tavade kogum, mis hõlmab tarkvaratehnika aspekte ja rakendab neid IT taristu ja toimingute suhtes. SRE alusepanijaks on Google, aga kasutuses on see juba paljudes firmades nagu Airbnb, IBM, Netflix jne.
Site Reliability Engineering Foundation℠ (SREF) sertifitseerimiskoolitus on sissejuhatus põhimõtetesse ja tavadesse, mis võimaldavad organisatsioonil kriitilisi teenuseid usaldusväärselt ja säästlikult skaleerida. Saidi töökindluse mõõtme kasutuselevõtt nõuab organisatsiooni ümberkorraldamist, uut keskendumist inseneritööle ja automatiseerimisele ning mitmete uute tööpõhimõtete kasutuselevõttu. Kursus toob esile SRE arengu ja selle tulevikusuuna.
Kursuse materjalid on koostanud DevOps Institute. Nii materjalid, kui ka kursus ise ja kursuse lektor on kõik ametlikult akrediteeritud.
Sihtgrupp:
Koolitusel osalemise eeldused: nõutavad eeltingimused kursusel osalemiseks puuduvad. Soovitav on omada üldisi teadmisi DevOps terminoloogiast ja põhimõtetest ning vastavat töökogemust
Koolituse eesmärk on varustada osalejaid tegelike stsenaariumite ja juhtumite poolt kinnitatud tavade, meetodite ja tööriistadega, et kaasata inimesi kogu organisatsioonis, kes on seotud töökindluse ja stabiilsuse tagamisega. Kursuse läbimisel saavad osalejad kontorisse tagasi jõudes praktilisi näpunäiteid, nagu teenusetaseme eesmärkide (SLO) mõistmine, seadmine ja jälgimine.
Koolituse sisu:
1. | SRE põhimõtted | SRE määratlus. SRE ja DevOps. SRE põhimõtted ja praktikad. |
2. | Teenustaseme eesmärgid ja veaeelarved | Arusaam teenustaseme eesmärkidest (SLO) ja veaeelarvest (error budget), veaeelarve poliitikad, SLOde määramine. |
3. | Rügamise vähendamine | Mis on rügamine teenuste ülalhoiu nimel (toil), miks ta on halb, millised on inimlikud ja organisatsioonilised vahendid vähendamaks rügamist. |
4. | Seire ja teenustaseme indikaatorid | Arusaam teenustaseme indikaatoritest (SLI) ja kuidas nad seostuvad teenustaseme eesmärkidega (SLO). Seiremaastik, vaadeldavus ja mõõdetavate teenuse-eesmärkide seadmine. |
5. | SRE tööriistad ja automatiseerimine | Automatiseerimise definitsioon. DevOps ja SRE automatiseerimisel. SRE automatiseerimise tüübid, ülevaade tööriistadest. |
6. | Paindlikkus ja vigadest õppimine | Vigadest õppimise eelised. Paindlikkuse (anti-fragility) määratlus. Organisatsioonilise tasakaalu nihutamine, kaosetehnika (chaos engineering). |
7. | SRE organisatsiooniline mõju | Miks organisatsioonid võtavad SRE omaks, SRE kasutuselevõtu mustrid, SRE organisatsiooniline mõju, jätkusuutlik reageerimine intsidentidele, laitmatud surmajärgsed (post mortem) uuringud, SRE skaleerimine. |
8. | SRE ja teised raamistikud. Trendid. | SRE ja DevOps, Agile, ITSM. SRE areng. SRE kõrvalvoolud, nagu Network Reliability Engineering ja Customer Reliability Engineering |
Programm:
Kursuse läbinud omandavad järgmised teadmised:
Eksam ja sertifikaat: Korduseksami voucher, kui see on vajalik, maksab 350 €+km
Koolitaja:
Risto Moor
Lisainfo: