Rumah > Artikel > Operasi dan penyelenggaraan > Operasi dan penyelenggaraan yang lancar, periuk besi
Pada 5 Jun, Vipshop mengeluarkan laporan kerosakan pada 29 Mac 2023. Disebabkan kerosakan pada sistem penyejukan IDC Nansha, pusat beli-belah dalam talian Vipshop berhenti berkhidmat, menyebabkan Beratus-ratus juta kerugian (sebagai orang operasi dan penyelenggaraan kecil, saya menggeletar).
Bagi Vipshop, pusat membeli-belah dalam talian adalah pintu masuk perniagaan terasnya, tetapi ia tidak boleh diterima jika kegagalan itu berlaku begitu lama. Di mata pengusaha kecil seperti kami, kemalangan seperti ini tidak sepatutnya berlaku dalam syarikat sebesar ini. Kami semua mencari cara untuk mengendalikan dan mengekalkan dengan meniru dan belajar daripada PPT mereka.
Namun begitu, PPT sangat maju sehingga tidak dapat menghalang kegagalan daripada berlaku.
Saya secara peribadi mencuba untuk membuat beberapa tekaan:
Kini terdapat pelbagai persidangan teknologi di negara ini, dan kemudian jemput CTO dan teknologi dari beberapa syarikat terkenal Orang yang bertanggungjawab memberi ucapan Berdasarkan ucapan, setiap syarikat sangat kuat (sekurang-kurangnya ini adalah bagaimana ia ditunjukkan di PPT, saya akan tiba-tiba menjadi pencerahan dan mendapat banyak manfaat Saya mengagumi syarikat ini dari lubuk hati saya dan mengagumi kekuatan hebat mereka, kebolehan hebat, dan pasukan yang hebat.
Walau bagaimanapun, PPT hanyalah alat bantu lagipun, ia tidak boleh menggantikan status quo.
PPT yang cantik hanya untuk mereka yang ingin melihatnya perlu ditanggung sendiri.
Saya telah melihat perkongsian Vipshop di GOPS sebelum ini, dan pembentangan PPT sangat bagus Jika saya menggunakan ini untuk melaporkan kepada bos, bos saya akan merasakan bahawa teknologi syarikat kami benar-benar berkuasa dan kami melakukannya dengan sangat baik. .
Jika berlaku masalah, siapa yang akan anda lakukan jika anda tidak melakukannya?
Apa sahaja yang keluar dari mulut anda akan kembali ke mulut anda.
Dalam buku "SRE: Google Operations Decrypted", latihan kerosakan menduduki ruang yang besar. Melalui latihan kesalahan, kebolehpercayaan dan toleransi kesalahan sistem dapat dipertingkatkan, pasukan dapat lebih memahami seni bina dan prinsip kerja sistem, pengaruh bersama setiap modul dapat difahami dengan lebih baik, dan kelemahan dan kelemahan dalam seni bina sistem dapat dapat ditemui dengan lebih cepat.
Boleh dikatakan bahawa latihan kerosakan adalah pautan teras bagi keseluruhan jaminan kestabilan, kerana ia boleh membantu pasukan meminimumkan kesilapan sebenar dan bertindak balas terhadap kemungkinan masalah dengan lebih cekap.
Tetapi, adakah ini benar dalam realiti?
Apabila benar-benar menjalankan latih tubi kesalahan, titik kerosakan mesti ditentukan terlebih dahulu, langkah balas tertentu mesti diatur dan dikeluarkan, pelan komprehensif mesti ditetapkan, dan tanggungjawab kerja dan tugas setiap orang mesti diterangkan dengan tepat.
Kerja-kerja persediaan ini sahaja memerlukan tenaga kerja dan sumber material yang banyak nasib sendiri, meletakkan harapan pada orang lain yang tidak menghadapi masalah.
Sebagai contoh, jika anda meletakkan harapan pada awan awam, jika tiada masalah dengan awan awam, keseluruhan sistem akan stabil, tetapi awan awam≠ boleh dipercayai sepenuhnya Google Cloud, Alibaba Cloud, Tencent Cloud, dsb. Walau bagaimanapun, membayar bil Ia adalah pengguna sendiri.
Oleh itu, bagi pasukan operasi dan penyenggaraan atau pasukan SRE, latih tubi kesalahan perlu diambil serius mereka bukan sahaja perlu membuat kerja persediaan untuk latihan, tetapi juga memberi perhatian kepada rancangan semasa latihan. ambil langkah tepat pada masanya dan buat pembetulan jika masalah ditemui.
Jangan biarkan latihan menjadi formaliti, jangan biarkan latihan menjadi KPI, jika tidak, anda akan menjadi sasaran pengoptimuman seterusnya.
Masalah dengan Vipshop pada 29 Mac boleh dilihat dari sisi: "Duohuo" mungkin hanya bercakap.
Dengan perkembangan perniagaan, seni bina sistem akan terus berkembang kerana keperluan kami untuk ketersediaan tinggi semakin tinggi dan lebih tinggi.
Contohnya, naik taraf daripada seni bina mesin tunggal dalam bilik komputer yang sama kepada seni bina siap sedia aktif, kemudian naik taraf kepada seni bina bilik berbilang mesin di bandar yang sama, dan akhirnya mencapai seni bina tiga pusat tahap di dua tempat.
Jika Vipshop membina berbilang bilik komputer di bandar yang sama, sistem utama dan sandaran yang paling ringkas di bandar yang sama tidak akan mati selama 12 jam.
Apatah lagi jika anda tinggal dua kali ganda di bandar yang sama.
Namun, saya hanya meneka dari perspektif Tuhan. Mungkin mereka juga banyak membuat kerja, tetapi mereka hanya berpura-pura bekerja banyak.
Pengurus besar di atas akhirnya akan menghasilkan sumber kewangan, manusia dan material contoh, membina kesiapsiagaan bencana di seluruh bandar, Kos pelaburan tidak semudah dubbo Setiap kali orang yang bertanggungjawab ke atas SRE melaporkan untuk memohon dana, jika pemimpin di atas tidak menyokongnya (wang itu tidak diperoleh, tetapi. begitu banyak yang dibelanjakan), semuanya sia-sia.
Pemimpin perlu mengawal kos, dan orang bawahan memerlukan wang untuk melakukan sesuatu kos yang tidak mencukupi menyebabkan ketidakmampuan untuk memenuhi keperluan, yang akan membawa kepada keadaan di mana PPT itu indah, tetapi realitinya mengerikan.
Walaupun anda mempunyai cita-cita, ia tidak berguna.
Jika berlaku apa-apa, saya akan korbankan awak hingga ke syurga.
Perkara di atas adalah rekaan semata-mata, jika ada persamaan, sila like~
Di banyak syarikat, operasi dan penyelenggaraan ada. kata kuat Rendah, sangat rendah, yang menyukarkan operasi dan penyelenggaraan untuk melakukan sesuatu atau memajukan sesuatu.
Namun, sebaik sahaja masalah berlaku, operasi dan penyelenggaraan adalah yang pertama ditolak, jadi "kambing hitam" sentiasa dipersalahkan pada operasi dan penyelenggaraan.
Jadi apa yang perlu kita lakukan sebagai pegawai operasi dan penyelenggaraan?
Akhir sekali, mari bercakap, mari bercakap, jangan mempersendakan produksi.
Atas ialah kandungan terperinci Operasi dan penyelenggaraan yang lancar, periuk besi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!