Rumah >Tutorial sistem >LINUX >Kunci kepada isu kestabilan operasi – ketersediaan

Kunci kepada isu kestabilan operasi – ketersediaan

WBOY
WBOYke hadapan
2024-03-27 18:11:201247semak imbas

Semakan lebih berdasarkan ringkasan dan penambahbaikan seterusnya. Jadi bagaimana kita mencari dan mengukur masalah kestabilan? Kemudian kita perlu mengeluarkan protagonis hari ini—ketersediaan.

Apakah ketersediaan?

Ketersediaan ialah penunjuk penting untuk menilai kestabilan perniagaan Ia boleh menemui masalah berkala dalam perniagaan melalui pengiraan data dan mewujudkan garis dasar, dan dengan itu meningkatkan kualiti perkhidmatan dengan cara yang lebih disasarkan.

Jadi, apakah itu kebolehgunaan? Ketersediaan merujuk kepada perkadaran jumlah masa yang tersedia untuk individu berfungsi dalam selang masa tertentu. Dalam erti kata lain, ia merujuk kepada kebarangkalian atau perkadaran sistem dapat beroperasi secara normal dalam tempoh masa tertentu. Bagi kebanyakan perniagaan Internet semasa kami, ia adalah "masa nyata" dan "dalam talian", iaitu Sistem Dalam Talian Masa Nyata. Bagi kebanyakan perniagaan kami, tempoh masa yang ditetapkan yang dinyatakan di atas hendaklah 7*24 jam.

Hasil kebolehgunaan selalunya dinyatakan menggunakan titik perpuluhan atau peratusan. Kami biasanya menggunakan ukuran yang dipanggil bilangan sembilan, yang sepadan dengan bilangan sembilan berturut-turut selepas titik perpuluhan. Contohnya, "Five Nines" bermakna sistem mempunyai ketersediaan 0.99999 (atau 99.999%) dalam tempoh masa yang ditetapkan.

Bagaimana untuk memahami magnitud yang sepadan?

Sebagai contoh, sistem beroperasi dalam tempoh masa tertentu, seperti 1 hari, iaitu 24 jam. Pada masa yang sama, butiran pemantauan kami ialah minit, iaitu 1440 minit. Sepanjang 1440 minit yang kami pantau, sistem berjalan seperti biasa selama 1430 minit. Kemudian dalam tempoh masa yang ditentukan ini, ketersediaan sistem ialah 1430/1440≈0.99306 (99.306%). Itulah yang sering kita panggil dua 9s.

Kemudian, nilai 99.306% mewakili bahagian sistem dalam keadaan Ketersediaan yang biasanya tersedia, dan nilai 0.694% yang diperoleh daripada 1-99.306% mewakili bahagian keadaan Ketidaktersediaan di mana sistem tidak dapat mengendalikan pengecualian. Hanya disenaraikan sebagai formula, ia adalah:

Jumlah masa perniagaan dalam talian = masa ketersediaan biasa perniagaan + masa ketidaksediaan luar biasa perniagaan

Melangkah lebih jauh, kebolehgunaan bermaksud:

Ketersediaan = masa ketersediaan biasa perniagaan / jumlah masa perniagaan dalam talian

Kunci kepada isu kestabilan operasi – ketersediaan

Cara membina ketersediaan

Memahami apa itu kebolehgunaan, mari kita bincangkan tentang cara mewujudkan kebolehgunaan. Terdapat banyak cara untuk mewujudkan kebolehgunaan, dan terdapat beberapa kaedah biasa:

Kaedah ujian dail

Kaedah ujian dail ialah kaedah menguji secara berkala sama ada status operasi setiap perniagaan adalah normal berdasarkan aplikasi, fungsi dan modulnya.

Sebagai contoh: Perniagaan kami mempunyai modul bernama A. Kemudian kami akan secara berkala (contohnya, sekali setiap 5 minit) mengambil contoh status berjalan modul ini dengan mensimulasikan gelagat pengguna. Jika modul berjalan seperti biasa, ia direkodkan sebagai Ketersediaan jika ia tidak normal, ia direkodkan sebagai Ketidaktersediaan. Perkadaran status Ketersediaan terkumpul dalam tempoh masa (contohnya, 1 hari) ialah ketersediaan modul ini.

Jadi, bagaimana untuk menilai sama ada perniagaan atau modul itu normal? Mari kita ambil perniagaan jenis web sebagai contoh Kita boleh menyemak kandungan utama halaman utama, halaman kategori atau halaman kandungan di bawah perkhidmatan. Secara umumnya, kita boleh memadankan medan atau kata kunci yang ditentukan pada Kepala, Badan dan Bawah halaman yang ditentukan. Jika medan atau kumpulan medan atau kata kunci yang ditentukan boleh dipadankan, ia adalah perkara biasa, jika tidak, ia adalah tidak normal. Kami boleh menggunakan skrip, Nagios, Zabbix dan alatan lain untuk melaksanakan ujian berkala perniagaan.

Kelebihan dan keburukan kaedah ini jelas. Kelebihannya ialah kaedah ini kurang sukar untuk dilaksanakan dan boleh diukur dengan mensimulasikan tingkah laku pengguna, dan ia juga boleh menjadi lebih konsisten dengan situasi perniagaan sebenar. Namun, melalui kaedah persampelan berkala ini, terdapat masalah sampel persampelan yang tidak mencukupi atau berat sebelah. Sebagai contoh, ujian dail dilakukan setiap 5 minit Jika kerosakan berlaku dan dibaiki dalam masa 5 minit ini, kaedah ujian dail akan sukar untuk menangkap ralat tersebut.

Kaedah analisis log

Kaedah analisis log ialah kaedah yang menganalisis log aplikasi, fungsi dan modul setiap perniagaan untuk mendapatkan ketersediaan.

Contohnya: Perniagaan kami mempunyai modul bernama A, kemudian log 1 jam pada modul ini akan dianalisis secara berkala (contohnya, sekali sejam). Perkadaran permintaan biasa yang dibezakan daripada tahap log ialah ketersediaan modul ini dalam sejam yang lalu. Mengambil perniagaan jenis web sebagai contoh, kami boleh membuat statistik dan menganalisis status 2XX dan 5XX masing-masing daripada log Kami boleh memahami bahawa 2XX bermaksud Ketersediaan dan 5XX bermaksud Ketidaktersediaan. (3XX dan 4XX boleh mempertimbangkan sama ada untuk mengambil bahagian dalam analisis berdasarkan keadaan perniagaan sebenar)

Kaedah ini jelas menyelesaikan masalah pensampelan yang tidak mencukupi atau berat sebelah dalam kaedah ujian dail, tetapi terdapat juga situasi di mana indeks impak perniagaan sebenar mungkin berbeza dengan ketara. Sebagai contoh, ralat kami dalam sejam yang lalu semuanya berlaku dalam masa 1 minit dan baki 59 minit perniagaan adalah perkara biasa. Jelas sekali, terdapat penyelewengan tertentu antara ketersediaan yang diperoleh dengan cara ini dan situasi perniagaan sebenar. Jadi bagaimana untuk menyelesaikan penyelewengan ini? Kaedah ambang analisis log wujud.

Kaedah ambang analisis log

Kaedah ambang analisis log ialah kaedah perancangan ketersediaan yang menambah pertimbangan ambang status berdasarkan kaedah analisis log.

Sebagai contoh: Perniagaan kami mempunyai modul bernama A. Kami mendapati melalui analisis log bahawa bilangan permintaan untuk modul ini dalam keadaan biasa adalah kira-kira 100,000 kali seminit Kemudian kami boleh menetapkan ambang 10 kali. Maksud 10 kali ini ialah kami membenarkan ralat kurang daripada satu persepuluh ribu berlaku dalam masa satu minit. Jika bilangan ralat yang berlaku dalam masa 1 minit adalah kurang daripada 10 kali, kami menganggap status pada minit lalu sebagai normal dan menandakannya sebagai Ketersediaan. Jika lebih daripada 10 ralat berlaku dalam masa 1 minit, maka kami menganggap status pada minit lalu sebagai tidak normal dan menandakannya sebagai Tidak Tersedia. Akhir sekali, nisbah status Ketersediaan dikira sebagai ketersediaan modul ini. Sudah tentu, ambang ini perlu diselaraskan mengikut situasi sebenar perniagaan.

Kaedah ini secara berkesan menyelesaikan masalah pemutusan hubungan antara sisihan sampel kaedah ujian dail dan kesan perniagaan sebenar kaedah analisis log, dan mencapai keseimbangan yang baik.

Ada satu lagi soalan, jika perniagaan terdiri daripada tiga modul A, B dan C, bagaimana untuk mengira ketersediaan perniagaan melalui ketersediaan modul? Kaedah mudah ialah menggunakan purata ketersediaan tiga modul yang paling banyak. Tetapi terdapat masalah dengan matlamat perniagaan. Kemudian kita boleh menggunakan kaedah purata wajaran dengan menyelaraskannya dengan matlamat perniagaan. Sebagai contoh, jika modul A lebih kritikal kepada perniagaan, maka kami akan memberikan modul A lebih berat apabila mengira ketersediaan modul C ialah sistem pintasan untuk perniagaan, jadi kami boleh mengurangkan berat modul C semasa mengira ketersediaan. Secara analogi, ketersediaan yang kami perolehi boleh sehampir mungkin dengan perniagaan dan matlamatnya.

Kaedah lain

Kami juga boleh menggunakan nod platform ujian pihak ketiga seperti Keynote dan Borui untuk menjalankan ujian perniagaan yang lebih meluas untuk meningkatkan ketepatan pengumpulan sampel dan mengurangkan penyelewengannya. Sudah tentu, hasilnya juga dihadkan oleh platform pihak ketiga dan kestabilan pautan
Untuk perniagaan dengan pelanggan, kami boleh melaksanakan pengurusan pada laluan kritikal pelanggan, dan kemudian memusatkan log pengurusan pengguna ke pelayan untuk analisis terpusat. Walaupun kaedah ini boleh menggambarkan status pengguna yang paling realistik, kaedah ini juga mempunyai masalah seperti kos pelaksanaan yang agak tinggi dan muat naik log tertangguh.

Ditulis di penghujung

Terdapat cara yang jauh lebih sedikit untuk mengira ketersediaan berbanding yang ditulis di atas, dan tiada kaedah tunggal yang boleh menyelesaikan semua masalah dan titik kesakitan. Pilih satu atau lebih kaedah yang paling sesuai untuk perniagaan atau pasukan anda dari perspektif kos, pendapatan, masa, dsb., dan gunakan kaedah tersebut untuk meningkatkan kualiti perkhidmatan perniagaan anda secara berterusan.

Atas ialah kandungan terperinci Kunci kepada isu kestabilan operasi – ketersediaan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:linuxprobe.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam