Rumah >Tutorial sistem >LINUX >Penerokaan mendalam sistem pengetahuan dalam bidang pengawasan
Pengenalan | Pemantauan ialah bahagian paling penting dalam keseluruhan operasi dan penyelenggaraan malah keseluruhan kitaran hayat produk Ia memberikan amaran tepat pada masanya untuk mengesan kerosakan terlebih dahulu, dan menyediakan data terperinci selepas itu untuk mengesan dan mengesan masalah. Terdapat banyak produk sumber terbuka yang bagus dalam industri untuk dipilih. Memilih sistem pemantauan sumber terbuka ialah penyelesaian yang menjimatkan masa, menjimatkan tenaga kerja dan paling cekap. Sudah tentu, rakan-rakan yang tidak tahu banyak tentang pemantauan mungkin mempunyai pemahaman yang lebih mendalam tentang keseluruhan sistem pemantauan selepas membaca artikel berikut. |
Mari kita fahami dahulu apa itu pemantauan, kepentingan pemantauan dan matlamat pemantauan Sudah tentu, setiap orang berada dalam industri, syarikat, perniagaan, kedudukan yang berbeza, dan mempunyai pemahaman yang berbeza tentang pemantauan, tetapi kita perlu memberi perhatian kepada. keperluan untuk pemantauan Fikirkan dari perspektif perniagaan syarikat, dan bukannya penggunaan teknologi pemantauan tertentu.
Pemantauan masa nyata tanpa gangguan sistem: Ia sebenarnya pemantauan masa nyata tanpa gangguan sistem (ini adalah pemantauan
).Maklum balas masa nyata tentang status semasa sistem: Apabila kita memantau perkakasan atau sistem tertentu, kita perlu dapat melihat status sistem semasa dalam masa nyata, sama ada ia normal, tidak normal atau rosak ;
Memastikan kebolehpercayaan dan keselamatan perkhidmatan: Tujuan pemantauan kami adalah untuk memastikan operasi normal sistem, perkhidmatan dan perniagaan
Pastikan operasi perniagaan yang berterusan dan stabil: Jika pemantauan kami sempurna, walaupun berlaku kerosakan, kami boleh menerima penggera kerosakan secepat mungkin dan mengendalikannya secepat mungkin, dengan itu memastikan operasi berterusan dan stabil perniagaan;
2. Kaedah pemantauanSekarang kita faham kepentingan pemantauan dan tujuan pemantauan, kita perlu faham kaedah pemantauan.
Fahami objek pemantauan: Adakah anda faham objek yang ingin kami pantau? Sebagai contoh, bagaimanakah CPU berfungsi?
Metrik penanda aras prestasi: Apakah sifat benda ini yang ingin kita pantau? Contohnya, penggunaan CPU, beban, mod pengguna, mod kernel dan penukaran konteks.
Takrif ambang penggera: Apakah yang dianggap sebagai kerosakan dan memerlukan penggera? Sebagai contoh, apakah beban CPU yang dianggap tinggi Apakah beban mod pengguna dan mod kernel?
Proses pengendalian kerosakan: Jika kami menerima penggera kerosakan, bagaimanakah kami harus menanganinya? Adakah terdapat proses yang lebih cekap?
3. Teras pemantauanKami telah mempelajari tentang kaedah pemantauan, objek pemantauan, penunjuk prestasi, definisi ambang penggera, dan langkah-langkah proses pengendalian kerosakan Sudah tentu, kita perlu mengetahui lebih lanjut tentang apakah teras pemantauan?
Temui masalah: Apabila penggera kegagalan sistem berlaku, kami akan menerima maklumat penggera kegagalan;
Masalah kedudukan: E-mel kegagalan biasanya menulis tentang kegagalan hos tertentu dan kandungan kegagalan tertentu Sebagai contoh, jika pelayan tidak dapat disambungkan: kita perlu mempertimbangkan sama ada masalah rangkaian atau sama ada beban terlalu tinggi dan menyebabkan masa yang lama Tidak dapat disambungkan, atau pembangunan tertentu mencetuskan dasar larangan firewall, dsb., kita perlu menganalisis punca kegagalan tertentu
Selesaikan masalah: Sudah tentu, selepas kita memahami punca kerosakan, kita perlu menyelesaikan kesalahan mengikut keutamaan penyelesaian kesalahan
Ringkaskan masalah: Selepas kita menyelesaikan kesalahan besar, kita perlu merumuskan punca dan pencegahan kerosakan untuk mengelakkan berulang pada masa hadapan
4. Alat pemantauanSeterusnya kita perlu memilih alat pemantauan yang sesuai untuk perniagaan syarikat Di sini saya telah mengklasifikasikan secara ringkas alat pemantauan
Alat pemantauan lama:MRTG (Multi Route Trffic Grapher) ialah satu set perisian yang boleh digunakan untuk melukis graf trafik rangkaian Ia dibangunkan oleh Tobias Oetiker dan Dave Rand di Olten, Switzerland, dan dilesenkan di bawah GPL. Versi terbaik MRTG telah dilancarkan pada tahun 1995. Ia ditulis dalam bahasa perl dan boleh digunakan merentasi platform Protokol SNMP digunakan untuk pengumpulan data melalui halaman Web untuk melukis imej dalam format GIF atau PNG.
Ganglia ialah sistem pemantauan teragih merentas platform, berskala, berprestasi tinggi seperti kluster dan grid. Ia berdasarkan reka bentuk berlapis, menggunakan pelbagai teknologi dan menggunakan RRDtool untuk menyimpan data. Ia mempunyai antara muka visual dan sesuai untuk pemantauan automatik sistem kluster. Struktur data dan algoritmanya yang direka dengan teliti menjadikan sambungan atas kepala dari hujung pemantauan ke hujung yang dipantau sangat rendah. Beribu-ribu kluster sedang menggunakan sistem pemantauan ini, yang boleh mengendalikan persekitaran kluster sebanyak 2,000 nod dengan mudah.
Cacti (bermaksud kaktus dalam bahasa Inggeris) ialah satu set alat analisis grafik pemantauan trafik yang dibangunkan berdasarkan PHP, MySQL, SNMP dan RRDtool Ia memperoleh data melalui snmpget dan menggunakan RRDtool untuk melukis, tetapi pengguna tidak perlu memahami parameter yang kompleks. daripada RRDtool. Ia menyediakan data yang sangat berkuasa dan fungsi pengurusan pengguna Setiap pengguna boleh ditetapkan untuk melihat struktur pokok, peranti hos dan mana-mana gambar Ia juga boleh digabungkan dengan LDAP untuk pengesahan pengguna dan juga boleh menyesuaikan templat. Dari segi paparan dan pemantauan data sejarah, fungsinya agak baik.
Cacti menjadikan pemantauan peranti berbeza boleh diguna semula dengan menambahkan templat, dan mempunyai fungsi lukisan yang boleh disesuaikan dan kuasa pengkomputeran yang berkuasa (fungsi tindanan data)
Nagios ialah sistem pemantauan peringkat perusahaan yang boleh memantau status berjalan dan maklumat rangkaian perkhidmatan, memantau status hos dan perkhidmatan tempatan atau jauh yang ditentukan, dan menyediakan fungsi pemberitahuan penggera yang tidak normal.
Nagios berjalan pada platform Linux dan UNIX. Pada masa yang sama, antara muka web disediakan untuk memudahkan pentadbir sistem melihat status rangkaian, pelbagai masalah sistem, dan log berkaitan sistem.
Fungsi Nagios memfokuskan pada pemantauan ketersediaan perkhidmatan dan boleh mencetuskan penggera berdasarkan status penunjuk pemantauan.
Pada masa ini, Nagios juga menduduki bahagian pasaran tertentu Namun, Nagios tidak dapat mengikuti perkembangan zaman dan tidak lagi dapat memenuhi keperluan pemantauan yang berubah-ubah Skala seni bina dan kemudahan penggunaannya perlu dipertingkatkan disepadukan dalam versi komersial Nagios XI.
Merokok digunakan terutamanya untuk memantau prestasi rangkaian, termasuk ping biasa, prestasi pelayan www, prestasi pertanyaan DNS, prestasi SSH, dll. Lapisan bawah juga disokong oleh RRDtool Ia dicirikan oleh lukisan yang sangat indah dan kelewatan rangkaian ditandai dengan warna dan bayang-bayang.
Tapak web merokok ialah: http://tobi.oetiker.cn/hp
Sistem pemantauan sumber terbuka OpenTSDB menggunakan Hbase untuk menyimpan semua data siri masa (tiada pensampelan) untuk membina pangkalan data siri masa yang diedarkan dan berskala. Ia menyokong pengumpulan data peringkat kedua, menyokong storan kekal, boleh melakukan perancangan kapasiti, dan boleh disepadukan dengan mudah ke dalam sistem penggera sedia ada.
OpenTSDB boleh mendapatkan penunjuk pengumpulan yang sepadan daripada kluster berskala besar (termasuk peranti rangkaian, sistem pengendalian dan aplikasi dalam kluster), dan menyimpan, mengindeks dan menyediakannya, menjadikan data ini lebih mudah difahami, seperti Webisasi , grafik, dsb. .
Alat pemantauan Ace:Zabbix ialah sistem pemantauan teragih yang menyokong pelbagai kaedah pengumpulan dan pelanggan pengumpulan Ia mempunyai Ejen yang berdedikasi dan juga menyokong pelbagai protokol seperti SNMP, IPMI, JMX, Telnet, dan SSH. Ia menyimpan data yang dikumpul dalam pangkalan data. , dan kemudian menganalisis dan mengaturnya, dan mencetuskan penggera apabila syarat dipenuhi. Skala fleksibel dan fungsi yang kaya tidak dapat ditandingi oleh sistem pemantauan lain. Secara relatifnya, fungsi keseluruhannya sangat baik. Daripada perbandingan pelbagai sistem pemantauan di atas, Zabbix mempunyai kelebihan, dengan fungsi yang kaya, skalabiliti, keupayaan pembangunan sekunder dan kesederhanaan penggunaan Pembaca boleh membina sendiri dengan hanya sedikit sistem pemantauan kajian.
Sistem pemantauan Xiaomi: helang terbuka. Matlamat open-falcon adalah untuk membuat produk pemantauan peringkat perusahaan Internet yang paling terbuka dan mudah digunakan.
Alat pemantauan tiga pihak:Terdapat banyak pemantauan pihak ketiga yang baik di pasaran sekarang, seperti: Monitor Bao, Monitor Easy, Tingyun, dan banyak vendor awan mempunyai pemantauan mereka sendiri, tetapi kami tidak akan memperkenalkannya di sini jika anda ingin mengetahuinya pemantauan pihak ketiga, anda boleh pergi ke laman web rasmi dengan berunding sendiri. (Elak bercakap tentang penempatan pengiklanan)
5. Proses pemantauanBanyak yang telah diperkenalkan di atas, jadi apakah alat pemantauan yang paling sesuai saya cadangkan beberapa alat pemantauan sumber terbuka: Zabbix, Open-Falcon, dan LEPUS (didedikasikan untuk pangkalan data pemantauan).
Tetapi artikel ini masih berdasarkan Zabbix untuk membina keseluruhan ekosistem sistem pemantauan.
Kemudian mari kita bercakap tentang keseluruhan proses Zabbix:
Pengumpulan data: Zabbix mengumpul data daripada sistem melalui SNMP, Ejen, ICMP, SSH, IPMI, dll.
Storan data: Zabbix disimpan pada MySQL dan juga boleh disimpan pada perkhidmatan pangkalan data lain
Analisis data: Apabila kami perlu menyemak dan menganalisis kerosakan selepas itu, Zabbix boleh memberikan kami maklumat yang berkaitan seperti grafik dan masa, supaya kami boleh menentukan lokasi kerosakan
Paparan data: paparan antara muka web (APP mudah alih, java_php juga boleh membangunkan antara muka web
).Memantau dan membimbangkan: penggera telefon, penggera e-mel, penggera WeChat, penggera SMS, mekanisme naik taraf penggera, dsb. (tidak kira apa penggera yang tersedia
).Pemprosesan penggera: Apabila menerima penggera, kita perlu memprosesnya mengikut tahap kerosakan, seperti: penting dan mendesak, penting dan tidak mendesak, dsb. Mengikut tahap kerosakan, bekerjasama dengan kakitangan yang berkaitan untuk menanganinya dengan cepat
6. Penunjuk pemantauanKami telah belajar tentang kaedah pemantauan, matlamat, proses dan alat apa yang tersedia untuk pemantauan Sesetengah orang mungkin tertanya-tanya, apakah sebenarnya yang perlu kami pantau? Jadi saya telah menyelesaikannya di sini:
6.1 Pemantauan PerkakasanPada hari-hari awal, kami menggunakan pemeriksaan bilik komputer untuk memeriksa kerlipan cahaya peralatan perkakasan untuk menentukan sama ada ini adalah sangat membazir tenaga kerja, dan ia adalah kerja yang berulang dan bukan teknikal.
Sudah tentu kami kini boleh memantau butiran perkakasan melalui IPMI dan menetapkan ambang penggera untuk CPU, memori, cakera, suhu, kipas, voltan, dll. (Kami boleh menulis julat penggera yang munasabah untuk kandungan penggera pemantauan sendiri)
Bahan rujukan perkhidmatan perkakasan pemantauan IPMI
6.2 Pemantauan SistemPerusahaan kecil dan sederhana pada asasnya adalah semua pelayan Linux, jadi kita mesti memantau penggunaan sumber sistem Pemantauan sistem adalah asas sistem pemantauan.
Objek utama untuk dipantau:
CPU mempunyai beberapa konsep penting: penukaran konteks, baris gilir jalankan dan penggunaan.
Ini juga merupakan beberapa petunjuk utama pemantauan CPU kami.
Biasanya, baris gilir larian setiap pemproses tidak boleh lebih tinggi daripada 3, nisbah "mod pengguna/mod kernel" penggunaan CPU dikekalkan pada 70/30, dan keadaan terbiar dikekalkan pada 50%. atas kesibukan sistem.
Alat yang biasa digunakan untuk CPU termasuk: htop, top, vmstat, mpstat, dstat, glances
Zabbix menyediakan templat pemantauan sistem: Antara Muka Agen Zabbix
Memori: Biasanya kita perlu memantau penggunaan memori dan penggunaan SWAP Pada masa yang sama, kita boleh menggunakan zabbix untuk melukis graf lengkung penggunaan memori untuk mencari limpahan memori perkhidmatan, dsb.
Alat yang biasa digunakan untuk ingatan termasuk: percuma, atas, vmstat, pandangan
Penggunaan memori: IO dibahagikan kepada IO cakera dan IO rangkaian. Di samping memantau data yang lebih terperinci semasa melakukan penalaan prestasi, pemantauan harian hanya tertumpu pada penggunaan cakera, pemprosesan cakera, kesibukan menulis cakera, dan rangkaian juga memantau trafik kad rangkaian.
Alat yang biasa digunakan termasuk: iostat, iotop, df, iftop, sar, glances
Pemantauan sistem lain termasuk menjalankan port proses, bilangan proses, pengguna log masuk, Buka Fail, dsb. (lihat templat OS Linux zabbix sendiri untuk butiran)
6.3 Pemantauan AplikasiSetelah memahami pemantauan perkakasan dan pemantauan sistem, operasi selanjutnya kami ialah log masuk ke pelayan untuk melihat perkhidmatan yang pelayan sedang berjalan, dan semuanya perlu dipantau.
Pemantauan perkhidmatan aplikasi juga merupakan bahagian penting dalam sistem pemantauan, seperti: LVS, Haproxy, Docker, Nginx, PHP, Memcached, Redis, MySQL, Rabbitmq, dll. Perkhidmatan yang berkaitan perlu dipantau menggunakan zabbix
Penulis telah menulis tentang proses operasi pemantauan perkhidmatan yang terperinci sebelum ini, jadi saya tidak akan menunjukkannya satu per satu di sini.
Zabbix menyediakan pemantauan perkhidmatan aplikasi: Zabbix Agent UserParameter
Pemantauan Java disediakan oleh Zabbix: Antara Muka Zabbix JMX
percona menyediakan pemantauan pangkalan data MySQL: percona-monitoring-pulgins
Sebagai laman web e-dagang yang menyasarkan pengguna di seluruh negara, ia juga perlu untuk menjejaki status rangkaian pelbagai tempat dan bilik komputer pada setiap masa.
Pemantauan rangkaian adalah sesuatu yang mesti kita pertimbangkan apabila membina platform pemantauan, terutamanya untuk senario dengan berbilang bilik komputer Status rangkaian antara setiap bilik komputer, status rangkaian dalam bilik komputer dan di seluruh negara adalah semua objek yang perlu kita fokuskan. jadi bagaimana pula dengan menguasai maklumat status ini? Kita perlu menggunakan alat pemantauan rangkaian Merokok.
Smokeping adalah hasil kerja Tobi Oetiker, pengarang rrdtool Ia ditulis dalam Perl Ia terutamanya memantau prestasi rangkaian, prestasi pelayan www, prestasi pertanyaan dns, dll. Ia menggunakan rrdtool untuk melukis, dan menyokong pengedaran secara langsung data daripada pelbagai ejen.
Pada masa yang sama, memandangkan anda mempunyai sedikit titik pemantauan, anda juga boleh menggunakan banyak alat pemantauan komersial, seperti Monitor Bao, Tingyun, Keynote, Borui, dsb. Pada masa yang sama, pembekal perkhidmatan ini juga boleh membantu anda memantau status CDN anda.
6.5 Analisis TrafikAnalisis trafik laman web adalah ilmu yang mesti dikuasai oleh kakitangan operasi dan penyelenggaraan. Contohnya, untuk syarikat e-dagang:
Melalui statistik dan analisis sumber pesanan, kami dapat memahami sama ada pelaburan pengiklanan kami di tapak web tertentu telah mencapai hasil yang diharapkan.
Anda boleh membezakan bilangan pelawat dari kawasan yang berbeza, malah jumlah transaksi barangan, dsb.
Statistik Baidu, analitis Google, alat juruweb, dsb., cuma benamkan js dalam halaman.
Walau bagaimanapun, data sentiasa berada di tangan pihak lain dan pemperibadian menyusahkan, jadi Google mencipta alat analisis sumber terbuka yang dipanggil piwik
6.6 Pemantauan logBiasanya, semasa sistem berjalan, sistem pengendalian akan menjana log sistem, dan aplikasi akan menjana log akses aplikasi, log ralat, log operasi dan log rangkaian Kami boleh menggunakan ELK untuk pemantauan log.
Untuk pemantauan log, keperluan yang paling biasa ialah pengumpulan, penyimpanan, pertanyaan dan paparan.
Komuniti sumber terbuka kebetulan mempunyai projek sumber terbuka yang sepadan: logstash (koleksi) + elasticsearch (storan + carian) + kibana (paparan)
Kami memanggil teknologi gabungan ketiga-tiga ELK Stack ini, jadi ELK Stack merujuk kepada gabungan susunan teknologi Elasticsearch, Logstash dan Kibana.
Jika maklumat log dikumpul, jika terdapat pengecualian dalam kemas kini penempatan, ia boleh dilihat serta-merta pada kibana.
Sudah tentu, anda juga boleh menapis log ralat melalui Zabbix untuk menjana makluman.
6.7 Pemantauan KeselamatanWalaupun terdapat banyak produk keselamatan sumber terbuka Linux, seperti iptables empat lapisan, perlindungan WEB tujuh lapisan Nginx+lua untuk melaksanakan WAF, dan akhirnya mengumpul log yang berkaitan dengan ELK Stack, dan memaparkan jenis serangan yang berbeza secara grafik. Tetapi ia sentiasa menjadi perkara yang memakan masa, dan secara peribadi saya fikir kesannya tidak begitu baik. Pada masa ini kami boleh memilih untuk menyambung kepada pembekal perkhidmatan pihak ketiga.
Vendor pihak ketiga menyediakan perpustakaan kerentanan yang komprehensif, meliputi perkhidmatan, pintu belakang, pangkalan data, pengesanan konfigurasi, CGI, SMTP, dll.
Pengesanan menyeluruh kelemahan hos dan aplikasi web digabungkan dengan perkongsian perlombongan dan industri bebas untuk mengemas kini kelemahan 0hari dengan segera untuk menghapuskan risiko keselamatan terkini
Pemantauan API 6.8Apabila API menjadi semakin penting, jelas sekali kami juga memerlukan data sedemikian untuk mengetahui sama ada API yang kami sediakan berfungsi dengan baik.
Pantau antara muka API GET, POST, PUT, DELETE, HEAD, OPTIONS permintaan Ketersediaan, ketepatan dan masa tindak balas ialah tiga penunjuk prestasi utama
Pemantauan menyeluruh prestasi halaman web, masa respons DNS, masa penubuhan sambungan HTTP, indeks prestasi halaman, masa respons, ketersediaan, saiz elemen, dll.
Zabbix menyediakan pemantauan URL: Pemantauan Web Zabbix
Platform pemantauan tanpa pemantauan penunjuk perniagaan bukanlah platform pemantauan yang lengkap Biasanya dalam sistem pemantauan kami, kami mesti memantau penunjuk perniagaan penting kami dan menetapkan ambang untuk pemberitahuan penggera.
Contohnya, industri e-dagang:
Berapa banyak pesanan dijana seminit;
Berapa ramai pengguna mendaftar seminit;
Berapa ramai pengguna aktif setiap hari;
Berapa banyak promosi yang ada setiap hari;
Berapa ramai pengguna yang diperkenalkan dengan aktiviti promosi;
Berapa trafik yang dibawa oleh promosi
Berapa keuntungan yang dibawa oleh promosi
Dll. Penunjuk penting boleh ditambah pada Zabbix dan kemudian dipaparkan melalui skrin.
7. Pemantauan dan penggeraTerdapat banyak cara untuk memberitahu penggera kerosakan Sudah tentu, kaedah yang paling biasa digunakan ialah mesej teks, e-mel dan penggera SMS
8. Pengendalian penggeraBagaimana kita menangani kerosakan selepas penggera umum Pertama, kita boleh mengendalikannya secara automatik melalui mekanisme peningkatan penggera Contohnya, jika perkhidmatan Nginx tidak berfungsi, kita boleh menetapkan peningkatan penggera untuk memulakan Nginx secara automatik. Tetapi jika kegagalan serius berlaku dalam perniagaan am, kami biasanya menugaskan kakitangan operasi dan penyelenggaraan yang berbeza untuk mengendalikannya berdasarkan tahap kegagalan dan perniagaan kegagalan. Sudah tentu, bentuk perniagaan yang berbeza, seni bina yang berbeza dan perkhidmatan yang berbeza mungkin menggunakan kaedah yang berbeza. Tiada model tetap yang boleh digunakan.
9. Pemantauan temudugaDalam temuduga operasi dan penyelenggaraan, kami sering ditanya soalan berkaitan pemantauan Jadi bagaimana kami harus menjawab soalan ini.
Pemantauan perkakasan. Memantau suis penghala melalui SNMP (anda boleh berkomunikasi dengan beberapa pengeluar untuk mengetahui cara melakukan ini), suhu pelayan dan lain-lain, boleh dicapai melalui IPMI. Sudah tentu, jika tiada perkakasan dan semuanya berada dalam awan, langkau sahaja langkah ini.
Pemantauan sistem. Seperti beban CPU, penukaran konteks, penggunaan memori, baca dan tulis cakera, penggunaan cakera, penggunaan inod cakera. Sudah tentu, ini perlu dikonfigurasikan dengan pencetus, kerana tetapan lalai terlalu rendah dan akan menyebabkan penggera yang kerap.
Pemantauan perkhidmatan. Sebagai contoh, seni bina LAMP yang digunakan oleh syarikat, nginx datang dengan modul Statusnya sendiri, PHP juga mempunyai Status yang berkaitan, MySQL boleh dipantau melalui alat rasmi percona, dan Redis mendapatkan maklumat melalui infonya sendiri untuk penapisan, dll. Kaedahnya serupa. Atau bawa perkhidmatan anda sendiri. Sama ada gunakan skrip untuk melaksanakan kandungan yang ingin anda pantau, serta fungsi penggera dan grafik.
Pemantauan rangkaian. Jika ia adalah hos awan dan ia tidak merentas bilik komputer, anda boleh memilih untuk tidak memantau rangkaian. Sudah tentu anda berkata kami berada di seberang bilik komputer dan sebagainya. Adalah disyorkan untuk menggunakan merokok untuk pemantauan berkaitan rangkaian. Atau serahkan terus kepada jurutera rangkaian anda, kerana terdapat kepakaran dalam industri.
Pemantauan keselamatan. Jika ia adalah hos awan, anda boleh mempertimbangkan untuk menggunakan perlindungan keselamatannya sendiri. Sudah tentu anda juga boleh menggunakan iptables. Jika ia adalah perkakasan, maka disyorkan untuk menggunakan tembok api perkakasan. Menggunakan awan, anda boleh membeli anti-DDoS untuk mengelakkan kerosakan yang boleh menyebabkan masa henti selama sehari. Jika ia adalah sistem, maka penyelesaian asas seperti kebenaran, kata laluan, sandaran, dan pemulihan mesti dilakukan dengan baik. web juga boleh menggunakan Nginx+Lua untuk melaksanakan tembok api peringkat web. Sudah tentu, anda juga boleh menggunakan Openresty bersepadu.
Pemantauan web. Masih terdapat banyak topik mengenai pemantauan web. Contohnya, anda boleh menggunakan pemantauan web terbina dalam untuk memantau kelewatan berkaitan halaman, masa respons js, masa muat turun, dsb. Di sini saya mengesyorkan menggunakan perisian komersial profesional, Monitoring Bao atau Tingyun untuk mencapai matlamat ini. Lagipun, terdapat bilik komputer di seluruh negara. (Jika ia adalah bilik berbilang komputer, mari kita bincangkannya secara berasingan)
Pemantauan log. Jika ia adalah web, anda boleh gunakan untuk memantau log ralat 50x dan 40x Nginx, dan log ERROR PHP. Sebenarnya, keperluan ini tidak lebih daripada pengumpulan, penyimpanan, pertanyaan dan paparan Kita sebenarnya boleh menggunakan ELKstack sumber terbuka untuk mencapainya. Logstash (koleksi), elasticsearch (storan + carian), kibana (paparan)
Pemantauan perniagaan. Kami telah melakukan begitu banyak, tetapi pada akhirnya kami masih memastikan operasi perniagaan. Hanya dengan cara ini pemantauan yang kami lakukan boleh masuk akal. Oleh itu, pemantauan di peringkat perniagaan memerlukan mesyuarat dan perbincangan dengan pembangunan dan pengarah untuk memantau penunjuk perniagaan yang lebih penting (yang perlu disahkan oleh mesyuarat) dan kemudian boleh dilaksanakan melalui skrip mudah, dan akhirnya menetapkan pencetus.
Analisis trafik. Kami biasanya menggunakan sekumpulan alat seperti awk sed xxx untuk menganalisis log. Ini tidak begitu mudah untuk kami mengira IP, PV dan UV. Kemudian anda boleh menggunakan Statistik Baidu, Statistik Google dan Perdagangan untuk membangunkan kod terbenam. Untuk mengelakkan privasi, anda juga boleh menggunakan piwik untuk melakukan analisis trafik yang berkaitan.
Visualisasi. Gunakan skrin dan perkenalkan beberapa perpustakaan pihak ketiga untuk mencantikkan antara muka Pada masa yang sama, kita juga perlu tahu bahawa volum pesanan tiba-tiba meningkat atau berkurangan. Dalam erti kata lain, gelombang besar lalu lintas tiba-tiba datang dari mana trafik ini dipromosikan atau diserang? Platform pemantauan boleh digabungkan untuk menyelesaikan hubungan perniagaan antara pelbagai sistem.
Pemantauan automatik. Memandangkan kami telah melakukan begitu banyak kerja di atas, sudah tentu kami tidak boleh menambah kunci satu demi satu. Ini boleh dicapai melalui mod aktif dan mod pasif Zabbix. Sudah tentu yang terbaik untuk melakukan ini melalui API.
Ringkasan
Jika kita benar-benar ingin mencapai sistem pemantauan yang lebih lengkap, perisian sumber terbuka semasa tidak dapat memuaskannya dengan baik Syarikat yang layak telah mula membangunkan sistem pemantauan mereka sendiri, seperti Open-Falcon sumber terbuka Xiaomi. Terdapat juga rangka kerja pemantauan sumber terbuka yang lebih baik seperti Sensu, dsb., serta influxdb dan grafana, yang boleh digunakan untuk menyesuaikan platform pemantauan yang sesuai dengan perusahaan anda sendiri.
Sudah tentu, apa yang saya katakan masih sangat mudah Pengalaman saya adalah terhad dan idea saya hanya boleh memberikan begitu banyak. Di atas adalah antara kaedah dan pengalaman yang saya kongsikan tentang pemantauan. (Burung tua tolong jangan mengeluh)
Atas ialah kandungan terperinci Penerokaan mendalam sistem pengetahuan dalam bidang pengawasan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!