Adakah pembelajaran mesin akan menyebabkan pengendali sistem pengurusan pangkalan data tidak bekerja?-LINUX-php.cn

Rumah

Tutorial sistem

LINUX

Adakah pembelajaran mesin akan menyebabkan pengendali sistem pengurusan pangkalan data tidak bekerja?

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jan 13, 2024 pm 06:24 PM

linuxtutorial linuxTopi Merahsistem linuxarahan linuxpensijilan linuxlinux topi merahvideo linux

Pengenalan

Sistem Pengurusan Pangkalan Data (DBMS) ialah bahagian paling penting dalam mana-mana sistem aplikasi intensif data. Mereka boleh mengendalikan sejumlah besar data dan beban kerja yang kompleks. Tetapi mereka sukar untuk diurus kerana mereka mempunyai ratusan atau ribuan "tombol" konfigurasi yang mengawal faktor seperti jumlah memori yang digunakan untuk caching dan kekerapan data ditulis ke peranti storan. Organisasi sering mengupah pakar untuk membantu memperhalusi kempen mereka, tetapi pakar sangat mahal untuk banyak perniagaan.

Artikel ini ditulis bersama oleh tiga tetamu dari Universiti Carnegie Mellon: artikel Dana Van Aken, Andy Pavlo dan Geoff Gordon. Projek ini menunjukkan cara penyelidik akademik boleh menggunakan AWS Cloud Credits for Research Program (https://aws.amazon.com/research-credits/) untuk menyokong kejayaan saintifik mereka.

OtterTune ialah alat baharu yang dibangunkan oleh pelajar dan penyelidik daripada Kumpulan Pangkalan Data Universiti Carnegie Mellon (http://db.cs.cmu.edu/projects/autotune/) yang mengautomasikan konfigurasi butang DBMS untuk mencari tetapan yang sesuai. Matlamatnya adalah untuk memudahkan sesiapa sahaja untuk menggunakan DBMS, walaupun mereka yang tidak mempunyai kepakaran dalam pentadbiran pangkalan data.

OtterTune berbeza daripada alatan konfigurasi DBMS yang lain kerana ia memanfaatkan sepenuhnya pengetahuan yang diperoleh daripada menala DBMS yang digunakan sebelum ini untuk menala DBMS yang baru digunakan. Ini dengan ketara mengurangkan masa dan sumber yang diperlukan untuk menala DBMS yang baru digunakan. Untuk tujuan ini, OtterTune mengekalkan pangkalan data yang mengandungi data penalaan yang dikumpul daripada sesi penalaan sebelumnya. Ia menggunakan data ini untuk membina model pembelajaran mesin yang menangkap maklumat tentang cara DBMS bertindak balas terhadap konfigurasi yang berbeza. OtterTune menggunakan model ini untuk membimbing pengguna apabila mencuba aplikasi baharu, mencadangkan tetapan yang meningkatkan matlamat tertentu, seperti mengurangkan kependaman atau meningkatkan daya pengeluaran.

Dalam artikel ini, kami meneroka setiap komponen saluran pembelajaran mesin OtterTune dan menunjukkan cara ia berkait antara satu sama lain untuk menyesuaikan konfigurasi DBMS anda. Kami kemudiannya menilai prestasi OtterTune pada MySQL dan Postgres dengan membandingkan prestasi konfigurasi optimumnya dengan konfigurasi yang dipilih oleh pentadbir pangkalan data (DBA) dan alat penalaan automatik yang lain.

OtterTune ialah alat sumber terbuka yang dibangunkan oleh pelajar dan penyelidik dalam Kumpulan Pangkalan Data di Universiti Carnegie Mellon. Semua kod diletakkan pada GitHub (https://github.com/cmu-db/ottertune) dan dikeluarkan di bawah Lesen Apache 2.0.

Cara ia berfungsi

Gambar di bawah menunjukkan komponen dan aliran kerja OtterTune.

Adakah pembelajaran mesin akan menyebabkan pengendali sistem pengurusan pangkalan data tidak bekerja?

Pada permulaan sesi penalaan baharu, pengguna memberitahu OtterTune matlamat khusus yang hendak dioptimumkan (seperti kependaman atau daya pemprosesan). Pengawal klien menyambung kepada DBMS sasaran dan mengumpul jenis contoh Amazon EC2 dan sasaran semasa.

Pengawal kemudian memulakan tempoh pemerhatian pertama, di mana ia memerhati DBMS dan merekodkan sasaran tertentu. Selepas tempoh pemerhatian tamat, pengawal mengumpul metrik dalaman daripada DBMS, seperti kiraan MySQL halaman yang dibaca daripada cakera dan halaman yang ditulis ke cakera. Pengawal mengembalikan kedua-dua matlamat khusus dan metrik dalaman kepada pengurus penalaan.

Selepas pengurus penalaan OtterTune menerima metrik, ia menyimpannya dalam repositori. OtterTune menggunakan keputusan untuk mengira konfigurasi seterusnya yang harus dipasang oleh pengawal pada DBMS sasaran. Pengurus penalaan mengembalikan konfigurasi ini kepada pengawal dan menganggarkan peningkatan yang dijangkakan melalui larian sebenar. Pengguna boleh memutuskan untuk meneruskan sesi penalaan atau menamatkannya.

Arahan

OtterTune mengekalkan senarai hitam butang untuk setiap versi DBMS yang disokongnya. Senarai hitam termasuk butang yang tidak perlu ditala (seperti nama laluan fail storan DBMS), atau butang yang mungkin mempunyai akibat yang serius atau tersembunyi (seperti yang boleh menyebabkan DBMS kehilangan data). Pada permulaan setiap sesi penalaan, OtterTune menyediakan senarai hitam kepada pengguna supaya mereka boleh menambah sebarang butang lain yang mereka mahu OtterTune mengelakkan penalaan.

OtterTune membuat andaian tertentu yang mungkin mengehadkan kegunaannya kepada sesetengah pengguna. Sebagai contoh, ia menganggap bahawa pengguna mempunyai hak pentadbir, membenarkan pengawal untuk mengubah suai konfigurasi DBMS. Jika pengguna tidak mempunyai hak pentadbir, mereka boleh menggunakan salinan kedua pangkalan data ke perkakasan lain untuk eksperimen penalaan OtterTune. Ini memerlukan pengguna memainkan semula surih beban kerja atau memajukan pertanyaan daripada DBMS gred pengeluaran. Untuk perbincangan lengkap tentang andaian dan had, lihat kertas kerja kami (http://db.cs.cmu.edu/papers/2017/tuning-sigmod2017.pdf).

Saluran Paip Pembelajaran Mesin

Imej di bawah menunjukkan cara data diproses semasa ia melalui saluran paip pembelajaran mesin OtterTune. Semua pemerhatian diletakkan dalam pangkalan data OtterTune.

OtterTune mula-mula menghantar hasil pemerhatian ke komponen Pencirian Beban Kerja. Komponen ini mengenal pasti set kecil metrik DBMS yang paling tepat menangkap perubahan prestasi dan ciri unik beban kerja yang berbeza.

Seterusnya, komponen Pengenalpastian Tombol menjana senarai pengisihan butang, menyenaraikan butang yang mempunyai kesan paling besar terhadap prestasi DBMS. OtterTune kemudian menyuapkan semua maklumat ini ke Automatic Tuner. Komponen ini memetakan beban kerja DBMS sasaran kepada beban kerja yang paling serupa dalam repositori data dan menggunakan semula data beban kerja untuk menjana konfigurasi yang lebih sesuai.

Adakah pembelajaran mesin akan menyebabkan pengendali sistem pengurusan pangkalan data tidak bekerja?

Sekarang mari kita menyelami setiap komponen saluran paip pembelajaran mesin.

Pencirian Beban Kerja: OtterTune menggunakan metrik masa jalan dalaman DBMS untuk menerangkan ciri tingkah laku beban kerja. Metrik ini mewakili beban kerja dengan tepat kerana ia menangkap banyak aspek tingkah laku masa jalan. Walau bagaimanapun, banyak metrik adalah berlebihan: sesetengahnya adalah metrik yang sama direkodkan dalam unit yang berbeza, dan yang lain mewakili bahagian bebas DBMS yang sangat berkorelasi secara berangka. Memperkemas metrik berlebihan adalah penting kerana ia mengurangkan kerumitan model pembelajaran mesin yang menggunakannya. Untuk tujuan ini, kami membahagikan metrik DBMS kepada kelompok berdasarkan corak korelasi. Kami kemudian memilih metrik perwakilan daripada setiap kluster, khususnya yang paling hampir dengan pusat kluster. Komponen seterusnya dalam saluran paip pembelajaran mesin menggunakan metrik ini.

Pengenalan Tombol: DBMS mungkin mempunyai beratus-ratus butang, tetapi hanya sebilangan kecil butang yang mempengaruhi prestasi DBMS. OtterTune menggunakan teknik pemilihan ciri popular yang dipanggil Lasso untuk menentukan butang yang mempengaruhi prestasi keseluruhan sistem anda dengan ketara. Dengan menggunakan teknik ini pada data dalam pangkalan data, OtterTune boleh mengenal pasti kepentingan susunan butang DBMS.

OtterTune kemudiannya perlu memutuskan berapa banyak butang untuk digunakan dalam konfigurasi yang dicadangkan. Menggunakan terlalu banyak butang meningkatkan masa pengoptimuman OtterTune. Menggunakan terlalu sedikit butang menghalang OtterTune daripada mencari konfigurasi optimum. Untuk mengautomasikan proses ini, OtterTune menggunakan pendekatan tambahan. Ia secara beransur-ansur meningkatkan bilangan butang yang digunakan dalam sesi penalaan. Pendekatan ini membolehkan OtterTune meneroka dan mengoptimumkan konfigurasi untuk set kecil butang yang paling penting, dan kemudian mengembangkan skop untuk mempertimbangkan butang tambahan.

Penala Automatik: Komponen Penalaan Automatik menentukan konfigurasi yang OtterTune patut cadangkan dengan melakukan analisis dua langkah selepas setiap tempoh pemerhatian.

Pertama, sistem mengenal pasti beban kerja daripada sesi penalaan sebelumnya yang paling mewakili beban kerja DBMS sasaran menggunakan data prestasi berbanding metrik yang dikenal pasti dalam komponen Pencirian Beban Kerja. Ia membandingkan metrik sesi dengan metrik daripada beban kerja sebelumnya untuk melihat mana yang bertindak balas serupa kepada tetapan butang yang berbeza.

Kemudian, OtterTune memilih konfigurasi butang lain untuk mencubanya. Ia sesuai dengan model statistik dengan data yang telah dikumpul, serta data daripada beban kerja yang paling serupa dalam repositori. Model ini membolehkan OtterTune meramalkan prestasi DBMS menggunakan setiap konfigurasi yang mungkin. OtterTune mengoptimumkan konfigurasi seterusnya untuk mencapai keseimbangan antara penerokaan (mengumpul maklumat untuk menambah baik model) dan eksploitasi (berprestasi sebaik mungkin pada metrik tertentu).

Tercapai

OtterTune ditulis dalam Python.

Mengenai Pencirian Beban Kerja dan Pengenalpastian Tombol, prestasi masa jalan bukanlah isu utama yang perlu dibimbangkan, jadi kami menggunakan scikit-lear untuk melaksanakan algoritma pembelajaran mesin yang sepadan. Algoritma ini berjalan dalam proses latar belakang dan akan menyepadukan data baharu sebaik sahaja ia tersedia dalam pangkalan data OtterTune.

Bagi Penala Automatik, algoritma pembelajaran mesin berada di laluan kritikal. Ia dijalankan selepas setiap tempoh pemerhatian, menyepadukan data baharu supaya OtterTune boleh memilih konfigurasi butang untuk mencuba seterusnya. Memandangkan prestasi adalah pertimbangan, kami melaksanakan algoritma ini menggunakan TensorFlow.

Untuk mengumpul data tentang perkakasan DBMS, konfigurasi butang dan metrik prestasi masa jalan, kami menyepadukan pengawal OtterTune dengan rangka kerja penanda aras OLTP-Bench.

Penilaian

Untuk menilai, kami membandingkan konfigurasi terbaik yang dipilih oleh OtterTune dengan konfigurasi berikut untuk prestasi MySQL dan Postgres:

Lalai: Konfigurasi disediakan oleh DBMS
Skrip penalaan: Konfigurasi yang dihasilkan oleh alat nasihat penalaan sumber terbuka
DBA: Konfigurasi yang dijana oleh pentadbir pangkalan data
RDS: Konfigurasi disesuaikan untuk DBMS, diurus oleh Amazon RD, digunakan pada jenis contoh EC2 yang sama.

Kami menjalankan semua percubaan di Amazon EC2 Spot Instances. Kami menjalankan setiap percubaan pada dua keadaan: satu untuk pengawal OtterTune dan satu lagi untuk sistem DBMS sasaran yang digunakan. Kami menggunakan jenis contoh m4.large dan m3.xlarge masing-masing. Kami menggunakan pengurus penalaan dan pustaka data OtterTune pada pelayan tempatan yang dilengkapi dengan 20 teras dan memori 128GB.

Kami menggunakan beban kerja TPC-C, yang merupakan piawaian industri untuk menilai prestasi sistem pemprosesan transaksi dalam talian (OLTP).

Kami mengukur kependaman dan daya pemprosesan terhadap setiap pangkalan data yang kami gunakan dalam eksperimen kami: MySQL dan Postgres. Angka berikut menunjukkan keputusan. Graf pertama menunjukkan jumlah kependaman persentil ke-99, yang mewakili masa "kes terburuk" yang diperlukan untuk transaksi selesai. Graf kedua menunjukkan keputusan untuk pemprosesan, diukur sebagai purata bilangan urus niaga yang diselesaikan sesaat.

Hasil MySQL:

Adakah pembelajaran mesin akan menyebabkan pengendali sistem pengurusan pangkalan data tidak bekerja?

Membandingkan konfigurasi optimum yang dijana oleh OtterTune dengan konfigurasi yang dijana oleh skrip penalaan dan RDS, anda akan mendapati bahawa jika anda menggunakan konfigurasi OtterTune, kependaman MySQL dikurangkan sebanyak kira-kira 60% dan daya pemprosesan meningkat sebanyak 35%. OtterTune juga menghasilkan konfigurasi dengan hasil yang sebaik yang dipilih oleh pentadbir pangkalan data.

Beberapa butang MySQL mempunyai impak yang ketara pada prestasi beban kerja TPC-C. Konfigurasi yang dijana oleh OtterTune dan pentadbir pangkalan data menyediakan tetapan yang baik untuk setiap butang ini. RDS berprestasi sedikit kurang baik kerana menyediakan tetapan sub-optimum untuk satu butang. Konfigurasi skrip penalaan melakukan yang paling teruk kerana hanya satu butang diubah suai.

Keputusan untuk Postgres:

Adakah pembelajaran mesin akan menyebabkan pengendali sistem pengurusan pangkalan data tidak bekerja?

Dari segi kependaman, OtterTune, alat penalaan, pengurusan pangkalan data dan konfigurasi yang dijana RDS semuanya menunjukkan peningkatan yang sama berbanding tetapan lalai Postgres. Kita mungkin boleh mengaitkan ini kepada overhed yang diperlukan untuk perjalanan pergi dan balik antara klien OLTP-Bench dan DBMS melalui rangkaian. Bagi daya pemprosesan, jika anda menggunakan konfigurasi yang disyorkan oleh OtterTune, prestasi Postgres adalah kira-kira 12% lebih tinggi daripada konfigurasi yang dipilih oleh pentadbir pangkalan data dan skrip penalaan, dan kira-kira 32% lebih tinggi daripada RDS.

Sama seperti MySQL, terdapat hanya beberapa butang yang memberi impak ketara kepada prestasi Postgres. OtterTune, pentadbir pangkalan data, skrip penalaan dan konfigurasi yang dijana RDS semuanya mengubah suai butang ini, dan kebanyakannya menyediakan tetapan yang cukup baik.

Kesimpulan

OtterTune mengautomasikan proses mencari tetapan yang betul untuk butang konfigurasi DBMS. Untuk menala DBMS yang baru digunakan, ia menggunakan semula data latihan yang dikumpul daripada sesi penalaan sebelumnya. Oleh kerana OtterTune tidak memerlukan penjanaan set data awal untuk melatih model pembelajaran mesin, masa penalaan dikurangkan dengan ketara.

Apa seterusnya? Untuk menampung peningkatan populariti penggunaan DBaaS yang tidak mempunyai akses jauh kepada sistem hos DBMS, OtterTune tidak lama lagi akan dapat mengesan secara automatik keupayaan perkakasan DMBS sasaran tanpa memerlukan akses jauh.

Untuk butiran lanjut tentang OtterTune, lihat kertas kami atau kod di GitHub. Sila beri perhatian kepada tapak web ini (http://ottertune.cs.cmu.edu/), kami akan melancarkan OtterTune, perkhidmatan penalaan dalam talian tidak lama lagi.
Mengenai pengarang:

Dana Van Aken ialah pelajar PhD dalam sains komputer di Carnegie Mellon University, dibimbing oleh Dr. Andrew Pavlo.

Andy Pavlo ialah penolong profesor sains pangkalan data di Jabatan Sains Komputer di Universiti Carnegie Mellon.

Geoff Gordon ialah seorang profesor bersekutu dan pengarah pendidikan bersekutu di Jabatan Pembelajaran Mesin di Universiti Carnegie Mellon.

Atas ialah kandungan terperinci Adakah pembelajaran mesin akan menyebabkan pengendali sistem pengurusan pangkalan data tidak bekerja?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan

Artikel ini dikembalikan pada:Linux就该这么学. Jika ada pelanggaran, sila hubungi admin@php.cn Padam

Artikel Berkaitan

什么是linux设备节点Apr 18, 2022 pm 08:10 PM

linux设备节点是应用程序和设备驱动程序沟通的一个桥梁；设备节点被创建在“/dev”，是连接内核与用户层的枢纽，相当于硬盘的inode一样的东西，记录了硬件设备的位置和信息。设备节点使用户可以与内核进行硬件的沟通，读写设备以及其他的操作。

Linux中open和fopen的区别有哪些Apr 29, 2022 pm 06:57 PM

区别：1、open是UNIX系统调用函数，而fopen是ANSIC标准中的C语言库函数；2、open的移植性没fopen好；3、fopen只能操纵普通正规文件，而open可以操作普通文件、网络套接字等；4、open无缓冲，fopen有缓冲。

linux中什么叫端口映射May 09, 2022 pm 01:49 PM

端口映射又称端口转发，是指将外部主机的IP地址的端口映射到Intranet中的一台计算机，当用户访问外网IP的这个端口时，服务器自动将请求映射到对应局域网内部的机器上；可以通过使用动态或固定的公共网络IP路由ADSL宽带路由器来实现。

什么是linux交叉编译Apr 29, 2022 pm 06:47 PM

在linux中，交叉编译是指在一个平台上生成另一个平台上的可执行代码，即编译源代码的平台和执行源代码编译后程序的平台是两个不同的平台。使用交叉编译的原因：1、目标系统没有能力在其上进行本地编译；2、有能力进行源代码编译的平台与目标平台不同。

linux中eof是什么May 07, 2022 pm 04:26 PM

在linux中，eof是自定义终止符，是“END Of File”的缩写；因为是自定义的终止符，所以eof就不是固定的，可以随意的设置别名，linux中按“ctrl+d”就代表eof，eof一般会配合cat命令用于多行文本输出，指文件末尾。

linux怎么判断pcre是否安装May 09, 2022 pm 04:14 PM

在linux中，可以利用“rpm -qa pcre”命令判断pcre是否安装；rpm命令专门用于管理各项套件，使用该命令后，若结果中出现pcre的版本信息，则表示pcre已经安装，若没有出现版本信息，则表示没有安装pcre。

linux怎么查询mac地址Apr 24, 2022 pm 08:01 PM

linux查询mac地址的方法：1、打开系统，在桌面中点击鼠标右键，选择“打开终端”；2、在终端中，执行“ifconfig”命令，查看输出结果，在输出信息第四行中紧跟“ether”单词后的字符串就是mac地址。

linux中rpc是什么意思May 07, 2022 pm 04:48 PM

在linux中，rpc是远程过程调用的意思，是Reomote Procedure Call的缩写，特指一种隐藏了过程调用时实际通信细节的IPC方法；linux中通过RPC可以充分利用非共享内存的多处理器环境，提高系统资源的利用率。

See all articles

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

2 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Repo: Cara menghidupkan semula rakan sepasukan

4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Hello Kitty Island Adventure: Cara mendapatkan biji gergasi

4 minggu yang laluBy尊渡假赌尊渡假赌尊渡假赌

Berapa lama masa yang diperlukan untuk mengalahkan fiksyen berpecah?

3 minggu yang laluByDDD

R.E.P.O. Simpan Fail Lokasi: Di manakah & bagaimana untuk melindunginya?

3 minggu yang laluByDDD

Tunjukkan Lagi

Alat panas

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.