Rumah  >  Artikel  >  Tutorial sistem  >  Menyelam mendalam ke topik lanjutan tentang penyahpepijat Linux

Menyelam mendalam ke topik lanjutan tentang penyahpepijat Linux

WBOY
WBOYke hadapan
2024-01-08 22:42:00372semak imbas
Pengenalan Kami akhirnya sampai ke artikel terakhir dalam siri ini! Kali ini, saya akan memberikan gambaran keseluruhan peringkat tinggi tentang beberapa konsep yang lebih maju dalam penyahpepijatan: penyahpepijatan jauh, sokongan perpustakaan kongsi, penilaian ekspresi dan sokongan multithreading. Idea ini lebih kompleks untuk dilaksanakan, jadi saya tidak akan menerangkan secara terperinci tentang cara melakukannya, tetapi saya berbesar hati untuk menjawab soalan tentang konsep ini jika anda mempunyai soalan.
Indeks Siri
  1. Sediakan persekitaran
  2. Titik putus
  3. Daftar dan Memori
  4. Bunian dan kerdil
  5. Kod sumber dan isyarat
  6. Lapisan kod sumber dilaksanakan langkah demi langkah
  7. Titik putus lapisan kod sumber
  8. Timbunan panggilan
  9. Kendalikan pembolehubah
  10. Tema Premium
Penyahpepijatan jauh

Penyahpepijatan jauh sangat berguna untuk sistem terbenam atau penyahpepijatan persekitaran yang berbeza. Ia juga menetapkan garis halus antara operasi penyahpepijat peringkat tinggi dan interaksi dengan sistem pengendalian dan perkakasan. Malah, penyahpepijat seperti GDB dan LLDB boleh dijalankan sebagai penyahpepijat jauh walaupun semasa menyahpepijat program tempatan. Struktur umum adalah seperti ini:
Linux 调试器之高级主题!

debuarch

Penyahpepijat ialah komponen yang kita berinteraksi melalui baris arahan. Mungkin jika anda menggunakan IDE, terdapat lapisan lain di atasnya yang berkomunikasi dengan penyahpepijat melalui antara muka mesin. Pada mesin sasaran (mungkin sama dengan mesin asli) terdapat stub nyahpepijat, yang secara teorinya merupakan pembalut di sekeliling perpustakaan penyahpepijatan sistem pengendalian yang sangat kecil yang melaksanakan semua tugas penyahpepijatan peringkat rendah seperti menetapkan titik putus pada alamat. Saya katakan "secara teori" kerana stub nyahpepijat semakin besar hari ini. Sebagai contoh, saiz rintisan nyahpepijat LLDB pada mesin saya ialah 7.6MB. Stub nyahpepijat berkomunikasi dengan proses nyahpepijat dan penyahpepijat melalui protokol jauh dengan menggunakan beberapa fungsi khusus sistem pengendalian (ptrace dalam kes kami).
Protokol penyahpepijatan jauh yang paling biasa ialah protokol jauh GDB. Ini ialah format paket berasaskan teks yang digunakan untuk menghantar arahan dan maklumat antara penyahpepijat dan stub nyahpepijat. Saya tidak akan menjelaskannya secara terperinci, tetapi anda boleh membaca lebih lanjut di sini. Jika anda memulakan LLDB dan melaksanakan log arahan membolehkan paket jauh gdb, anda akan mendapat kesan semua paket yang dihantar melalui protokol jauh. Pada GDB, anda boleh melakukan perkara yang sama dengan set remotelogfile.

Sebagai contoh mudah, ini ialah paket untuk menetapkan titik putus pada:

$Z0,400570,1#43

$ menandakan permulaan paket. Z0 ialah arahan untuk memasukkan titik putus memori. 400570 dan 1 ialah parameter, di mana yang pertama ialah alamat untuk menetapkan titik putus dan yang terakhir ialah penentu jenis titik putus untuk sasaran tertentu. Akhir sekali, #43 ialah jumlah semak untuk memastikan data tidak rosak.

Protokol jauh GDB sangat mudah untuk dikembangkan dengan paket tersuai, yang berguna untuk melaksanakan fungsi khusus platform atau bahasa.

Perpustakaan kongsi dan sokongan pemuatan dinamik

Penyahpepijat perlu mengetahui perpustakaan kongsi yang dimuatkan oleh program yang sedang dinyahpepijat supaya ia boleh menetapkan titik putus, mendapatkan maklumat dan simbol tahap kod sumber, dsb. Selain mencari pustaka yang dipautkan secara dinamik, penyahpepijat juga mesti menjejaki perpustakaan yang dimuatkan pada masa jalan melalui dlopen. Untuk mencapai tujuan ini, pemaut dinamik mengekalkan struktur persimpangan. Struktur ini mengekalkan senarai terpaut deskriptor perpustakaan kongsi, serta penunjuk kepada fungsi yang dipanggil apabila senarai terpaut dikemas kini. Struktur ini disimpan dalam bahagian .dynamic fail ELF dan dimulakan sebelum pelaksanaan program.

Algoritma penjejakan mudah:

  • Pengesan mencari kemasukan program dalam pengepala ELF (atau boleh menggunakan vektor tambahan yang disimpan dalam /proc//aux).
  • Program pengesanan menetapkan titik putus pada kemasukan program dan memulakan pelaksanaan.
  • Apabila titik putus dicapai, cari alamat struktur persimpangan dengan mencari alamat beban .dynamic dalam fail ELF.
  • Semak struktur persimpangan untuk senarai perpustakaan yang sedang dimuatkan.
  • Tetapkan titik putus pada fungsi kemas kini pemaut.
  • Senarai dikemas kini setiap kali titik putus dicapai.
  • Program penjejakan berpusing tanpa had, terus melaksanakan program dan menunggu isyarat sehingga isyarat program penjejakan keluar.

Saya menulis contoh kecil konsep ini, yang boleh anda temui di sini. Saya boleh menulis dengan lebih terperinci pada masa hadapan jika ada yang berminat.

Pengiraan ungkapan

Penilaian ekspresi ialah ciri program yang membolehkan pengguna menilai ungkapan dalam bahasa sumber asal semasa menyahpepijat atur cara. Sebagai contoh, dalam LLDB atau GDB, anda boleh melaksanakan print foo() untuk memanggil fungsi foo dan mencetak hasilnya.

Terdapat beberapa kaedah pengiraan berbeza bergantung pada kerumitan ungkapan. Jika ungkapan itu hanyalah pengecam mudah, penyahpepijat boleh melihat maklumat nyahpepijat, mencari pembolehubah dan mencetak nilai, sama seperti yang kami lakukan pada bahagian terakhir siri ini. Jika ungkapan itu agak rumit, mungkin untuk menyusun kod ke dalam ungkapan perantaraan (IR) dan mentafsirkannya untuk mendapatkan hasilnya. Sebagai contoh, untuk sesetengah ungkapan, LLDB akan menggunakan Clang untuk menyusun ungkapan ke dalam IR LLVM dan mentafsirnya. Jika ungkapan itu lebih kompleks, atau memerlukan panggilan fungsi tertentu, kod itu mungkin perlu JIT ke sasaran dan dilaksanakan dalam ruang alamat penyahpepijat. Ini melibatkan panggilan mmap untuk memperuntukkan beberapa memori boleh laku, kemudian menyalin kod yang disusun ke dalam blok itu dan melaksanakannya. LLDB dilaksanakan menggunakan keupayaan JIT LLVM.

Jika anda ingin mengetahui lebih lanjut tentang kompilasi JIT, saya sangat mengesyorkan artikel Eli Bendersky mengenai subjek tersebut.

多线程调试支持

本系列展示的调试器仅支持单线程应用程序,但是为了调试大多数真实程序,多线程支持是非常需要的。支持这一点的最简单的方法是跟踪线程的创建,并解析 procfs 以获取所需的信息。

Linux 线程库称为 pthreads。当调用 pthread_create 时,库会使用 clone 系统调用来创建一个新的线程,我们可以用 ptrace 跟踪这个系统调用(假设你的内核早于 2.5.46)。为此,你需要在连接到调试器之后设置一些 ptrace 选项:

ptrace(PTRACE_SETOPTIONS, m_pid, nullptr, PTRACE_O_TRACECLONE);

现在当 clone 被调用时,该进程将收到我们的老朋友 SIGTRAP 信号。对于本系列中的调试器,你可以将一个例子添加到 handle_sigtrap 来处理新线程的创建:

case (SIGTRAP | (PTRACE_EVENT_CLONE << 8)):
//get the new thread ID
unsigned long event_message = 0;
ptrace(PTRACE_GETEVENTMSG, pid, nullptr, message);
//handle creation
//...

一旦收到了,你可以看看 /proc//task/ 并查看内存映射之类来获得所需的所有信息。

GDB 使用 libthread_db,它提供了一堆帮助函数,这样你就不需要自己解析和处理。设置这个库很奇怪,我不会在这展示它如何工作,但如果你想使用它,你可以去阅读这个教程。

多线程支持中最复杂的部分是调试器中线程状态的建模,特别是如果你希望支持不间断模式或当你计算中涉及不止一个 CPU 的某种异构调试。

最后!

呼!这个系列花了很长时间才写完,但是我在这个过程中学到了很多东西,我希望它是有帮助的。如果你有关于调试或本系列中的任何问题,请在 Twitter @TartanLlama或评论区联系我。如果你有想看到的其他任何调试主题,让我知道我或许会再发其他的文章。

Atas ialah kandungan terperinci Menyelam mendalam ke topik lanjutan tentang penyahpepijat Linux. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:linuxprobe.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam