Rumah >hujung hadapan web >tutorial js >Pengikis JavaScript untuk Senarai Anugerah Akademi Wikipedia.

Pengikis JavaScript untuk Senarai Anugerah Akademi Wikipedia.

Susan Sarandon
Susan Sarandonasal
2025-01-24 16:39:121029semak imbas

Tutorial ini menunjukkan pengikis web menggunakan perpustakaan Cheerio JavaScript untuk mengekstrak filem pemenang Anugerah Akademi dari Wikipedia dan simpannya ke fail CSV.

Pertama, pasangkan pakej yang diperlukan:

<code class="language-bash">npm install cheerio axios</code>
URL halaman Wikipedia adalah:

<code class="language-javascript">const url = 'https://en.wikipedia.org/wiki/List_of_Academy_Award%E2%80%93winning_films';</code>
Kod mengambil HTML halaman menggunakan

, kemudian menggunakan Cheerio untuk menghuraikannya: axios

<code class="language-javascript">const { data: html } = await axios.get(url);
const $ = cheerio.load(html);

const theadData = [];
const tableData = [];</code>
Skrip menavigasi DOM, mengekstrak data dari sel jadual:

<code class="language-javascript">$('tbody').each((i, column) => {
  const columnData = [];
  $(column).find('th').each((j, cell) => {
    columnData.push($(cell).text().replace('\n', ''));
  });
  theadData.push(columnData);
});

tableData.push(theadData[0]);

$('table tr').each((i, row) => {
  const rowData = [];
  $(row).find('td').each((j, cell) => {
    rowData.push($(cell).text().trim());
  });
  if (rowData.length) tableData.push(rowData);
});</code>
Akhirnya, data yang diekstrak diformat dan disimpan ke fail CSV menggunakan

, dengan titik koma sebagai pembatas: fs.writeFileSync

<code class="language-javascript">const csvContent = tableData.map((row) => row.join(';')).join('\n');
fs.writeFileSync('academy_awards.csv', csvContent, 'utf-8');</code>
Jalankan skrip menggunakan:

<code class="language-bash">node scraper.js</code>
Fail yang dihasilkan

mengandungi data yang dikikis. academy_awards.csv

A JavaScript scraper for the Wikipedia Academy Award List. Tutorial ini dibina pada tutorial mengikis sebelumnya menggunakan Go dan Python. Pertimbangkan untuk menyokong penulis jika ini membantu:

Atas ialah kandungan terperinci Pengikis JavaScript untuk Senarai Anugerah Akademi Wikipedia.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn