ホームページ >ウェブフロントエンド >jsチュートリアル >ウィキペディア アカデミー賞リストの JavaScript スクレーパー。
このチュートリアルでは、JavaScriptのCheerio Libraryを使用してWebスクレイピングを示して、Wikipediaからアカデミー賞を受賞した映画を抽出し、CSVファイルに保存します。
最初に、必要なパッケージをインストールします:
WikipediaページURLは:
<code class="language-bash">npm install cheerio axios</code>です
コードは
const url = 'https://en.wikipedia.org/wiki/List_of_Academy_Award%E2%80%93winning_films';
スクリプトはDOMをナビゲートし、テーブルセルからデータを抽出します。
axios
<code class="language-javascript">const { data: html } = await axios.get(url); const $ = cheerio.load(html); const theadData = []; const tableData = [];</code>を使用してCSVファイルに保存されます。
:
<code class="language-javascript">$('tbody').each((i, column) => { const columnData = []; $(column).find('th').each((j, cell) => { columnData.push($(cell).text().replace('\n', '')); }); theadData.push(columnData); }); tableData.push(theadData[0]); $('table tr').each((i, row) => { const rowData = []; $(row).find('td').each((j, cell) => { rowData.push($(cell).text().trim()); }); if (rowData.length) tableData.push(rowData); });</code>を使用してスクリプトを実行します
fs.writeFileSync
結果の
<code class="language-javascript">const csvContent = tableData.map((row) => row.join(';')).join('\n'); fs.writeFileSync('academy_awards.csv', csvContent, 'utf-8');</code>
<code class="language-bash">node scraper.js</code>このチュートリアルは、GoとPythonを使用した以前のスクレイピングチュートリアルに基づいています。 これが役立つ場合は、著者をサポートすることを検討してください:
academy_awards.csv
以上がウィキペディア アカデミー賞リストの JavaScript スクレーパー。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。