ホームページ  >  記事  >  バックエンド開発  >  urllib2 や BeautifulSoup などの Python ライブラリを使用して、Web サイトから日の出と日の入りの時刻をプログラムで取得するにはどうすればよいでしょうか?

urllib2 や BeautifulSoup などの Python ライブラリを使用して、Web サイトから日の出と日の入りの時刻をプログラムで取得するにはどうすればよいでしょうか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-10-26 23:07:30621ブラウズ

How can Python libraries like urllib2 and BeautifulSoup be used to programmatically scrape sunrise and sunset times from a website?

Python を使用したプログラムによる Web スクレイピング

紹介: Web スクレイピングは、Web サイトからデータを抽出するプロセスであり、データ分析とオートメーション。 Python は、開発者が Web コンテンツを効果的にスクレイピングできるようにするさまざまなモジュールを提供します。

urllib2 と BeautifulSoup を使用した Web スクレイピング

毎日の日の出/日の入り時刻を取得するという特定の目標向けWeb サイトからの場合は、urllib2 と BeautifulSoup ライブラリの組み合わせが適切なソリューションです。これらのモジュールは連携して Web コンテンツを取得および解析し、関連情報にアクセスできるようにします。

コード ウォークスルー

指定された Python コードは、どのように機能するかを示す動作例を提供します。このアプローチを使用するには:

<code class="python">import urllib2
from BeautifulSoup import BeautifulSoup

# Fetch the web page
response = urllib2.urlopen('http://example.com')

# Parse the HTML content
soup = BeautifulSoup(response.read())

# Identify the desired table and rows
table = soup('table', {'class': 'spad'})[0]
rows = table.tbody('tr')

# Extract and print the date, sunrise, and sunset information
for row in rows:
    tds = row('td')
    print(tds[0].string, tds[1].string)</code>

このコード内:

  • urllib2.urlopen('http://example.com').read() は、指定された Web サイトの HTML コンテンツを取得します。
  • BeautifulSoup(response.read()) は、HTML コンテンツを構造化オブジェクトに解析します。
  • table = Soup('table', {'class': 'spad'})[0] は、クラス属性に基づいて対象のテーブルを見つけます。
  • rows = table.tbody('tr ') は、日の出/日の入りの時刻が含まれるテーブルの行を選択します。
  • print(tds[0].string, tds[1].string) は、日付と日の出/日の入りの時刻。

追加リソース

さらに詳しいガイダンスについては、次のチュートリアルを参照してください:

  • [美しいスープとリクエストを使用した Python による Web スクレイピング](https://www.edureka.co/blog/web-scraping-with-python/)
  • [Python による Web スクレイピング](https:/ /www.geeksforgeeks.org/web-scraping-using-python/)

以上がurllib2 や BeautifulSoup などの Python ライブラリを使用して、Web サイトから日の出と日の入りの時刻をプログラムで取得するにはどうすればよいでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。