ホームページ  >  に質問  >  本文

Python - Web ページのコンテンツを取得する beautifulsoup に関する問題

リーリー

Python コード:

リーリー

しかし、返された結果は空です。このセレクターの書き方が間違っているのでしょうか?

習慣沉默習慣沉默2702日前635

全員に返信(6)返信します

  • 某草草

    某草草2017-05-27 17:41:42

    リーリー

    https://www.crummy.com/softwa...

    返事
    0
  • 阿神

    阿神2017-05-27 17:41:42

    https://www.crummy.com/softwa... の説明を参照してください。正しい使用方法は次のとおりです:
    neirong=soup.find('p',class_='talk-article__body talk-transcript__body')

    ただp包含的内容,进一步调用neirong.contentsを手に入れるために

    返事
    0
  • 怪我咯

    怪我咯2017-05-27 17:41:42

    リーリー

    返事
    0
  • 怪我咯

    怪我咯2017-05-27 17:41:42

    ブラウザから見ている内容はjsで動的に生成されており、bsとのマッチングが出来ないのですが、見たところ変なクラス名は基本的にjsで生成されていることが分かりました

    返事
    0
  • 给我你的怀抱

    给我你的怀抱2017-05-27 17:41:42

    find_all を使用します。find はクラスには使用できません

    返事
    0
  • 曾经蜡笔没有小新

    曾经蜡笔没有小新2017-05-27 17:41:42

    • 個人的には、BeautifulSoup を使用して Web ページを解析するときに、作成者が要素の配置に CSS 機能を使用する場合は、このメソッドでクラスの値をパラメータまたはタグとして使用するのが最善です。属性はパラメーターとして使用でき、非常に便利です。同時に、パラメーターは次のような CSS セレクター文字列をサポートします。クラス a.タイトル").

    • soup.find() メソッドは現在ではあまり使われていないようですが、BeautifulSoup4 では非推奨になっているのでしょうか。一般に、find が表示される限り、それは find_all() およびその他のメソッドです。
      上記の詳細については、「Super Soup」の中国語ドキュメントを参照してください: http://Beautifulsoup.readthed...

    返事
    0
  • キャンセル返事