ホームページ  >  に質問  >  本文

Python クローラーはどのようにしてspanとspanの間のコンテンツをクロールし、それぞれを辞書に保存しますか?

ハウス プロファイルを個別にキャプチャし、独立した列としてディクショナリに保存したいと考えていますが、for ループを使用してインライン要素を直接抽出する方法はありません。
これは私のコードです:

リーリー

これは Web ページの HTML コードです:

リーリー
phpcn_u1582phpcn_u15822710日前2090

全員に返信(5)返信します

  • 曾经蜡笔没有小新

    曾经蜡笔没有小新2017-05-18 10:54:42

    実際には、これにはパターンがあることがわかります。私がデモを書きました。 リーリー

    get_text() を通じてすべての内部コンテンツを取得し、スペースを削除します。後で分割する場合は、split を使用できます。残りは書きません。

    ご質問がございましたら、お気軽にお問い合わせください。

    返事
    0
  • 给我你的怀抱

    给我你的怀抱2017-05-18 10:54:42

    このHTMLコードの書き方が間違っているような気がします。ラベルの内容テキストがラベルの外にあります

    正しいラベルの内容は 2 つだけです:

    • ハウス概要:

    • 46m²

    返事
    0
  • 巴扎黑

    巴扎黑2017-05-18 10:54:42

    内部テキスト

    返事
    0
  • 滿天的星座

    滿天的星座2017-05-18 10:54:42

    あなたの場合、すべてのテンプレートがこのように固定されている場合、forループと正規表現を使用するのが最も便利だと思います

    返事
    0
  • 黄舟

    黄舟2017-05-18 10:54:42

    pyquery吧

    pyqueryからQとしてPyQueryをインポート

    Q(テキスト).find('.house-info li').text()

    返事
    0
  • キャンセル返事