Bagaimanakah perangkak Python merangkak kandungan antara rentang dan rentang dan menyimpannya dalam kamus masing-masing?

Question

Saya mahu menangkap profil rumah secara berasingan dan menyimpannya dalam kamus sebagai lajur bebas, tetapi tiada cara untuk mengekstrak terus elemen sebaris menggunakan gelung for.
Ini kod saya:

曾经蜡笔没有小新 · Answer

Sebenarnya, ia sangat mudah. Anda boleh lihat ada corak dalam pemisah |

something  = '''房屋概况：住宅  |1室1厅1卫|46m²| (高层)/共18层

                        |南北

                        | 豪华装修

                    ''';

soup  = BeautifulSoup(something, 'lxml')
plaintext = soup.select('li')[0].get_text().strip()

Dapatkan semua kandungan dalaman melalui get_text(), dan kemudian keluarkan ruang. Anda boleh menggunakan split untuk membahagikannya kemudian, dan saya tidak akan menulis selebihnya.

Jika anda mempunyai sebarang pertanyaan, sila hubungi.

给我你的怀抱 · Answer

Saya rasa kod html ini ditulis salah, teks kandungan label berada di luar label

Hanya ada dua kandungan label yang betul:

Gambaran Keseluruhan Rumah:
46m²

巴扎黑 · Answer

<p>InnerTeks</p>

滿天的星座 · Answer

Dalam kes anda, saya fikir ia adalah paling mudah untuk menggunakan gelung for ditambah ungkapan biasa, jika semua templat dibetulkan seperti ini

黄舟 · Answer

用pyquery吧

daripada pyquery import PyQuery sebagai Q

Q(teks).cari('.info-rumah li').teks()

Bagaimanakah perangkak Python merangkak kandungan antara rentang dan rentang dan menyimpannya dalam kamus masing-masing?

membalas semua(5)saya akan balas

Saya rasa kod html ini ditulis salah, teks kandungan label berada di luar label

Hanya ada dua kandungan label yang betul: