搜尋

首頁  >  問答  >  主體

Python提取HTML頁面字串並轉為資料幀的方法

<p>我有一個包含字串的HTML頁面。我想將其轉換為資料幀。這個字串中的行是用一個不在引號內的空格分隔的(在列值中的引號之間有空格)。 </p> <p>頁面連結:https://gladys.geog.ucl.ac.uk/bikesapi/load.php?scheme=saopaulo</p> <p>我知道這是一個常見的問題,但如果這是一個完全重複的問題,並且有相同的問題和解決方案,請你發給我鏈接嗎?我嘗試了幾種解決方案,但沒有符合我的問題。 </p>
P粉691461301P粉691461301465 天前492

全部回覆(1)我來回復

  • P粉775788723

    P粉7757887232023-08-17 10:20:21

    嘗試使用pd.read_csv

    url = "https://gladys.geog.ucl.ac.uk/bikesapi/load.php?scheme=saopaulo"
    
    df = pd.read_csv(url)
    print(df.head())
    

    輸出結果:

       #id timestamp|gmt_local_diff_sec|gmt_servertime_diff_sec                   name        lat        lon  bikes  spaces  installed  locked  temporary  total_docks  givesbonus_acceptspedelecs_fbbattlevel  pedelecs
    0    1                               1692123219|10800|-3600    1 - Largo da Batata -23.566831 -46.693741     43      37       True   False      False           83                                     NaN        10
    1    3                               1692123219|10800|-3600     3 - CPTM Pinheiros -23.566478 -46.701258      6       7       True   False      False           15                                     NaN         3
    2    4                               1692123219|10800|-3600  4 - Rua Diogo Moreira -23.569145 -46.692003      2      20       True   False      False           23                                     NaN         2
    3    5                               1692123219|10800|-3600        5 - Chicão Vive -23.569894 -46.697897      4       7       True   False      False           11                                     NaN         1
    4    6                               1692123219|10800|-3600        6 - Rua Manduri -23.572137 -46.690107     10       7       True   False      False           19                                     NaN         0
    

    回覆
    0
  • 取消回覆