搜索

首页  >  问答  >  正文

Python提取HTML页面字符串并转为数据帧的方法

<p>我有一个包含字符串的HTML页面。我想将其转换为数据帧。这个字符串中的行是用一个不在引号内的空格分隔的(在列值中的引号之间有空格)。</p> <p>页面链接:https://gladys.geog.ucl.ac.uk/bikesapi/load.php?scheme=saopaulo</p> <p>我知道这是一个常见的问题,但如果这是一个完全重复的问题,并且有相同的问题和解决方案,请你发给我链接吗?我尝试了几种解决方案,但没有匹配我的问题。</p>
P粉691461301P粉691461301465 天前491

全部回复(1)我来回复

  • P粉775788723

    P粉7757887232023-08-17 10:20:21

    尝试使用pd.read_csv

    url = "https://gladys.geog.ucl.ac.uk/bikesapi/load.php?scheme=saopaulo"
    
    df = pd.read_csv(url)
    print(df.head())
    

    输出结果:

       #id timestamp|gmt_local_diff_sec|gmt_servertime_diff_sec                   name        lat        lon  bikes  spaces  installed  locked  temporary  total_docks  givesbonus_acceptspedelecs_fbbattlevel  pedelecs
    0    1                               1692123219|10800|-3600    1 - Largo da Batata -23.566831 -46.693741     43      37       True   False      False           83                                     NaN        10
    1    3                               1692123219|10800|-3600     3 - CPTM Pinheiros -23.566478 -46.701258      6       7       True   False      False           15                                     NaN         3
    2    4                               1692123219|10800|-3600  4 - Rua Diogo Moreira -23.569145 -46.692003      2      20       True   False      False           23                                     NaN         2
    3    5                               1692123219|10800|-3600        5 - Chicão Vive -23.569894 -46.697897      4       7       True   False      False           11                                     NaN         1
    4    6                               1692123219|10800|-3600        6 - Rua Manduri -23.572137 -46.690107     10       7       True   False      False           19                                     NaN         0
    

    回复
    0
  • 取消回复