Heim  >  Fragen und Antworten  >  Hauptteil

Python-Methode zum Extrahieren von HTML-Seitenzeichenfolgen und deren Konvertierung in Datenrahmen

<p>Ich habe eine HTML-Seite, die eine Zeichenfolge enthält. Ich möchte es in einen Datenrahmen konvertieren. Zeilen in dieser Zeichenfolge werden durch ein Leerzeichen getrennt, das nicht in Anführungszeichen steht (in Spaltenwerten gibt es Leerzeichen zwischen Anführungszeichen). </p> <p>Seitenlink: https://gladys.geog.ucl.ac.uk/bikesapi/load.php?scheme=saopaulo</p> <p>Ich weiß, dass dies eine häufige Frage ist, aber wenn es sich um ein exaktes Duplikat mit demselben Problem und derselben Lösung handelt, könnten Sie mir bitte den Link senden? Ich habe mehrere Lösungen ausprobiert, aber keine passte zu meinem Problem. </p>
P粉691461301P粉691461301401 Tage vor447

Antworte allen(1)Ich werde antworten

  • P粉775788723

    P粉7757887232023-08-17 10:20:21

    尝试使用pd.read_csv

    url = "https://gladys.geog.ucl.ac.uk/bikesapi/load.php?scheme=saopaulo"
    
    df = pd.read_csv(url)
    print(df.head())
    

    输出结果:

       #id timestamp|gmt_local_diff_sec|gmt_servertime_diff_sec                   name        lat        lon  bikes  spaces  installed  locked  temporary  total_docks  givesbonus_acceptspedelecs_fbbattlevel  pedelecs
    0    1                               1692123219|10800|-3600    1 - Largo da Batata -23.566831 -46.693741     43      37       True   False      False           83                                     NaN        10
    1    3                               1692123219|10800|-3600     3 - CPTM Pinheiros -23.566478 -46.701258      6       7       True   False      False           15                                     NaN         3
    2    4                               1692123219|10800|-3600  4 - Rua Diogo Moreira -23.569145 -46.692003      2      20       True   False      False           23                                     NaN         2
    3    5                               1692123219|10800|-3600        5 - Chicão Vive -23.569894 -46.697897      4       7       True   False      False           11                                     NaN         1
    4    6                               1692123219|10800|-3600        6 - Rua Manduri -23.572137 -46.690107     10       7       True   False      False           19                                     NaN         0
    

    Antwort
    0
  • StornierenAntwort