Gibt es eine Möglichkeit, ein Regex-Muster durch Verknüpfen in einem Datenrahmen in Pandas zu extrahieren?

Question

Ich versuche, ein Regex-Muster aus Links in einer generierten Pandas-Tabelle zu extrahieren. Der Code zum Generieren des Pandas-Datenrahmens lautet wie folgt: importpandasaspdimportreurl='https://www.espncricinfo.com/records/year/team-match-results/2005-2005/twenty20-internationals-3'base_url='https: //www.espn

P粉310931198 · Answer

你接近了。这将添加一个带有比赛ID的新列。

import pandas as pd
import re

url = 'https://www.espncricinfo.com/records/year/team-match-results/2005-2005/twenty20-internationals-3'
base_url = 'https://www.espncricinfo.com'

def match(row):
    match_id = re.findall('t20i-(\d*)/', row[1])
    return match_id[0]
    
table = pd.read_html(url, extract_links = "body")[0]
table['match'] = table['Scorecard'].apply(match)
print(table)

输出:

Team 1  ...   match
0   (新西兰, None)  ...  211048
1       (英格兰, None)  ...  211028
2  (南非, None)  ...  222678

[3 行 x 8 列]

Gibt es eine Möglichkeit, ein Regex-Muster durch Verknüpfen in einem Datenrahmen in Pandas zu extrahieren?

Antworte allen(1)Ich werde antworten