Adakah terdapat cara untuk mengekstrak corak regex dengan memaut dalam bingkai data dalam Pandas?

Question

Saya cuba mengekstrak corak regex daripada pautan dalam jadual Pandas yang dijana. Kod untuk menjana bingkai data Pandas adalah seperti berikut: importpandaspdimportreurl='https://www.espncricinfo.com/records/year/team-match-results/2005-2005/twenty20-internationals-3'base_url='https: //www

P粉310931198 · Answer

Anda dekat. Ini akan menambah lajur baharu dengan ID padanan.

import pandas as pd
import re

url = 'https://www.espncricinfo.com/records/year/team-match-results/2005-2005/twenty20-internationals-3'
base_url = 'https://www.espncricinfo.com'

def match(row):
    match_id = re.findall('t20i-(\d*)/', row[1])
    return match_id[0]
    
table = pd.read_html(url, extract_links = "body")[0]
table['match'] = table['Scorecard'].apply(match)
print(table)

Keluaran:

Team 1  ...   match
0   (新西兰, None)  ...  211048
1       (英格兰, None)  ...  211028
2  (南非, None)  ...  222678

[3 行 x 8 列]

Adakah terdapat cara untuk mengekstrak corak regex dengan memaut dalam bingkai data dalam Pandas?

membalas semua(1)saya akan balas