javascript - 关于python，正则表达式作为if判断条件的问题

Question

有2000行链接需要进行爬虫处理，可分为以下三种类型，字体加粗。 https://www.coursera.org/course/inforiskhttps://www.coursera.org/specializations/cloudcomputinghttps://www.coursera.org/learn/python-dat...

PHPz · Answer

仅仅检查是否含有用in就可以了吧？

def check_url(word, url):
    return word in url

for u in urls:
    if check_url('/course/', u):
        do something
    elif check_url('/specializations/', u):
        do something
    elif check_url('/learn/', u):
        do something

巴扎黑 · Answer

import re
raw = '''
https://www.coursera.org/course/inforisk
https://www.coursera.org/specializations/cloudcomputing
https://www.coursera.org/learn/python-data'''

check_func = lambda url, key: re.search('^https://www.coursera.org/%s/.+' % key, url)
for url in raw.split('
'):
    if check_func(url, 'course'):
        print 'I m course'
    elif check_func(url, 'specializations'):
        print 'I m specializations'
    elif check_func(url, 'learn'):
        print 'I m learn'

这里用到了正则.+，其中.是指任意字符，+代表一个以上的字符，.+就是匹配一个以上的任意字符。
Python中re模块是正则相关的模块，这里用到了re.search，如果匹配字符串成功，会返回一个对象，否则返回None
re模块还有其他函数，例如re.findall,re.match,re.replace等

直接用in是不可以的，例如如果url是https://www.coursera.org/course/specializations，就会导致specializations和course都能匹配到。
希望可以帮到你。

javascript - 关于python，正则表达式作为if判断条件的问题

Antworte allen(2)Ich werde antworten