请问我的python小爬虫代码应该怎么做优化？

Question

新入门做的一个爬取文段程序，代码看起来比较臃肿，请问有没有什么好的建议呢？另外我准备在for循环末尾把数据插入mysql数据库，这样做好吗，还是说再弄一个for循环，第一个for循环把数据存进二维列表里，第二个循环再逐条插入数据呢？#-*- coding:utf-8 -*-
import re
from pyquery import Py

面对疾风吧 · Answer

如果还在for循环里添加数据库操作，那代码看起来就很丑了，其实每一部分都可以分成函数或建类来处理，
比如
1.获取网页内容和过滤html标签可以建一个函数

def get_page(url):
    pass

2.获取时间戳和转换时间戳可以合并在一个函数中

def handld_time():
    pass

3.获取标题、作者、时间可用一个函数处理

def get_article_content():
    pass

这样函数可以复用，并且调用起来十分方便灵活，因为这只是一个小程序，用几个函数重构就可以达到效果了

请问我的python小爬虫代码应该怎么做优化？

全員に返信(1)返信します