將爬取資料存入mysql-Python教學-PHP中文網

首頁

後端開發

Python教學

將爬取資料存入mysql

大家讲道理

May 28, 2017 am 09:58 AM

mysql

Python 與mysql 資料連接用pymysql

<span style="color: #0000ff">import<span style="color: #000000"> pymysql



conn =pymysql.connect(host=<span style="color: #800000">'<span style="color: #800000">127.0.0.1<span style="color: #800000">',user=<span style="color: #800000">'<span style="color: #800000">root<span style="color: #800000">',passw<a href="http://www.php.cn/wiki/1360.html" target="_blank">ord</a>=<span style="color: #800000">'<span style="color: #800000">123456<span style="color: #800000">',db=<span style="color: #800000">'<span style="color: #800000">company<span style="color: #800000">',char<a href="http://www.php.cn/code/8209.html" target="_blank">set</a>=<span style="color: #800000">"<span style="color: #800000">utf8<span style="color: #800000">"<span style="color: #000000">)

cur=<span style="color: #000000">conn.cursor()
sql=‘’‘<br><br>’‘’<span style="color: #000000">employee=<span style="color: #000000">cur.execute(sql)
conn.commit()
cur.close()
conn.close()</span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span></span>

基本操作大概就這樣
這次爬取的是淘寶商品頁面

過程就略了放程式碼

import requestsimport reimport pymysqldef getHTMLtext(url):    try:
       r=requests.get(url,timeout=100)
       r.raise_for_status()
       r.encoding=r.apparent_encoding       return r.text    except:        return ""def getpage(itl,html):    try:
        plt=re.findall(r'"view_price":"[\d.]*"',html)
        nlt=re.findall(r'"raw_title":".*?"',html)        for i in range(len(plt)):
            price = eval(plt[i].split(':')[1])
            title = eval(nlt[i].split(':')[1])
            itl.append([price, title])    except:       print("")def printgoods(itl):
    tplt = "{:2}\t{:8}\t{:16}"
    print(tplt.format("序号", "价格", "商品名称"))

    count = 0
    conn = pymysql.connect(host='127.0.0.1', user='root', password='123456', db='company',charset="utf8")

    cur = conn.cursor()

    sqlc = '''
                create table coffee(
                id int(11) not null auto_increment primary key,
                name varchar(255) not null,
                price float not null)DEFAULT CHARSET=utf8;                '''

    try:
        A = cur.execute(sqlc)
        conn.commit()        print('成功')    except:        print("错误")    for g in itl:
        count = count + 1
        b=tplt.format(count, g[0], g[1])



        sqla = '''
        insert into  coffee(name,price)
        values(%s,%s);       '''
        try:
            B = cur.execute(sqla,(g[1],g[0]))
            conn.commit()            print('成功')        except:            print("错误")        # save_path = 'D:/taobao.txt'
        # f=open(save_path,'a')
        #        # f.write(b+'\n')
        # f.close()
    conn.commit()
    cur.close()
    conn.close()def main():
    goods="咖啡"
    depth =2
    start_url='https://s.taobao.com/search?q='+goods
    List =[]    for i in range(depth):        try:
            url =start_url +"&s="+ str(i*44)
            html=getHTMLtext(url)
            getpage(List,html)        except:           continue


    print(printgoods(List))    # savefiles(data)main()

可以看到所需的資料已經存入資料庫了

以上是將爬取資料存入mysql的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

您如何將元素附加到Python數組？Apr 30, 2025 am 12:19 AM

Inpython，YouAppendElementStoAlistusingTheAppend（）方法。 1）useappend（）forsingleelements：my_list.append（4）.2）useextend（）orextend（）或= formultiplelements：my_list.extend.extend（emote_list）ormy_list = [4,5,6] .3）useInsert（）forspefificpositions：my_list.insert（1,5）.beaware

您如何調試與Shebang有關的問題？Apr 30, 2025 am 12:17 AM

調試shebang問題的方法包括：1.檢查shebang行確保是腳本首行且無前置空格；2.驗證解釋器路徑是否正確；3.直接調用解釋器運行腳本以隔離shebang問題；4.使用strace或truss跟踪系統調用；5.檢查環境變量對shebang的影響。

如何從python數組中刪除元素？Apr 30, 2025 am 12:16 AM

pythonlistscanbemanipulationusseveralmethodstoremovelements：1）theremove（）MethodRemovestHefirStocCurrenceOfAstePecificiedValue.2）thepop（）thepop（）methodRemovesandReturnturnturnturnsanaNelementAgivenIndex.3）

可以在Python列表中存儲哪些數據類型？Apr 30, 2025 am 12:07 AM

pythonlistscanstoreanydatate型，包括素，弦，浮子，布爾人，其他列表和迪克尼亞式

在Python列表上可以執行哪些常見操作？Apr 30, 2025 am 12:01 AM

pythristssupportnumeroferations：1）addingElementSwithAppend（），Extend（），andInsert（）。 2）emovingItemSusingRemove（），pop（），andclear（），and clear（）。 3）訪問andModifyingandmodifyingwithIndexingandSlicing.4）

如何使用numpy創建多維數組？Apr 29, 2025 am 12:27 AM

使用NumPy創建多維數組可以通過以下步驟實現：1)使用numpy.array()函數創建數組，例如np.array([[1,2,3],[4,5,6]])創建2D數組；2)使用np.zeros(),np.ones(),np.random.random()等函數創建特定值填充的數組；3)理解數組的shape和size屬性，確保子數組長度一致，避免錯誤；4)使用np.reshape()函數改變數組形狀；5)注意內存使用，確保代碼清晰高效。

說明Numpy陣列中'廣播”的概念。Apr 29, 2025 am 12:23 AM

播放innumpyisamethodtoperformoperationsonArraySofDifferentsHapesbyAutapityallate AligningThem.itSimplifififiesCode，增強可讀性，和Boostsperformance.Shere'shore'showitworks：1）較小的ArraySaraySaraysAraySaraySaraySaraySarePaddedDedWiteWithOnestOmatchDimentions.2）

說明如何在列表，Array.Array和用於數據存儲的Numpy數組之間進行選擇。Apr 29, 2025 am 12:20 AM

forpythondataTastorage，choselistsforflexibilityWithMixedDatatypes，array.ArrayFormeMory-effficityHomogeneousnumericalData，andnumpyArraysForAdvancedNumericalComputing.listsareversareversareversareversArversatilebutlessEbutlesseftlesseftlesseftlessforefforefforefforefforefforefforefforefforefforlargenumerdataSets; arrayoffray.array.array.array.array.array.ersersamiddreddregro

See all articles