首頁  >  文章  >  後端開發  >  怎麼用Python來讀取和處理文件後綴?

怎麼用Python來讀取和處理文件後綴?

零下一度
零下一度原創
2017-06-27 09:56:581795瀏覽

最近在弄一個項目分析的時候,看到有一個後綴為”.sqlite”的數據文件,由於以前沒怎麼接觸過,就想著怎麼用python來打開並進行數據分析與處理,於是稍微研究了一下。

SQLite是一款非常流行的關聯式資料庫,由於它非常輕盈,因此被大量應用程式採用。

就像csv文件一樣,SQLite可以將資料儲存於單一資料文件,以便方便的分享給其他人員。許多程式語言都支援SQLite資料的處理,python語言也不例外。

sqlite3是python的一個標準函式庫,可以用來處理SQLite資料庫。

用sqlite3建立和操作資料庫檔案

對於資料庫的SQL語句,本文會用到最基礎的SQL語句,應該不影響閱讀。如果想進一步了解,可參考以下網址:

下面,我們來應用salite3模組來建立SQLite資料文件,以及進行資料讀寫操作。主要的步驟如下:

  1. ##與資料庫建立連接,建立資料庫檔案(.sqlite檔案)

  2. 建立遊標(cursor)

  3. 建立資料表(table)

  4. 在資料表中插入資料

  5. 查詢資料

##。
  • 示範程式碼如下:

    import sqlite3with sqlite3.connect('test_database.sqlite') as con:
        c = con.cursor()
        c.execute('''CREATE TABLE test_table
        (date text, city text, value real)''')for table in c.execute("SELECT name FROM sqlite_master WHERE type='table'"):
            print("Table", table[0])
        c.execute('''INSERT INTO test_table VALUES
        ('2017-6-25', 'bj', 100)''')
        c.execute('''INSERT INTO test_table VALUES
        ('2017-6-25', 'pydataroad', 150)''')
        c.execute("SELECT * FROM test_table")
        print(c.fetchall())
    Table test_table
    [('2017-6-25', 'bj', 100.0), ('2017-6-25', 'pydataroad', 150.0)]
  • 關於SQLite資料庫中資料的視覺化預覽,有很多的工具可以實現,我這裡使用的是SQLite Studio,是一個免費使用的工具,不需要安裝,下載下來就可以使用,有興趣的同學可以參考下面的連結。
  • https://sqlitestudio.pl/index.rvt?act=download

  • 資料預覽的效果如下:
#### #######用pandas來讀取sqlite資料檔######從上面程式碼的運行結果可以看出,資料查詢的結果是一個由tuple組成的list。 python的list資料在進行進一步的資料處理與分析時,可能會不太方便。可以想像一下,假設如果資料庫的表格中一共有100萬行或更多數據,從list中循環遍歷獲取數據,效率會比較低。 ######這時,我們可以考慮用pandas提供的函數來從SQLite資料庫檔案中讀取相關資料信息,並保存在DataFrame中,方便後續進一步處理。 ######Pandas提供了兩個函數,都可以讀取後綴為「.sqlite」資料檔的資訊。 ############read_sql()############read_sql_query()#########
import pandas as pdwith sqlite3.connect('test_database.sqlite') as con:# read_sql_query和read_sql都能通过SQL语句从数据库文件中获取数据信息df = pd.read_sql_query("SELECT * FROM test_table", con=con)# df = pd.read_sql("SELECT * FROM test_table", con=con)print(df.shape)
    print(df.dtypes)
    print(df.head())
<code style="font-size: 14px; font-family: Roboto, 'Courier New', Consolas, Inconsolata, Courier, monospace; margin: auto 5px; white-space: pre; border-radius: 3px; display: block !important; overflow: auto; padding: 1px;">(2, 3)
date      object
city      object
value    float64
dtype: object
        date        city  value
0  2017-6-25          bj  100.0
1  2017-6-25  pydataroad  150.0<br></code>
##########

以上是怎麼用Python來讀取和處理文件後綴?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn