日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python开发sqlite3完整_让Python更加充分的使用Sqlite3-阿里云开发者社区

發布時間:2023/12/15 python 18 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python开发sqlite3完整_让Python更加充分的使用Sqlite3-阿里云开发者社区 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

我最近在涉及大量數據處理的項目中頻繁使用 sqlite3。我最初的嘗試根本不涉及任何數據庫,所有的數據都將保存在內存中,包括字典查找、迭代和條件等查詢。這很好,但可以放入內存的只有那么多,并且將數據從磁盤重新生成或加載到內存是一個繁瑣又耗時的過程。

我決定試一試sqlite3。 因為只需打開與數據庫的連接, 這樣可以增加可處理的數據量,并將應用程序的加載時間減少到零。此外,我可以通過 SQL 查詢替換很多Python邏輯語句。

我想分享一些關于這次經歷的心得和發現。

TL;DR

使用大量操作 (又名 executemany)。

你不需要使用光標 (大部分時間)。

光標可被迭代。

使用上下文管理器。

使用編譯指示 (當它有意義)。

推遲索引創建。

使用占位符來插入 python 值。

1. 使用大量操作

如果你需要在數據庫中一次性插入很多行,那么你真不應該使用 execute。sqlite3 模塊提供了批量插入的方式:executemany。

而不是像這樣做:

for?row?in?iter_data():

connection.execute('INSERT?INTO?my_table?VALUES?(?)',?row)

你可以利用這個事實,即 executemany 接受元組的生成器作為參數:

connection.executemany(

'INSERT?INTO?my_table?VALUE?(?)',

iter_data()

)

這不僅更簡潔,而且更高效。實際上,sqlite3 在幕后利用 executemany 實現 execute,但后者插入一行而不是多行。

我寫了一個小的基準測試,將一百萬行插入空表(數據庫在內存中):

executemany: 1.6 秒

execute: 2.7 秒

2. 你不需要游標

一開始我經常搞混的事情就是,光標管理。在線示例和文檔中通常如下:

connection?=?sqlite3.connect(':memory:')

cursor?=?connection.cursor()

#?Do?something?with?cursor

但大多數情況下,你根本不需要光標,你可以直接使用連接對象。

像 execute

executemany

類似的操作可以直接在連接上調用。以下是一個證明此事的示例:

import?sqlite3

connection?=?sqlite3(':memory:')

#?Create?a?table

connection.execute('CREATE?TABLE?events(ts,?msg)')

#?Insert?values

connection.executemany(

'INSERT?INTO?events?VALUES?(?,?)',

[

(1,?'foo'),

(2,?'bar'),

(3,?'baz')

]

)

#?Print?inserted?rows

for?row?in?connnection.execute('SELECT?*?FROM?events'):

print(row)

3. 光標(Cursor)可被用于迭代

你可能經常會看到使用fetchone或fetchall來處理 SELECT 查詢結果的示例。但是我發現處理這些結果的最自然的方式是直接在光標上迭代:

for?row?in?connection.execute('SELECT?*?FROM?events'):

print(row)

這樣一來,只要你得到足夠的結果,你就可以終止查詢,并且不會引起資源浪費。當然,如果事先知道你需要多少結果,可以改用 LIMIT SQL語句,但Python生成器是非常方便的,可以讓你將數據生成與數據消耗分離。

4. 使用Context Managers(上下文管理器)

即使在處理SQL事務的中間,也會發生討厭的事情。為了避免手動處理回滾或提交,你可以簡單地使用連接對象作為上下文管理器。 在以下示例中,我們創建了一個表,并錯誤地插入了重復的值:

import?sqlite3

connection?=?sqlite3.connect(':memory:')

with?connection:

connection.execute(

'CREATE?TABLE?events(ts,?msg,?PRIMARY?KEY(ts,?msg))')

try:

with?connection:

connection.executemany('INSERT?INTO?events?VALUES?(?,??)',?[

(1,?'foo'),

(2,?'bar'),

(3,?'baz'),

(1,?'foo'),

])

except?(sqlite3.OperationalError,?sqlite3.IntegrityError)?as?e:

print('Could?not?complete?operation:',?e)

#?No?row?was?inserted?because?transaction?failed

for?row?in?connection.execute('SELECT?*?FROM?events'):

print(row)

connection.close()

5. 使用Pragmas

…當它真的有用時

在你的程序中有幾個 pragma 可用于調整 sqlite3 的行為。特別地,其中一個可以改善性能的是 synchronous :

connection.execute('PRAGMA?synchronous?=?OFF')

你應該知道這可能是危險的。如果應用程序在事務中間意外崩潰,數據庫可能會處于不一致的狀態。所以請小心使用! 但是如果你要更快地插入很多行,那么這可能是一個選擇。

6. 推遲索引創建

假設你需要在數據庫上創建幾個索引,而你需要在插入很多行的同時創建索引。把索引的創建推遲到所有行的插入之后可以導致實質性的性能改善。

7. 使用占位符插入 Python 值

使用 Python 字符串操作將值包含到查詢中是很方便的。但是這樣做非常不安全,而 sqlite3 給你提供了更好的方法來做到這一點:

#?Do?not?do?this!

my_timestamp?=?1

c.execute("SELECT?*?FROM?events?WHERE?ts?=?'%s'"?%?my_timestamp)

#?Do?this?instead

my_timestamp?=?(1,)

c.execute('SELECT?*?FROM?events?WHERE?ts?=??',?my_timestamp)

此外,使用Python%s(或格式或格式的字符串常量)的字符串插值對于 executemany 來說并不是總是可行。所以在此嘗試沒有什么真正意義!

請記住,這些小技巧可能會(也可能不會)給你帶來好處,具體取決于特定的用例。你應該永遠自己去嘗試,決定是否值得這么做。

本文作者:佚名

來源:51CTO

總結

以上是生活随笔為你收集整理的python开发sqlite3完整_让Python更加充分的使用Sqlite3-阿里云开发者社区的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。