SQLite 设计与概念

SQLite 设计与概念,第1张

概述   转载自: http://www.eoeandroid.com/thread-71734-1-1.html               http://www.eoeandroid.com/thread-71727-1-1.html                                                                                   

转载自:http://www.eoeandroid.com/thread-71734-1-1.html

http://www.eoeandroid.com/thread-71727-1-1.html

<一>

1、API

  由两部分组成: 核心API(core API) 和扩展API(extension API)
  核心API的函数实现基本的数据库 *** 作:连接数据库,处理sql,遍历结果集。它也包括一些实用函数,比如字符串转换, *** 作控制,调试和错误处理。
  扩展API通过创建你自定义的sql函数去扩展sqlite。

  1.1、sqlite Version 3的一些新特点:
  (1)sqlite的API全部重新设计,由第二版的15个函数增加到88个函数。这些函数包括支持UTF-8和UTF-16编码的功能函数。
  (2)改进并发性能。加锁子系统引进一种锁升级模型(lock escalation model),解决了第二版的写进程饿死的问题(该问题是任何一个DBMS必须面对的问题)。这种模型保证写进程按照先来先服务的算法得到排斥锁(Exclusive Lock)。甚至,写进程通过把结果写入临时缓冲区(Temporary Buffer),可以在得到排斥锁之前就能开始工作。这对于写要求较高的应用,性能可提高400%(引自参考文献)。
  (3)改进的B-树。对于表采用B+树,大大提高查询效率。
(4)sqlite 3最重要的改变是它的存储模型。由第二版只支持文本模型,扩展到支持5种本地数据类型。
  总之,sqlite Version 3与sqlite Vertion 2有很大的不同,在灵活性,特点和性能方面有很大的改进。

  1.2、主要的数据结构(The Principal Data Structures)

  sqlite由很多部分组成-parser,tokenize,virtual machine等等。但是从程序员的角度,最需要知道的是:connection,statements,B-tree和pager。它们之间的关系如下:

Java代码:

上图告诉我们在编程需要知道的三个主要方面:API,事务(Transaction)和锁(Locks)。从技术上来说,B-tree和pager不是API的一部分。但是它们却在事务和锁上起着关键作用。 

 

1.3、Connections和Statements

  Connection和statement是执行sql命令涉及的两个主要数据结构,几乎所有通过API进行的 *** 作都要用到它们。一个连接(Connection)代表在一个独立的事务环境下的一个连接A (connection represents a single connection to a database as well as a single transaction context)。每一个statement都和一个connection关联,它通常表示一个编译过的SQL语句,在内部,它以VDBE字节码表示。Statement包括执行一个命令所需要一切,包括保存VDBE程序执行状态所需的资源,指向硬盘记录的B-树游标,以及参数等等。

  1.4、B-tree和pager
  一个connection可以有多个database对象---一个主要的数据库以及附加的数据库,每一个数据库对象有一个B-tree对象,一个B-tree有一个pager对象(这里的对象不是面向对象的“对象”,只是为了说清楚问题)。
  Statement最终都是通过connection的B-tree和pager从数据库读或者写数据,通过B-tree的游标(cursor)遍历存储在页面(page)中的记录。游标在访问页面之前要把数所从disk加载到内存,而这就是pager的任务。任何时候,如果B-tree需要页面,它都会请求pager从disk读取数据,然后把页面(page)加载到页面缓冲区(page cache),之后,B-tree和与之关联的游标就可以访问位于page中的记录了。
  如果cursor改变了page,为了防止事务回滚,pager必须采取特殊的方式保存原来的page。总的来说,pager负责读写数据库,管理内存缓存和页面(page),以及管理事务,锁和崩溃恢复(这些在事务一节会详细介绍)。
  总之,关于connection和transaction,你必须知道两件事:

  (1)对数据库的任何 *** 作,一个连接存在于一个事务下。
  (2)一个连接决不会同时存在多个事务下。
  whenever a connection does anything with a database,it always operates under exactly one
  transaction,no more,no less.

  1.5、核心API
  核心API 主要与执行sql命令有关,本质上有两种方法执行SQL语句:prepared query 和wrapped query。Prepared query由三个阶段构成:preparation,execution和finalization。其实wrapped query只是对prepared query的三个过程包装而已,最终也会转化为prepared query的执行。

  1.5.1、连接的生命周期(The Connection lifecycle)
  和大多数据库连接相同,由三个过程构成:
  (1)连接数据库(Connect to the database):
  每一个sqlite数据库都存储在单独的 *** 作系统文件中,连接,打开数据库的C API为:sqlite3_open(),它的实现位于main.c文件中,如下:

1 int sqlite3_open(const char *zfilename,sqlite3 **ppDb){2 3 return openDatabase(zfilename,ppDb,sqlITE_OPEN_READWRITE | sqlITE_OPEN_CREATE,0);4 5 }


  (3)断开连接(disconnect from the database):
  主要是关闭数据库的文件。

  1.5.2、执行Prepared query
  前面提到,预处理查询(Prepared query)是sqlite执行所有sql命令的方式,包括以下三个过程:

  (1)Prepared query:
  分析器(parser),分词器(tokenizer)和代码生成器(code generator)把sql Statement编译成VDBE字节码,编译器会创建一个statement句柄(sqlite3_stmt),它包括字节码以及其它执行命令和遍历结果集的所有资源。
  相应的C API为sqlite3_prepare(),位于prepare.c文件中,如下:

 1 int sqlite3_prepare( 2  3 sqlite3 *db,        4  5 const char *zsql,     6  7 int nBytes,        8  9 sqlite3_stmt **ppStmt,  10 11 const char **pzTail   12 13 ){14 15 int rc;16 17 rc = sqlite3LockAndPrepare(db,zsql,nBytes,0,ppStmt,pzTail);18 19 assert( rc==sqlITE_OK || ppStmt==0 || *ppStmt==0 ); 20 21 return rc;22 23 }


(2)Execution:  虚拟机执行字节码,执行过程是一个步进(stepwise)的过程,每一步(step)由sqlite3_step()启动,并由VDBE执行一段字节码。由sqlite3_prepare编译字节代码,并由sqlite3_step()启动虚拟机执行。在遍历结果集的过程中,它返回sqlITE_ROW,当到达结果末尾时,返回sqlITE_DONE。

  (3)Finalization:
  VDBE关闭statement,释放资源。相应的C API为sqlite3_finalize()。
  通过下图可以更容易理解该过程:

 1 #include 2 #include 3 #include"sqlite3.h" 4 #include 5 intmain(intargc,char**argv){ 6 int rc,i,ncols; 7 sqlite3 *db; 8 sqlite3_stmt *stmt; 9 char *sql;10 const char*tail;11 //打开数据12 rc=sqlite3_open("foods.db",&db);13 if(rc){14 fprintf(stderr,"Can'topendatabase:%sn",sqlite3_errmsg(db));15 sqlite3_close(db);16 exit(1);17 }18   19 sql="select * from episodes";20 //预处理21 rc=sqlite3_prepare(db,sql,(int)strlen(sql),&stmt,&tail);22 if(rc!=sqlITE_OK){23 fprintf(stderr,"sqlerror:%sn",sqlite3_errmsg(db));24 }25   26 rc=sqlite3_step(stmt);27 ncols=sqlite3_column_count(stmt);28 while(rc==sqlITE_ROW){29     30 for(i=0;ifprintf(stderr,"'%s'",sqlite3_column_text(stmt,i));31 }32 fprintf(stderr,"n");33 rc=sqlite3_step(stmt);34 }35 //释放statement36 sqlite3_finalize(stmt);37 //关闭数据库38 sqlite3_close(db);39 return0;  40 }

<二>

本节讨论事务,事务是DBMS最核心的技术之一.在计算机科学史上,有三位科学家因在数据库领域的成就而获ACM图灵奖,而其中之一 Jim Gray(曾任职微软)就是因为在事务处理方面的成就而获得这一殊荣,正是因为他,才使得olTP系统在随后直到今天大行其道.关于事务处理技术,涉及到很多,随便就能写一本书.在这里我只讨论sqlite事务实现的一些原理,sqlite的事务实现与大型通用的DBMS相比,其实现比较简单.这些内容可能比较偏于理论,但却不难,也是理解其它内容的基础.好了,下面开始第二节---事务.

2、 事务(Transaction)

2.1、事务的周期(Transaction lifecycles)
程序与事务之间有两件事值得注意:
(1) 哪些对象在事务下运行——这直接与API有关。
(2) 事务的生命周期,即什么时候开始,什么时候结束以及它在什么时候开始影响别的连接(这点对于并发性很重要)——这涉及到sqlite的具体实现。

一个连接(connection)可以包含多个(statement),而且每个连接有一个与数据库关联的B-tree和一个pager。Pager在连接中起着很重要的作用,因为它管理事务、锁、内存缓存以及负责崩溃恢复(crash recovery)。当你进行数据库写 *** 作时,记住最重要的一件事:在任何时候,只在一个事务下执行一个连接。这些回答了第一个问题。
一般来说,一个事务的生命和statement差不多,你也可以手动结束它。默认情况下,事务自动提交,当然你也可以通过BEGIN..COMMIT手动提交。接下来就是锁的问题。

2.2、锁的状态(Lock States)
锁对于实现并发访问很重要,而对于大型通用的DBMS,锁的实现也十分复杂,而sqlite相对较简单。通常情况下,它的持续时间和事务一致。一个事务开始,它会先加锁,事务结束,释放锁。但是系统在事务没有结束的情况下崩溃,那么下一个访问数据库的连接会处理这种情况。
在sqlite中有5种不同状态的锁,连接(connection)任何时候都处于其中的一个状态。下图显示了相应的状态以及锁的生命周期。


关于这个图有以下几点值得注意:
(1) 一个事务可以在UNLOCKED,RESERVED或EXCLUSIVE三种状态下开始。默认情况下在UNLOCKED时开始。

(2) 白色框中的UNLOCKED,PENDING,SHARED和 RESERVED可以在一个数据库的同一时存在。
(3) 从灰色的PENDING开始,事情就变得严格起来,意味着事务想得到排斥锁(EXCLUSIVE)(注意与白色框中的区别)。
虽然锁有这么多状态,但是从体质上来说,只有两种情况:读事务和写事务。

2.3、读事务(Read Transactions)
我们先来看看SELECT语句执行时锁的状态变化过程,非常简单:一个连接执行select语句,触发一个事务,从UNLOCKED到SHARED,当事务COMMIT时,又回到UNLOCKED,就这么简单。

考虑下面的例子(为了简单,这里用了伪码):

db = open('foods.db')db.exec('BEGIN')db.exec('SELECT * FROM episodes')db.exec('SELECT * FROM episodes')db.exec('COMMIT')db.close()

由于显式的使用了BEGIN和COMMIT,两个SELECT命令在一个事务下执行。第一个exec()执行时,connection处于SHARED,然后第二个exec()执行,当事务提交时,connection又从SHARED回到UNLOCKED状态,如下:

UNLOCKED→PENDING→SHARED→UNLOCKED//如果没有BEGIN和COMMIT两行时如下:UNLOCKED→PENDING→SHARED→UNLOCKED→PENDING→ SHARED→UNLOCKED
2.4、写事务(Write Transactions)
下面我们来考虑写数据库,比如UPDATE。和读事务一样,它也会经历UNLOCKED→PENDING→SHARED,但接下来却是灰色的PENDING,

2.4.1、The Reserved States
当一个连接(connection)向数据库写数据时,从SHARED状态变为RESERVED状态,如果它得到RESERVED锁,也就意味着它已经准备好进行写 *** 作了。即使它没有把修改写入数据库,也可以把修改保存到位于pager中缓存中(page cache)。
当一个连接进入RESERVED状态,pager就开始初始化恢复日志(rollback journal)。在RESERVED状态下,pager管理着三种页面:

(1) ModifIEd pages:包含被B-树修改的记录,位于page cache中。
(2) UnmodifIEd pages:包含没有被B-tree修改的记录。
(3) Journal pages:这是修改页面以前的版本,这些并不存储在page cache中,而是在B-tree修改页面之前写入日志。
Page cache非常重要,正是因为它的存在,一个处于RESERVED状态的连接可以真正的开始工作,而不会干扰其它的(读)连接。所以,sqlite可以高效的处理在同一时刻的多个读连接和一个写连接。

2.4.2 、The Pending States
当一个连接完成修改,就真正开始提交事务,执行该过程的pager进入EXCLUSIVE状态。从RESERVED状态,pager试着获取 PENDING锁,一旦得到,就独占它,不允许任何其它连接获得PENDING锁(PENDING is a gateway lock)。既然写 *** 作持有PENDING锁,其它任何连接都不能从UNLOCKED状态进入SHARED状态,即没有任何连接可以进入数据(no new readers,no new writers)。只有那些已经处于SHARED状态的连接可以继续工作。而处于PENDING状态的Writer会一直等到所有这些连接释放它们的锁,然后对数据库加EXCUSIVE锁,进入EXCLUSIVE状态,独占数据库(讨论到这里,对sqlite的加锁机制应该比较清晰了)。

2.4.3、The Exclusive State 在EXCLUSIVE状态下,主要的工作是把修改的页面从page cache写入数据库文件,这是真正进行写 *** 作的地方。在pager写入modifIEd pages之前,它还得先做一件事:写日志。它检查是否所有的日志都写入了磁盘,而这些通常位于 *** 作的缓冲区中,所以pager得告诉OS把所有的文件写入磁盘,这是由程序synchronous(通过调用OS的相应的API实现)完成的。 日志是数据库进行恢复的惟一方法,所以日志对于DBMS非常重要。如果日志页面没有完全写入磁盘而发生崩溃,数据库就不能恢复到它原来的状态,此时数据库就处于不一致状态。日志写入完成后,pager就把所有的modifIEd pages写入数据库文件。接下来就取决于事务提交的模式,如果是自动提交,那么pager清理日志,page cache,然后由EXCLUSIVE进入UNLOCKED。如果是手动提交,那么pager继续持有EXCLUSIVE锁和保存日志,直到COMMIT 或者RolLBACK。 总之,从性能方面来说,进程占有排斥锁的时间应该尽可能的短,所以DBMS通常都是在真正写文件时才会占有排斥锁,这样能大大提高并发性能。 总结

以上是内存溢出为你收集整理的SQLite 设计与概念全部内容,希望文章能够帮你解决SQLite 设计与概念所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/1172272.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-02
下一篇 2022-06-02

发表评论

登录后才能评论

评论列表(0条)

保存