索引是一种单独的、物理的对数据库表中一列或多列的值进行排序的一种存储结构,它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单。索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容。
一个索引是存储的表中一个特定列的值数据结构(最常见的是B-Tree,还有哈希表索引和R-tree)。索引是在表的列上创建。所以,要记住的关键点是索引包含一个表中列的值,并且这些值存储在一个数据结构中。请记住记住这一点:索引是一种数据结构
使用索引的全部意义就是通过缩小一张表中需要查询的记录(行)的数目来加快搜索的速度。
假设有一张学生名单表,有一百条数据。要查询其中名字为 小明 的学生。
一般采取select * from students where name ='小明'由于我们想要得到每一个名字为小明的学生信息,在查询到第一个符合条件的行后,不能停止查询,因为可能还有其他符合条件的行。所以,必须一行一行的查找直到最后一行-这就意味数据库不得不检查上千行数据才能找到所以名字为小明 的学生。这就是所谓的全表扫描。
假设我们在 name这一列上创建一个B-Tree索引。当我们用SQL查找名字是‘小明 ’的学生时,不需要再扫描全表。而是用索引查找去查找名字为‘小明 ’的学生,因为索引已经按照按字母顺序排序。索引已经排序意味着查询一个名字会快很多,因为名字首字母为‘小’的学生都是排列在一起的。另外重要的一点是,索引同时存储了表中相应行的指针以获取其他列的数据。
首先索引存在的目的是让你快速检索到你想要的数据。举一个大家都经常使用的例子。你小学的时候使用的字典。如果你想查询一个字的详细信息:读音、释义、组词等信息。你会根据它的偏旁部首或者拼音的首字母这样先在字典的前面索引页面查到这个字在字典的第几页,然后直接翻到对应的页面就可以查询到你想要查询的字。相比上面的步骤,如果你没有索引页,字典中的汉字都是随机存放的,没有任何顺序可言,而此时如果你直接去翻字典中的每一页,挨个的查找,直到找到你想要的字,犹如大海捞针,很慢很费劲。
不知道这样的例子你能否理解。
集合上面的例子,你可以把汉字的读音、释义、组词等信息看做数据表中多个列中的值。汉字呢就相当于是表中数据的主键值。
有的时候,索引并不能存储很多的数据内容,比如汉字,你当然可以把汉字的读音、释义、祖册等各种信息全部放在索引页面中,但是这样就导致了你此时的索引页面会比正常只存储偏旁或者拼音的索引页,多存储很多信息,此时的索引页就会比较庞大,多出很多的存储页。这样你去查询索引页的时候,原本翻1-3页就可以定位到要查询的汉字在第几页,现在你可能要翻10-30页才能查询到你的汉字信息。效率没有比索引页面中单独只存储偏旁部首或者拼音,具体信息单独存在字典后面的某一个页面中的方式高。所以,索引和数据分开。
上面的例子中,汉字只是有读音、释义、词组三个信息。如果有更多的信息呢?比如一个汉字的解释需要一页纸或者两页值。此时的信息如果都放在索引页面中存放,那么将导致索引页更大。
以上就是基本的原理。为什么要用索引,索引中为什么不都存放所有的信息。
你这个必需是在录入的时候先把汉字的首字母也存入数据库,不然的话没办法实现,比如你打“HZ”,那杭州首字母也叫“HZ”,汉字也叫“HZ”,你可以在录入的时候让它自动转换,录入杭州自动生成一个“HZ”存入另一个字段,这个代码我这里有:欢迎分享,转载请注明来源:内存溢出
评论列表(0条)