数据库索引

数据库索引,第1张

1,什么是索引

索引是关系数据库中对数据库表中一列或所列数据进行排序的存储结构。好比是字典的目录

2,索引的应用场景

数据库中存放大量的数据时,直行sql语句将花费较大时间,时间过长将影响用户体验,并且我们应用中大多数接口都具有查询功能,最后都将落在数据库查询中,所以需要提高数据库查询的速度就需要使用到索引,就像通过目录查字典就会很快查到结果

3,数据库查询原理

通过IO读写在磁盘中一块一块查找目标数据,该过程称为全表扫描

4,IO读写是在磁盘中一条一条查,索引也是如此,为什么索引快

因为索引采用了不同的数据结构(B+树),该数据结构在查询上有明显优势

5,索引的分类

主键索引,普通索引,唯一索引,联合索引,全文索引。

其中联合索引需要满足最左前缀法则才能实现索引。

6,索引的物理存放位置

innoDB类型的索引与数据存放在一个文件中

myisam类型的索引和数据分别存放在两个文件中

下面是关于数据库索引的相关知识:

简单来说,数据库索引就是数据库的数据结构!进一步说则是该数据结构中存储了一张表中某一列的所有值,也就是说索引是基于数据表中的某一列创建的。总而言之:一个索引是由表中某一列上的数据组成,并且这些数据存储在某个数据结构中。

2索引的作用。举个例子,假设有一张数据表Emplyee,该表有三列:

表中有几万条记录。现在要执行下面这条查询语句,查找出所有名字叫“Jesus”的员工的详细信息

3如果没有数据库索引功能,数据库系统会逐行的遍历整张表,对于每一行都要检查其Employee_Name字段是否等于“Jesus”。因为我们要查找所有名字为“Jesus”的员工,所以当我们发现了一条名字是“Jesus”的记录后,并不能停止继续查找,因为可能有其他员工也叫“Jesus”。这就意味着,对于表中的几万条记录,数据库每一条都要检查。这就是所谓的“全表扫描”( full table scan)

4而数据库索引功能索引的最大作用就是加快查询速度,它能从根本上减少需要扫表的记录/行的数量。

5如何创建数据库索引。可以基于Employee表的两列创建索引即可:

索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。如果想按特定职员的姓来查找他或她,则与在表中搜索所有的行相比,索引有助于更快地获取信息。

2索引的一个主要目的就是加快检索表中数据的方法,亦即能协助信息搜索者尽快的找到符合限制条件的记录ID的辅助数据结构。

3索引是对数据库表中一个或多个列(例如,employee 表的姓名 (name) 列)的值进行排序的结构。

4例如这样一个查询:select from table1 where id=10000。如果没有索引,必须遍历整个表,直到ID等于10000的这一行被找到为止;有了索引之后(必须是在ID这一列上建立的索引),即可在索引中查找。由于索引是经过某种算法优化过的,因而查找次数要少的多。可见,索引是用来定位的。

5从数据搜索实现的角度来看,索引也是另外一类文件/记录,它包含着可以指示出相关数据记录的各种记录。其中,每一索引都有一个相对应的搜索码,字符段的任意一个子集都能够形成一个搜索码。这样,索引就相当于所有数据目录项的一个集合,它能为既定的搜索码值的所有数据目录项提供定位所需的各种有效支持

参考资料:

数据库索引-百度百科

) 全表扫描(Full Table Scans FTS)

为实现全表扫描 Oracle读取表中所有的行 并检查每一行是否满足语句的WHERE限制条件一个多块读 *** 作可以使一次I/O能读取多块数据块(db_block_multiblock_read_count参数设定) 而不是只读取一个数据块 这极大的减少了I/O总次数 提高了系统的吞吐量 所以利用多块读的方法可以十分高效地实现全表扫描 而且只有在全表扫描的情况下才能使用多块读 *** 作 在这种访问模式下 每个数据块只被读一次

使用FTS的前提条件 在较大的表上不建议使用全表扫描 除非取出数据的比较多 超过总量的 % % 或你想使用并行查询功能时

使用全表扫描的例子

SQL> explain plan for select from dual; Query Plan SELECT STATEMENT[CHOOSE] Cost= TABLE ACCESS FULL DUAL

) 通过ROWID的表存取(Table Access by ROWID或rowid lookup)

行的ROWID指出了该行所在的数据文件 数据块以及行在该块中的位置 所以通过ROWID来存取数据可以快速定位到目标数据上 是Oracle存取单行数据的最快方法

这种存取方法不会用到多块读 *** 作 一次I/O只能读取一个数据块 我们会经常在执行计划中看到该存取方法 如通过索引查询数据

使用ROWID存取的方法

SQL> explain plan for select from dept where rowid = AAAAyGAADAAAAATAAF ; Query Plan SELECT STATEMENT [CHOOSE] Cost= TABLE ACCESS BY ROWID DEPT [ANALYZED]

)索引扫描(Index Scan或index lookup)

我们先通过index查找到数据对应的rowid值(对于非唯一索引可能返回多个rowid值) 然后根据rowid直接从表中得到具体的数据 这种查找方式称为索引扫描或索引查找(index lookup) 一个rowid唯一的表示一行数据 该行对应的数据块是通过一次i/o得到的 在此情况下该次i/o只会读取一个数据库块

在索引中 除了存储每个索引的值外 索引还存储具有此值的行对应的ROWID值 索引扫描可以由 步组成 ( ) 扫描索引得到对应的rowid值 ( ) 通过找到的rowid从表中读出具体的数据 每步都是单独的一次I/O 但是对于索引 由于经常使用 绝大多数都已经CACHE到内存中 所以第 步的I/O经常是逻辑I/O 即数据可以从内存中得到 但是对于第 步来说 如果表比较大 则其数据不可能全在内存中 所以其I/O很有可能是物理I/O 这是一个机械 *** 作 相对逻辑I/O来说 是极其费时间的 所以如果多大表进行索引扫描 取出的数据如果大于总量的 % % 使用索引扫描会效率下降很多 如下列所示

SQL> explain plan for select empno ename from emp where empno= ; Query Plan SELECT STATEMENT [CHOOSE] Cost= TABLE ACCESS BY ROWID EMP [ANALYZED] INDEX UNIQUE SCAN EMP_I

但是如果查询的数据能全在索引中找到 就可以避免进行第 步 *** 作 避免了不必要的I/O 此时即使通过索引扫描取出的数据比较多 效率还是很高的

SQL> explain plan for select empno from emp where empno= ; 只查询empno列值 Query Plan SELECT STATEMENT [CHOOSE] Cost= INDEX UNIQUE SCAN EMP_I

进一步讲 如果sql语句中对索引列进行排序 因为索引已经预先排序好了 所以在执行计划中不需要再对索引列进行排序

SQL> explain plan for select empno ename from emp where empno > order by empno; Query Plan SELECT STATEMENT[CHOOSE] Cost= TABLE ACCESS BY ROWID EMP [ANALYZED] INDEX RANGE SCAN EMP_I [ANALYZED]

从这个例子中可以看到 因为索引是已经排序了的 所以将按照索引的顺序查询出符合条件的行 因此避免了进一步排序 *** 作

根据索引的类型与where限制条件的不同 有 种类型的索引扫描

索引唯一扫描(index unique scan)

索引范围扫描(index range scan)

索引全扫描(index full scan)

索引快速扫描(index fast full scan)

( ) 索引唯一扫描(index unique scan)

通过唯一索引查找一个数值经常返回单个ROWID 如果存在UNIQUE 或PRIMARY KEY 约束(它保证了语句只存取单行)的话 Oracle经常实现唯一性扫描

使用唯一性约束的例子

SQL> explain plan for select empno ename from emp where empno= ; Query Plan SELECT STATEMENT [CHOOSE] Cost= TABLE ACCESS BY ROWID EMP [ANALYZED] INDEX UNIQUE SCAN EMP_I

( ) 索引范围扫描(index range scan)

使用一个索引存取多行数据 在唯一索引上使用索引范围扫描的典型情况下是在谓词(where限制条件)中使用了范围 *** 作符(如> < <> >= <= beeen)

使用索引范围扫描的例子

SQL> explain plan for select empno ename from emp where empno > order by empno; Query Plan SELECT STATEMENT[CHOOSE] Cost= TABLE ACCESS BY ROWID EMP [ANALYZED] INDEX RANGE SCAN EMP_I [ANALYZED]

在非唯一索引上 谓词col = 可能返回多行数据 所以在非唯一索引上都使用索引范围扫描

使用index rang scan的 种情况

(a) 在唯一索引列上使用了range *** 作符(> < <> >= <= beeen)

(b) 在组合索引上 只使用部分列进行查询 导致查询出多行

(c) 对非唯一索引列上进行的任何查询

( ) 索引全扫描(index full scan)

与全表扫描对应 也有相应的全索引扫描 而且此时查询出的数据都必须从索引中可以直接得到

全索引扫描的例子

An Index full scan will not perform single block i/o s and so it may prove to be inefficient e g Index BE_IX is a concatenated index on big_emp (empno ename) SQL> explain plan for select empno ename from big_emp order by empno ename; Query Plan SELECT STATEMENT[CHOOSE] Cost= INDEX FULL SCAN BE_IX [ANALYZED]

( ) 索引快速扫描(index fast full scan)

扫描索引中的所有的数据块 与 index full scan很类似 但是一个显著的区别就是它不对查询出的数据进行排序 即数据不是以排序顺序被返回 在这种存取方法中 可以使用多块读功能 也可以使用并行读入 以便获得最大吞吐量与缩短执行时间

索引快速扫描的例子

BE_IX索引是一个多列索引

big_emp (empno ename) SQL> explain plan for select empno ename from big_emp; Query Plan SELECT STATEMENT[CHOOSE] Cost= INDEX FAST FULL SCAN BE_IX [ANALYZED]

只选择多列索引的第 列

SQL> explain plan for select ename from big_emp; Query Plan SELECT STATEMENT[CHOOSE] Cost= INDEX FAST FULL SCAN BE_IX [ANALYZED]

lishixinzhi/Article/program/Oracle/201311/17452

数据库引入了索引

用户对数据库最频繁的 *** 作是进行数据查询 一般情况下 数据库在进行查询 *** 作时需要对整个表进行数据搜索 当表中的数据很多时 搜索数据就需要很长的时间 这就造成了服务器的资源浪费 为了提高检索数据的能力 数据库引入了索引机制

有关 索引 的比喻

从某种程度上 可以把数据库看作一本书 把索引看作书的目录 通过目录查找书中的信息 显然较没有目录的书方便 快捷

数据库索引实际是什么(两部分组成)

索引是一个单独的 物理的数据库结构 它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单

索引在表中的角色

一个表的存储是由两部分组成的 一部分用来存放表的数据页面 另一部分存放索引页面 索引就存放在索引页面上

索引高效原理

通常 索引页面相对于数据页面来说小得多 当进行数据检索时 系统先搜索索引页面 从中找到所需数据的指针 再直接通过指针从数据页面中读取数据

索引的分类

在SQL Server 的数据库中按存储结构的不同将索引分为两类 簇索引(Clustered Index)和非簇索引(Nonclustered Index)

( )簇索引对表的物理数据页中的数据按列进行排序 然后再重新存储到磁盘上 即簇索引与数据是混为一体 的它的叶节点中存储的是实际的数据 由于簇索引对表中的数据一一进行了排序 因此用簇索引查找数据很快 但由于簇索引将表的所有数据完全重新排列了 它所需要的空间也就特别大 大概相当于表中数据所占空间的 % 表的数据行只能以一种排序方式存储在磁盘上 所以一个表只能有一个簇索引

( )非簇索引具有与表的数据完全分离的结构 使用非簇索引不用将物理数据页中的数据按列排序 非簇索引的叶节点中存储了组成非簇索引的关键字的值和行定位器 行定位器的结构和存储内容取决于数据的存储方式 如果数据是以簇索引方式存储的 则行定位器中存储的是簇索引的索引键;如果数据不是以簇索引方式存储的 这种方式又称为堆存储方式(Heap Structure) 则行定位器存储的是指向数据行的指针 非簇索引将行定位器按关键字的值用一定的方式排序 这个顺序与表的行在数据页中的排序是不匹配的 由于非簇索引使用索引页存储因此它比簇索引需要更多的存储空间且检索效率较低但一个表只能建一个簇索引 当用户需要建立多个索引时就需要使用非簇索引了

小结 Clustered Index 是与物理数据混在一起并对物理数据进重排 就像使用拼音查字典;Unclustered Index 是与物理数据完全分离的 利用额外空间对关键字进行重排 就像使用部首查字典

数据库索引应用

一 索引的概念

索引就是加快检索表中数据的方法 数据库的索引类似于书籍的索引 在书籍中 索引允许用户不必翻阅完整个书就能迅速地找到所需要的信息 在数据库中 索引也允许数据库程序迅速地找到表中的数据 而不必扫描整个数据库

二 索引的特点

索引可以加快数据库的检索速度

索引降低了数据库插入 修改 删除等维护任务的速度

索引创建在表上 不能创建在视图上

索引既可以直接创建 也可以间接创建

可以在优化隐藏中 使用索引

使用查询处理器执行SQL语句 在一个表上 一次只能使用一个索引

其他

三 索引的优点

创建唯一性索引 保证数据库表中每一行数据的唯一性

大大加快数据的检索速度 这也是创建索引的最主要的原因

加速表和表之间的连接 特别是在实现数据的参考完整性方面特别有意义

在使用分组和排序子句进行数据检索时 同样可以显著减少查询中分组和排序的时间

通过使用索引 可以在查询的过程中使用优化隐藏器 提高系统的性能

四 索引的缺点

创建索引和维护索引要耗费时间 这种时间随着数据量的增加而增加

索引需要占物理空间 除了数据表占数据空间之外 每一个索引还要占一定的物理空间 如果要建立聚簇索引 那么需要的空间就会更大

当对表中的数据进行增加 删除和修改的时候 索引也要动态的维护 降低了数据的维护速度

lishixinzhi/Article/program/MySQL/201311/29604

索引就好象一本字典的目录。凭借字典的目录,我们可以非常迅速的找到我们所需要的条目。数据库也是如此。凭借Oracle数据库的索引,相关语句可以迅速的定位记录的位置,而不必去定位整个表。 虽然说,在表中是否创建索引,不会影响到Oracle数据库的使用,也不会影响数据库语句的使用。这就好像即使字典没有目录的话,用户仍然可以使用它一样。可是,若字典没有目录,那么可想而知,用户要查某个条目的话,其不得不翻遍整本字典。数据库也是如此。若没有建立相关索引的话,则数据库在查询记录的时候,不得不去查询整个表。当表中的记录比较多的时候,其查询效率就会很低。所以,合适的索引,是提高数据库运行效率的一个很好的工具。 不过,并不是说表上的索引越多越好。过之而不及。故在数据库设计过程中,还是需要为表选择一些合适的索引。宁缺勿滥,这是建立索引时的一个遵循标准。在理论上,虽然一个表可以设置无限的索引。但是,数据库管理员需要知道,表中的索引越多,维护索引所需要的开销也就越大。每当数据表中记录有增加、删除、更新变化的时候,数据库系统都需要对所有索引进行更新。故数据库表中的索引绝对不是多多益善。具体来说,在索引建立上,笔者对大家有如下建议。 建议一:在基数小的字段上要善于使用位图索引。 基数是位图索引中的一个基本的定义,它是指数据库表中某个字段内容中不重复的数值。如在员工信息表中的性别字段,一般就只有男跟女两个值,所以,其基数为2;婚姻状况字段的话,则其只有已婚、未婚、离婚三种状态,其基数就为3;民族一览内也是只有有限的几个值。 对于要查询基数小的字段,如现在用户想查找所有婚姻状况为“已婚”的“女性”时,利用位图索引可以提高查询的效率。这主要是因为标准索引是通过在索引中保存排序过的索引列以及对应的ROWID来实现的。若我们在基数小的列上建立标准索引的话,则其会返回大量的记录。 而当我们在创建位图索引的时候,在Oracle会对整个表进行扫描,并且会为索引列的每个取值建立一个位图。若内容相同,则在位图上会以一个相同的数字表示。此时,若这个字段的基数比较小的话,则若需要实现对整个字段的查询的话,效率就会非常的高。因为此时,数据库只要位图中数字相同的内容找出来即可。 除了在数据表某列基数比较小的情况下,采用位图索引外,我们往往在一些特殊的情况下,也会建议采用位图索引。最常见的情况是,在Where限制条件中,若我们多次采用AND或者OR条件时,也建议采用位图索引。因为当一个查询饮用了一些部署了位图索引的列的时候,这些位图可以很方便的与AND或者Or 运算符 *** 作结合以快速的找出用户所需要的记录。 但是,这里要注意,不是在条件语句中包含运算符的时候,采用位图索引都能够提供比较高的效率。一般来说,只有AND 或者OR运算符的时候,位图索引才会比较具有优势。若此时用户采用大于号或者不等于号作为条件语句中的限制条件的时候,则往往采用标准索引具有更大的优势。 所以,笔者在数据库设置中,一般只有在三种情况下才采用位图索引。一是列的基数比较小,而有可能需要根据这些字段的内容查找相关的记录;二是在条件语句中,用到了AND或者OR运算符的时候。除了这两种情况外,最好能够采用其他适合的索引。第三种情况是,需要用到NULL作为查询的限制条件。因为标准查询一般情况下,会忽略所有的NULL值列。也就是说,若需要查询“所有没有身份z号码”的员工的信息的时候,标准索引并不能够起到加速查询速度的作用。此时,就需要采用位图索引。因为位图索引会记录相关的NULL值列信息。 建议二:创建索引的一些限制条件。 并不说,表或者列建立的索引越多越好。相反,索引建的越多,有时会反而会影响数据库运行的整体性能。所以,在建立索引的时候,仍然会有一些限制条件。 一是不要对一些记录内容比较少的表建立索引。在一个应用系统设计的时候,如设计一个ERP系统的数据库,其虽然有几千张表。但是,并不是每张表都有大量记录的。相反,其中有近一半左右的数据表,可能其存储的数据不会超过百条。如员工登陆帐户密码表、企业部门信息表等等。对于这些记录内容比较少的表,我们建立最好不要为其建立索引。无论是表上的,还是字段上,都不要建立索引。

以上就是关于数据库索引全部的内容,包括:数据库索引、数据库索引是什么,有什么用,怎么用、浅谈存取Oracle当中扫描数据的方法等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/sjk/9848578.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-02
下一篇2023-05-02

发表评论

登录后才能评论

评论列表(0条)

    保存