`

Oracle索引札记

阅读更多

Oracle的索引包含:BTree、位图索引、基于函数的索引

 

默认情况下大多使用Btree索引,该索引就是通常所见唯一索引、聚簇索引等等,Btree用在OLTP,加快查询速度。位图索引是Oracle的比较引人注目的地方,其主要用在OLAP(联机数据分析)方面,也就是数据仓库方面用到,目的是在加快查询速度是,节省存储 空间。

 

B*Tree索引结构类似二叉树结构,通过二分法将数据逐步分为2部分,叶子节点包含索引码和行ID,叶子节点之间通过双向链表结构连接。二叉树结构决定了索引也是有高度的即二叉树的深度。

 

索引码是唯一的,如果对于唯一索引,索引码就是索引列的数据,而对于非唯一索引,索引码可以能通过列值加上行ID来构建。

 

位图索引,索引和数据是一对多,而B*Tree索引索引与行数据是一对一的。

 

通常情况下,索引都要耗费比较大的存储空间,位图采用了压缩技术实现磁盘空间缩减。Btree用在高基数(即列的数据相异度大),位图用在低基数列。

 

位图索引的基本原理是在索引中使用位图而不是列值。通常在事实表和维表的键之间有很低的集的势(cardinality),使用位图索引,存储更为有效,与B*Tree索引比较起来,只需要更少的存储空间,这样每次读取可以读到更多的记录,而且与B*Tree索引相比,位图索引将比较,连接和聚集都变成了位算术运算,大大减少了运行时间,从而得到性能上的极大的提升。
  
  在Oracle中如何合理的使用位图索引?以下的几个事项应该考虑。
  
  * 如果要使用位图索引,始化参数STAR_TRANSFORMATION_ENABLED应该设置为TRUE.
  
  *  优化模式应该是CBO。对于数据仓库的环境中,总是应该考虑使用CBO(COST-BASEDOPTIMIZER)。
  
  *  位图索引应该建立在每一个事实表的外键列上。(这只是一个一般的规则.)
  
  此外,对于数据表中的cardinality如何客观的确定也是一个问题,一万条数据中只包含3个值的集和算是低的了,那么一亿条记录中包含3万条记录算不算低的呢?对于这样的情况,建议几行一下数据的模拟测试,一般来说,在数据仓库环境中,位图索引的性能要好于B*Tree索引。还要注意位图索引不是为OLTP数据库设计的,不应该在OLTP数据库中大量的使用它,尤其是对那些有更新操作的表 。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics