ehxz 发表于 2011-6-14 17:17:45

SYBASE ASE中的统计信息

在SYBASE ASE中,SQL语句执行的时间主要取决于查询执行器对数据 的访问路径和处理方式,也就是执行计划,而最优的执行计划由查询优化器负责获取。SYBASE ASE的查询优化器是基于成本的,对于每一个获得的执行计划,优化器都会进行成本的计算,最终将成本最低的执行计划标识为最优。优化器通过一定的算法和公式来衡量执行计划的成本,而在算法和公式中使用的数据就是数据库 的统计信息。统计信息存储在两个系统 表中,一个是systabstats表,用于存储表/索引级的统计信息,另一个是sysstatistics表,用于存储列级的统计信息。
      如何阅读表的统计信息
SYBASE提供了操作系统级的命令optdiag用于输出统计信息,其常见使用方式如下:
optdiag statistics db_name[.owner[. ] ] ]
-U user_name
-P password
-S server
-o output_file
eg:
optdiag statistics zxvnms.dbo.device -Usa -P -S205 -o D:\device.log

输出的统计信息位于output_file中
      统计信息类型
1.      表/索引级的统计信息
以下为某个ALLPAGES类型的表的统计信息的输出中表和索引级的统计信息,由于聚簇索引的页级就是表的数据,因此对于ALLPAGES类型的表,聚簇索引的统计信息也就是表的统计信息,而非聚簇索引则有单独的统计信息。如果是DOL类型的表,由于其聚簇索引的结构类似于其非聚簇索引,因此聚簇索引和非聚簇索引都有单独的统计信息。
Statistics for index:                   "tbl_Result_18476745991" (cluster ed)
Index column list:                     "StartTime", "StartTimeDstOffset", "ObjectNo"
   Data page count:                438440
   ---数据页的数目,用于估计表扫描的成本
   Empty data page count:            0
   ---空数据页的树木,如果太多,会导致大块IO的效率下降
   Data row count:                   7534351.0000000000000000
   ---数据行数目,优化器用其设定每页的平均行数
   Forwarded row count:            0.0000000000000000
   ---前移行数目,仅用于DOL表,优化器为每一个前移行计算两个IO
   Deleted row count:                0.0000000000000000
      ---删除行数目,仅用于DOL表,如果太多,意味着页上数据填充率比较低
   Data page CR count:            375587.0000000000000000
   ---用于计算Data page cluster ratio
   OAM + allocation page count:      52506
      ---OAM页和分配但也首页的数目
   First extent leaf pages:          0
   Data row size:                     294.5465171263140292
   Index height:                      3
   Parallel join degree:               0.0000000000000000
   Unused page count:                9192
   OAM page count:                  52
Derived statistics:                  
   Data page cluster ratio:         0.1638354164765989
   ---数据页聚簇率,太低意味着在数据在不同extent上的分布比较分散,会导致大块
    IO的效率下降
   Space utilization:               0.6202966169989167
   Large I/O efficiency:            0.1459182559566758
Statistics for index:                   "StartTimeIndex" (nonclustered)
Index column list:                      "StartTime", "ObjectNo", "StartTimeDstOffset"
   Leaf count:                        24911
   ---索引页级的数据页数目
   Empty leaf page count:             0
   Data page CR count:                820046.0000000000000000
   Index page CR count:               13291.0000000000000000
   Data row CR count:               879449.0000000000000000
   First extent leaf pages:           0
   Leaf row size:                      21.0000000000000000
   Index height:                       2
Derived statistics:                  
   Data page cluster ratio:         0.0720347204369401
   Index page cluster ratio:          0.5331008854429509
   Data row cluster ratio:            0.9378502633418034
   Space utilization:               0.7783659386238538
   Large I/O efficiency:            0.2342856528655574
2.      列级统计信息
  
Statistics for column:                  "StartTime"
Last update of column statistics:       Apr 10 20079:43:36:100PM
   Range cell density:                0.0003456469583822
   ---描述列中副本值的平均数,密度越接近1,不同的值越多,越接近0,值越单一
   Total density:                     0.0003456469583822
   ---整个列中重复值的平均数,优化器他把用做评估一次连接中表扫描有多少返回行
   Range selectivity:               default used (0.33)
   In between selectivity:             default used (0.25)
   ---选择性,优化器在无法知道SARG值时,适用默认的选择性,对于等式使用10%,开区间条件,使用33%,闭区间使用25%
   Unique range values:               0.0003287310979619
   Unique total values:               0.0003287310979619
   Average column width:            default used (8.00)
Histogram for column:                   "StartTime"
---直方图
Column datatype:                        datetime
Requested step count:                  20
---步骤数
Actual step count:                        20
Sampling Percent:                        0
   Step   Weight                  Value
      1   0.00000000       <=       "Mar 10 20072:44:59:996AM"
      2   0.05280559       <=       "Mar 12 20071:45:00:000AM"
      3   0.05153025       <=       "Mar 13 2007 10:45:00:000PM"
      4   0.05326261       <=       "Mar 15 20077:45:00:000PM"
      5   0.05243758       <=       "Mar 17 20072:30:00:000PM"
      6   0.05464172       <=       "Mar 19 2007 10:45:00:000AM"
      7   0.05039562       <=       "Mar 21 20072:45:00:000AM"
      8   0.05414711       <=       "Mar 22 20078:45:00:000PM"
      9   0.04996035       <=       "Mar 24 2007 11:00:00:000AM"
       10   0.05312137       <=       "Mar 26 20074:00:00:000AM"
       11   0.05150971       <=       "Mar 27 20076:00:00:000PM"
       12   0.05440811       <=       "Mar 29 20079:15:00:000AM"
       13   0.05107565       <=       "Mar 30 20078:15:00:000PM"
       14   0.05475893       <=       "Apr1 20079:00:00:000AM"
       15   0.05237434       <=       "Apr2 20078:00:00:000PM"
       16   0.05490058       <=       "Apr4 20076:30:00:000AM"
       17   0.05202205       <=       "Apr5 2007 10:30:00:000AM"
       18   0.05357409       <=       "Apr7 20079:15:00:000PM"
       19   0.05094394       <=       "Apr9 20075:00:00:000AM"
       20   0.05213039       <=       "Apr 10 20079:15:00:000PM"
直方图描述了在各个范围中值的比例
      update statistics的使用
优化器使用统计信息时,首先把统计信息读入内存 中,在表的数据发生改变时,其内存中的统计信息也随之发生改变,但只有在正常关闭数据库,运行sp_flushstats,执行optdiag以及执行 update statistic等情况下统计信息才会被立即写入磁盘,在数据库运行过程中,housekeeper进程会在空闲时将统计信息写入磁盘。在数据库长期运行后,由于统计信息更新的滞后,会导致统计信息出现误差,这时候不准确的统计信息会导致优化器选择错误的执行计划,所以在数据库运行一段时间以后需要更新统计信息。更新的命令有:
update statistics table_name
---更新表以及和特定索引的统计信息
update statistics table_name
---更新特定列的统计信息
update index statistics table_name
---更新索引以及索引头列以及头列组合的统计信息
update all statistics table_name
---更新表中所有列的统计信息
需要注意的是,更新统计信息需要扫描全表或是所有索引,因此对于数据量很大的表会使用很长时间,这期间数据库会对表加锁,有可能阻塞表的插入更新和删除操作。
对于一般的查询使用update index statistics table_name 就足够了,如果对于某些特殊的查询,可以考虑对于使用到的列进行列统计信息的单独更新,这样可以节约更新统计信息的时间。

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/paluo/archive/2010/11/17/6015170.aspx

页: [1]
查看完整版本: SYBASE ASE中的统计信息

免责声明:
本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。

Mail To:Admin@SybaseBbs.com