监控 SQL Server 的运行状况--常用检测语句

  1. Microsoft SQL Server 2005 提供了一些工具来监控数据库。方法之一是动态管理视图。
  2. 动态管理视图 (DMV) 和动态管理函数 (DMF) 返回的服务器状态信息可用于监控服务器实例的运行状况、诊断问题和优化性能。 
  3. 常规服务器动态管理对象包括: 
  4.     dm_db_*:数据库和数据库对象 
  5.     dm_exec_*:执行用户代码和关联的连接 
  6.     dm_os_*:内存、锁定和时间安排 
  7.     dm_tran_*:事务和隔离 
  8.     dm_io_*:网络和磁盘的输入/输出 
  9. 此部分介绍为监控 SQL Server 运行状况而针对这些动态管理视图和函数运行的一些常用查询。 
  10. 示例查询 
  11. 您可以运行以下查询来获取所有 DMV 和 DMF 名称 
  1. SELECT * FROM sys.system_objects  
  2. WHERE name LIKE 'dm_%'  
  3. ORDER BY name 
  1. 监控 CPU 瓶颈 
  2. CPU 瓶颈通常由以下原因引起:查询计划并非最优、配置不当、设计因素不良或硬件资源不足。下面的常用查询可帮助您确定导致 CPU 瓶颈的原因。 
  3. 下面的查询使您能够深入了解当前缓存的哪些批处理或过程占用了大部分 CPU 资源 
  1. SELECT TOP 50   
  2.       SUM(qs.total_worker_time) AS total_cpu_time,   
  3.       SUM(qs.execution_count) AS total_execution_count,  
  4.       COUNT(*) AS  number_of_statements,   
  5.       qs.sql_handle   
  6. FROM sys.dm_exec_query_stats AS qs  
  7. GROUP BY qs.sql_handle  
  8. ORDER BY SUM(qs.total_worker_time) DESC
  1. 下面的查询显示缓存计划所占用的 CPU 总使用率(带 SQL 文本)。
  1. SELECT   
  2.       total_cpu_time,   
  3.       total_execution_count,  
  4.       number_of_statements,  
  5.       s2.text  
  6.       --(SELECT SUBSTRING(s2.text, statement_start_offset / 2, ((CASE WHEN statement_end_offset = -1 THEN (LEN(CONVERT(NVARCHAR(MAX), s2.text)) * 2) ELSE statement_end_offset END) - statement_start_offset) / 2) ) AS query_text  
  7. FROM   
  8.       (SELECT TOP 50   
  9.             SUM(qs.total_worker_time) AS total_cpu_time,   
  10.             SUM(qs.execution_count) AS total_execution_count,  
  11.             COUNT(*) AS  number_of_statements,   
  12.             qs.sql_handle --,  
  13.             --MIN(statement_start_offset) AS statement_start_offset,   
  14.             --MAX(statement_end_offset) AS statement_end_offset  
  15.       FROM   
  16.             sys.dm_exec_query_stats AS qs  
  17.       GROUP BY qs.sql_handle  
  18.       ORDER BY SUM(qs.total_worker_time) DESC) AS stats  
  19.       CROSS APPLY sys.dm_exec_sql_text(stats.sql_handle) AS s2 
  1. 下面的查询显示 CPU 平均占用率最高的前 50 个 SQL 语句。
  1. SELECT TOP 50  
  2. total_worker_time/execution_count AS [Avg CPU Time],  
  3. (SELECT SUBSTRING(text,statement_start_offset/2,(CASE WHEN statement_end_offset = -1 then LEN(CONVERT(nvarchar(max), text)) * 2 ELSE statement_end_offset end -statement_start_offset)/2) FROM sys.dm_exec_sql_text(sql_handle)) AS query_text, *  
  4. FROM sys.dm_exec_query_stats   
  5. ORDER BY [Avg CPU Time] DESC 
  1. 下面显示用于找出过多编译/重新编译的 DMV 查询。 
  2.  
  3.     select * from sys.dm_exec_query_optimizer_info  
  4.     where   
  5.           counter = 'optimizations'  
  6.           or counter = 'elapsed time' 
  1. 下面的示例查询显示已重新编译的前 25 个存储过程。plan_generation_num 指示该查询已重新编译的次数。
  1.     select top 25  
  2.           sql_text.text,  
  3.           sql_handle,  
  4.           plan_generation_num,  
  5.           execution_count,  
  6.           dbid,  
  7.           objectid   
  8.     from sys.dm_exec_query_stats a  
  9.           cross apply sys.dm_exec_sql_text(sql_handle) as sql_text  
  10.     where plan_generation_num > 1  
  11.     order by plan_generation_num desc  
  12.  
  13. 效率较低的查询计划可能增大 CPU 占用率。 
  14.  
  15. 下面的查询显示哪个查询占用了最多的 CPU 累计使用率。 
  16.  
  17.     SELECT   
  18.         highest_cpu_queries.plan_handle,   
  19.         highest_cpu_queries.total_worker_time,  
  20.         q.dbid,  
  21.         q.objectid,  
  22.         q.number,  
  23.         q.encrypted,  
  24.         q.[text]  
  25.     from   
  26.         (select top 50   
  27.             qs.plan_handle,   
  28.             qs.total_worker_time  
  29.         from   
  30.             sys.dm_exec_query_stats qs  
  31.         order by qs.total_worker_time desc) as highest_cpu_queries  
  32.         cross apply sys.dm_exec_sql_text(plan_handle) as q  
  33.     order by highest_cpu_queries.total_worker_time desc  
  34.  
  35. 下面的查询显示一些可能占用大量 CPU 使用率的运算符(例如 ‘%Hash Match%’、‘%Sort%’)以找出可疑对象。 
  36.  
  37.     select *  
  38.     from   
  39.           sys.dm_exec_cached_plans  
  40.           cross apply sys.dm_exec_query_plan(plan_handle)  
  41.     where   
  42.           cast(query_plan as nvarchar(max)) like '%Sort%'  
  43.           or cast(query_plan as nvarchar(max)) like '%Hash Match%' 
  1. 如果已检测到效率低下并导致 CPU 占用率较高的查询计划,请对该查询中涉及的表运行 UPDATE STATISTICS 以查看该问题是否仍然存在。然后,收集相关数据并将此问题报告给 PerformancePoint 规划支持人员。 
  2.  
  3. 如果您的系统存在过多的编译和重新编译,可能会导致系统出现与 CPU 相关的性能问题。 
  4.  
  5. 您可以运行下面的 DMV 查询来找出过多的编译/重新编译。 
  6.  
  7.     select * from sys.dm_exec_query_optimizer_info  
  8.     where   
  9.     counter = 'optimizations'  
  10.     or counter = 'elapsed time'  
  11.  
  12. 下面的示例查询显示已重新编译的前 25 个存储过程。plan_generation_num 指示该查询已重新编译的次数。 
  13.  
  14.     select top 25  
  15.     sql_text.text,  
  16.     sql_handle,  
  17.     plan_generation_num,  
  18.     execution_count,  
  19.     dbid,  
  20.     objectid   
  21.     from sys.dm_exec_query_stats a  
  22.     cross apply sys.dm_exec_sql_text(sql_handle) as sql_text  
  23.     where plan_generation_num > 1  
  24.     order by plan_generation_num desc  
  25.  
  26. 如果已检测到过多的编译或重新编译,请尽可能多地收集相关数据并将其报告给规划支持人员。
  1. 内存瓶颈 
  2.  
  3. 开始内存压力检测和调查之前,请确保已启用 SQL Server 中的高级选项。请先对 master 数据库运行以下查询以启用此选项。 
  4.  
  5.     sp_configure 'show advanced options'  
  6.     go  
  7.     sp_configure 'show advanced options', 1  
  8.     go  
  9.     reconfigure  
  10.     go  
  11.  
  12. 首先运行以下查询以检查内存相关配置选项。 
  13.  
  14.     sp_configure 'awe_enabled'  
  15.     go  
  16.     sp_configure 'min server memory'  
  17.     go  
  18.     sp_configure 'max server memory'  
  19.     go  
  20.     sp_configure 'min memory per query'  
  21.     go  
  22.     sp_configure 'query wait'  
  23.     go  
  24.  
  25. 运行下面的 DMV 查询以查看 CPU、计划程序内存和缓冲池信息。 
  26.  
  27.     select   
  28.     cpu_count,  
  29.     hyperthread_ratio,  
  30.     scheduler_count,  
  31.     physical_memory_in_bytes / 1024 / 1024 as physical_memory_mb,  
  32.     virtual_memory_in_bytes / 1024 / 1024 as virtual_memory_mb,  
  33.     bpool_committed * 8 / 1024 as bpool_committed_mb,  
  34.     bpool_commit_target * 8 / 1024 as bpool_target_mb,  
  35.     bpool_visible * 8 / 1024 as bpool_visible_mb  
  36.     from sys.dm_os_sys_info  
  37.  
  38. I/O 瓶颈 
  39.  
  40. 检查闩锁等待统计信息以确定 I/O 瓶颈。运行下面的 DMV 查询以查找 I/O 闩锁等待统计信息。 
  41.  
  42.     select wait_type, waiting_tasks_count, wait_time_ms, signal_wait_time_ms, wait_time_ms / waiting_tasks_count  
  43.     from sys.dm_os_wait_stats    
  44.     where wait_type like 'PAGEIOLATCH%'  and waiting_tasks_count > 0  
  45.     order by wait_type  
  46.  
  47. 如果 waiting_task_counts 和 wait_time_ms 与正常情况相比有显著变化,则可以确定存在 I/O 问题。获取 SQL Server 平稳运行时性能计数器和主要 DMV 查询输出的基线非常重要。 
  48.  
  49. 这些 wait_types 可以指示您的 I/O 子系统是否遇到瓶颈。 
  50.  
  51. 使用以下 DMV 查询来查找当前挂起的 I/O 请求。请定期执行此查询以检查 I/O 子系统的运行状况,并隔离 I/O 瓶颈中涉及的物理磁盘。 
  52.  
  53.     select   
  54.         database_id,   
  55.         file_id,   
  56.         io_stall,  
  57.         io_pending_ms_ticks,  
  58.         scheduler_address   
  59.     from  sys.dm_io_virtual_file_stats(NULL, NULL)t1,  
  60.             sys.dm_io_pending_io_requests as t2  
  61.     where t1.file_handle = t2.io_handle  
  62.  
  63. 在正常情况下,该查询通常不返回任何内容。如果此查询返回一些行,则需要进一步调查。 
  64.  
  65. 您还可以执行下面的 DMV 查询以查找 I/O 相关查询。 
  66.  
  67.     select top 5 (total_logical_reads/execution_count) as avg_logical_reads,  
  68.                        (total_logical_writes/execution_count) as avg_logical_writes,  
  69.                (total_physical_reads/execution_count) as avg_physical_reads,  
  70.                Execution_count, statement_start_offset, p.query_plan, q.text  
  71.     from sys.dm_exec_query_stats  
  72.           cross apply sys.dm_exec_query_plan(plan_handle) p  
  73.           cross apply sys.dm_exec_sql_text(plan_handle) as q  
  74.     order by (total_logical_reads + total_logical_writes)/execution_count Desc  
  75.  
  76. 下面的 DMV 查询可用于查找哪些批处理/请求生成的 I/O 最多。如下所示的 DMV 查询可用于查找可生成最多 I/O 的前五个请求。调整这些查询将提高系统性能。 
  77.  
  78.     select top 5   
  79.         (total_logical_reads/execution_count) as avg_logical_reads,  
  80.         (total_logical_writes/execution_count) as avg_logical_writes,  
  81.         (total_physical_reads/execution_count) as avg_phys_reads,  
  82.          Execution_count,   
  83.         statement_start_offset as stmt_start_offset,   
  84.         sql_handle,   
  85.         plan_handle  
  86.     from sys.dm_exec_query_stats    
  87.     order by  (total_logical_reads + total_logical_writes) Desc  
  1. 阻塞 
  2.  
  3. 运行下面的查询可确定阻塞的会话。 
  4.  
  5.     select blocking_session_id, wait_duration_ms, session_id from   
  6.     sys.dm_os_waiting_tasks  
  7.     where blocking_session_id is not null  
  8.  
  9. 使用此调用可找出 blocking_session_id 所返回的 SQL。例如,如果 blocking_session_id 是 87,则运行此查询可获得相应的 SQL。 
  10.  
  11.     dbcc INPUTBUFFER(87)  
  12.  
  13. 下面的查询显示 SQL 等待分析和前 10 个等待的资源。 
  14.  
  15.     select top 10 *  
  16.     from sys.dm_os_wait_stats  
  17.     --where wait_type not in ('CLR_SEMAPHORE','LAZYWRITER_SLEEP','RESOURCE_QUEUE','SLEEP_TASK','SLEEP_SYSTEMTASK','WAITFOR')  
  18.     order by wait_time_ms desc  
  19.  
  20. 若要找出哪个 spid 正在阻塞另一个 spid,可在数据库中创建以下存储过程,然后执行该存储过程。此存储过程会报告此阻塞情况。键入 sp_who 可找出 @spid;@spid 是可选参数。 
  21.  
  22.     create proc dbo.sp_block (@spid bigint=NULL)  
  23.     as  
  24.     select   
  25.         t1.resource_type,  
  26.         'database'=db_name(resource_database_id),  
  27.         'blk object' = t1.resource_associated_entity_id,  
  28.         t1.request_mode,  
  29.         t1.request_session_id,  
  30.         t2.blocking_session_id      
  31.     from   
  32.         sys.dm_tran_locks as t1,   
  33.         sys.dm_os_waiting_tasks as t2  
  34.     where   
  35.         t1.lock_owner_address = t2.resource_address and  
  36.         t1.request_session_id = isnull(@spid,t1.request_session_id)  
  37.  
  38. 以下是使用此存储过程的示例。 
  39.  
  40.     exec sp_block  
  41.     exec sp_block @spid = 7  

原文出自:http://www.cnblogs.com/jiguixin/archive/2011/01/05/1926235.html