SQLSERVER排查CPU占用高的情况

SQLSERVER排查CPU占用高的情况,第1张

概述SQLSERVER排查CPU占用高的情况 今天中午,有朋友叫我帮他看一下数据库, *** 作系统是Windows2008R2 ,数据库是SQL2008R2 64位 64G内存,16核CPU 硬件配置还是比较高的,他说服务器运行的是金蝶K3软件,数据库实例里有多个数据库   现象 他说是这几天才出现的,而且在每天的某一个时间段才会出现CPU占用高的情况 内存占用不太高,只占用了30个G CPU占用100% sqlSERVER排查cpu占用高的情况

今天中午,有朋友叫我帮他看一下数据库, *** 作系统是windows2008R2,数据库是sql2008R2 64位

64G内存,16核cpu

硬件配置还是比较高的,他说服务器运行的是金蝶K3软件,数据库实例里有多个数据库

 

现象

他说是这几天才出现的,而且在每天的某一个时间段才会出现cpu占用高的情况

内存占用不太高,只占用了30个G

cpu占用100%


排查方向

一般排查都是用下面的脚本,一般会用到三个视图sys.sysprocesses ,dm_exec_sessions ,dm_exec_requests

1 USE master2 GO3 --如果要指定数据库就把注释去掉4 SELECT * FROM sys.[sysprocesses] WHERE spID]>50 AND DB_name([dbID])='gposdb'5 SELECT COUNT(*) FROM sys].dm_exec_sessionssession_ID50

看一下当前的数据库用户连接有多少

然后使用下面语句看一下各项指标是否正常,是否有阻塞,这个语句选取了前10个最耗cpu时间的会话

 1 SELECT top 10 2 ], 3 request_ID 4 start_timeAS '开始时间',128)"> 5 status状态 6 command命令 7 dest.textSQL语句 8 DB_name(database_ID]) 数据库名 9 blocking_session_ID正在阻塞其他会话的会话ID10 wait_type等待资源类型11 wait_time等待时间12 wait_resource等待的资源13 reads物理读次数14 writes写次数15 logical_reads逻辑读次数16 row_count返回结果行数'17 dm_exec_requestsAS der 18 CROSS APPLY 19 sys.dm_exec_sql_text](der.sql_handleAS dest 20 50 AND DB_name(der.])=gposdb'  21 ORDER BY cpu_timeDESC


如果想看具体的SQL语句可以执行下面的SQL语句,记得在SSMS里选择以文本格式显示结果

在SSMS里选择以文本格式显示结果10 3 dest.6 sys.7 50 8

模拟了一些耗cpu时间的动作

还有查看cpu数和user scheduler数和最大工作线程数,检查worker是否用完也可以排查cpu占用情况

查看cpu数和user scheduler数目
SELECT cpu_count,scheduler_count FROM sys.dm_os_sys_info查看最大工作线程数SELECT max_workers_count FROM sys.dm_os_sys_info

查看机器上的所有schedulers包括user 和system
通过下面语句可以看到worker是否用完,当达到最大线程数的时候就要检查blocking了


对照下面这个表
各种cpu和sqlSERVER版本组合自动配置的最大工作线程数
cpu数                 32位计算机                        64位计算机
<=4                     256                                   512
  8                        288                                   576
 16                       352                                   704
 32                       480                                   960

SELECT2 scheduler_address,128)">3 scheduler_ID,128)">4 cpu_ID,128)">5 status,128)">6 current_tasks_count,128)">7 current_workers_count,active_workers_countFROM sys.dm_os_schedulers

如果sqlSERVER存在要等待的资源,那么执行下面语句就会显示出会话中有多少个worker在等待

结合[sys].[dm_os_wait_stats]视图,如果当前sqlSERVER里面没有任何等待资源,那么下面的SQL语句不会显示任何结果

2 3 4 5 6 7 dest. 8 9 10 der.11 12 13 dowswaiting_tasks_count当前正在进行等待的任务数14 15 16 17 18 19 INNER JOIN dm_os_wait_statsAS dows 20 ON der.]21 22 sys.23 24 比如我当前执行了查询SalesOrderDetail_test表100次,由于表数据非常多,所以SSMS需要把sqlSERVER执行的结果慢慢的取走,

造成了ASYNC_NETWORK_IO等待

USE
AdventureWorksFROM dbo.SalesOrderDetail_testGO 100

 


问题源头

经过排查和这几天的观察情况,确定是某些表缺失索引导致,现在在这些表上增加了索引,问题解决

select from t_AccessControl 权限控制表权限控制from t_GroupAccess 用户组权限表用户组权限from t_GroupAccesstype 用户组权限类表用户组权限类from t_ObjectAccess 对象权限表对象权限from t_ObjectAccesstype 对象权限类型表对象权限类型6 from t_ObjectType 对象类型表对象类型

查询cpu占用高的语句

2 total_worker_time/execution_count AS avg_cpu_cost,plan_handle,128)"> 3 execution_count,128)"> 4 (SUBSTRING(text,statement_start_offset/2 + 1,128)"> 5 (CASE WHEN statement_end_offset = -1 6 THEN LEN(CONVERT(nvarchar(max),text)) * 2 7 ELSE statement_end_offset 8 END - statement_start_offset)2) 9 FROM sys.dm_exec_sql_text(sql_handle)) AS query_text10 FROM sys.dm_exec_query_stats11 avg_cpu_cost

查询缺失索引

SELECT
2 Databasename = DB_name(database_ID)3,Number Indexes Missing] count(*) FROM sys.dm_db_missing_index_detailsGROUP BY 2 DESC;

SELECT 2 Total Cost] ROUND(avg_total_user_cost * avg_user_impact * (user_seeks + user_scans),0) 3 ,avg_user_impact 4,tablename = statement 5,0)">EqualityUsage= equality_columns 6,0)">InequalityUsage= inequality_columns 7,0)">Include Cloumns= included_columns 8 FROM sys.dm_db_missing_index_groups g 9 JOIN sys.dm_db_missing_index_group_stats s 10 ON s.group_handle = g.index_group_handle JOIN sys.dm_db_missing_index_details d 12 ON d.index_handle = g.index_handle13 DESC;

定位问题后,新建非聚集索引

CREATE NONCLUSTERED INDEX IX_t_AccessControl_F4 ON dbo.t_AccessControl2 (3 FObjectType4 )include(FUserID],0)">FAccesstypeFAccessMaskWITH( STATISTICS_norECOmpuTE = OFF,IGnorE_DUP_KEY ON,ALLOW_PAGE_LOCKS ON) ON PRIMARY6 drop index IX_t_AccessControl_F4 on t_AccessControl

 cpu占用恢复正常

跟踪模板和跟踪文件下载,请使用sql2008R2 版本:files.cnblogs.com/lyhabc/跟踪模板和trace.rar

总结

从多次历史经验来看,如果cpu负载持续很高,但内存和IO都还好的话,这种情况下,首先想到的一定是索引问题,十有八九错不了。

注意文章开头贴出的客户机器负载情况图

 

总结

以上是内存溢出为你收集整理的SQLSERVER排查CPU占用高的情况全部内容,希望文章能够帮你解决SQLSERVER排查CPU占用高的情况所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/sjk/1173380.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-02
下一篇 2022-06-02

发表评论

登录后才能评论

评论列表(0条)

保存