日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程语言 > java >内容正文

java

记一次线上Java程序导致服务器CPU占用率过高的问题排除过程

發(fā)布時(shí)間:2023/12/20 java 25 豆豆
生活随笔 收集整理的這篇文章主要介紹了 记一次线上Java程序导致服务器CPU占用率过高的问题排除过程 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

1、故障現(xiàn)象

客服同事反饋平臺(tái)系統(tǒng)運(yùn)行緩慢,網(wǎng)頁(yè)卡頓嚴(yán)重,多次重啟系統(tǒng)后問題依然存在,使用top命令查看服務(wù)器情況,發(fā)現(xiàn)CPU占用率過高。

2、CPU占用過高問題定位

2.1、定位問題進(jìn)程

使用top命令查看資源占用情況,發(fā)現(xiàn)pid為14063的進(jìn)程占用了大量的CPU資源,CPU占用率高達(dá)776.1%,內(nèi)存占用率也達(dá)到了29.8%

[ylp@ylp-web-01 ~]$ top top - 14:51:10 up 233 days, 11:40, 7 users, load average: 6.85, 5.62, 3.97 Tasks: 192 total, 2 running, 190 sleeping, 0 stopped, 0 zombie %Cpu(s): 97.3 us, 0.3 sy, 0.0 ni, 2.5 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st KiB Mem : 16268652 total, 5114392 free, 6907028 used, 4247232 buff/cache KiB Swap: 4063228 total, 3989708 free, 73520 used. 8751512 avail Mem PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 14063 ylp 20 0 9260488 4.627g 11976 S 776.1 29.8 117:41.66 java

2.2、定位問題線程

使用ps -mp pid -o THREAD,tid,time命令查看該進(jìn)程的線程情況,發(fā)現(xiàn)該進(jìn)程的多個(gè)線程占用率很高

[ylp@ylp-web-01 ~]$ ps -mp 14063 -o THREAD,tid,time USER %CPU PRI SCNT WCHAN USER SYSTEM TID TIME ylp 361 - - - - - - 02:05:58 ylp 0.0 19 - futex_ - - 14063 00:00:00 ylp 0.0 19 - poll_s - - 14064 00:00:00 ylp 44.5 19 - - - - 14065 00:15:30 ylp 44.5 19 - - - - 14066 00:15:30 ylp 44.4 19 - - - - 14067 00:15:29 ylp 44.5 19 - - - - 14068 00:15:30 ylp 44.5 19 - - - - 14069 00:15:30 ylp 44.5 19 - - - - 14070 00:15:30 ylp 44.5 19 - - - - 14071 00:15:30 ylp 44.6 19 - - - - 14072 00:15:32 ylp 2.2 19 - futex_ - - 14073 00:00:46 ylp 0.0 19 - futex_ - - 14074 00:00:00 ylp 0.0 19 - futex_ - - 14075 00:00:00 ylp 0.0 19 - futex_ - - 14076 00:00:00 ylp 0.7 19 - futex_ - - 14077 00:00:15

從輸出信息可以看出,14065~14072之間的線程CPU占用率都很高

2.3、查看問題線程堆棧

挑選TID為14065的線程,查看該線程的堆棧情況,先將線程id轉(zhuǎn)為16進(jìn)制,使用printf “%x\n” tid命令進(jìn)行轉(zhuǎn)換

[ylp@ylp-web-01 ~]$ printf "%x\n" 14065 36f1

再使用jstack命令打印線程堆棧信息,命令格式:jstack pid |grep tid -A 30

[ylp@ylp-web-01 ~]$ jstack 14063 |grep 36f1 -A 30 "GC task thread#0 (ParallelGC)" prio=10 tid=0x00007fa35001e800 nid=0x36f1 runnable "GC task thread#1 (ParallelGC)" prio=10 tid=0x00007fa350020800 nid=0x36f2 runnable "GC task thread#2 (ParallelGC)" prio=10 tid=0x00007fa350022800 nid=0x36f3 runnable "GC task thread#3 (ParallelGC)" prio=10 tid=0x00007fa350024000 nid=0x36f4 runnable "GC task thread#4 (ParallelGC)" prio=10 tid=0x00007fa350026000 nid=0x36f5 runnable "GC task thread#5 (ParallelGC)" prio=10 tid=0x00007fa350028000 nid=0x36f6 runnable "GC task thread#6 (ParallelGC)" prio=10 tid=0x00007fa350029800 nid=0x36f7 runnable "GC task thread#7 (ParallelGC)" prio=10 tid=0x00007fa35002b800 nid=0x36f8 runnable "VM Periodic Task Thread" prio=10 tid=0x00007fa3500a8800 nid=0x3700 waiting on condition JNI global references: 392

從輸出信息可以看出,此線程是JVM的gc線程。此時(shí)可以基本確定是內(nèi)存不足或內(nèi)存泄露導(dǎo)致gc線程持續(xù)運(yùn)行,導(dǎo)致CPU占用過高。
所以接下來我們要找的內(nèi)存方面的問題

3、內(nèi)存問題定位

3.1、使用jstat -gcutil命令查看進(jìn)程的內(nèi)存情況

[ylp@ylp-web-01 ~]$ jstat -gcutil 14063 2000 10S0 S1 E O P YGC YGCT FGC FGCT GCT 0.00 0.00 100.00 99.99 26.31 42 21.917 218 1484.830 1506.7470.00 0.00 100.00 99.99 26.31 42 21.917 218 1484.830 1506.7470.00 0.00 100.00 99.99 26.31 42 21.917 219 1496.567 1518.4840.00 0.00 100.00 99.99 26.31 42 21.917 219 1496.567 1518.4840.00 0.00 100.00 99.99 26.31 42 21.917 219 1496.567 1518.4840.00 0.00 100.00 99.99 26.31 42 21.917 219 1496.567 1518.4840.00 0.00 100.00 99.99 26.31 42 21.917 219 1496.567 1518.4840.00 0.00 100.00 99.99 26.31 42 21.917 220 1505.439 1527.3550.00 0.00 100.00 99.99 26.31 42 21.917 220 1505.439 1527.3550.00 0.00 100.00 99.99 26.31 42 21.917 220 1505.439 1527.355```從輸出信息可以看出,Eden區(qū)內(nèi)存占用100%,Old區(qū)內(nèi)存占用99.99%,Full GC的次數(shù)高達(dá)220次,并且頻繁Full GC,Full GC的持續(xù)時(shí)間也特別長(zhǎng),平均每次Full GC耗時(shí)6.8秒(1505.439/220)。根據(jù)這些信息,基本可以確定是程序代碼上出現(xiàn)了問題,可能存在不合理創(chuàng)建對(duì)象的地方####3.2、分析堆棧 使用jstat命令查看進(jìn)程的堆棧情況

[ylp@ylp-web-01 ~]$ jstat 14063 >>jstat.out
“`
把jstat.out文件從服務(wù)器拿到本地后,用編輯器查找?guī)в许?xiàng)目目錄并且線程狀態(tài)是RUNABLE的相關(guān)信息,從圖中可以看出ActivityUtil.java類的447行正在使用HashMap.put()方法

3.3、代碼定位

打開項(xiàng)目工程,找到ActivityUtil類的477行,代碼如下:

找到相關(guān)同事了解后,這段代碼會(huì)從數(shù)據(jù)庫(kù)中獲取配置,并根據(jù)數(shù)據(jù)庫(kù)中remain的值進(jìn)行循環(huán),在循環(huán)中會(huì)一直對(duì)HashMap進(jìn)行put操作。

查詢數(shù)據(jù)庫(kù)中的配置,發(fā)現(xiàn)remain的數(shù)量巨大

至此,問題定位完畢。

總結(jié)

以上是生活随笔為你收集整理的记一次线上Java程序导致服务器CPU占用率过高的问题排除过程的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。