设为首页 - 加入收藏 贤淑网 (http://www.xianshufang.com)- 国内知名站长资讯网站,提供最新最全的站长资讯,创业经验,网站建设等!
热搜: ag6亚游官网|平台 曝光 数据 手机
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

老牌运维教你如何快速分析Linux服务器的性能问题

发布时间:2019-10-01 09:36 所属栏目:[优化] 来源:互联网蚂蚁哥
导读:作为一名linux系统运维人员,最主要的工作是优化系统配置,使应用在系统上以最优的状态运行,但是由于硬件问题、软件问题、网络环境等的复杂性 和多变性,导致对系统的优化变得异常复杂,如何定位性能问题出在哪个方面,是性能优化的一大难题, 本章从系统

作为一名linux系统运维人员,最主要的工作是优化系统配置,使应用在系统上以最优的状态运行,但是由于硬件问题、软件问题、网络环境等的复杂性 和多变性,导致对系统的优化变得异常复杂,如何定位性能问题出在哪个方面,是性能优化的一大难题, 本章从系统入手,重点讲述由于系统软、硬件配置不当可能造成的性能问题,并且给出了检测系统故障和优化性能的一般方法和流程。

老牌运维教你如何快速分析Linux服务器的性能问题

1 cpu性能评估

Cpu是影响Linux性能的主要因素之一,下面先介绍几个查看CPU性能的命令。

1.1 vmstat命令

该命令可以显示关于系统各种资源之间相关性能的简要信息,这里我们主要用它来看CPU的一个负载情况。

下面是vmstat命令在某个系统的输出结果:

  1. [root@node1?~]#?vmstat?2?3?
  2. procs?———–memory———-?—swap–?—–io—-?–system–?—–cpu——?
  3. ?r?b?swpd?free?buff?cache?si?so?bi?bo?in?cs?us?sy?id?wa?st?
  4. ?0?0?0?162240?8304?67032?0?0?13?21?1007?23?0?1?98?0?0?
  5. ?0?0?0?162240?8304?67032?0?0?1?0?1010?20?0?1?100?0?0?
  6. ?0?0?0?162240?8304?67032?0?0?1?1?1009?18?0?1?99?0?0?

对上面每项的输出解释如下:

  1. ??procs?
  2. ?
  3. ??r列表示运行和等待cpu时间片的进程数,这个值如果长期大于系统CPU的个数,说明CPU不足,需要增加CPU。?
  4. ?
  5. ??b列表示在等待资源的进程数,比如正在等待I/O、或者内存交换等。?
  6. ?
  7. ??memory?
  8. ?
  9. ??swpd列表示切换到内存交换区的内存数量(以k为单位)。如果swpd的值不为0,或者比较大,只要si、so的值长期为0,这种情况下一般不用担心,不会影响系统性能。?
  10. ?
  11. ??free列表示当前空闲的物理内存数量(以k为单位)?
  12. ?
  13. ??buff列表示buffers?cache的内存数量,一般对块设备的读写才需要缓冲。?
  14. ?
  15. ??cache列表示page?cached的内存数量,一般作为文件系统cached,频繁访问的文件都会被cached,如果cache值较大,说明cached的文件数较多,如果此时IO中bi比较小,说明文件系统效率比较好。?
  16. ?
  17. ??swap?
  18. ?
  19. ??si列表示由磁盘调入内存,也就是内存进入内存交换区的数量。?
  20. ?
  21. ??so列表示由内存调入磁盘,也就是内存交换区进入内存的数量。?

一般情况下,si、so的值都为0,如果si、so的值长期不为0,则表示系统内存不足。需要增加系统内存。

  1. ??IO项显示磁盘读写状况?
  2. ?
  3. ??Bi列表示从块设备读入数据的总量(即读磁盘)(每秒kb)。?
  4. ?
  5. ??Bo列表示写入到块设备的数据总量(即写磁盘)(每秒kb)?

这里我们设置的bi+bo参考值为1000,如果超过1000,而且wa值较大,则表示系统磁盘IO有问题,应该考虑提高磁盘的读写性能。

  1. ??system?显示采集间隔内发生的中断数?
  2. ??in列表示在某一时间间隔中观测到的每秒设备中断数。?
  3. ??cs列表示每秒产生的上下文切换次数。?

上面这2个值越大,会看到由内核消耗的CPU时间会越多。

  1. ??CPU项显示了CPU的使用状态,此列是我们关注的重点。?
  2. ??us列显示了用户进程消耗的CPU?时间百分比。us的值比较高时,说明用户进程消耗的cpu时间多,但是如果长期大于50%,就需要考虑优化程序或算法。?
  3. ??sy列显示了内核进程消耗的CPU时间百分比。Sy的值较高时,说明内核消耗的CPU资源很多。?

根据经验,us+sy的参考值为80%,如果us+sy大于 80%说明可能存在CPU资源不足。

  1. ??id?列显示了CPU处在空闲状态的时间百分比。?
  2. ??wa列显示了IO等待所占用的CPU时间百分比。wa值越高,说明IO等待越严重,根据经验,wa的参考值为20%,如果wa超过20%,说明IO等待严重,引起IO等待的原因可能是磁盘大量随机读写造成的,也可能是磁盘或者磁盘控制器的带宽瓶颈造成的(主要是块操作)。?

综上所述,在对CPU的评估中,需要重点注意的是procs项r列的值和CPU项中us、sy和id列的值。

1.2 sar命令

检查CPU性能的第二个工具是sar,sar功能很强大,可以对系统的每个方面进行单独的统计,但是使用sar命令会增加系统开销,不过这些开销是可以评估的,对系统的统计结果不会有很大影响。

【免责声明】本站内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

网友评论
推荐文章