从人工智能部署中获取最大价值
Load高 & CPU高 这是我们最常遇到的一类情况,即load上涨是CPU负载上升导致。根据CPU具体资源分配表现,可分为以下几类: CPU sys高 这种情况CPU主要开销在于系统内核,可进一步查看上下文切换情况。
CPU si高 这种情况CPU大量消耗在软中断,可进一步查看软中断类型。一般而言,网络I/O或者线程调度引起软中断最为常见:
CPU us高 这种情况说明资源主要消耗在应用进程,可能引发的原因有以下几类:
Load高 & CPU低 这种情况出现的根本原因在于不可中断睡眠态(TASK_UNINTERRUPTIBLE)进程数较多,即CPU负载不高,但I/O负载较高。可进一步定位是磁盘I/O还是网络I/O导致。 三 排查策略
利用现有常用的工具,我们常用的排查策略基本如下图所示:
这8类分片中,除wa和id外,其余分片CPU都处于工作态。 二 资源&瓶颈分析
从上文我们了解到,Load Average和CPU使用率可被细分为不同的子域指标,指向不同的资源瓶颈。总体来说,指标与资源瓶颈的对应关系基本如下图所示。 (编辑:济南站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |