Car-tech

Oracle工程师通过热图显示延迟之谜

Anonim

“将热点视为热图是识别可能被忽略的细微特征的有效方法,”甲骨文首席软件工程师Brendan Gregg在“可视化系统延迟”一文中写道。 Gregg也告诫说,虽然这种可视化可以让我们更好地了解正在发生的事情,但它并不总是为观察到的行为提供答案。尽管如此,热图还可以提供解决下一代数据中心延迟问题的见解。

[进一步阅读:用于媒体流和备份的最佳NAS盒]

确定系统缓慢的原因一直是一个挫折数据中心管理员和系统管理员。网络分析工具可用于可视化网络性能,但系统的其他方面(如存储阵列中磁盘的响应性)难以量化。

Sun Microsystems早已为其Solaris操作系统提供了一种工具,称为DTrace,可以在一秒钟的基础上表征系统各个部分的延迟。然而,它可以产生的压倒性数据仍然需要归结为易于理解的形式。

输入Gregg的热图。热图是一种简单的可视化技术,其中在二维图上,不同的值由不同的颜色表示。

热图可以在大多数网络分析工具上显示比线图更多的图形,因为虽然图“允许平均值如果提供的话,延迟的实际组成或分布不能超过最大值,“他写道,”热图对于快速识别异常值也很有用,然后可以更详细地检查,他认为

对于本文,Gregg绘制了各种不同寻常的工作负载条件,使用Oracle Analytics可视化软件可视化呈现DTrace收集的数据。他设置X轴代表时间,Y轴代表延迟时间。最黑暗的颜色代表了最多的输入输出。

在很多情况下,他发现简单的工作负载可能会产生各种复杂的(有时无法解释的)模式。

在一种情况下,少量数据按顺序写入磁盘池。格雷格预计只会看到代表随机延迟出现的“白噪声”。相反,热图显示延迟水平上升和下降的原因不明。 “以这种方式可视化延迟清楚地提出了比提供答案更多的问题,”他说,“另一种模式证明同样神秘。测试涉及向44个磁盘发送数据流。首先,将数据发送到只有一个磁盘,然后发送到两个磁盘,依此类推,直到所有44个磁盘都接收数据。

Gregg预计磁盘延迟会随着系统总线饱和数据而线性增加。

他将这种模式称为彩虹翼龙,因为热图与一只彩色飞行恐龙的轮廓相似。

“总结彩虹翼手龙:很少有人知道它的准确性,而且需要更多的调查,这表明了简单的可视化可以变得多深,“他写道,”Gregg还使用热图来揭示巨大的噪音在服务器上,Gregg几年前在YouTube上展示过的现象

虽然这些热图是在通过网络文件存储(NFS)协议运行的Zettabyte文件系统(ZFS)上运行的系统上完成的,但此方法可用于表征其他文件系统的操作,甚至可以使用其他组件(如CPU, Gregg写道:

Joab Jackson为

IDG新闻服务

报道了Enterpise软件和通用技术突发新闻。在@Joab_Jackson的Twitter上关注Joab。 Joab的电子邮件地址是[email protected]