运维“数据思维”有多重要?
一、数据库命令规范
将机器数据转化为预测和预防能力 例如,当一家公司在突然收到大量报告和信息时,通常他们会认识到出了问题。其中大多数内容是机器生成的,有些带有自定义模板,有些甚至是由人编写的。如果不进行某种形式的分组,团队将无法从更高层面上了解所发生的情况。他们可以设计一个分组工具,但这需要投入大量的时间和精力,同时更多的事件报告会不断累积。 同样,由于如此多的信息具有不同的内容,仅在内容相同时对信息进行分组并不能减少问题的数量。使用AI技术来识别相似性可以让团队随时间推移累积更多的相关信息。不同于数以千计的单个问题(每个问题由一个报告或信息表示),通过这种方式对警报进行分组,这只会显示出几个核心问题,而这些核心问题就是其他问题的根源。 此时,该系统已使响应团队具备了预测和预防能力。找出最大的问题,解决可能导致未来问题的根源,这就变得更为容易。优先处理核心问题上的一些工程工作会导致事件数量显著下降,所有这一切都源自基本的AI分组。 从理论上讲,这应该是一个非常可靠的过程。一旦对信息进行解析、识别和向量化,系统就应该很容易按相似的内容将信息进行分组。这些信息都是文本相关的,而这些向量可以让该平台来衡量相关性的强度。 当然,实际上并不总是那么简单。语言的灵活性意味着该系统经常出错。这就是为什么PagerDuty公司在我们的产品中建立了功能强大的反馈系统。 通过人工反馈改进结果 当最终用户向该系统提供反馈时,他们就为我们提供了新的数据点以有助于完善该流程。通常,这需要承认,A和B看起来应该是相互关联的。然而,该信息在人类语境中显示,它们彼此之间没有多大关系。 PagerDuty公司的反馈系统会给予那些拥有相同单词而正相关的信息更大的权重,但之后人工反馈表明它们并不相似。这种评估和修改过程可以在软件中通过一个大型的强化学习系统完成,但对于用户而言,这只是单词和信息是否应该分在一起的一个简单的评估过程。 当然,客户不需要了解其如何工作的具体细节。客户服务和IT团队应该使用简单的工具来提供反馈,以描述哪些词汇不匹配。 在更高的层面上,PagerDuty公司的反馈系统为用户提供了用于合并和拆开警报中的词汇组的众多选项。这只是一个抓取选项,可将这些词汇组从某一组中移入或移出;本质上表示,某些项彼此属于同一组,但另一项则不属于。 另一个不太复杂但功能同样强大的产品可能只需要几个简单的赞成和反对按钮。 用户基本上可以表示赞同某一匹配,或指出该过程中存在的缺陷。
任何事情都可能让客户感到沮丧和失望,就像在客户服务部门工作过的人会告诉您的那样。在这些不可预测的情况下改进工作,这需要在问题出现时尽快地学习、了解和解决问题。最初的太空集成事件智能和应急响应解决方案是通过观察数字信号和人类响应行为,将机器与人类遥测技术相结合。 (编辑:济南站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |