Close

切实可靠的警报

Opsgenie 可确保您不会错过任何关键警报。通过与监控、派单和聊天工具深度集成,Opsgenie 可以将警报分组、滤除干扰因素,并通过多个渠道通知您,为您的团队提供必要信息,让您能够立即开始解决问题。


仪表板屏幕截图

多个警报渠道

大多数监控工具都是通过电子邮件发送通知的,但如果警报非常紧急,需要快速响应,电子邮件就满足不了要求。Opsgenie 使用多个沟通渠道(包括电子邮件、短信、移动推送和语音通话)来确保接收者能及时收到通知。

丰富警报内容

短消息往往无法传达足够的信息,让用户做出有效的决策。Opsgenie 警报可不仅限于几个字符!向警报添加可选字段,并附加图表、日志、运行手册等,进一步丰富警报内容,提供背景信息,让接收者能够确定正确的行动措施。

警报快照
工具

自定义警报操作

通过直接从 Opsgenie 应用程序执行适当的操作来响应警报。除了默认的警报操作(例如“添加注释”和“关闭”)之外,您还可以通过执行调查和纠正操作来响应警报。例如,您可以检测服务器的网络连接或重启服务器,或者通过单击按钮创建服务请求单。

组织节点图标

自动化操作

创建能够自动运行诊断或修复操作以响应传入警报的操作策略。通过与 AWS Systems Manager 或其他第三方自动化平台集成,Opsgenie 可在警报满足预定义的条件时触发您的响应方案。系统可以采取纠正操作,无需待命工程师参与,从而减少警报疲劳和 MTTR。

仪表板屏幕截图

警报自定义和分类

借助 Opsgenie,您可以重新格式化警报消息,使其易于理解和规范化,而不必考虑它们的来源。您可以使用附加信息来标记警报,还能轻松组织和筛选它们。


警报生命周期跟踪

Opsgenie 可提供每个警报的详细跟踪信息。警报活动日志显示与警报相关的所有活动——警报创建时间、通知对象、通知发送时间,以及接收者是否看到了警报或采取了任何操作。只要有可能,系统就会持续进行跟踪,无需特定的用户操作。

活动日志快照
通知屏幕截图

警报和通知策略

为了防止警报疲劳,系统会根据警报的来源、优先级或时间,以不同的方式来发送通知。Opsgenie 可灵活地根据警报的内容和时间来取消、延迟或加快发送警报。


心跳

如何知道您的监控系统正在工作并创建警报?Opsgenie 的心跳功能可通过检查监控工具是否处于活动状态且已连接,以及自定义任务是否按时完成,来确保端到端的警报发送。如果在指定的时间范围内未检测到信号,Opsgenie 会立即给您发送问题警报。

心跳监控屏幕截图

亲自体验可靠的警报功能