首页 >运维 >linux运维 >如何处理影响实例运行状态的有计划或非预期事件

如何处理影响实例运行状态的有计划或非预期事件

坏嘻嘻
坏嘻嘻原创
2018-09-19 09:37:561717浏览

本文在介绍如何处理影响实例运行状态的有计划或非预期事件的基础上,重点探讨了其具体步骤,本文内容很紧凑,希望大家耐心学习。

系统事件

系统事件是影响实例运行状态的有计划或非预期事件。特指因探测到更新维护、违规操作、系统故障、软硬件故障、因预付费即将到期或账号欠费时,发生的重启、停止或者释放ECS实例等操作的事件。

概述

实例是您构建业务应用的核心基础组件,当您完成了实例选型、购买、初始化配置并开始部署业务后,实例的健康状态对于您的业务连续性和系统可靠性有关键作用。为提升系统可靠性、系统性能和安全防护能力,ECS会主动对实例所宿的物理服务器做日常维护并修复潜在的系统故障。当探测到物理服务器出现故障或者隐患时,ECS将实例在线热迁移到健康的服务器,以保持实例的健康运行状态。这些维护是日常维护。日常维护有别于系统事件,日常维护通常是无感知完成的,不会发送维护通知,也不对实例造成影响。

发生系统事件时,ECS及时给您发送通知、应对措施和事件周期等信息。对于有计划的系统事件,会提前告知该事件对实例的影响和预计执行时间点等信息。您可以在执行系统事件之前及时备份数据、做好应用层面的准备进而防备对业务的可靠性和连续性的潜在影响。对于已处理的系统事件,您可以查询过去两个月内实例的历史系统事件,获取故障诊断和复盘分析数据。

使用限制

除已停售的实例规格族之外,例如c1、c2、m1、m2、s1、s2、s3和t1等,所有的实例规格族均支持系统事件功能。更多详情,请参阅实例规格族。

事件类型

系统事件类型如下表所示。

微信截图_20180919093132.png

事件状态

系统事件的生命周期中,有如下事件状态。

微信截图_20180919093143.png

事件窗口

系统事件有如下窗口期:

用户操作窗口期:系统事件计划发起到执行之间的时间段。通常系统维护相关事件用户操作窗口期为24~48小时,预付费实例即将到期而停止的操作窗口期为7至15天,账号欠费而停止的操作窗口期通常小于1小时。

您可以根据该事件对业务的影响情况,选择推荐的应对方式提前修复系统事件,或者等待执行默认应对动作。对于ECS主动修复系统故障触发的系统事件,ECS根据系统维护操作计划安排提前一段时间向您发送事件通知。

事件执行窗口期:若您没有提前应对系统事件,修复故障类系统事件通常会在进入事件执行窗口期的6小时内自动完成、因计费问题引发系统事件实例会被立刻停止、经典网络类型实例会在7天后被释放以及VPC类型实例会在15天后被释放。随后您会收到系统事件的执行结果。

微信截图_20180919093153.png

说明

对于突发故障或者违规操作等非技术因素导致的非预期系统事件,通常不会存在用户操作窗口期,只有短暂的事件执行窗口期。您可以查询历史系统事件用于故障诊断、原因分析或数据复原。

查看系统事件

如果存在有计划的系统事件,ECS控制台待处理事件按钮上会出现显著标示提醒您查看。

登录ECS管理控制台 。

在左侧导航栏里,单击概览。

在概览 页的常用操作区域,单击待处理事件。

单击系统计划事件页面,您可以看到实例ID、地域、实例运行状态、事件类型、推荐操作等相关信息。您可以在操作列执行需要的操作。

API操作:DescribeInstancesFullStatus查询实例的系统事件。

查看历史系统事件

在全部事件页面,您可以查看过去两个月内发生的全部系统事件记录,为故障诊断和复盘分析提供数据支撑。

登录ECS管理控制台 。

在左侧导航栏里,单击概览。

在概览页的常用操作区域,单击待处理事件。

在左侧导航栏中,单击全部事件。在全部事件页面,单击系统计划事件 > 实例,查看实例ID、事件类型和事件状态等相关信息。

API操作:DescribeInstanceHistoryEvents查询历史系统事件。

订阅事件通知

所有系统事件均可以通过云监控配置报警规则,当事件发生时会及时通知您。更多详情,请参阅 云监控 文档云产品系统事件监控。

应对建议

您可以通过控制台操作或者API调用应对系统事件。从系统事件出发管理ECS,可以提高您对ECS的底层感知能力,优化ECS实例运维。

微信截图_20180919093210.png

以上是如何处理影响实例运行状态的有计划或非预期事件的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn