5G新基建繁荣发展,AIOps使能服务夯实智能化运维基础


一、中国经济发展步入数字化新时代


2020年5G成为了中国经济发展的关键词,与5G新基建相关的物联网、车联网、人工智能、大数据中心等词霸屏科技圈热搜。在5G新基建浪潮之下,中国经济的发展步入数字化新时代。如果说新基建是数字经济发展的根基,那么5G在其中发挥的作用就是以点及面的广泛覆盖。不夸张的说,5G在新基建中起到了至关重要的作用。
图片

5G商用迎来了发展元年,数字化时代进入加速发展阶段。在这样的大环境下部分行业场景数据得到了极大丰富,比如IoT大规模落地后采集数据更为便捷,机器学习、深度学习、知识图谱、因果推理等算法与模型的也在逐步完善,借助GPU等分布式并行计算架构飞速发展,让普惠算力更易于获得,在数据、算法、算力这三个限制AI技术发展的方面取得长足进步后,AI技术也羽翼渐丰,潜移默化的融入到了各行各业,其创造的价值也越来越多。
图片




二、AIOps是企业智能运维转型趋势


随着利好一波又一波袭来,呈指数增长的需求让不少企业面临着更大的压力,高速发展的同时内耗也更为严重。网络问题复杂化与业务质量高要求成为了数字经济时代两大挑战,运维能力能否跟得上业务发展的脚步成为了不少企业在管理上的痛点,也成为了决定电信网络能否持续发挥效能的关键因素。

我们都知道网络运维能力是否强势,直接影响着企业生产力是否高效。但就目前的现状整体而言,网络运维面临着问题被动发现和故障根因定位难两大问题。据数据统计,75%的问题由用户发现,运维工程师花费90%的时间定位问题。那么,再细化到各个行业首当其冲的问题就是,相对应专业领域的运维系统开发周期长,且能够达到流程自动化,形成定制化优质解决方案的技术壁垒相对较高。

如果以AI人工智能技术和网络运维相结合,能碰撞出怎样的火花呢?这样的结合就是我们今天要说的AIOps。

图片

AIOps(Artificial Intelligence for IT Operations)即智能运维,AIOps将AI应用于运维领域,基于已有的运维数据(日志、监控信息、应用信息等),充分利用人工智能的优势来进一步解决自动化运维没办法解决的问题。


下面我们从AIOps智能运维技术在企业园区网络的应用案例来了解下,带来了哪些新的变化。




三、某大型企业园区AIOps智能运维实践


某大型企业园区包含了生产产线、员工办公区。园区的生产区域引入了5G网络,以及AI行业解决方案来提升制造场景的生产效率、产品良品率,优化生产流程。借助5G网络增强移动宽带(eMBB)、超高可靠与低时延通信(uRLLC)、海量机器类通信(mMTC)等特点,以及人工智能技术在产品质检、生产线和仓库资源调度的应用,来提高生产线自动化与智能化程度。同时企业园区内有众多部门和合作伙伴办公区域,使用WIFI网络,来提升工作沟通和协作效率。

图片

使用5G园区网络和AI行业解决方案后,为园区的生产运营带来了多方面的提升。首先在生产线,通过AI边缘质量检测,5G 端边云协同,实现质检从“本地计算”到“边缘计算”AI迁移,降低成本增加智能管控。单一重复性工作无需过剩人员消耗,智能化流水线让设备采购成本大幅减少,其次,自动化智能化系统同时协同仓储区域调度,无需人工核查出厂产品计件。从原材料进入园区到生产线再加工再到产品质检、仓库存储、产品出厂形成流程化智能化管理,减少人工核验所带来的人工成本,缩短产品从加工生产到仓储销售所耗费的时间成本,进一步提升产品利润率。

当然,在这样自动化智能化的园区中网络形态多样复杂,有无线WIFI网络,也有5G通信网络;覆盖的设备也从行业设备到视觉检测设备等多种多样,这一体系的构成涉及接入点AP、接入/核心交换机、防火墙、接入控制器AC、小站、宏站RRU等等。
图片
这样复杂的智能化园区,大量的生产设备和器件都通过5G通信网络互连。为了保障生产连续性、生产安全和质量水平,对网络故障处理和恢复时长的要求就相对较高,发生故障必须尽快恢复,以及定位和解决。然而,以往人工解决故障已支撑不了园区的高要求。那么,网络运维人员如何提前预警、快速根因定位,实现高效智能化园区维护呢?

下图是针对该园区网络智能运维系统解决方案全景图:
  图片
首先,AIOps将5G2B园区的网元上报的KPI做异常检测,进行故障识别。接着,结合KPI告警,完成故障定界定位,并分析故障影响以及受影响的业务。然后,自动进行故障分类和诊断推荐。同时,AIOps还可视化展示运维监控大屏,运维人员可以在一张屏预览KPI异常监控、故障看板、故障详情等,大幅提升了运维管理效率。

我们从园区网络运维部门员工小X的一天工作来直观感受下智能运维带来的变化。

运维员工小X周一9点上班,来到办公室,查看运维监控大屏,一切正常。上午10点小X收到KPI异常提醒短信,查看运维大屏,观察到有KPI异常显示,点击其故障详情发现,是某台RRU设备出现故障无法正常使用,按照设备故障智能切换策略,园区网络管理系统已启用该区域备用设备,网络未出现断连等情况。根据系统提示的故障修复推荐,小X及时知会了该设备所在区域的本地运维人员,前往替换设备,恢复了备用资源。下午2点,园区购置的一批IoT生产线设备到货,需要接入园区系统网络,小X使用AIOps使能服务的数据接入能力,将新设备的KPI、告警、日志等运维数据快速接入到监控大屏中展示,对于特别需要关注的一类KPI指标采用界面配置方式,基于AIOps原子服务能力配置出波动性检测精度更高的定制监控大屏,实现了实时监控运维。


四、华为AIOps使能服务降低开发门槛,加速AI应用落地客户生产系统


AIOps使能服务降低开发门槛,零编码定制场景组合应用,支持合作伙伴快速开发行业AI应用。华为支持通用接口采集,如SFTP,FTPS,Kafka,RESTFul等,为各行业合作伙伴快速接入平台提供最大的便捷性。华为提供丰富的原子能力,并采用自主研发+生态合作相结合的方式,提供数字化基础组件,提高AI应用开发效率,针对不同行业在不同场景下的实际需求组建快速定制化开发专属解决方案。与此同时,华为沉淀了10+开箱即用的智能APP,覆盖运营商网络、园区网络、DC网络和IT应用等应用领域。让企业从运营管理的源头开始多场景实现流程化智能化,提高企业管理运营效率。

华为AlOps使能服务作为智能运维AI能力引擎,AI技术优势与华为本身在电信领域的专业优势相结合,为运维系统智能化发展提供了高效便捷的智能化数字平台。同时华为也以一贯拥抱合作伙伴的开放包容的心态,紧密的联系着各界合作伙伴。降低AI应用开发门槛,加速客户生产系统AI应用的落地,加速5G新基建发展进程,成为了华为AIOps使能服务诞生的初衷,也是其一直秉承的理念。
(完)