微众|全年产品可用率99.9985%,微众银行智能运维首战告捷

_原题为 全年产品可用率99.9985% , 微众银行智能运维首战告捷
近日 , 由清华大学、中国移动、中国计算机协会互联网专业委员会主办的第三届国际智能运维(AIOps)挑战赛决赛在杭州举行 。 来自全国产学研各界的141个企业与高校团队、673名选手报名参赛 , 经过五个多月的激烈角逐 , 微众银行智能运维团队首次参赛便挺进六强 , 最终获得全国季军 。

微众|全年产品可用率99.9985%,微众银行智能运维首战告捷
文章图片
据了解 , 国际智能运维(AIOps)挑战赛已经举行两届 , 旨在加强工业界与学术界的交流 , 促进AIOps技术的迅速发展和落地 。 此次挑战赛的课题是“微服务”应用系统的故障排查 , 是微众银行过去两年在智能化领域主要研究的方向 。 微众银行基于自主可控的分布式架构搭建 , 运维该架构最大的挑战便是微服务的稳定运行 。 当应用系统异常时 , 如何快速定位及恢复 , 一直是运维人员亟待解决的首要问题 。 在此次复赛阶段 , 各参赛团队需每晚22点上传运维数据 , 在最短时间提交检测结果 , 对参赛队伍的检测速度和检测准确率都提出了极大挑战 。 微众银行的代表团队最快3秒提交结果 , 真正做到了秒级识别和秒级定位 , 这也是对其两年来智能运维系统建设的成果检验 。
作为首家互联网银行 , 微众银行自上线之初即承担着如何降低IT运维成本、降低金融服务门槛以便让更广泛的用户享受到普惠金融服务的使命 , 而利用人工智能、大数据等创新科技提升智能运维水平 , 正是提升运维效率、降低运维成本的有效手段 。
据了解 , 2018年微众银行开始应用机器学习算法进行运维智能化建设 。 借助智能化运维手段 , 微众银行实现了由机器人管家负责资源调配 , 仅需不超过10名运维人员就可以管理万余台服务器 , 大幅度降低IT运维成本 , 减少人为可能造成的失误;运用神经网络技术 , 通过系统自动学习 , 无需人工介入即可实时精确的发现指标异动 , 减少95%的监控配置工作量;应用机器学习、神经网络与知识图谱技术 , 大幅提升异常检测准确率 , 异常识别准确率提升至96%;应用异常根因定位(RCA)方法论 , 在异常发生的1分钟内根因定位系统即可给出异常根因的方向和结论 , 根因定位准确率高于80% , 并自动通知运维人员 , 大幅减少异常处置时间 , 平均通报时长仅12.6分钟 。 在疫情期间 , 异常根因定位更支持运维团队实现了部分事件手机远程在线处理 , 有效提升了运维效率 。
智能化的运维系统有力保障了银行信息系统的稳定运行、大大降低了运维成本 。 2019年 , 微众银行有效客户数逾2亿 , 单日交易笔数近6亿 , 消息峰值 24万/秒 , 达到国有大型银行同等规模水平 。 在如此高并发高交易压力下 , 全年产品综合可用率达99.9985% 。 得益于系统的稳定性和高可用 , 2019年微众银行户均IT运维成本仅3.5元 , 约为国内银行业界的10% 。
【微众|全年产品可用率99.9985%,微众银行智能运维首战告捷】在数字技术日新月异的当今 , 运维智能化重要性愈发成为工业界的共识 , 未来 , 微众银行将会继续着力推进AIOps落地探索和实践 , 为普惠金融业务的进一步发展提供可靠的基础支撑 。