“蜂鸟”云原生智能研运一体化平台实践

  • 2022-04-28

  • 来源:金融电子化

随着数字化时代的到来,证券行业金融科技蓬勃发展。构建敏捷化研发体系,建立强大的IT研发平台,提速金融科技技术能力建设,以快速响应市场需求和用户诉求变得尤为紧迫和重要。国信证券研发了“蜂鸟”云原生智能研运一体化平台,实现了敏捷开发、持续交付和智能运维的一体化运营,为持续敏捷交付提供了坚实技术底座。该项目有效带动金融业科技工作积极融入云原生浪潮,助推数字化转型。

 

案例背景

国信证券是行业前八家创新试点证券公司之一。公司以“金融科技,科技创新”为主导思想,不断推进数字化转型。为响应快速增长的金融业务和丰富多彩的金融创新,国信金太阳手机交易系统采用了敏捷开发模式和微服务架构等前沿技术。业务微服务改造后,使用传统小型机、物理机、虚拟机等载体方式进行业务发布已不是最佳方案,具体体现在以下几个方面。

 

一是传统方式下,上线一个业务系统从申请资源、升级补丁、部署业务、网络开通到业务发布上线等至少需要3~5天时间。而通过基于容器技术的云原生DevOps可以实现持续交付、敏捷部署,将交付效率提升至数分钟级别。

 

二是业务使用物理机、虚拟机部署,要以天或小时级别进行扩容上线,无法根据业务实时负载进行秒级动态弹性伸缩。需要一种灵活性更强、粒度更细的资源管理方式,快速适应灵活多变的业务负载。

 

三是按监管要求,证券交易的核心系统需要在“两地三中心”进行多活部署,以满足业务高可用、高可靠的运行服务能力。开源的容器管理平台无法做到多数据中心、多集群、多分区的统一管理。因此,需要一套满足公司要求的容器多集群统一管理平台,让业务可以灵活地部署在多个数据中心机房,满足跨区域、跨平台、甚至跨服务商之间的规模化部署能力,最大满足业务高标准运行和服务保障。

 

因此,为了高效支撑业务快速迭代上线并保持与时俱进的IT系统,亟需在企业内部建设一套统一、标准化的云原生容器运行和管理环境。

 

平台技术架构和创新点介绍

1.技术架构设计介绍。“蜂鸟”平台技术架构设计包含有基础架构层、平台管理层、业务服务能力层。

 

(1)基础架构层:基础架构层南向主要由基础的计算资源池、存储资源池和网络资源池组成,考虑到金融证券复杂的业务场景和网络架构,“蜂鸟”平台基础架构层必须兼容公司现有基础设施,在平台的基础架构层做了大量的定制开发工作。基础架构层之上则是容器管理平台,采用云原生Kubernetes技术框架,提供多云异构计算的统一管理门户。

 

(2)平台管理层:容器平台管理层采用Docker引擎、Kubernetes编排为核心技术,针对公司复杂的网络环境,定制开发一套符合公司管理规范的集群分区、网络分区和租户管理等功能;同时对接了公司的CMDB磐石系统、单点登录系统、运维大数据平台等,实现了与现有“监管控析”一体化运维工具的统一管理,提升“蜂鸟”平台的管理和业务运维能力。

 

(3)应用服务层:应用服务层以分层化、模块化的方式,为上层业务提供了所需要的工具集合,赋予微服务业务研发和运维所需的云原生工具。

 

2.创新点介绍。

(1)与国信自研微服务框架和流水线深度融合:融合微服务、流水线的DevOps管道,减少了开发人员申请资源、搭建环境、管理设备、部署软件等精力和时间,打通开发、构建、测试、部署和问题定位,支持应用编排和一键部署到测试、预发布、生产等环境,新业务开发周期从原来的几周时间,缩短至小时级别的交付速率。

 

(2)与公司“监管控析”一体化运维平台全面融合:与ITSM平台全面打通,变更发布满足ISO 20000 IT服务管理体系标准;容器对象全部纳入CMDB,实现IT资源在容器环境与非容器环境的统一与标准化管理;打通服务监控、事件管理、日志采集、运维大数据、调用链跟踪等故障定位工具,与运行监控体系全面集成,打造云原生智能运维一体化平台。

 

(3)支持“两地三中心”多集群的统一调度和集中式管理:证券交易的核心系统需要在“两地三中心”进行多活部署,以满足业务高可用、高可靠的运行服务能力。平台实现了多集群统一管理,一站式运维,让研运一体化交付的应用可以灵活地部署在多个数据中心机房。

 

(4)深度融合金融科技,智能化提升资源效能和应用可用性。一是符合行业特性的弹性伸缩策略。“蜂鸟”能够根据业务负载,自动秒级弹性伸缩,并针对证券业特点定制了基于交易日历时段的弹性伸缩策略,轻松应对业务流量高峰。二是高效的资源调度利用能力。国信证券需要依据基础设施、容器平台、应用的多个场景进行优化,自研了一套调度机制,通过NUMA感知技术加快了多处理器之间的协作效率,让内存访问的效率加快,让应用可以使用最少的资源来提供优秀的性能。三是精准的故障发现与自愈能力。与公司“监管控析”一体化运维平台全面融合,具备更精准的故障发现智能检测策略,可自动对运行应用故障进行准确判别、隔离和恢复,故障处理速度显著提升。

 

(5)集成丰富安全工具链,全面实现研运安全一体化(DevSecOps):随着敏捷开发运维的流行,如何在快速发布上线的研发流程中保证安全成为了挑战。为了建立一种可以持续、灵活合作的安全机制和流程,引入研运安全一体化工具,集成丰富的安全工具链,实现“安全左移”,即更早地将安全性集成到代码持续构建与发布的过程中,比如漏洞扫描、配置检测、资产清点等能力,确保云原生应用在镜像构建、镜像发布、容器运行时的安全性。

 

应用价值

国信证券“蜂鸟”云原生智能研运一体化平台上线后,社会效益、经济效益、研发效益和管理效益明显。

 

1.响应国家“十四五”规划和2035年远景目标。国家“十四五”规划将“加快数字发展建设数字中国”作为独立篇章,数字中国建设被提到新高度。云计算是数字经济重点发展产业之一,云原生作为云计算的再升级,已经成为云计算未来的发展方向,是企业实现数字化转型的最短路径。国信证券通过建设蜂鸟云原生研运一体化平台,加快完善数字基础设施,提高云原生基础能力、安全和运维管理水平,切实提升科技赋能业务开发,驱动数字化发展战略,积极响应国家“十四五”规划和2035年远景目标。

 

2.提升研发效率,赋能数字化转型。“蜂鸟”云原生智能研运一体化整合了Jenkins、Gitlab、SonarQube等开发工具链,提升了开发流水线快速编译和通过率的速率,减少了开发人员从传统的申请资源、搭建环境、管理设备、维护传统软件架构等精力和时间。新业务开发周期从原来的几周,缩短至小时级别的交付速率,业务迭代上线速度提升了55%,降低了软件开发费用。平台的智能调度和机制弹性,可以最大限度释放基础架构服务能力,基础资源利用率提升了62%以上。

 

“蜂鸟”平台高效的资源调度利用能力和精准的故障发现与自愈能力,帮助运维人员节省了日常打补丁、升级等重复性工作,赋能数字员工建设,降低50%以上的运维工作量,每年可节省大量人力成本,实现降本提效。

 

“蜂鸟”平台打造了券商行业内部的“云原生基础设施”,夯实数字化和智能化能力,为全面数字化转型继续赋能。

 

3.获得多个外部奖项认可,行业内处于领先地位。“蜂鸟”平台积极参与金融科技成果评选,并获得多个外部奖项,包括:2020年“金融科技发展奖”三等奖,第六届“云鹰奖”卓越项目奖,深交所金融科技课题三等奖,信通院可信云用户最佳实践奖。项目还顺利通过中国信息通信研究院《研发运营一体化(DevOps)能力成熟度模型》持续交付3级评估认证,达到国内领先水准。国信证券也是第三家通过持续交付3级评估的券商,行业内处于领先地位。

 

国信证券不仅在公司内部全面拥抱云原生,还积极参与行业交流,带动金融业科技工作积极融入云原生浪潮,加速数字化转型。

  • 科研/技术服务
  • 案例
  • CTO
  • CIO
  • 供应链/生态
  • 证券
  • 金融
  • “蜂鸟”平台
  • 国信证券
  • 云原生
  • 金融科技

推荐

我要评论

相关文章