当下,人工智能技术快速地发展并逐步渗透进入生产生活各领域,深入的影响着社会及产业的运行。同时作为新质生产力发展的重要驱动,AI发展的核心要素——多元化模型的开发与应用则构成了有关技术的核心竞争力来源。
作为一家深耕数智技术19年的企业级软件厂商,国双早在2013年就积极在产品发展过程中引入人工智能,郑重进入以自然语言处理及语言模型、知识图谱等前沿领域的认知智能领域研发技术。值得一提的是,国双数智底座现已积累高达30多万个开箱即用的智能模型以及超过10亿的图谱知识节点,并可轻松支撑大规模的公司集团内部日常TB级的数据流转。
当然,虚实融合的技术产业落地离不开在探索中持续创新,敏捷迭代、持续交付和持续部署则是不可或缺的必由之路,为应对这样的挑战,2021年国双内部启动了DevOps建设,强化自身产品及团队对大型公司集团数字化、智能化项目的交付和部署能力支撑。如今随大规模的公司集团智能化需求的爆发,人工智能技术资产也在国双内部得以高速累积。为避免研发成果流失,并同步提升模型跨项目、跨场景的存储与复用,以及模型市场的共享效率,国双产品专家团队决定通过MLOps的实践方法,新增源运行参数跟踪、模型注册库功能,以强化国双数智底座模型全生命周期的管理能力,以此对大型公司集团客户所亟需的智能化落地及纵深发展提供更加强有力的支撑。
MLOps 的定义:机器学习运营(MLOps)是机器学习工程领域中的一项核心功能,它着重于简化机器学习模型从开发到生产的部署流程,并满足后续的维护和监控需求。
与 DevOps 类似,MLOps 同样需要数据科学家、DevOps 工程师以及其他 IT 利益相关者的紧密协作。其核心目的是对整个机器学习开发生命周期实施版本控制,从而确保模型的可追溯性、可重复性和可管理性。通过 MLOps,企业能够更高效地部署机器学习模型,快速响应业务需求,并持续监控和优化模型性能。
国双数智底座Gridsum COMPaaS产品负责人林航为此谈到:“业务中模型的落地并非一次性任务,而是需要经过一个持续且复杂的迭代更新过程。模型管理中心依托MLOps(机器学习运维)的实践,实现模型开发、运维与业务决策团队间的无缝连接,以构建模型全生命周期的管理体系,可以更好的对大规模的公司客户智能化应用的稳定运行做出保障。所幸在国双内部,我们研发及运营团队都深刻的认同和共识到了这个要点,并追求力保去构建好这样的协同。”
事实上,MLOps 在许多核心原则上与 DevOps 模式不谋而合。DevOps 通过实现快速、持续迭代的应用部署方法,明显提升了软件开发的效率和质量。MLOps 则在此基础上借鉴并扩展了这些原则,专注于将机器学习模型高效地应用到生产环境中,以更好的实现人工智能中的机器学习技术在产业场景中的融合落地。
应用落地才是人工智能研发技术的“最后一公里”,为此人工智能技术研发专家要面对所有的环节的挑战,包括目标定义、数据采集、数据清洗、特征提取、模型选择、模型训练、模型部署、模型监控等,其中任何一个环节出现一些明显的异常问题,都可能会影响算法和模型在最终业务中落地的效果,更可能会因为偏差造成不可估量的损失。
在这样的背景下,倒逼研发技术专家利用工程化技术去优化模型的自学能力,能够让模型保持持续更新迭代,并随着数据和业务的变化不断进行自适应,避免衰退,始终保持在最佳状态,为业务场景应用带来更好的效果和更多的价值,这并非易事,其实就是对国双的技术及产品研制团队提出了更高的要求。但国双团队坚持认为,在人工智能技术产业化时代,模型能力将从自然语言问答、业务推理、业务决策,逐步向创新设计、组织生产能力进化,机器学习技术、边缘智能技术将越来越多应用到所有的领域,构建一个稳定可靠的机器学习系统将变得至关重要,是所有数智化转型企业一定要面对以及必须要解决的挑战。
发展至今,受益于DevOps和MLOps模式的贯彻,通过与数十个行业领域的场景融合实践,国双数智底座Gridsum COMPaaS形成了具备200余项平台能力、数百项技术模块的丰富能力。发端于坚实的海量分布式大数据处理,纵深于以数据要素为根基的产业智能化研发、落地和应用,国双科技的产品能力版图正日益得以持续的完整和进化。返回搜狐,查看更加多