金融机构大模型进阶:现有算力资源面临诸多挑战大模型表现出的强大理解、生成和推理能力,让各行各业开始探索其落地应用。 中关村金融科技产业发展联盟专家委员会主任委员周延礼在公开场合表示,随着深度学习和人工智能算法的发展,算力的不断提升以及数据的积累,人工智能与各行各业逐步结合、融合发展,成为新兴经济发展的重要力量。 结合企业的具体实践,科技界人士普遍认为,在当前探索可研和试点应用阶段,企业一般从大模型训练和微调入手,而基于大数据量、大规模参数进行的大模型训练,需要消耗大量算力资源。可以说,算力日益成为数字经济的新型生产力,作为算力的重要组成部分,存力的价值也日益凸显。 金融机构落地大模型的关键点是什么?存力价值如何提升?根据《金融行业先进AI存力报告》(以下简称《报告》),构建可用、可信、可控的先进存力,是金融行业落地大模型的“必答题”。 算力集群存在“木桶效应” 算力、数据和算法是大模型落地应用的三大支撑要素,其中,算力需求最先迎来爆发。 目前,银行、保险、证券等金融机构尤其是头部金融机构已经开始落地大模型场景应用,并自建大模型能力。据了解,大模型的落地应用必须依托由高性能计算芯片、存储和网络共同构成的大规模算力集群,对此,金融机构也在进行重点布局。 据中国工商银行软件开发中心高级专家刘承岩介绍,工商银行在算力方面已经建成了可以支持千亿模型训练和推理的算力集群,引入了千亿模型的算法。 需要注意的是,算力集群也存在“木桶效应”,其中,存力的重要性往往被忽视。《报告》提到,大模型训练等场景对于存力提出了一系列新挑战,而存力也往往容易成为短板,制约算力效能发挥,成为大模型落地过程中潜藏的风险。 简单来说,如果存储和网络性能无法支撑大规模的数据存储、读写和传输,高性能计算芯片无用武之地,价值也将大打折扣。 对于存力的发展,相关政策已有着墨。2023年10月,工业和信息化部等六部门联合印发《算力基础设施高质量发展行动计划》提出“加速存力技术研发应用”,围绕全闪存、蓝光存储、硬件高密、数据缩减、编码算法、芯片卸载、多协议数据互通等技术,推动先进存储创新发展。 满足存力提升需要 补齐短板,重视存力的提升,与大模型落地应用场景密切相关。 根据相关调研结论,金融行业典型的大模型应用场景包括数据分析、智能问答、智能客服、数字营业厅、智能投顾、智能投研、营销内容生成、产品推荐、智能风控等,部分场景已进入试点应用阶段。 面对复杂的应用场景,大模型作为变革性技术,需要实现能力内化,金融机构在应用场景中优先调用了自有大模型,并对其进行训练和部署,模型参数量往往在千亿级。因此,对于大模型落地应用走在前列的金融行业而言,AI算力建设颇具挑战。 “中国人保在大模型研究和应用场景落地过程中,感受到最大的限制并非是技术问题,而是算力资源严重不足。” 中国人民保险集团科技运营部总经理刘苍牧坦言,“在国产化算力尚未强大的当下,这对我们持续开展大模型研究和推广应用是一个巨大的挑战。” 《报告》认为,在重视大模型能力建设的背景下,金融机构必须构建起坚实的智能算力基础设施,以支撑大模型的高效训练和部署。作为AI算力基础设施的关键组成部分之一,构建先进存力的着力点在哪里? 《报告》称,金融机构对于AI先进存力的需求可以总结为三方面:可用、可信、可控。具体来看,在可用方面,金融机构要满足大模型场景对于存力的高吞吐、高IOPS、高带宽、低延时的极致性能要求,提升算力资源利用率;在可信方面,在满足以上极致性能要求的前提下,金融机构在先进存力建设中还需要考虑信创适配问题,同时,破解国产硬件性能瓶颈;在可控方面,金融机构需要尽可能降低成本,在采购存储系统时,保证自身大模型能力建设的自主性和灵活性。 加强跨界合作 业内人士认为,大模型时代的到来将推动新一轮算力基础设施建设,先进存力是其中至关重要的组成部分。 《报告》提出,相比算力、网络可以通过直接采购成熟产品服务快速形成能力,软硬件高度融合且更具开放性的存力建设具有更大的挑战性。金融机构应当提升对存力建设的重视度,同时在算力基础设施建设中进行前瞻性的统筹规划,做好存力与算力、网络的匹配,避免出现存力短板,阻碍大模型落地进程。 “大模型算法技术门槛高,底层算力资源需求大,必须借助相关产业公司的技术和算力共同开展大模型的底座研究和训练。”刘苍牧表示,智能前沿技术如通用大模型,在底层算力算法技术储备方面的门槛极高,金融机构必将积极开展跨界合作,充分发挥第三方机构的技术先发优势,与自身的业务场景和专业知识相结合,共同打造智能金融生态圈,实现优势互补和互利共赢。 据了解,目前业内已有商业银行、证券公司与科技企业在大模型算力基础设施建设方面有所合作。 |
|