商汤发布“日日新”大模型体系,含“商量”“秒画”“琼宇”“格物”

 
日期:2023-04-10 22:32   点击数:1596   来源:澎湃新闻   共有条评论
分享到
 

       4月10日,商汤科技董事长兼CEO徐立在商汤技术交流日上发布“日日新”大模型体系,取自《礼记·大学》,汤之盘铭:苟日新,日日新,又日新。“日日新”大模型体系包含自然语言生成、照片生成服务、感知模型预标注、模型研发。商汤发布中文语言大模型应用平台“商量”,1800亿参数中文大语言模型支持超长文本知识理解,支持问答、理解与生成等中文语言能力,可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。

      现场演示了中文语言大模型写作广告语、续写儿童故事、编程等。编程核心功能包括代码补全、扩写、翻译、重构、修正,以及注释生成代码、复杂度分析、测试用例生成等。徐立表示,内部实测代码编写效率提升62%,HumanEval测试集一次通过率40.2%。下一代软件开发范式是AI for AI,代码=80% AI生成 20%人工。

      超10亿参数自研文生图生成模型“秒画”,支持二次元等多种生成风格。单卡A100支持,2秒生成1张512K分辨率的图片。用户可基于单卡A100自训练。基于平台发布的模型,可设置toB服务API(应用程序编程接口),结合商汤大算力对外提供服务。

      此外,商汤科技对外发布3D内容生成平台“琼宇”(场景生成)、“格物”(物体生成),基于3D内容生成技术对空间和物体的复刻与交互。100平方公里城市级生成,“琼宇”用时2天,具有厘米级重建精度,还原场景的真实细节和光照效果,应用场景涵盖城市及园区数字孪生、建筑设计、影视创作、文旅和电商等。

      徐立对澎湃科技(www.thepaper.cn)表示,在这个时间点推出大模型体系,是希望吸引更多下游用户,自然语言模型能够把各种垂直类的任务串联起来,用多模态混合的模式迭代行业场景。通过提供新的多模态训练框架,训练下一个阶段的多模态大模型,通过细分场景端到端的迭代和应用,帮助多模态大模型的发展。目前已有8家商业客户使用商汤多模态训练框架进行大模型训练。“我们希望我们的大模型体系能够帮助行业生产出下一代最领先的多模态模型,并且升级性能。”