AI热点资讯 - 一周回顾(12月30日-1月5日)

 
日期:2025-01-06 11:13   点击数:28   来源:   共有条评论
分享到
 

在过去的一周,人工智能领域发生了多项重要事件,涵盖技术创新、产品发布和行业动态。以下是对这些事件的详细回顾:


阿里通义千问推出Qwen-Agent框架


1月4日,阿里通义千问团队发布了全新的AI Agent开发框架——Qwen-Agent。该框架基于通义千问模型(Qwen),旨在帮助开发者利用模型的指令遵循、工具使用、规划和记忆能力,快速构建定制化的AI Agent应用。Qwen-Agent采用两层架构设计,底层提供语言模型和基础工具,顶层提供现成的智能体组件,开发者可以灵活组合这些组件,构建能够执行复杂任务的智能体。此外,Qwen-Agent还提供了浏览器助手、代码解释器、自定义助手等示例应用,供开发者参考和使用。为了降低使用门槛,阿里巴巴近期下调了API AI服务价格,并提供了DashScope云服务,方便开发者自行部署Qwen模型。Qwen-Agent框架还提供了GUI界面,开发者可以使用Gradio框架创建交互式网页演示,进一步提升开发效率和用户体验。


Meta开源“记忆层”技术,优化Transformer架构


1月3日,Meta宣布开源一项名为“记忆层”(Memory layers)的创新研究,旨在解决Transformer架构在处理大规模数据时的算力瓶颈。随着模型参数的增加,传统的查询方法需要遍历整个记忆层,导致效率低下且消耗巨大算力和时间。“记忆层”提出了新的高效查询机制,通过比较查询键与两个较小集合中的键,可以快速找到最相关的键,而无需遍历整个记忆层。这意味着在不增加算力的情况下,可以显著增加大模型的参数,从而提高模型的性能和效率。Meta的“记忆层”技术通过优化查询过程,使得大模型能够在更高效的环境下运行,为AI技术的发展提供了新的可能性。


智谱AI发布GLM-Zero-Preview推理模型


12月31日,智谱AI推出了旗下首个推理模型——GLM-Zero-Preview。该模型专注于增强AI的推理能力,擅长处理数理逻辑、代码和需要深度推理的复杂问题。与基座模型相比,GLM-Zero-Preview在不显著降低通用任务能力的情况下,显著提升了专家任务能力。在AIME 2024、MATH500和LiveCodeBench等评测中,其表现与OpenAI的o1-preview相当。用户可以在“智谱清言”中免费使用GLM-Zero-Preview,开发者也可以在“智谱开放平台”中通过API进行调用,进一步拓展其应用场景。


百度上线“AI搜”功能,提升搜索体验


1月1日,百度在网页端首页上线了“AI搜”入口。“AI搜”是基于百度文心大模型打造的桌面端AI搜索引擎,内容侧已经打通百度搜索引擎、百度健康、百度文库等内容生态,确保搜索结果的可靠性和权威性。“AI搜”主要提供话题探索、问题解决、决策辅助、知识答疑、主题研究、学习创作等功能,覆盖文生图、文生文、逻辑推理、多轮对话、智能摘要、AI修图等AI技术。此外,“AI搜”还提供了文心智能体入口,用户可以通过@方式与不同智能体进行交互,方便使用和创建智能体。百度“AI搜”的推出,标志着百度在AI搜索引擎领域的进一步发展,将为用户提供更智能、更便捷的搜索体验。


英伟达计划2025年推出Jetson Thor机器人芯片


据英国《金融时报》报道,英伟达计划于2025年上半年推出最新一代人形机器人芯片——Jetson Thor。英伟达机器人业务负责人兼副总裁Deepu Talla表示,物理AI领域和机器人领域的“ChatGPT”时代即将到来,市场已经到了“转折点”。他认为,当前生成式AI的爆发式增长以及通过模拟生成的环境,将推动甚至突破机器人市场的增长。在过去12个月里,英伟达已经能够结合生成式AI进行模拟实验。然而,英伟达目前正面临多家厂商的竞争,多家厂商也在减少对英伟达的依赖。据报道,今年2月,包括微软和OpenAI在内的几家公司均投资了具身机器人公司Figure AI。


我国首个通用具身智能机器人数据集发布


1月3日,由国家地方共建具身智能机器人创新中心与北京大学计算机学院联合打造的我国首个通用具身智能机器人训练开源数据集正式发布。该数据集对多种形态的机器人本体进行了数据采集,包含了两百多个不同任务的多类场景,旨在加速推动具身智能产业的发展。具身智能赋予机器人思考和执行复杂任务的能力,而高质量的数据集是训练此类机器人的关键。该数据集通过多种方式采集机器人数据,如操作机械臂、远程遥控设备、捕捉机器人动作等,以训练机器人模仿人类行为。


xAI的Grok 3模型预训练完成


1月3日,马斯克在社交平台X上透露,xAI团队开发的下一代大语言模型Grok 3的预训练已经完成。Grok 3的算力投入相比前一代的Grok 2提升了10倍。这一模型的训练依托于xAI在美国孟菲斯建成的超级计算机集群Colossus,该集群拥有10万块英伟达H100 GPU,是全球最强大的AI训练系统之一。

马斯克此前曾表示,Grok 3有望成为全球最强大的AI模型,与OpenAI的最新模型形成直接竞争。虽然他尚未公布具体的发布时间,但这一模型预计将在文本生成、推理、编程和多模态任务中展现出更强的性能。

Grok 3的研发反映了xAI在AI技术领域的雄心壮志,同时也展示了其与OpenAI等行业领先者竞争的潜力。业内人士预测,Grok 3的发布可能引发新一轮的大模型竞争,加速全球AI技术的发展。