腾讯公布大模型最新进展
腾讯披露了大模型研发的最新进展。不过,不是类ChatGPT的C端通用大模型,而是To B的行业大模型。
今年2月初,有消息称,针对类ChatGPT对话式机器人,腾讯成立了混元助手项目组,由腾讯首席科学家张正友带队研发。一季度财报会议上,腾讯总裁刘炽平透露,“混元模型构建进展顺利”。此后便鲜有消息。
相较混元的低调,腾讯率先公布了行业大模型的研发进展。依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务,助力客户构建专属大模型及智能应用。
事实上,自从ChatGPT掀起大模型热潮,如何将大模型能力应用到自身的行业和场景里,以及解决成本、数据、安全等大模型实际落地难题,成为行业关注的焦点。此前,百度、阿里等大厂已经官宣伙伴计划和工具链,声称要让每一个行业都能够用上自己的大模型。
与此同时,很多创业企业也马力全开,金融、教育、医疗、自动驾驶等多个垂直领域的公司都已相继传出要推行业大模型的消息。大模型的战事,已经开始从通用大模型卷向更加垂直的行业大模型。
通用大模型不一定是最优解
过去半年,百度文心一言、阿里通义千问、360智脑、讯飞星火等国内通用大模型产品纷纷问世,不少C端用户在试用的同时,许多企业管理者也在思考,如何把大模型技术应用到自己企业场景中。
“虽然大家对通用大模型期待很高,但它不一定是满足行业场景需求的最优解。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生如此表示。比如,它不一定懂行业的专业术语,不了解企业内部的独特情况,回答会比较虚、比较笼统,偶尔还会一本正经地胡说八道,信息也不够及时。
目前,通用大模型一般都是基于广泛的公开文献与网络信息来训练的,网上的信息可能有错误、有谣言、有偏见,许多专业知识与行业数据积累不足,导致模型的行业针对性与精准度不够,数据“噪音”过大。但是,在很多产业场景中,用户对企业提供的专业服务要求高,容错性低。企业一旦提供了错误信息,可能引起巨大的法律责任或公关危机。
汤道生认为,“客户更需要有行业针对性的行业大模型,再加上企业自己的数据做训练或精调,才能打造出实用性高的智能服务。企业所需要的是在实际场景中真正解决了某个问题,而不是在100个场景中解决了70%-80%的问题。”
另外,训练数据越多,模型越大,训练与推理的成本也越高。实际上,大部分的企业场景,可能也不需要万能的通用AI来满足需要。加上,安全和合规也是必要的考量因素。因此很多企业会选择与具备一站式行业大模型服务能力的云厂商合作,打造企业专属的行业大模型。
基于此,腾讯正在依托腾讯云TI平台打造行业大模型精选商店,为企业客户提供涵盖模型预训练、模型精调、智能应用开发等一站式行业大模型解决方案。
腾讯云行业大模型主打就是实用
从腾讯云MaaS全景图来看,腾讯云加大了大模型基础设施建设。
在技术底座方面,今年4月,腾讯云发布了专为大模型训练设计的新一代HCC高性能计算集群,采用最新一代的腾讯云星星海自研服务器,具备业界最高的3.2Tbps互联带宽,算力性能提升了3倍。
此外,腾讯云即将推出向量数据库(Tencent Cloud VectorDB),源自腾讯集团每日处理千亿次检索的向量引擎(OLAMA),单索引支持10亿级向量规模,更适用于AI运算、检索,数据接入AI的效率也比传统方案提升10倍。
平台层的核心是腾讯云TI平台,结合大模型技术,TI平台此次进行了新的升级,除了包含此前就有的数据标注、训练、评估、测试和部署等工具,还有升级后的 " 太极 Angel”,可以进行更优训练和推理加速。
最上层的MaaS是针对具体产品和行业推出的具体解决方案,除了包含行业大模型精调解决方案,还有针对细分领域的模型训练平台、各种应用平台以及具体的智能应用。
比如,基于文旅大模型打造的机器人客服。如果你问“端午节有哪些比较经济的旅游景点推荐?”基于通用大模型的客服机器人,只能给出一些简单的景点介绍和路线规划。但是,当用大量有针对性的行业数据来做模型精调之后,客服机器人的回答就变得更加细致,能够规划出每天的交通、景点安排,给出经济实惠的定制化推荐方案。
据腾讯云副总裁、腾讯云智能负责人吴运声透露,目前,腾讯云已经为传媒、文旅、政务、金融等10余个行业提供了超过50个大模型行业解决方案。
值得一提的是,除了与合作伙伴共创之外,腾讯云行业大模型还在腾讯企点、腾讯会议、腾讯AI代码助手等多款腾讯生态内头部产品中率先应用。
其中,腾讯企点基于大模型能力研发探索全新一代智能客服和企点分析AI助手,旨在全面提升企业的客服和数据分析能力。腾讯会议宣布即将推出覆盖会议全流程场景的AI小助手。腾讯云将推出新一代AI代码助手,用AI加持来重塑开发体验和团队能力,让开发者通过全新的人机协作,达到高效创作。
由此来看,腾讯云行业大模型走的还是实用路线。吴运声在接受媒体采访时也表示,行业大模型的核心在于根据客户需求制定相关的模型参数,而不是一味追求“规模大”或是“参数高”。
吴运声强调,希望能以最低的成本、最合适的模型和最好的服务把大模型真正做好,会在预算和成本可控的情况下提供最符合逻辑的模型,让其在场景中达到目的,解决问题,而不是关注几亿、几十亿、几百亿还是一千多亿这些参数数字。
腾讯多元布局大模型 行业大模型率先卷起来
与微软类似,腾讯采取投研并举的方式布局大模型赛道。
对外投资上,腾讯已经连投三家AI大模型企业。5月31日,北京深言科技有限责任公司发生工商变更,股东新增广西腾讯创业投资有限公司;6月2日,大模型创业公司MiniMax被曝完成新一轮2.5亿美元融资,腾讯参投;6月5日,王慧文创办的AI大模型公司光年之外被曝完成2.3亿美元融资,源码资本、腾讯投资等参投。
内部研发上,出于大模型落地的现实性考量,腾讯在通用大模型和行业大模型两个方向同步探索,这也是国内公司在大模型落地上达成的共识。
对于通用大模型,腾讯手中早有“混元”大模型,但一直没有推出具体的对话大模型产品。今年5月,在腾讯一季度财报会议上,腾讯总裁刘炽平透露,“混元模型构建进展顺利”。马化腾则表态,“不急于一时”。
相比通用大模型的低调,腾讯率先在行业大模型上行动起来,腾讯云目前已经可以提供超过50个大模型行业解决方案。而在此之前,百度、阿里等大厂已经官宣伙伴计划和工具链,声称要让每一个行业都能够用上自己的大模型。
大厂纷纷入局,行业大模型赛道也卷起来。但就目前来看,大多其实都还停留在讲概念、讲技术、进行内部测试或项目定制的阶段,在具体落地和商业化层面尚未实现质的突破。
汤道生说,“大模型只是开端,AI与产业的融合将绽放出创造力的未来。”腾讯等行业大模型还会带来哪些令人惊喜的落地产品或应用,值得期待。