腾讯混元大模型亮相！实测上手，对话腾讯副总裁蒋杰

经验数据是什么意思_大数据优质经验介绍_数据和经验

智东西

作者 | 三北

编辑 | 漠影

“今天我们非常高兴地告诉大家，腾讯自主研发通用大模型混元正式向产业亮相。”腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生今日宣布。在腾讯一年一度的全球数字生态大会上，腾讯自研大模型的神秘面纱终于揭开。

汤道生表示，混元大模型目前已有超千亿的参数规模、超2万亿Tokens的预训练语料，自即日起通过腾讯云对外全面开放。

与此同时，腾讯也一并带来了混元大模型“全家桶”的最新消息：腾讯云、腾讯广告、腾讯游戏、腾讯会议、腾讯文档等超过50个腾讯业务和产品，宣布已接入腾讯混元大模型测试，并取得初步效果。

随着“百模大战”在我国打响，大模型在场景中的实战检验效果成为产业关注焦点。腾讯本次交出了什么样的“答卷”？作为2018年起就不断传出大模型进展的科技公司，腾讯对大模型有什么样不同理解和布局？

智东西记者抵达腾讯全球数字生态大会现场，与腾讯集团副总裁蒋杰进行了深入对话，并上手实测了刚刚亮相的混元大模型，从而对上述问题的答案有了更深入了解。

经验数据是什么意思_大数据优质经验介绍_数据和经验

腾讯集团副总裁蒋杰

一、混元大模型亮相：不止聊天

训练烧钱，百模大战，大家的期待是什么？

一开场，蒋杰就从这个产业聚焦关注的话题引出话头：“我们希望用大模型提高人们的工作效率，让人们从容享受休闲的时光。然而，大模型在现实世界实际场景中应用非常有限。大模型在容错率高、任务简单的休闲场景已经可用，而在更有价值的严肃场景、工作场景、专业场景，都无法大面积地胜任。为了解锁这样的场景，大模型需要更加可靠，且更加成熟地在复杂场景中胜任更多任务。”

针对这一行业普遍难题，腾讯混元大模型从可靠性和成熟性两个维度解题。

首先，在可靠性方面，蒋杰称混元大模型有效降低了大语言模型“幻觉”比例，相比主流开源大模型降低30%至50%。所谓“幻觉”，简单说就是大模型“胡言乱语”。为了确保大模型的更加可靠，我们需要减少模型胡言乱语的现象。

不同于业界采取加搜索、增强知识图谱等“外挂”做法，蒋杰称，腾讯在预训练阶段采取“探真算法”进行事实修正。比如，让混元写一篇作文，尝试论证关羽和秦琼谁的战斗力更强，它并没有像市面上一些大模型一样将历史事件、人物、时间张冠李戴。

大数据优质经验介绍_数据和经验_经验数据是什么意思

混元减少“幻觉”的例子

其次，混元提升了抗诱导能力，面对安全诱导类问题的拒答率提升20%。这也加强了大模型的可靠性。

为了提升模型可靠性方面，腾讯通过深度的优化让模型学会识别陷阱的问题去抵制诱惑。在实际应用中，比如当用户提出一个问题：怎么样超速最安全？不同于其他大模型提出怎样超速的建议，混元则会拒绝回答了这样不安全的问题。这正是因为其在训练中，通过强化学习的方法，让模型对不安全问题说不。

大数据优质经验介绍_数据和经验_经验数据是什么意思

混元抗诱导能力的例子

与此同时，在成熟性方面，混元大模型覆盖了短文本和千字级别长文本生成能力。当前市面上大模型在超长任务处理上很难实现。腾讯通过位置编码优化，提升长文的处理效果和性能，结合指令跟随优化，让产出内容更符合字数要求，从而提升超长文本的生成和续写能力。

大数据优质经验介绍_经验数据是什么意思_数据和经验

混元撰写长文的例子

此外，腾讯混元大模型也提升了逻辑思考能力，支持结合实际场景推理决策。在大模型训练中，一些团队会让大模型通过“死记硬背”的方式学会中小学的数学题。但是在现实生活中，“背题”人人都行，还需要让大模型具备理解上下文的能力。腾讯推出思维链新策略，有效强化模型对问题拆解和分步思考的倾向。

经验数据是什么意思_数据和经验_大数据优质经验介绍

混元逻辑推理能力的例子

可以看到，从行业痛点出发，腾讯正将混元大模型打造成一个具备强大的中文创作能力、复杂语境的逻辑推理能力、可靠的任务执行能力的通用大模型。

蒋杰称，混元经过了一系列的严格测评。在中国信通院的测评中，混元大模型在模型开发、模型能力这两项得到了当前的最高分；混元大模型在三大常见的测试集上表现非常强大。

数据和经验_经验数据是什么意思_大数据优质经验介绍

混元通过多项主流测评

但蒋杰指出，混元的目的不是在评测集上取得高分，而是要将技术运用到实践的场景，助行业去创新提效。

二、实测混元：实用级大模型在手边，视频、文档都已接入

按照腾讯的战略定位，混元大模型是“从实践中来，到实践中去”的实用级大模型。

蒋杰透露了混元大模型产品化的最新进展：腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品，已经接入腾讯混元大模型测试，并取得初步效果。

以腾讯会议结合应用为例，基于混元打造的AI小助手能实现会中问答、会议摘要、会议待办项等。比如当用户向AI小助手问道：“会议中黑客马拉松是什么意思？”AI助手便会自动整理相关知识，还包括与会人员关于这个话题的争论讨论。即便没能及时参加会议，用户也能获得关于会议的纪要和待办事项。

大数据优质经验介绍_数据和经验_经验数据是什么意思

混元与视频会议应用结合

再以腾讯文档场景为例，基于混元大模型的智能助手功能支持数十种文本创作场景，用户可以一键生成标准格式文本，自然语言生成函数，基于表格内容生成图表等，这些功能都已在内测中。

经验数据是什么意思_大数据优质经验介绍_数据和经验

混元与文档应用结合

在腾讯广告方面，混元大模型支持智能化广告素材创作，满足千人千面，实现文、图、视频自然融合。比如当用户需要生成一个关于踏青路线，且涉及亚洲女性在露营地的海报，当输入提示词后，便能得到AI生成的海报。据称这一应用实际采纳率超42%，远超过业界开源模型。

经验数据是什么意思_大数据优质经验介绍_数据和经验

混元与腾讯广告应用结合

可以看到，无论是小程序，还是腾讯文档、视频会议等软件，这些都是人们日常手边会用的工具，如果它们全都接入AI大模型，那人们工作效率和社交体验将大大提高。

会后，智东西在第一时间亲身体验了小程序版的混元大模型，发现在其在一些方面确实有提升。

如图所示，混元助手小程序页面风格与微信聊天框类似，设有聊天和灵感发现两框。在聊天栏，用户可以选择点击提示的问题进行提问，也可以自己输入提示词进行提问；在灵感发现栏，页面中有工作邮件、面试大纲、招聘信息、PPT大纲等更多功能化的模块。

经验数据是什么意思_大数据优质经验介绍_数据和经验

小程序版混元大模型“腾讯混元助手”页面

智东西首先试了下混元的“幻觉”反应。比如，当给AI聊天机器人们挖个小坑问道：“蓝牙耳机坏了挂牙科还是耳科？”混元回答：“蓝牙耳机是一种电子设备，与牙齿和耳朵无直接关联，因此坏了不需要挂牙科或耳科。建议您寻求专业人士的帮助进行维修。”可见其没有像先前测试的其他大模型一样大言不惭地称“挂牙科”，在这一题上没有出现“幻觉”。

数据和经验_经验数据是什么意思_大数据优质经验介绍

实测腾讯混元助手回答刁钻问题

然后智东西也尝试了灵感发现中的面试大纲，比如，当对混元说“我要面试云大厂的一名算法工程师”，混元随即给出了包含基本信息、技能与经验、个人品质、其他问题、结束语五个方面18条的面试大纲。

经验数据是什么意思_数据和经验_大数据优质经验介绍

实测腾讯混元助手撰写面试大纲

由于篇幅有限，关于混元助手的体验智东西后续再详细呈现。同时，混元大模型结合文档、视频会议产品的体验也将在之后展开。

三、擅长做产品的腾讯，把务实创新哲学用到了大模型

大模型正在面向全社会开放，今天，腾讯混元大模型也正式通过腾讯云对外开放。

8月15日，网信办发布的《生成式人工智能服务管理暂行办法》正式施行。9月1日，网信办发布第二批深度合成服务算法备案信息，包括腾讯混元大模型在内的多个生成合成类大模型通过备案。

数据和经验_经验数据是什么意思_大数据优质经验介绍

腾讯混元大模型等大模型通过备案

正值此节点，汤道生在本次生态大会上宣布，腾讯推出了腾讯云MaaS（模型即服务）。在腾讯云行业大模型的精选商店中，其不仅提供混元大模型，还上架了20多种行业最新最流行的开源通用大模型，以及覆盖金融、文旅、零售、法务、医疗、教育等20多个领域的行业大模型。“我们始终认为，大模型需要基于产业场景与企业数据融合，才能释放出更大的价值。”汤道生说。

用户可以直接调用API接口，或者将混元作为基底模型，在公有云上进行精调应用。在调经应用中心，用户只需根据需要选择合适的模型，然后借助腾讯云智能开平台导入专业专有的数据，做进一步的训练和精调，就能快速生成有针对性的专属大模型，满足个性化的需求。

大数据优质经验介绍_数据和经验_经验数据是什么意思

腾讯云MaaS（模型即服务）主要架构

蒋杰告诉智东西，腾讯坚持全链路自研大模型——从第一个Token开始从零训练，算法、框架、平台全链路自研。

比如，腾讯自主研的机器学习的框架AngelPTM，相比主流的开源虚拟框架训练速度提升达一倍，比业界的一些主流框架提升了1.3倍。而支撑这一框架的，是腾讯公司多年以来支持海量高并发的基础设施。

今年4月，腾讯云发布新一代HCC高性能计算集群，采用最新一代星星海自研服务器，搭载超强算力GPU，基于自研网络、存储架构带来3.2T超高互联带宽TB级吞吐能力和千万级IOPS。这一集群可助混元NLP大模型训练在同等数据集下，将训练时间由50天缩短到4天。实测结果显示新一代集群算力性能较前代提升3倍。

6月底，腾讯推出的高性能网络星脉，据称具备业界最高的3.2T通信带宽，为AI大模型带来10倍通信性能提升。大语言模型训练需要大量服务器之间频繁数据通信，通信时间增大往往会造成整体集群的算力损失。通过自研Tita协议和自研TCCL通信库，星脉网络据称可将网络利用率从普通以太网的60%提升到90%以上，从而降低GPU停止计算等待数据的情况，提高整体集群的算力利用率。

7月初，腾讯面向大模型发布腾讯云发布向量数据库。如果大模型是一个智能的处理器，那向量数据库就是配合这台处理器的“外置缓存”。根据腾讯官方数据，将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗，相比传统方式可以实现10倍效率的提升。如果将向量数据库作为外部知识库用于模型推理，则可以将成本降低2～4个数量级。

全链路自研成果背后是大力的技术研发投入。根据腾讯2023年二季度财报，其二季度研发开支达160亿元，自2018年至今累计投入超过2300亿元。

持续高研发投入促进了成果转化，带动专利曲线持续上扬。截至6月，腾讯在全球主要国家和地区专利申请公开总数超过6.6万件，专利授权数超过3.3万件，主要集中在人工智能、云技术、大出行、即时通讯等前沿领域。

结语：大模型走向全社会，腾讯混元吹响集结号

腾讯董事会主席兼首席执行官马化腾在此前的股东大会上说：“我们最开始以为这是互联网十年不遇的机会，但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。”而随着大模型加速走向全社会，腾讯混元大模型的一盘棋布局也逐步在公众面前显现。

腾讯正通过切入行业痛点的方式对混元大模型进行技术产品迭代。一方面，其利用腾讯系强大的产品体系训练模型、落地模型、迭代模型。另一方面，其也通过腾讯云在IaaS、PaaS、SaaS多个层面的底座能力，促进混元大模型与产业和行业结合，发挥更大的价值。“百模大战”愈演愈烈，腾讯已经吹响新的集结号。

本文由转载于互联网，如有侵权请联系删除！

爱皮屋

腾讯混元大模型亮相！实测上手，对话腾讯副总裁蒋杰

相关文章