经验和数据哪个重要_大数据优质经验_数据和经验

作者 | 鲁冬雪

随着互联网行业的发展进入新阶段,互联网企业正在积极寻求外部增长机会,以推动业务的持续创新。在消费互联网时代,大多平台都是通过流量变现,然而当前互联网红利逐渐减少,“在保证流量基础上,降本增效的同时还要提高服务质量”成为了互联网平台角逐下半场的关键点,各大互联网平台向产业互联网转型已成为必然趋势。

更注重企业与产业的高质量发展的“产业互联网”,力求通过一切手段优化资源配置、降低交易成本、提高生产和服务效率。其中,大模型技术是推动消费互联网向产业互联网转型的关键技术之一。基于大模型,企业可以更加精准地预测用户需求,提供个性化的服务,并更好地优化生产和服务流程,提高生产效率和质量,成为了产业存量变革的来源,而企业也据此寻找到了第二增长曲线。可以说,大模型技术的发展将加速互联网产业升级。

大模型发展的前置条件是大数据技术的发展,超大参数规模的 AI 模型需要海量数据提供训练资源。行内人普遍认为,“大模型 + 大数据”的组合就像孪生双子,是推动世界向全面数字化目标迈进不可或缺的重要力量。在这样的背景下,很多企业技术先行者都正在积极努力,竭尽全力地将大模型 + 大数据的澎湃能量运用到生产实践中,实现真正的“降本增效、提升客户价值、改善用户体验”。在这些技术先行者中有这样一群人,他们有一个共同的身份——华为云联创营 MVP (以下简称“ MVP”)。

经验和数据哪个重要_数据和经验_大数据优质经验

“MVP 计划” 于 2023 年 3 月正式发布,经过重重选拔,数十位来自行业头部企业的 MVP 成员脱颖而出。MVP 的定位是“产业数字化的实践者”、“创新技术的布道师”、“不断探索边界的实干家”,旨在从产业数字化的实际问题出发,携手共探促进更多行业解决方案的孵化,丰富行业技术生态,让数字化价值更普惠共享、更公平可及。近期,InfoQ 与其中 2 位 MVP 代表成员围绕“AI 大模型 + 大数据”主题进行了交流, 一起探索了 MVP 们背后的故事。

1 37 手游技术总监陶学诚:“大模型技术创新需要行业共同探索”

37 手游是三七互娱集团旗下专注于移动游戏运营的标杆品牌,累计运营超过 2000 款游戏。作为 37 手游技术总监,陶学诚重构了公司原有的数据系统,在公司事业群层面实施了数字化迭代,构建了完整的数据平台,同时积极打通内外部数据通道。目前,他正在带领 37 手游技术团队,以公司事业群数字化转型工作为基础,全面推动产业数字化进程。

37 手游是华为云联创营活动的“常客”,陶学诚通过第七期华为云联创营 CTO 领航班了解到了“MVP 计划”。谈及从“了解”到成为该计划的一员,他第一时间想到的是——与华为云联创营共同探索、共同成长。他负责的团队之前主要面向公司内部,华为云联创营为其提供了与外界加强交流学习的机会。他希望通过这样的形式提升自己和团队在行业内的技术影响力,同时也能收获更多行业优秀实践反哺企业,帮助团队进一步提升。所以当该计划“号召各领域的‘价值专家’加入到计划中,与华为云联创营一起进行第三方公益技术沙龙布道、技术交流,积极总结个人实践经验,完成产业技术布道,为更多人、企业乃至产业发展赋能”时,他毫无犹豫地选择加入了该计划。

如今,AI 和大模型技术在手游行业的应用已经风生水起,陶学诚也在积极为行业大模型的构建做出自己的努力。目前他观察到,手游领域主要有三大 AI 应用场景——游戏资产的 AI 绘图生成、在游戏内容中构建可以与玩家进行自然对话的 NPC 或虚拟玩家、代码的 AI 辅助编程。此外,大模型在文案生成、营销策划、智能客服等层面也开始有实践应用,同时“打击黑产”工作中也可以利用 AI 技术对其进行行为识别。

37 手游作为游戏发行商,主要希望通过大模型技术来提升运营效率,并丰富游戏内容生态。在具体实践中,37 手游团队主要使用大模型来生成游戏发行运营过程中所需的大量宣传素材、优化数据分析管道。与此同时,团队还发现,大模型和其他 AI 技术在内容生态改善方面潜力十分突出,比如运营方可以使用 AI 技术制作虚拟玩家,帮助真实玩家加快拼局速度,改善持续游玩体验;又比如,基于 AI 的内容过滤系统则可以有效管制游戏内的对话交流平台,实时屏蔽恶意、负面的聊天内容。

大模型的应用与大数据是相辅相成的,37 手游之前就在陶学诚的主导下构建了自己的数据平台,获得了更快的数据分析能力,为将来的大模型应用打下了良好基础。随着数据规模不断扩大,模型训练会变得更加容易,效果也会更加令人满意。

目前陶学诚并没有计划带领团队自研底层大模型,而是选择了与行业优秀的大模型合作构建上层应用级私有模型。他认为,AI 与公有云的能力是高度绑定的,大部分公司的运维能力和基础设施更新速度都很难跟得上公有云迭代速度。正因如此,对于 37 手游这样的企业来说,基于行业优秀大模型展开研发可以有效降低门槛,使企业可以将主要精力集中在模型的行业应用,以解决企业运营中存在的实际问题。

他在采访中也提到,“目前大模型的应用还存在很多实际问题。例如,基于 AI 辅助生成的代码可能存在一些难以预期的 Bug,因此不太适用于同业务强挂钩、问题描述不清的复杂场景。整个行业对大模型的应用落地都处于探索阶段,需要参与其中的企业多尝试、多分享,才能推动行业在这一方面持续发展,解决现存的诸多挑战。”

从业者的观念转变是陶学诚眼中大模型实践应用的另一大障碍。在大量以编码为工作的技术团队中,编码能力被认为是一项很有壁垒和创意的工作,而当 AI 编码工具可以很快速的写出很优质代码的时候,传统的程序开发者往往对大模型的应用存在抵触心理。如何转变他们的思路,让他们能够在工作中自然而然地运用 AI 技术提升效率,是行业共同面对的难题。他表示,希望在未来能够基于自己手中在做的技术实践,去推动解决大模型在行业应用中出现的种种难题。他坚信:“随着上述问题在未来逐渐得到解决,AI 大模型技术在游戏产业中的潜力是不可估量的。”

2 汽车之家 CTO 项碧波:“构建大模型技术与行业应用间的桥梁”

项碧波在搜索引擎、商业广告、推荐系统、自然语言处理及数据挖掘领域具备丰富的经验。加入汽车之家后致力于打造企业的数据和技术能力,构建用户数据生态和经营数据生态,助力主机厂与经销商业务流程数字化,赋能汽车产业数字化转型。

作为汽车之家 CTO,项碧波需要为“一年一度”的 818 晚会做好技术支持工作,华为云在其中提供的一系列“高可用”能力,给他留下了深刻的印象。后来随着合作的深入,他多次参加华为云联创营的活动,华为云联创营过去为不同行业和领域的专家创造了很多分享机会,这也为他带来了不少新启发,让汽车之家获取到了很多可用资源。当他在今年 3 月了解到了“MVP 计划”,一下就被该计划驱动产业数字化发展的理念所击中,而他过去也一直希望通过自己的努力来推动技术发展,两者不谋而合,第一时间便加入到了计划中来。

一直以来,汽车之家的企业定位都是“沟通消费者与汽车厂商的门户与桥梁”。因此,项碧波带领的技术团队非常重视 AI 技术创新,并在日常经营中有着大量应用。例如,汽车之家的 AI 智能推荐可以为几千万用户提供 200 多个智能推荐场景,在数十亿内容中快速、精准地提供汽车资讯。团队还基于大语言模型和多模态内容理解等技术建立了多层级内容标签体系,提升推荐系统的精准度与质量。此外,汽车之家的智能客服、智能搜索服务应用了自然语言处理、机器学习等技术加快响应速度、解决用户问题,并运用大数据分析和 AI 预测能力的智能营销系统为广告投放创造了更高的转化渠道。

2022 年,汽车之家品牌代言人谷爱凌的“数字人“形象与汽车之家 AI 体验官宫玖羽相继上线。谈到这两位数字人,项碧波最自豪的是团队在行业现有技术的基础上做了很多突破。首先,数字人的背后都有着汽车之家大语言模型提供的智能化支撑,能够帮助用户解答很多专业汽车领域的问题;其次,汽车之家在语音识别与合成方面的积累也运用到了数字人上,甚至能够准确识别四川话、粤语等方言;同时,为解决用户设备性能参差不齐的问题,数字人还运用了云端 3D 渲染技术来为用户带来高清、流畅的一致体验。

大数据优质经验_经验和数据哪个重要_数据和经验

全新打造的能源空间站是汽车之家 2022 年实现的另一大创新成果。空间站中的全息体验仓利用全息投影技术,可以让用户一次体验多款经过数字建模的车型,选购效率大大提升。同时大数据与 AI 智能语音的赋能确保了全息投影的车体细节准确,也为用户带来了更真实的互动体验。

在以上提到的多个实践过程中,汽车之家技术团队充分意识到了 AI 技术对业务增效与企业长期发展的重要意义,项碧波也非常重视“大模型”这样的行业创新,带领团队在这一领域投入了大量资源。汽车之家目前正在内测一款名为“仓颉”的自研行业大模型,该模型是汽车之家技术团队将大模型技术运用在汽车行业垂直领域的成果,主要解决用户选车决策时面临的问题。对此,项碧波介绍到:“未来用户无需通过传统的搜索、浏览、筛选过程来选择车型,只需直接告诉了仓颉自己的用车场景、家庭人口、日常通勤距离、成本预算等信息,模型就可以直接给出非常适合的选项。”

大数据优质经验_数据和经验_经验和数据哪个重要

据悉,仓颉大模型在海量通用数据学习的基础上,利用汽车之家 18 年来积累的亿级别之家自有的高质量汽车领域专业数据,通过数据的筛选和有效利用增强了汽车领域模型的理解能力,在汽车领域问答打分评测仓颉大语言模型优于 ChatGPT (提升 13%)。值得一提的是,该模型在汽车垂直领域训练中,平衡通用能力和汽车领域能力,减少在通用的能力遗忘,并对训练的效率进行了多方法提升,使得该模型在通用能力方面,与开源的同级别模型相比,性能显著提升。

大数据优质经验_经验和数据哪个重要_数据和经验

此外,汽车之家还开发了基于全链路智能营销的 AIGC 模型,覆盖了文案策划、创意视频内容定制等营销环节,可以帮助车企降本增效,带来更高的销售转化率。接下来,汽车之家还将进一步拓展大模型 + 大数据的应用场景,围绕具体的业务需求推动应用落地。项碧波认为,“汽车之家打造的大模型与相关产品相当于行业的一种基础设施,可以为 AI 产业和汽车行业应用之间建立起一座桥梁,降低 B 端和 C 端客户应用先进技术的门槛。”

3 “互联网产业升级”是智能化时代的商业变革

虽然以上两位 MVP 来自两个不同的行业,但他们对于大模型 + 大数据的行业应用却有着很多共同的观点。两位专家都高赞了大模型技术在垂直领域的应用潜力,并纷纷基于各自的业务实践,努力将这种潜力化为可衡量的价值。同时,两位技术专家都认可大数据与大模型应用“相辅相成”的关系,他们都认为——高水平的大数据底座是企业推进互联网产业化进程的前提,也是大模型能力落地的重要保障。

在这个背景下,企业不仅需要重视技术创新和应用,更需要在行业交流中持续吸收新知识、新成果,积极推动这些技术的业务落地和发展。但还需要注意的是,当前大模型正处于技术发展早期阶段,其在行业内的落地刚刚开始,无论是大模型研发厂商还是使用大模型的用户都缺乏足够的经验和实践。另一方面,大模型的产业应用潜力巨大,有希望充分调动现有海量数据的内在价值、简化工作流程、加强用户体验,但大模型在实际部署中遇到的很多问题和挑战也是难以预期的。而“MVP 计划”恰恰给了来自不同行业的企业技术贡献者一个推动行业“同交流、共使力”的机会,大家一起面对挑战,共同推进产业数字化发展。目前,MVP 计划第三期学员已启动招募工作,期待更多行业专家加入。

正如两位专家在访谈中所提到的那样,华为云在与伙伴的合作过程中展现的“开放共享、持续创新、一直与伙伴保持前沿的技术讨论”和“赋能千行百业的具体行动”是吸引各家企业加入华为云联创营的原因所在。就比如现在华为云的盘古大模型已迭代到了 3.0 版本,为大模型技术赋能千行百业按下了加速键。汽车之家 CTO 项碧波认为盘古大大降低了行业企业利用大模型技术改善业务的门槛;37 手游技术总监陶学诚也认为盘古这样的大模型未来将帮助越来越多的产业实现数智化重构。可以说,随着 AI 大模型、大数据等技术的发展,互联网与产业的融合将进一步加快。

众所周知,互联网产业升级不仅仅是技术的升级,更是一场深层次的商业变革,在这过程中,产业数字化需求端与数字技术供应侧,还存在着一条巨大的鸿沟,需要技术创新者和产业数字化深耕者不断双向奔赴。在这背景下,华为云将于 9 月 21 日,华为全联接大会 2023 期间,举办“华为云互联网产业峰会 &AIGC 高峰论坛”,与互联网先锋企业、产业专家、技术大咖共探互联网产业升级之道,邀请各界同仁一起思想碰撞。

大数据优质经验_经验和数据哪个重要_数据和经验


本文由转载于互联网,如有侵权请联系删除!