文|林炜鑫
编辑|杨逍
36氪获悉,近日「恺望数据」完成数千万元Pre-A轮融资,由亚盛投资领投,清智资本参与投资。本轮融资资金将用于自动化产线和工具链的持续研发和迭代。这是恺望数据在一年内完成的第三次融资,此前天使轮及天使+轮投资方包括辰韬资本、璞跃中国、三一集团和溪山天使汇等。
36氪此前报道过恺望数据。公司成立于2022年2月,致力于打造AI数据自动化平台,并为车企、自动驾驶公司以及人工智能等跨产业企业提供一站式AI数据解决方案。
拿到前两轮融资后,恺望数据最重要的动作就是进行产品迭代升级。具体来说,恺望数据推出了"Smart Chain恺望自动化AI数据产线",目的是降低人员标注学习难度、标注难度、降低单帧数据处理的精神消耗,提高数据处理速度和质量。
恺望数据创始人兼CEO于旭告诉36氪,自动驾驶行业对于优质、高效及稳定的大规模数据的需求正在不断增长,“以往可能只看价格,现在既看价格,还要求稳定、高质量、高效率。因此,恺望数据很坚定地通过研发技术和优化运营效率,持续输出稳定、高质量、高效率的大规模数据。”
这套全新工具平台包括:“3D辅助标注”工具平台、“4D-BEV数据拼接与标注”工具链、“5KW大点云”工具平台,以及“6大数据生态闭环解决方案”。
BEV感知是通往城市NOA的必经之路,国内自动驾驶布局的车企及技术公司,均在加速推动BEV感知算法落地,而决定着算法及模型速度的重要要素,则是数据的质量和效率。
恺望数据研发国内首个4D-BEV感知算法的数据拼接与标注工具链,支持大数据流并行作业,实现200万人同时标注,目前已在车企应用。
于旭介绍,“3D辅助标注”工具是国内唯一一个在2D中标记后反投影到3D中精准找到标注物的工具,“5KW大点云”工具平台则是国内首个实现可在8G内存电脑上运行5千万点云数据标注能力的工具。
虽然公司研发出先进的数据标注工具,但于旭认为,数据标注目前仍无法全自动化,“随着自动驾驶对高质量、高产效数据的需求逐步提升,数据标注已经从低成本人力标注,逐渐变为了高阶标注人才的需求。”
比自动驾驶更需要高端标注人员的,是AI大模型行业。据透露,恺望数据目前已为多家知名大模型公司提供数据服务,其自研的AI大模型数据标注工具链和强化训练工具也已正式使用。
于旭表示,行业内急需本科及以上学历各专业的毕业生来满足大模型标注人才的需求。恺望数据定义这些高阶标注人员为“垂类高阶标注人才”。公司在去年已打造“恺望数据学院”,通过高校合作,共建产融实训基地,储备及培训大批高校学生标注员,为行业迅速提供大量稳定且优质的数据标注人才。
目前,恺望数据学院已培训50所学校,培养超过1500名学生为恺望提供数据标注服务,计划至今年年底将超过2000人规模。
经过一年半时间发展,恺望数据已与新能源汽车、自动驾驶、人工智能大模型领域百余家出行及人工智能领域企业,开展了数据相关的深度合作。据于旭透露,公司单月订单已超1500万元。
创始人于旭毕业于法国昂热大学,是字节跳动、Momenta、Uber等企业数据生产及运营体系的第一搭建者,拥有多段从零到一的大数据平台搭建经验。团队成员来自字节跳动、阿里巴巴、Uber、Momenta、梅赛德斯-奔驰等公司。公司团队近40人,其中研发人员占比超过70%,公司在技术研发投入超过60%。
欢迎交流