随着大模型成为现象级技术热点,“大模型+垂直场景”应用掀起了行业革新的浪潮,“百模大战”一触即发,各厂商纷纷开始了大模型落地进程。
对于龙猫数据而言,大模型从不是纸上谈兵,在每一轮技术革命中,龙猫数据都会敏锐嗅取行业风向,将新技术与自身产品架构进行高效结合,带来真切具体的应用升级体验。作为自动驾驶数据服务商,龙猫数据不断打磨技术内核,推出AutopilotGPT,在自动标注领域取得绝对领先的先发优势。
龙猫数据AutopilotGPT具备强泛化能力,可解决图片、点云等数据识别痛点问题;兼容多类型传感器,如禾赛、图达通、大疆等多款激光雷达;可识别多种应用场景,如目标检测、目标追踪、车道线识别、可行驶区域识别、图像分割、点云分割等。
龙猫数据AutopilotGPT支持在线体验,登录https://renwu.longmaosoft.com/tools/AutopilotGPT.html,选择上传文件,AutopilotGPT将会自动分析图片、点云内容,给出识别结果,生成检测、分割、json等多类型效果数据,下方会对识别类别数量自动计算统计。
AutopilotGPT 图像识别案例
AutopilotGPT 点云识别案例
1.龙猫数据AutopilotGPT参数量突破百亿
具备通用物体分辨能力
龙猫数据AutopilotGPT参数量突破百亿,应用结果显示模型已具备通用的物体分辨能力,该能力使得模型对于常见的不同场景,标注准确率高。对于不常见和极端的场景,配合Zero Shot/Few Shot技术,可以使标注精度达到常见场景的水平,即标注模型已天然具备适配不同场景不同下游任务的能力。
2.龙猫数据AutopilotGPT具备强泛化能力
通过DAM模块解决点云场景识别痛点问题
目前在ADA(Active Domain Adpation)/UDA(Unlabelled Domain Adpation) 领域,点云数据模型的泛化能力较差,明显低于RGB图像的模型,而点云又是国内自动驾驶公司几乎必备的数据形式,这为自动标注的落地场景带来了明显的挑战。
要想解决以上问题,首先需要明确问题产生的原因:
1.点云数据相比于图像数据更难收集,导致点云数据集的数据分布不够广泛;
2.点云数据之间的差异明显大于图像数据,会使模型依赖数据集先验知识(Dataset Bias)。
针对第一个问题,龙猫数据采用实际数据加仿真数据的混合数据形式,获取足够广泛性的数据分布。针对第二个问题,龙猫数据自研了DAM(Domain Adpation Model)模块,能够处理不同分布的(不同雷达型号)的数据,并在此过程中促使模型学习到了更少依赖数据集先验知识也就是更具真实表征能力的特征。
龙猫数据AutopilotGPT,在不进行FineTune的情况下(Zero Shot),可以处理市面上的几乎全部雷达型号(16线-300线雷达)。
龙猫数据AutopilotGPT示意图
数据集识别能力对比:使用DAM VS withoutDAM
3.集合各路自动驾驶算法专家
打造龙猫数据技术基因内核
AutopilotGPT的落地与公司技术基因的内核密不可分。龙猫数据的愿景从不局限在基础数据服务,而是聚焦于对数据与算法间智慧工具链路的构建。为此,龙猫数据组建了一支高水平的研发团队,聚集了众多自动驾驶领域的算法专家。
团队具备高浓度自动驾驶内核因子:算法总监白宇,曾任及云科技自动驾驶业务线负责人,蔚来感知团队主任工程师,京东 X 事业部无人车团队算法工程师。其他成员主要来自国内自动驾驶技术领先的主机厂商,或是行业内出名的专家学者,皆具备前沿的专业视角及丰富的开发经验。
大家从五湖四海向龙猫数据汇聚前行,体现出对公司发展理念的高度认可:怀揣纯粹的信念,在探索中永葆热忱。正如白宇所说:“选择龙猫,最大的感受是这是一家做实事的企业,每一步都能感受到深思熟虑后的笃定,清晰地知道要做什么,要往哪里走,我个人非常认可龙猫的规划,以及看好未来的市场规模。”
AutopilotGPT的落地,正是表现出龙猫数据研发团队深厚的开发经验和内敛的研发智慧,过程不言,但终将顶峰相见。
龙猫数据自有标注系统已接入AutopilotGPT,在实际场景应用中得到显著出成效。以Lidar检测自动标注算法为例,经过使用前后比较,至少可以提升10倍以上标注效率。
不过,AutopilotGPT只是龙猫数据在技术层面实现效率提升的一个环节。在拥有良好的算法基础后,配合自身完备的工具链系统,可以做到人机全链路高效结合,在各个环节去完善操作体验,实现全方位数据服务的产业效率提升。
龙猫数据标注系统具备灵活的集成能力,可部署至企业内部,链接上下游系统,实现自动驾驶数据的全链路闭环流转。
大模型的爆发,是机会也是挑战,大模型的相关工作已经证明其在多个任务上具备超越人类的能力,其中也包括标注任务。白宇及整个龙猫数据要做的,是乘风而上,摆脱数据标注行业以人力为本的桎梏,成为以算法为驱动的数据解决方案企业。
在技术演进的洪流中,始终谦卑求索;在革故鼎新的进程里,无畏开创先河。在沉稳与突破之间,龙猫数据稳步遵循适合自己的步调,不忘初心,坚定走向充满无限可能的广袤天地。