4月25日,人工智能软件公司商汤科技旗下的智能汽车解决方案独立品牌商汤绝影,携系列原生态大模型及相关产品矩阵首次亮相北京车展。
作为首个提出感知决策一体化自动驾驶通用模型的公司,商汤绝影在本届车展上首次向公众展示了面向量产的端到端自动驾驶解决方案UniAD(Unified Autonomous Driving)的道路测试表现,同时还带来了以多模态场景大脑为核心的AI大模型座舱产品矩阵以及全新座舱3D交互演示,全景展示了通用人工智能(AGI)技术驱动的灵活自适应、深度个性化、安全可信赖、有人文关怀的未来出行全新体验。
商汤绝影UniAD自动驾驶解决方案在无高精地图、仅依靠视觉感知的实际道路测试成果显示,无论是在复杂城市道路还是在无中线的乡村道路上,搭载UniAD的车辆均能高效准确地完成大角度左转上桥、避让占道车辆及施工区域、绕行跑步行人等一系列高难度操作,做到“像人一样开车”。
凭借商汤科技大装置的丰沛算力、高质量仿真数据和行业领先的模型性能,UniAD端到端方案有更高的能力上限,以及强大的学习和思考能力;数据驱动的端到端模型泛化能力强、迭代效率快,可以帮助车企低成本快速开城;纯视觉感知的无图方案,进一步降低系统的软硬件成本,助力智驾普及,实现全国都能开。
在端到端系统基础上,商汤绝影还在本次车展期间介绍了新一代自动驾驶大模型DriveAGI,其将推动自动驾驶从数据驱动向认知驱动的跃迁。依托多模态大模型强大的世界理解、推理能力、决策能力以及交互能力,DriveAGI将是目前最贴近人类思维模式、最能理解人类意图并有最强解决驾驶困难场景能力的技术方案。
前不久上市的小米SU7将AI大模型带进座舱,而商汤“日日新”大模型也全面助力小爱同学车载语音场景应用。
4月23日,商汤科技发布全新升级的“日日新SenseNova 5.0”大模型。6000亿参数的“日日新5.0”采用混合专家架构(MOE),具备更强的知识、数学、推理及代码能力,成为国内首个全面对标甚至超越GPT-4 Turbo的大模型,多模态能力领先GPT-4V。基于端云结合的架构,商汤端侧大模型大幅超越同量级大模型,越级比肩7B、13B大模型,更适合车端部署。
基于多模态大模型、大语言模型、文生图模型等能力组合,商汤绝影构建了以多模态场景大脑为核心的一系列全景感知、主动关怀且富有创造力的大模型座舱产品。
人机交互的创新也是驱动座舱体验升维的重要因素,去年Apple Vision Pro的问世展现了3D交互的创新体验和应用潜力。商汤绝影凭借深厚的感知技术研发实力和高效的创新迭代效率,将3D Gaze高精视线交互和3D 动态手势交互这两大全新座舱3D交互演示带到现场,让观众体验到更符合人类直觉的舱内交互方式,推动座舱交互向更安全、更便利的3D交互升维进化。
面向未来,商汤绝影还在进一步探索舱驾融合,实现智能驾驶和智能座舱在硬件、软件及应用层面的全面融合,提升用户体验、降低系统成本,进一步打破舱内外的界限和束缚,涌现更多创新功能,带来更安全、更加全方位,更具人文关怀的新体验。