今年,“AI+”成为推动经济增长和社会进步的新质生产力,而大模型上车也成为汽车行业拥抱新质生产力的主要方向。据不完全统计,现阶段已有远超10家汽车品牌搭载大模型,而随着各大车企相继官宣人工智能大模型相关的战略布局,“软件定义汽车”时代也开始向“AI定义汽车”过渡,汽车行业迎来新的增长点,产业链加速融合。
大模型在汽车的应用涵盖车联网、高级辅助驾驶、智能座舱等多个场景,如打造信息交互协同的智慧出行系统、感知环境并做出判断、打造定制化服务等。而在众多场景中,车载语音交互是大模型上车智能座舱领域的第一站。
对于车企而言,将先进的大模型技术融入车载语音系统至关重要,能够以更高的效率、更低的成本达到更智能化的体验。
对此,在盖世汽车2024第二届汽车人工智能大会上,思必驰智能汽车事业部高级产品总监曾春华谈到,随着多模融合大模型的发展,多模态跨领域交互、类人交互、以及终端车载家庭互联场景融合的时代终将到来,“大模型+大融合”将重新定义智能汽车人机交互。
思必驰 智能汽车事业部高级产品总监
智破大模型引入痛点,思必驰匠心打造“1+N”模式
随着车厂对大模型能力的需求日益旺盛,引入大模型产生的痛点、难点也逐渐暴露。
首先,大模型的引入容易对现有的技术链路产生影响,如何实现不同厂商大模型的融合、调度和分配成为车企面临的一大挑战。其次,随着大模型规模的日益庞大,反馈速度也逐渐放缓,而这在需要毫秒级响应速度的车载场景中尤为关键。
面向生态融合,为助力车厂解决以上痛难点,思必驰基于自研全链路智能语音语言交互技术、DFM大模型以及大数据构建“中枢大模型”架构,打造“1+N”模式,即“1”个百模中台与“N”个专业大模型组合上车,打通前端语言处理、用车场景与后端模型生态,形成车载垂域的生态圈,使车载AI体验从“语音指令”迈向“语言智能”+“工具智能”,将吸纳众多顶尖的大模型厂商构建一个强大的语音交互系统,以汇聚不同大模型的技术特点与优势,提供更加全面、精准的语音服务。
图源:思必驰
这涉及技术架构的升级,特别是从单一大模型到以中枢大模型为底座的多模型融合车载Agent框架,同时确保端侧与云侧分布式部署,支持解耦,便于后续轻量化升级,并通过新的大模型云端框架,支持垂域模型实现插拔式灵活升级。
调动不同大模型、实现技术落地并与现有语音系统完美融合,是智能座舱发展的重要方向。模型融合过程主要涉及两个方向:
首先,是大小模型的纵向融合。大模型具有语义理解、任务推理等强大能力,但并不能完全替代小模型。在某些基础和垂直行业领域,小模型具备精准分类、响应快速等特点,仍不可或缺。因此,需要实现小模型与大模型的协同工作,确保两者之间的调度关系得当。
这意味着在众多大模型中选择最适合的,围绕车的场景进行全新的、更智能的语音交互理解,包括大模型的场景推荐,以及人格化、情感化的融合。
聚焦多元车载场景,重塑语音交互体验
国内乘用车语音控制功能渗透率持续上升。据盖世汽车研究院统计,2023年,累计语音控制功能渗透率超过75%。预计到2025年,国内语音交互产品渗透率将达92%,市场规模将达23亿元。
随着用户对车载语音交互体验需求的提升,各语音功能搭载量均呈现出明显的上升趋势。
图源:思必驰
针对以上高频场景,思必驰重点发力进行技能重构。出行是人们日常生活中的重要部分,无论是上下班、出差还是休闲娱乐,行程规划都是关键一环。在这个过程中,导航成为车载语音交互的重要应用场景。传统导航流程繁琐,思必驰大模型的引入能够实现“一步到位”的便捷体验,通过出行规划功能,用户只需简单一句话,即可快速生成出行方案并导航至目的地。
图源:思必驰
车载语音交互还涉及诸多其他场景,如车控、娱乐等。特别是当车辆出现故障或交通事故时,用户需要快速获取解决方案。思必驰大模型能够结合丰富的数据和知识,为用户提供及时、准确的反馈和建议。此外,用户对车辆的情感化需求也在逐渐增长,思必驰大模型可以结合用户的个性化需求,提供更为贴心、智能的服务。
据介绍,目前,基于多模融合大模型方案打造的“天琴语音助手”7.0版本可以实现多人设自由切换、大模型行程规划、跨域上下文意图理解、一句话百变壁纸等多个首创式落地应用。全域端到端速度以及多轮对话语音合成速度均可控制在3s以内,拒识+响应的整体准确率在92.7%,其中非闲聊类准确率可达98%以上,大大降低用户闲聊声音对座舱交互的影响。
坚持对话式AI技术积累,思必驰持续发力汽车语音交互场景
思必驰是国内专业的对话式人工智能平台型企业,基于自研的全链路智能对话系统定制开发平台、语言计算大模型DFM、人工智能语音芯片,围绕“云+芯”布局,为物联网、数字政企领域提供软硬件结合的人工智能技术与产品服务。
思必驰的核心优势在于全链路语音交互技术、软硬一体化人机对话系统构建能力以及大规模对话系统定制能力。凭借在行业的核心技术积累,思必驰将全链路智能对话定制平台与DFM-2大模型相结合,支持客户自主构建 “千人千面” 的个性化语音交互解决方案,实现大规模、高质量、个性化的人工智能系统定制。
近年来,思必驰以提升语音识别的准确性、交互的自然性以及系统的智能化水平为目标,实现了多项创新和突破:累计牵头、参与制定了70项国家/行业/团体标准,范围涉及语音合成、语音识别、声纹识别、机器学习、智能能力等级、自然语言处理等;拥有近100项全球独创技术,已授权知识产权近1500件,获得23项产品、技术相关优秀认证,并多次在国际评测中夺得冠军。
深耕于汽车行业多年,思必驰拥有多年车载语音经验。从最初的车载语音系统,到如今的多模融合大模型方案,始终以满足用户需求为核心。
2022年,思必驰汽车语音交互方案通过了中国信通院可信AI评测,并获得L9级智能认证,是国内目前已知的最高车载语音交互产品的智能等级认证。
2023年,思必驰大模型在智能座舱的应用案例成功入选由中国质量认证中心和中关村智用人工智能研究院联合发布的《大模型行业应用白皮书》,彰显思必驰大模型在实际应用场景的落地能力。思必驰参与编制的国内首个汽车大模型标准也于近期正式发布,聚焦汽车行业高质量发展,助推汽车大模型产品升级优化。
2024年,思必驰升级大模型技术全场景方案应用,并开启出海战略,在汽车领域,一方面加大与海外车企的本土化合作,一方面伴随中国新能源车企“走出去”。由思必驰主导,联合中国信息通信研究院、中国电信提出的车载多音区语音交互国际标准,于4月份在法国获国际电信联盟标准化局(ITU-T)第16研究组(SG16)讨论并立项。这也是在该领域中,首个由中国公司牵头制定的新一代汽车语音交互国际标准。
目前,思必驰已与近60家汽车品牌合作,包括新势力品牌、自主品牌及国际巨头,产品已应用于160多款量产车型,累计装车量突破1000万台。在车载语音领域,思必驰增速显著,国内新能源车载语音市场占有率第一,在车载语音全行业跻身Top 3。
图源:思必驰
曾春华表示,思必驰致力于与大模型厂商和车厂合作,共同推动车载语音交互技术的发展。同时,思必驰也将关注多模态交互、车家生态融合等前沿技术,不断提升车载语音交互的智能化水平。思必驰希望借助全链路语音技术,通过中枢大模型的调度和融合能力,打造车载垂域生态圈,为用户带来更为便捷、智能的出行体验!