首页 » 人工智能 » 智能座舱之语音TTS

智能座舱之语音TTS

中建深圳装饰通讯 2025-01-23 0

扫一扫用手机浏览

文章目录 [+]

一、TTS是什么

笔墨转语音,大家可以以微信的语音转笔墨的反向工程来理解,紧张浸染是实现机器对话。

智能座舱之语音TTS 智能座舱之语音TTS 人工智能

二、车载领域语音合成现状剖析

车载场景目前是TTS技能的主要运用处景,其发展紧张经历了以下四个阶段:

智能座舱之语音TTS 智能座舱之语音TTS 人工智能
(图片来自网络侵删)

个中,高度个性化的发展该当细分为两个阶段。

第一个阶段,基于人群圈层的个性化,划分的圈层可能为男性/女性,儿童/成人/老年人,车主/搭客,基于车企的策略不同。

第二个阶段,通过声纹识别或摄像头等感知手段,实现真正的千人千面,定制自己专属的TTS风格化回答。

三、当前车载场景下的痛点机器感:听感上仍能够识别出是机器的合成音,不自然、重读不准确等;风格单一:语音合成风格较为单一,并且多为播音风格,短缺乐趣;情绪欠缺:播报的情绪音,领悟进车载的交互场景办法粗暴,体验不佳,详细表现为不同情绪音不区分场景、不区分文本,仅仅通过腔调等变革表达情绪,存在机器的僵硬感;智能化:场景定义不全面或不准确,由于车载TTS的回答语基于车载语音产品经理对场景的定义,存在漏定义、定义错的情形;并且在通过TTS勾引用户的角度看,当前所有的车企方案较少考虑到这一点。

四、车载TTS的主要指标

车载TTS的评价指标沿用语音业界的MOS评价办法,即约请听音人试听合针言音,根据分值描述,从拟人性、连贯性、韵律感等方面为语音选择得当的分数,常日紧张的指标为:

但是以上指标紧张都是针对TTS发音的问题,在实际测试的过程中,也会对TTS反馈的语料准确性、是否得当等进行测试,常日单一问题单一办理。

五、语音TTS碰着的范例问题端云变革:在汽车行驶过程中,进入隧道或停车场等场景时,车辆的网络状态会切换为弱网/无网状态,此时云真个语音资源就会切换为本地资源,切换顺滑度、音色相似度等都是范例问题;多音字发音缺点:机器未准确识别语境,发音缺点;断句缺点:碰着没有标点符号或者标点符号缺点的文本,机器未能识别,形成断句缺点;方言表达不隧道:机器直接采取了文本的发音,未转换成方言发音。

例:

早上好,粤语该当说zou sen,而TTS会直接说早上好(粤语腔调)。

没有,粤语该当说冇,而TTS会直接说没有(粤语腔调)。

六、产品角度看车载TTS1. 车载TTS的商业代价

车机作为第三个屏幕,其运营是一个说了良久的话题,但是目前真正在车机上实现商业化运营代价的车企却没有,而风格化回答语,没有安全性、政策等成分的限定,是目前能看到落地最快的方向之一,并且运营代价,如果能担保较低本钱形成风格化回答语的情形下,对付具备较多智能存量车的车企来说,在我个人角度上来看为高。

2. 大模型对车载TTS可能的影响

一是个性化定制本钱降落:大模型通过大量的数据学习,空想中可以快速对一些特定形象进行学习,降落学习本钱,例如影视作品的角色,形成具有该角色风格的回答语。

二是更加快速合成结合业务的风格回答语:车载TTS更多的是结合业务的场景,例如导航去天安门、打开车门等,大模型结合业务将实现更加多变、准确、有趣的回答。

本文由@加饭 原创发布于大家都是产品经理。
未经容许,禁止转载。

题图来自 Unsplash,基于 CC0 协议

该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事。

标签:

相关文章

揭秘电子医疗设备PCBA代工这些才是关键!

随着医疗技能的飞速发展,电子医疗设备正逐步向高效、智能化、小型化方向迈进。在这个过程中,印刷电路板组装(PCBA)技能作为医疗设备...

人工智能 2025-01-23 阅读0 评论0

“益阳造”电路板七成销往日韩和欧美

“开放崛起新征程”专题采访走进益阳,一起来看湖南最大的电路板生产企业和“木之王国”。 “益阳产”电路板,去年出口额1.4亿美元作为...

人工智能 2025-01-23 阅读0 评论0