首 页 要闻 要论 协商 统战 党派 委员讲堂 理论 人事 社会 法治 视频 文化

首页>专题>话说新经济>新科技

报告显示:智能语音千亿规模市场未来可期

2023年01月12日 10:40 | 来源:人民政协网 分享到: 

1

1月11日,由国家工业信息安全发展研究中心主办,科大讯飞股份有限公司、国家语音及图像识别产品质量检验检测中心、国家智能语音创新中心协办的中国智能语音产业发展高峰论坛暨2022年中国语音产业联盟年会成功举办。

工业和信息化部信息技术发展司副司长王威伟,中国科学院院士姚建铨,国家工业信息安全发展研究中心副主任、国家语音及图像识别产品质量检验检测中心主任何小龙,联盟理事长、科大讯飞董事长刘庆峰,科大讯飞总裁吴晓如,清华大学语音和语言技术中心主任、北京得意音通技术有限责任公司董事长郑方,北京海天瑞声科技股份有限公司副总经理、首席科学家郝玉峰,国家智能语音创新中心总经理吴江照等通过讯飞听见云会议的形式线上参会。会议由联盟秘书长、国家工业信息安全发展研究中心人工智能所副所长刘永东主持。

会上,中国语音产业联盟发布《中国智能语音产业发展报告(2021-2022)》,报告指出,我国智能语音产业整体发展环境积极向好,多项关键技术取得突破,产业扎根不断深入,已形成大中小企业融通创新、协同发展的健康生态。

工信部信息技术发展司副司长王威伟在致辞中表示,党的二十大报告提出构建新一代信息技术、人工智能等一批新的增长引擎,智能语音产业作为新一代信息技术和人工智能产业的重要组成部分,必将迎来更大的发展机遇,在促进经济社会发展和数字化转型中发挥更加重要的引领和支撑作用。

市场规模高速增长,龙头企业占据主导份额

智能语音作为智能时代人机交互的关键接口,各行业爆发式的场景需求驱动行业发展进入黄金期,技术突破和应用落地不断深入。从全球范围来看,2022年全球智能语音产业规模将达351.2亿美元,保持33.1%的高速增长;从我国来看,根据德勤统计数据,2022年我国智能语音市场将达341亿元,同比增长13.4%。

报告指出,以科大讯飞为代表的语音龙头企业布局较广,是行业创新发展的支柱,占据较大市场份额。同时,科大讯飞、百度、阿里等龙头企业通过打造技术能力开放平台,构建开源生态,引领行业技术创新和应用开发。以讯飞开放平台为例,目前已开放545项AI产品及能力,聚集超过380.5万开发者团队,开发出超过159.5万个AI应用,并从AI龙头+开发者的“二维”生态,升级到AI龙头+行业龙头+开发者的“三维”生态,联合行业龙头搭建基线系统,让更多开发者参与到数字经济浪潮中。

关键技术突破,筑牢行业坚实底座

“2022年是智能语音技术突破的关键年”,报告指出,我国智能语音企业在多项难点技术上实现新的突破。纵向上从语音识别、合成、翻译向计算机视觉、认知智能、运动智能领域延伸,横向上从单点技术突破模式发展到机器认知、多模式复杂场景应用。

在语音识别方面,视听融合的多模态交互技术成为技术演进的主要方向。科大讯飞多模语音增强技术融合语音与视觉的多模感知,让高噪音场景下的语音交互跨过实用门槛,率先在车载、会议、地铁购票和医疗挂号等场景落地。此外,针对低资源语音识别难题,海天瑞声和科大讯飞分别从语音数据和算法层面推动技术进步。

在语音合成方面,随着电商直播等行业的繁荣,语音合成技术也表现出拟人化、口语化的发展趋势。科大讯飞多风格多情感语音合成系统SMART-TTS可提供11种强度可调的情感合成能力。而火山语音的超自然对话语音合成和META的语音对语音翻译(speech-to-speech translation, S2ST),通过在模型训练中添加副语言数据,让语音交互更加自然和个性化。

要促进智能语音技术持续突破,与会专家从两个方向提出了发展路径。一方面,姚建铨院士指出,针对智能语音多学科交叉的学科特性,研究人员需要探索新原理、新机制、新材料、新工艺和新器件,集成创新推动核心技术进步;另一方面,语音技术需要进一步向深度理解延伸,科大讯飞总裁吴晓如表示:“更先进的语音交互系统不仅要‘能听会说’,还要深度地去理解人的信息”,自然语言理解和知识推理技术的进步,让机器可以在越来越多的领域帮助人类解决更专业和复杂的问题。

应用规模化落地,加速与实体经济融合

报告指出,受疫情和产业数字化、智能化转型影响,智能语音应用场景迅速铺开。据德勤统计数据,预计到2030年,智能语音消费级和企业级应用市场将分别超过700亿和千亿规模。

在消费者产品领域,AI学习机、翻译笔等AI+学习产品帮助学生学习减负增效;智能录音笔、智能办公本、智能鼠标等AI+办公产品深受职场人士欢迎;AI翻译机、智能麦克风、智能语音键盘、智能耳机、智能助听器等AI+生活产品,让更多人享受AI科技的便利。

在汽车领域,智能语音已成人机交互关键环节,并从车内交互衍生车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。以科大讯飞为代表的国内AI龙头已占据中国语音交互车端应用行业的领先地位。

在运营商领域,智能语音技术与健康养老、家庭教育、家庭娱乐等场景结合,带来更加智慧的家庭生活体验。融合5G与机器翻译技术的无障碍智能通信,让普通的 5G 手机用户,不用下载任何软件,就可以使用实时翻译和转写服务,实现跨语种的无障碍视频通话。

在教育领域,科大讯飞全球中文学习平台已覆盖全球183个国家,吸引300多万海外中文学习爱好者使用;利用智能语音和人工智能技术可实现英语听说教、学、考、评、管一站式服务,减少无效训练。

在医疗领域,去年疫情期间,科大讯飞电话机器人助力全国31个省112个地市疫情排查,累计服务超1.1亿人次;智能外呼和智医助理可用于独居老人、留守儿童的日常关爱和兜底保障。

在城市领域,智能语音技术已在安徽省一体化网上政务服务平台、聊城城市大脑、三亚市崖州湾科技城智慧产城园区、天津市AI银发智能服务平台等创新示范项目中应用。姚建铨院士指出,智能语音与建设智慧城市的要求完全吻合,可以实现各种语音高效转换和智能处理,为智慧城市进一步建设带来新的机遇。

在工业领域,我国打造了包括国家智能语音创新中心在内的一批语音技术创新“国家队”, 开展工业声学、多语种、AI语音芯片等关键共性技术研究工作。科大讯飞联合国家智能语音创新中心打造的工业听诊器、声学成像仪、工业设备卫士、智能巡检机器人等“工业六感”产品,已广泛应用到生产、质检、巡检等多个工业环节。

在金融领域,声纹识别技术已经被应用在各类身份认证环节。得意音通董事长郑方表示,声纹是目前除DNA外,最可靠的身份认证方式,相比传统方法具有明显优势。此外,科大讯飞智能客服机器人、智能联络中心AICC等AI+金融应用,帮助金融机构提升客服和运营效率。

展望智能语音产业未来发展,报告认为,后竞争时代亟需关注新增的不确定性因素,包括核心关键技术能力仍需提升,开源生态培育仍需加大投入,重点应用场景落地仍需提速,传统行业开放场景动能不足等。


编辑:董雨吉