国内语音实验室名录

John · 发表于 2025-5-10 06:41

登陆有奖并可浏览互动！

您需要登录才可以下载或查看，没有账号？立即注册

×

近期，我们整理了国内语音实验室名录，供语音方向的学者参考，如有更好的补充，欢迎在评论区留言，与我们交流探讨^-^
1. 中国科学技术大学语音及语言信息处理国家工程实验室
语音及语言信息处理国家工程实验室，英文缩写为：“NEL-SLIP”。
围绕语音及语言核心技术及产业发展需要，建立语音及语言技术研究、工程化应用的研究开发平台和测试验证平台，开展自然人机交互、人工智能、海量信息处理及挖掘等重点领域的研究并实现产业化，形成从核心技术研究到技术运营服务的完整产业链，提升我国在相关领域的自主创新能力和核心竞争力，促进我国语音及相关产业的快速发展。
http://nelslip.ustc.edu.cn/
2. 中国科学院语言声学与内容理解重点实验室
中国科学院语言声学与内容理解重点实验室（以下简称实验室）依托中国科学院声学研究所，其前身是成立于2002年的一个语音实验室。实验室布局于音频听感知、语音识别和面向声学应用的大数据分析等方向，全方位覆盖了以音频为核心的媒体内容理解研究内容。
https://hccl.ioa.ac.cn/

感觉有帮助的话，不妨点个赞再走~
3. 清华大学语言和语音技术中心
语音和语言技术研究中心(简称CSLT)面向移动互联时代人类对信息处理个性化的需求，通过先进的语音和语言处理技术在任何时间、任何地点、实现任何方式的人机交互。语音和语言技术中心将以"面向应用、推进创新；突出重点、厚积薄发"为指导思想，面向语音和语言处理技术领域，以语音识别、说话人识别、语言理解为主要研究方向。语音和语言技术中心包括三个实验室，分别是语音识别实验室(ASRLab)、声纹识别实验室(VPRLab)、自然语言处理实验室(NLPLab)。
http://cslt.riit.tsinghua.edu.cn/index.php
4. 深圳市智能媒体和语音重点实验室
深圳市智能媒体和语音重点实验室的前身是香港科技大学人类语言技术中心与深港产学研基地联合成立的深圳研发中心。
主要研究方向包括：
跨平台多媒体智能人机交互技术：嵌入式语音识别和人机交互关键技术，高性能分布式语音识别关键技术，鲁棒性（带口音及噪音环境）中文语音识别技术，跨平台WindowsCE、Linux、Android等多种平台语音处理软件和系统设计
语音音频检索及处理技术：跨信道海量语音检索和关键词定位技术，音频、关键语音、关键人识别和定位技术，网络语音/音频信息收集和数据清洗技术
文本数据挖掘及辅助决策技术：互联网海量内容获取与存取技术，语音理解及文本挖掘技术，信息检索和信息可视化技术
中文多媒体数据资源建设：海量多媒体数据加工处理，中文语音和音频数据标注、收集、处理的行业标准制定，数据处理支撑软件和系统
http://www.imsl.org.cn/index.html
5. 陕西省语音与图像信息处理重点实验室音频、语音与语言处理研究组(谢磊老师等)
西北工业大学音频、语音与语言处理研究组(ASLP@NPU)隶属于陕西省语音与图像信息处理重点实验室。研究组成立于1995年，经过近20多年的快速发展，已形成了人机语音交互、语音与音频信号处理、音视频多模态信息处理、情感识别、多媒体内容分析、机器学习等主要研究方向。
http://www.npu-aslp.org/
6. 中国科学院自动化所模式识别国家重点实验室智能交互课题组
智能交互课题组隶属于中国科学院自动化研究所模式识别国家重点实验室。主要从事的研究方向包括：多语言语音合成、情感语音合成、基于隐马尔可夫模型的语音合成、情感语音识别、语音转换方法、语音评价方法、可视语音合成-人脸动画、自然口语分析与合成、情感交互技术等。
http://www.speakit.cn/show/index_show
7. 厦门大学智能语音实验室
厦门大学智能语音实验室现有团队成员包括洪青阳副教授、李琳副教授、童峰教授，以及20余名在校研究生。实验室主要研究方向是声纹识别、语音识别、语音合成、语音增强、语音唤醒、语种识别、麦克风阵列等。
https://speech.xmu.edu.cn/
8. 山西大学语音语言实验室
语音语言实验室关注于自然语言、语音数据的分析及不同模态的融合策略。同视觉信息一致，语音和语言是常见的信息模态，在生活中发挥着极为重要的作用。认识语音和语言，并对其进行语义挖掘与分析，发现不同模态数据的内在关联与逻辑，从而最大可能性的利用多模态数据是该实验室要完成的主要任务。
研究方向：
语言分析：面向大数据舆情分析、面向特定领域的语义搜索，人机对话
语音分析:音频理解、音频生成、音乐推荐、情感分析
多模态融合:我们在世界中经历是多模态的：我们看到的物体，听到的声音，交流的文字，闻到的气味和品尝的味道。为了让人工智能在理解我们周围的世界取得进步，他需要同时解释这些多模态信号。多模态机器学习旨在创建可以处理和关联来自多个模态的信息的模型。多模态机器学习包括5个基本任务：表示(representation)、转换(translation)、对齐(alignment)、融合(fusion)和互相学习(co-learning)。
http://dig.sxu.edu.cn/jg/sjznyjzx/yyyyclsys/137312.htm
9. 上海交通大学信号处理与系统研究所
上海交通大学信号处理与系统研究所的前身是雷达技术研究室。为适应国内外形势和技术发展的要求，主要从事雷达信号处理，通信信号处理、语音信号处理、DSP应用等。
https://wnt.sjtu.edu.cn/sps/
企业类实验室
10. 达摩院语音实验室
致力于下一代人机语音交互基础理论、关键技术和应用系统研究工作，研究领域包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等。形成了覆盖电商、新零售、司法、交通、制造等多个行业的产品和解决方案，为消费者、企业和政府提供高质量的语音交互服务。
https://damo.alibaba.com/labs/speech/
11. 中国科学院自动化研究所数字内容技术与服务研究中心
目前数字内容技术与服务研究中心研究范围覆盖文字、语音、图像、图形等，应用涉及教育、广电、媒体、娱乐、安全等多个领域，语音识别关键核心技术评测多次获得第一，已经成为国内中文信息处理和数字内容服务领域前沿技术最重要的研究基地之一。
徐波
http://www.ia.cas.cn/sourcedb_ia_cas/cn/iaexpert/200908/t20090804_2310484.html
12. 上海交通大学语音实验室-俞凯老师组
https://speechlab.sjtu.edu.cn/
13. 哈尔滨工业大学智能接口与人机交互研究中心(韩纪庆老师)
研究领域：

Robust语音识别：研究噪声下的语音识别、变异语音识别、情感语音合成等方法；
语音信息内容安全：研究因特网环境下对语音内容进行有效控制的方法；
音频水印及信息伪装：开展音频数字产品的版权保护技术及音频信息伪装技术的研究；
音频信息检索：研究在音频信息流中迅速有效地检索出所需信息的技术；
智能化移动音频计算：研究在移动计算环境下集音频输入输出技术于一体，具有环境感知能力，人性化的音频计算技术。

http://homepage.hit.edu.cn/hanjiqing
<hr/>感谢评论区各位积极的补充，答案的质量也越来越高~
评论区有语音方向的社群，大家可自愿加入~
以下为补充回答：
14. 天津大学王龙标、魏建国等老师团队
魏建国教授所在系别为软件工程，研究方向包含语音识别、声纹识别、言语康复、医学图像分析等，个人主页：http://tjuttc.tju.edu.cn/weiweb/；
王龙标教授所在系别为人工智能学院，研究方向包含语音识别、说话人识别、声学信号处理、语音合成、语音对话、自然语言理解、情感计算、人工智能、机器学习等，个人主页：Longbiao Wang
15. 北京语言大学智能语音习得技术实验室
主要工作为促进汉语作为第二语言的语音教学任务而进行的资源建设和技术开发。实验室研究了特定汉语语音的感知，包括声调、辅音以及声调与音段之间的相互作用；通过各种感知训练，提高了部分学习者区分声调、混淆辅音、鼻音韵母等的感知能力；针对语音识别中的语音错误，研究了基于深层神经网络的语音识别技术。
16. 内蒙古自治区蒙古文信息处理技术重点实验室
该实验室自2007年成立以来，研究开发了蒙古文信息检索系统、蒙古文印刷体识别系统、蒙古文古籍检索系统及以蒙古文为主的多语种电子辞典、蒙古文OFFICE等软件，为实现把蒙古文从“纸上”搬到“计算机上”奠定了基础。2016年正式公开发布的蒙古语语音识别和语音合成系统是让计算机也会“开口说蒙古语。
17. 中国人民大学信息学院多媒体计算实验室
实验室目前拥有教师4名（副教授2名、讲师2名），他们分别于中科院声学所、美国卡耐基梅隆大学、日本富山大学及荷兰阿姆斯特丹大学获得博士学位。
实验室致力于数字视频、数字图像、数字音频等多媒体数据的分析、理解、管理和查询等研究；研究重点包括：音频内容理解和搜索、计算机音乐信息的处理和音乐语义信息挖掘、声纹识别、语音识别与理解、图像内容分析、理解和搜索、统计机器学习、神经网络算法优化以及组合优化问题求解等。在多媒体相关的重要国际会如ACMMM、ICMR、 ICASSP INTERSPEECH及IJCNN上都发表了有影响力的学术论文。
18.  西北工业大学音频语音与语言处理研究组
研究组成立于1995年，经过近20多年的快速发展，已形成了人机语音交互、语音与音频信号处理、音视频多模态信息处理、情感识别、多媒体内容分析、机器学习等主要研究方向。核心成员包括三位教授、一位副教授、九位海外兼职教授和50余名硕博士研究生。
目前实验室已经与百度、搜狗、阿里巴巴、微软、腾讯、IBM、三星、华为、中兴、小米、京东、云知声、出门问问、Roobo、哈曼等著名IT公司和多家初创公司开展了广泛深入的科研合作，与腾讯建有“西北工业大学-腾讯媒体信息技术联合实验室”，与明星创业公司云知声建有“西北工业大学-云知声智能语音交互联合实验室”。多年来，实验室承担了众多国家和省部级科研项目、国际合作项目以及企业合作项目，发表学术论文300余篇，众多研究成果已经应用于工业界。在多个重要会议上获得多篇优秀论文奖，参加多个国际评测获得第一名，取得了丰硕的研究成果。
http://www.nwpu-aslp.org/
19.  东南大学无线电工程系-赵力老师组
主要从事语音信号处理、自然语言处理、声频和视频信号处理、情感信息处理等方面的研究工作。在语音和声频信号检测、汉语连续语音识别的语音学模型、语言学模型、说话人和环境自适应方法；汉语连续语音韵律特征、F0的生成模型、声调处理等方面进行过深入的研究，取得了一些有价值的研究成果。在语音会话系统、语言翻译系统以及听觉模型、声场景分析、语音信号中的情感信息处理等方面也进行过研究工作，并取得过一些研究成果。
http://signal.seu.edu.cn/faculty-and-staff/li-zhao
19.  西北师范大学教育技术学院-杨鸿武教授
主要从事语言声学和语音信号处理、跨语言智能信息处理、智能教育等方面的研究工作，在民汉双语语音识别与语音合成、跨语言智能语音处理、藏族学生学习普通话的发音偏误检测等方面的研究工作等方面取得了一定的成果，实现的彝语和藏语三大方言的语音合成已经应用于中国民族语文翻译局的智能民族语言语音翻译系统中。近年来，主持国家自然科学基金面上项目1项、地区项目2项，甘肃省杰出青年基金项目1项，甘肃省高等学校创新团队项目1项，其他省部级项目3项。获甘肃省高等学校优秀科研成果奖1项、教育部科学技术进步奖1项。发表SCI、EI、CPCI检索论文40余篇，申请和获得国家发明专利6件、实用新型专利和计算机软件著作权30余件，出版著作2部、《人工智能初中版》教材1部。
https://jyjs.nwnu.edu.cn/2019/0705/c5262a122868/page.htm
20.  北京理工大学信息与电子学院-谢湘老师组
研究领域：语音人机交互，物联网技术
科学研究：以负责人和骨干成员身份参加国家自然科学基金项目7项；国家“863”项目2项；国家科技重大专项3项；ITU、3GPP、Ericsson、GIPS等国际合作项目以及中国移动等企业合作项目。累计发表学术论文79篇，申请发明专利5项。
https://www.x-mol.com/university/faculty/236092

原文地址：https://zhuanlan.zhihu.com/p/285349154

图文播报

[分享] 国内语音实验室名录

登陆有奖并可浏览互动！

发表回复

浏览过的版块

官方推荐 /3

个人中心