用户名
UID
Email
密码
记住
立即注册
找回密码
只需一步,快速开始
微信扫一扫,快速登录
开启辅助访问
收藏本站
快捷导航
门户
Portal
社区
资讯
会议
市场
产品
问答
数据
专题
帮助
签到
每日签到
企业联盟
人才基地
独立实验室
产业园区
投资机构
检验科
招标动态
供给发布
同行交流
悬赏任务
共享资源
VIP资源
百科词条
互动话题
导读
动态
广播
淘贴
法规政策
市场营销
创业投资
会议信息
企业新闻
新品介绍
体系交流
注册交流
临床交流
同行交流
技术杂谈
检验杂谈
今日桔说
共享资源
VIP专区
企业联盟
投资机构
产业园区
业务合作
投稿通道
升级会员
联系我们
搜索
搜索
本版
文章
帖子
用户
小桔灯网
»
社区
›
A、行业资讯区
›
同行交流
›
2024语音分离方向还有研究前景么?
图文播报
2025庆【网站十二周
2024庆中秋、迎国庆
2024庆【网站十一周
2023庆【网站十周年
2022庆【网站九周年
2021庆中秋、迎国庆
返回列表
查看:
4850
|
回复:
5
[讨论]
2024语音分离方向还有研究前景么?
[复制链接]
临床医师
临床医师
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-5-11 12:41
|
显示全部楼层
|
阅读模式
登陆有奖并可浏览互动!
您需要
登录
才可以下载或查看,没有账号?
立即注册
×
2024语音分离方向还有研究前景么?
原文地址:https://www.zhihu.com/question/655387627
楼主热帖
小桔灯网业务合作须知!
如何注册小桔灯网VIP会员?
如何选择一款质量上乘且价格实惠的ELISA试剂盒?
[
ELISA技术
]
国际认证CB 讲解
[
CAP认证
]
智慧仓储新时代:从“人工管”到“智能控”,遨智云如何重新定义冷链仓储?
[
冷链管理
]
为什么那么多公司做前后端分离项目后端响应的 HTTP 状态一律 200?
[
同行交流
]
生娃娃,有什么意义?有没有必要“优生优育”?
[
生殖医学
]
免疫组化查了16项?
[
免疫组化技术
]
为什么我感觉现代医学还是很落后?
[
液体活检技术
]
分子育种提高酶活?
[
原料技术
]
回复
使用道具
举报
提升卡
检验医师
检验医师
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-5-11 12:42
|
显示全部楼层
感觉语音算法还是和语义有关系才有搞头,不然就是信号处理,深度学习算法很有可能在实际应用时被传统模型暴打。
回复
支持
反对
使用道具
举报
检验医师
检验医师
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-5-11 12:42
|
显示全部楼层
语音分离方向还是一个比较细分的类别,
我个人感觉如果是语音整体方向还行,例如:合成语音和人声的鉴别,AI音乐创作等,
但语音分离没有发现重大的难题或者较大的应用市场。
回复
支持
反对
使用道具
举报
大力水手
大力水手
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-5-11 12:42
|
显示全部楼层
如果是问应用前景,我觉得是有的,目前有海量的语音应用需求。
但是问研究前景,个人谨慎推荐。因为语音至少从70年代开始就已经进入工业界了,很多问题都已经做得差不多,是否还有值得研究投入的方向就需要深入探索。最近研究论文数量也可以看出语音相关不算热门。
总而言之,语音分离是一个好的应用方向,但是不一定是一个好的研究方向。
回复
支持
反对
使用道具
举报
卡卡
卡卡
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-5-11 12:43
|
显示全部楼层
语音分离技术在2024年依然具有广阔的研究前景。这一技术对于改善语音通信、声学目标检测、声音信号增强等方面的应用具有重要的理论意义和实用价值。随着深度学习技术的不断进步,基于深度学习的语音分离技术日益得到广泛关注和重视,展现出相当光明的应用前景。
语音分离技术,尤其是基于深度学习的方法,正在不断探索和改进中。例如,清华大学团队提出的RTFS-Net模型,通过压缩-重建的方式,在提高分离性能的同时,大幅减少了模型的计算复杂度和参数数量,这表明提高语音分离性能并不一定需要更大的模型,而是需要创新、高效的架构。
此外,语音分离技术在智能助手、自动驾驶、会议场景等应用中的潜力巨大。例如,达摩院语音实验室认为,下一个语音技术解锁的场景将会是用更多“人-人”交流替代当前“人-机”交互模式的会议场景。这表明,语音分离技术在会议场景中的研究和应用将是未来的一个热点方向。
语音分离技术在未来不仅有着持续的研究价值,而且在实际应用中也将迎来更广泛的应用场景和更深层次的技术创新。
回复
支持
反对
使用道具
举报
同花顺
同花顺
当前离线
金桔
金币
威望
贡献
回帖
0
精华
在线时间
小时
雷达卡
发表于 2025-5-11 12:44
|
显示全部楼层
有,但场景不多,大多数是会议声音分离,音乐人声分离,背景音乐分离。
目前来说,语音场景普遍比较封闭,不公开,不开源,研究难度大,想取得进展比较难,这条路比较难走。
大多数做语音的都是3A方面,其他方面很少涉及,啸叫抑制大多数技术都做不到,很多大厂都没解决,我之前在某会场问某教授“声反馈问题咋解决”,他完全没有听过这个概念。
总之,这条路难走,大多数都是自嗨,而且封闭。
声源分离之人声与伴奏分离(人生艰难啊)_人声伴奏分离原理-CSDN博客
啸叫终结篇--声源分离技术-CSDN博客
啸叫终结篇之二--声源分离技术实现-CSDN博客
语音增强与降噪_语音增强和语音降噪-CSDN博客
回复
支持
反对
使用道具
举报
返回列表
发表回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
浏览过的版块
NMPA体系考核
悬赏任务
新品前瞻
室间质评
免疫荧光技术
关闭
官方推荐
/3
【扫描左侧二维码关注微信】参与交流!
网站定期开展行业相关话题互动交流活动!对认真参与讨论的桔友将有金桔奖励!欢迎参与。
查看 »
IVD业界薪资调查(月薪/税前)
长期活动,投票后可见结果!看看咱们这个行业个人的前景如何。请热爱行业的桔友们积极参与!
查看 »
小桔灯网视频号开通了!
扫描二维码,关注视频号!
查看 »
返回顶部
快速回复
返回列表
客服中心
搜索
官方QQ群
洽谈合作
关注微信
微信扫一扫关注本站公众号
个人中心
个人中心
登录或注册
业务合作
-
投稿通道
-
友链申请
-
手机版
-
联系我们
-
免责声明
-
返回首页
Copyright © 2008-2024
小桔灯网
(https://www.iivd.net) 版权所有 All Rights Reserved.
免责声明: 本网不承担任何由内容提供商提供的信息所引起的争议和法律责任。
Powered by
Discuz!
X3.5 技术支持:
宇翼科技
浙ICP备18026348号-2
浙公网安备33010802005999号
快速回复
返回顶部
返回列表