基于内容的音频检索系统的前端抗噪技术
作者:
时间:2010-09-14
来源:网络
收藏
引言
本文引用地址:http://www.eepw.com.cn/article/166556.htm
基于内容的音频检索指通过音频特征分析,对不同音频数据赋以不同语义,使具有相同语义的音频在听觉上保持相似。该技术在许多领域都有极大应用价值。在检索系统中一种常见情形是将安静环境下训练的模型应用于实际有背景噪声的环境。尤其在哼唱输入的情况下,噪声不可避免,因此噪声背景环境中的音频识别技术一直备受关注。本文给出一个将音频增强和音频检索系统相连接的抗噪声音频检索系统,重点分析基于内容的音频检索系统的前端抗噪技术。
2 系统平台的建立
基于内容的音频检索系统运用多媒体信息处理技术,结合人感知心理研究和模式识别技术实现音频检索,包括音频分割、特征提取和索引检索等关键步骤。在提交哼唱式音频过程中不可避免地会受到来自周围环境和传输媒介引入的噪声、设备内部电噪声的干扰。这些干扰将使检索系统的性能恶化。因此,必须对带噪音频进行抗噪处理。音频检索系统首先是建立数据库,对音频数据进行特征提取。音频检索主要采用哼唱查询方式,用户通过查询界面哼入查询信息,然后提交查询。在进行属性特征提取前通过前端抗噪模块增强哼唱语音。接着系统对哼唱音频提取特征,然后检索引擎对特征矢量进行匹配,按相关性排序后通过查询接口返回给用户。图1为抗噪声检索系统原理框图。
3 音频抗噪技术分析
3.1 语音增强算法分类
系统前端输入信号通常是哼唱输入,语音频段可以采用语音增强技术。语音增强是指为了提高受噪声污染的语音信号的质量而对含噪语音所做的处理,主要用于从带噪语音信号中提取纯净的原始音频或原始语音参数。根据不同的标准,语音增强算法有多种分类方法。
从信号输入的通道数分为单通道的语音增强算法与多通道的语音增强算法。单通道语音系统下语音与噪声同时存在于一个通道中,语音信息与噪声信息必须从同一个信号中得出。常用方法包括谱减法、信号统计模型方法、听觉掩蔽算法、维纳滤波方法、信号子空间算法等。多通道语音增强算法则采用麦克风阵列获取信号数据,它可充分利用阵列信号的信号源方向、说话人位置等空间特性,结合语音信号与噪声的特征实现语音增强。代表性的算法有自适应波束形成算法、结合波束形成与后滤波算法及各种基于信号子空间、统计模型算法等。
另一种分类方法是根据对语音信号处理方式的不同,将语音增强算法分为时域语音增强算法和变换域语音增强算法两大类。时域语音增强是在时间域直接处理带噪语音来恢复纯净语音,利用语音信号在时域中的短时平稳特性、相关特性等来研究具有针对性的噪声消除技术,其代表性算法有最大后验概率估计法、卡尔曼滤波法、梳状滤波器法、子空间的方法、自适应噪声抵消算法、语音生成模型等。变换域语音增强需一个适当的变换将语音信号转换到变换域中,然后针对变换域中的带噪语音分量的特性设计算法恢复纯净语音分量,最后通过相应的反变换获得纯净语音信号在时域中的估计。其常用变换有离散傅里叶变换、离散余弦变换及K-L变换和小波变换等,代表性算法有谱减法、维纳滤波法、短时谱幅度的MMSE估计、自适应滤波法等、听觉掩蔽效应增强算法,小波变换算法、基于频域盲源分离的语音增强技术等。还有一些新方法,如神经网络、分形理论等。
上一页 1 2 下一页
关键词: 前端 技术 系统 检索 内容 音频 基于
分享给小伙伴们:
评论
我来说两句……
验证码:
相关推荐
- YD2206 双声道音频功率放大电路 资源下载 音频 功率放大 放大电路 YD2206 | 2007-12-25
- 24 音频技术 视频 Android 传感器 无线传输 音频 | 2015-06-30
- 基于RC电路的一次性滤波器 设计方案 基于 电路 一次性 滤波器 | 2009-07-06
- 嵌入式操作系统大比拼 jackwang | 2002-05-13
- 音频无线传输-红外发射电路 资源下载 音频 无线传输 红外 发射电路 | 2007-12-25
- 大家在互相借鉴吧!–嵌入式系统词汇表 jackwang | 2002-05-14
- 5G带给功放的一些新转变 手机与无线通信 5G 功率放大器 RF 前端 | 2020-02-10
- 基于ADI iCoupler®技术的隔离HDMI视频系统 视频 ADI iCoupler®技术 隔离I2C isoPower | 2019-05-31
- 基于运放的差动放大器 设计方案 基于 运放 差动 放大器 | 2009-07-06
- 基于ADIiCoupler®技术的隔离HDMI视频系统 视频 世健 ADI ADIiCoupler®技术 隔离HDMI | 2019-09-12
- 苹果五大系统全家桶推送 苹果 系统 | 2020-03-25
- LTspice音频W AV文件:使用立体声和加密语音消息 202003 LTspice 音频 WAN 立体声 加密 | 2020-03-03
- 大家在互相借鉴吧!–嵌入式系统词汇表 jackwang | 2002-05-14
- 变电站蓄电池远程充放电控制系统的研究 电源与新能源 202005 变电站 蓄电池 远程充放电 系统 | 2020-04-29
- 总投资120亿元,年产25万片硅基OLED微型显示器生产线项目落户浙江湖州 光电显示 硅基OLED微型显示器 浙江 技术 | 2020-05-13
- 大家在互相借鉴吧!–嵌入式系统词汇表 jackwang | 2002-05-14
- PT100的前端电路 设计方案 PT100 前端 电路 | 2009-07-06
- 百瑞互联的蓝牙芯片:深耕汽车和工业物联网 手机与无线通信 蓝牙 音频 | 2020-02-19
- 集成音频功率放大电路LM380 设计方案 集成 音频 功率 放大 电路 LM380 | 2009-07-06
- “芯”希望来自新工艺!EUV和GAAFET技术是个什么鬼? 新工艺 技术 | 2020-02-24
- Upgrading a bsp for tornado2.2 资源下载 Tornado VxWorks 系统 通讯软件包 C C++ | 2007-02-09
- 大家在互相借鉴吧!–嵌入式系统词汇表 jackwang | 2002-05-14
- 梅雨将至,全新Honeywell新风除湿系统帮你舒爽度过 物联网与传感器 除湿 系统 | 2020-04-24
- macOS新测试系统发布 macOS 系统 | 2020-04-19
- USB系统研究 资源下载 USB 技术 USB 协议 USB 总线 总线拓扑体系 | 2007-02-09
- 模拟力学系统的电路 设计方案 模拟 力学 系统 电路 | 2009-07-06
- 音频控制电路集锦 资源下载 音频 控制电路 | 2007-12-25
- 100%全面屏就差最后一步实现 屏下摄像头迟迟不能解决 手机与无线通信 100%全面屏 屏下摄像头 技术 | 2019-12-11
- 上一篇:C2H技术在视频监控系统中的应用
- 下一篇:电视手机的标准及挑战
焦点
更多>>
推荐视频
更多>>
技术专区
- FPGA
- DSP
- MCU
- 示波器
- 步进电机
- Zigbee
- LabVIEW
- Arduino
- RFID
- NFC
- STM32
- Protel
- GPS
- MSP430
- Multisim
- 滤波器
- CAN总线
- 开关电源
- 单片机
- PCB
- USB
- ARM
- CPLD
- 连接器
- MEMS
- CMOS
- MIPS
- EMC
- EDA
- ROM
- 陀螺仪
- VHDL
- 比较器
- Verilog
- 稳压电源
- RAM
- AVR
- 传感器
- 可控硅
- IGBT
- 嵌入式开发
- 逆变器
- Quartus
- RS-232
- Cyclone
- 电位器
- 电机控制
- 蓝牙
- PLC
- PWM
- 汽车电子
- 转换器
- 电源管理
- 信号放大器
0 Comments