百科技术库 各行业技术资料 - 百科资料网
欢迎来到百科技术库 各行业技术资料 - 百科资料网! [免费注册] | [登录] 微信快捷登录 QQ登录 微博登录 | 帮助中心 各行业技术应有尽有!
全国服务热线 13310018778

栏目导航

最新技术
语音分离方法及装置
本发明实施例提供了一种语音分离方法及装置,方法包括将获取的目标带噪音频信号分解到预设频域范围中的M个频点,得到M个频点的分解信号,基于人耳听觉感知特性,将M个频点的分解信号合并到P个预设频率子带中,每间隔预设时长,对每个预设频率子带包括的频点的分解信号进行分帧处理,得到每个预设频率子带对应的N个起止时间段的分析单元,估算P个预设频率子带对应的同一个起止时间段的P个分析单元中,每个分析单元对应的目标比值,基于P个目标比值,对同一个起止时间段对应的目标带噪音频信号进行噪声消除处理,得到同一个起止时间段对应的目标语音信号。降低目标语音信号的畸变,提高语音质量效果。
一种联合去混响的回声消除方法及装置
一种联合去混响的回声消除方法,包括如下步骤:S1.利用麦克风阵列和音频播放装置分别获取模拟麦克风信号和模拟参考信号,通过ADC分别转化为数字麦克风信号和数字参考信号;S2.通过短时傅里叶变换将接收的数字麦克风信号和数字参考信号每个声道的时域信号分解成多个频点的频域信号,得到频域麦克风信号和频域参考信号;S3.将当前帧和当前帧的若干过去帧的频域麦克风信号和频域参考信号作为缓存的频域信号存储到联合预测缓存器中;S4.通过自适应滤波器对联合预测缓存器中缓存的频域信号进行滤波,并对其中的频域麦克风信号进行回声消除。本发明方案利用联合去混响的回声消除算法,可有效改善回声消除效果,提升语音交互质量。
语音降噪方法、装置及设备
本发明涉及一种语音降噪方法、装置及设备,其中方法包括:采集连续音频信号,并将音频信号分割为多个语音音素;将语音音素与音素模型库的音素模型进行匹配,将匹配度最高的音素模型作为被选择的输出音素模型;对输出因素模型按照采集所得音素的响度变化和持续长度进行波形修正后输出。与现有技术相比,本发明采用预先建立针对个人的语音音素模型库,然后将采集的到音频分割为多个语音音素,最后根据采集到的语音音素对标准语音音素模型进行波形修正后播放,可以在强度相似的更加复杂的语音环境中实现个人语音提取,达到降噪的效果。
一种回声消除时延估算方法及回声消除方法
本发明公开了一种回声消除时延估算方法及回声消除方法,包括以下步骤:在直接存储器访问层设置缓冲区;在缓冲区为即将播放的音频信号以一定的采样频率添加参考音采样点;在缓冲区以同样的采样频率为录制的音频信号添加录音采样点;根据放音点与录音点间距离和音频采样频率获得回声时延;在缓冲区根据回声时延获得与录音采样点匹配对应的参考音采样点,从而获得录音音频和对应参考音音频的混合音频;根据混合音频拆分出一路录音信号和一路参考音信号;执行回声消除处理算法,得到干净的录音信号;可以精确的计算时间延迟,误差在一个采样点级别,远小于软件估算误差;占用CPU资源少,开销只有一次录音和对应参考音的额外拷贝。
一种音频修复方法、装置、设备及介质
本公开实施例涉及一种音频修复方法、装置、设备及介质,其中该方法包括:获取待处理的音频帧信号;检测音频帧信号中存在的截波区间;其中,截波区间中包含连续的多个截波点,截波点为幅值超过预设阈值的信号点;根据与截波区间临近的非截波点判断检测到的截波区间是否满足指定插值条件;如果是,基于非截波点采用指定插值法对截波区间进行修复。本公开实施例提供的上述音频修复方式所需的运算量很低,因此可极大缩短修复时间,可达到快速实时的音频修复效果。
一种基于反正切函数的零吸引回声消除方法
一种基于反正切函数的零吸引回声消除方法,其步骤是:第一步:获取信号,采样远端传来的语音信号从而得到当前时刻n的远端信号离散值x(n);同时,对采样近端麦克风收集到的回声信号从而得到当前时刻n的期望信号d(n)。第二步:计算自适应滤波器的输出y(n),第三步:回声抵消,将近端信号d(n)减去输出信号y(n)得到误差信号e(n)。第四步:权系数向量的更新,(1)根据当前时刻n的误差信号e(n),算出当前时刻n基于反正切函数的误差信号(2)利用去冲激干扰的误差信号更新得到下一个时刻n+1的抽头权向量W(n+1);第五步:令n=n+1,重复第一步至第四步的步骤,直至通话结束。本发明对电话通信系统的辨识能力强且收敛速度快、稳态误差低,回声消除效果明显。
人机交互方法、装置、存储介质及终端设备
本申请公开了一种人机交互方法、装置、存储介质及终端设备,属于人工智能技术领域。该方法应用于终端设备,终端设备集成有语音交互组件、N个业务组件和接入方提供的自定义声学模型;该语音交互组件中封装有与语音交互相关的SDK;N个业务组件是由接入方根据自身产品需求在开发方提供的业务组件集合中选择的;一个业务组件用于为终端设备提供至少一项服务,包括:通过语音交互组件接收自定义声学模型采集的音频数据;通过语音交互组件,将音频数据发送至服务器,该音频数据用于指示服务器执行音频处理并生成响应数据;通过语音交互组件,将服务器返回的响应数据下发至第一业务组件。本申请为接入方实现灵活以及简便地智能语音交互提供了可能。
一种5G智慧杆
本发明公开了一种5G智慧杆,包括:照明模块,用于根据语音模块接收的用户输入的与目标语音信号对应的目标指令,对当前照明环境进行相应照明亮度调节;检测模块,用于获取当前照明环境的动态视频,同时,检测并反馈基于所述动态视频的视频照明信息,并基于所述视频照明信息对对应的照明亮度进行反馈调节;传输模块,用于判断所述检测模块与指定终端之间的连通情况,根据连通情况,将动态视频、反馈信息、调节结果传输到指定终端进行显示。通过发出语音信号来远程控制照明模块的亮度以及反馈调节,不仅解决了传统控制方式可控距离短的问题,还可以随意调节智慧杆的亮度,提高其的调节灵活度。