CN118283468B - 一种用于无线麦克风的音频去噪方法 - Google Patents
一种用于无线麦克风的音频去噪方法 Download PDFInfo
- Publication number
- CN118283468B CN118283468B CN202410683361.4A CN202410683361A CN118283468B CN 118283468 B CN118283468 B CN 118283468B CN 202410683361 A CN202410683361 A CN 202410683361A CN 118283468 B CN118283468 B CN 118283468B
- Authority
- CN
- China
- Prior art keywords
- audio
- frequency
- energy
- respiratory
- respiration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000029058 respiratory gaseous exchange Effects 0.000 claims abstract description 70
- 230000000241 respiratory effect Effects 0.000 claims abstract description 54
- 238000001228 spectrum Methods 0.000 claims abstract description 26
- 230000036391 respiratory frequency Effects 0.000 claims abstract description 23
- 238000012216 screening Methods 0.000 claims abstract description 13
- 230000002596 correlated effect Effects 0.000 claims description 19
- 230000035565 breathing frequency Effects 0.000 claims description 11
- 230000036387 respiratory rate Effects 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 2
- 208000037656 Respiratory Sounds Diseases 0.000 description 31
- 230000008569 process Effects 0.000 description 14
- 230000000875 corresponding effect Effects 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 230000030279 gene silencing Effects 0.000 description 3
- 230000001502 supplementing effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2410/00—Microphones
- H04R2410/01—Noise reduction using microphones having different directional characteristics
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种用于无线麦克风的音频去噪方法,包括:获取背景电流数据以及音频电流数据;根据背景电流数据与音频电流数据得到音频有效信息频谱图;综合频率左右邻域之间能量共振关联情况获取音频呼吸共振程度;根据音频呼吸共振程度得到音频呼吸对比程度;根据音频呼吸对比程度筛选出若干音频呼吸频率;根据音频呼吸频率筛选出待剔除音频呼吸频率;对待剔除音频呼吸频率与音频有效信息频谱图进行频谱相减,并进行傅里叶逆变换得到麦克风音频去噪数据序列。本发明更有效地降低了音频数据中的噪声量,提高了去噪后的音频数据表达音频信息内容的准确性。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种用于无线麦克风的音频去噪方法。
背景技术
无线麦克风是一种通过无线电子信号传输声音信息,实现声音的电子设备。在无线麦克风传输声音信息时,会因无线麦克风设备中线路的干扰,产生噪声影响音频内容的清晰度。因此为了提高音频内容的清晰度,需要对音频数据进行去噪。
现有技术通常利用频谱减法算法将背景噪声频谱信息与音频数据的全部频谱信息相减,逆变换得到去噪后的音频数据;在实际环境中,人员发出语音信息时会不可避免地附有部分可检测的呼吸声音信息,而这部分呼吸声音信息也会一定程度地干扰语音信息内容的正确表达;但传统的频谱减法算法并没有考虑呼吸声音信息对音频数据信息表达的干扰,无法选取合适的频谱信息进行相减,导致传统去噪后的音频数据无法准确表达音频信息内容,降低了去噪效果。
发明内容
本发明提供一种用于无线麦克风的音频去噪方法,以解决现有的问题:传统的频谱减法算法并没有考虑呼吸声音信息对音频数据信息表达的干扰,无法选取合适的频谱信息进行相减,导致传统去噪后的音频数据无法准确表达音频信息内容。
本发明的一种用于无线麦克风的音频去噪方法采用如下技术方案:
包括以下步骤:
获取若干背景电流数据以及音频电流数据;
对背景电流数据整体与音频电流数据整体进行频谱相减得到由若干频率构成的音频有效信息频谱图;综合音频有效信息频谱图中频率左右邻域之间的能量值分布差异以及能量共振关联情况,获取每个频率的音频呼吸共振程度;根据音频呼吸共振程度,从所有频率中筛选出若干音频呼吸共振频率;
对于任意一个频率,分析所述频率的高低频分布趋向,对比所述频率与音频呼吸共振频率之间的能量差异,并结合所述频率的音频呼吸共振程度,得到所述频率的音频呼吸对比程度;根据音频呼吸对比程度,从所有频率中筛选出若干音频呼吸频率;
根据音频有效信息频谱图中的音频呼吸频率,从每个音频电流数据的傅里叶频谱图中筛选出若干待剔除音频呼吸频率;根据待剔除音频呼吸频率对音频有效信息频谱图进行处理得到麦克风音频去噪数据序列。
优选的,所述音频呼吸共振程度的获取方法为:
将音频有效信息频谱图中任意一个频率记为目标频率,对目标频率左右两侧分布的频率进行数据段划分,得到目标频率的左邻音频频率数据段以及右邻音频频率数据段;
对比目标频率在左邻音频频率数据段与右邻音频频率数据段之间能量的变化浮动差异,获取目标频率的左右邻域音频能量差异值;
对比左邻音频频率数据段与右邻音频频率数据段之间相同位置下能量分布的对称共振情况,获取目标频率的左右邻域音频能量对称性;
根据左右邻域音频能量差异值、左右邻域音频能量对称性以及目标频率的能量值,得到目标频率的音频呼吸共振程度;所述音频呼吸共振程度与所述左右邻域音频能量差异值呈正相关,与所述左右邻域音频能量对称性呈正相关,与所述能量值呈正相关。
优选的,所述左右邻域音频能量差异值的获取方法为:
根据目标频率与左邻音频频率数据段的能量差异,获取目标频率的左邻音频能量差异值;
根据目标频率与右邻音频频率数据段的能量差异,获取目标频率的右邻音频能量差异值;
将左邻音频能量差异值右邻音频能量差异值之间的差异量,作为目标频率的左右邻域音频能量差异值。
优选的,所述左邻音频能量差异值的获取方法为:
将目标频率与左邻音频频率数据段中每个频率之间能量值的差异总量,作为目标频率的左邻音频能量差异值。
优选的,所述左右邻域音频能量对称性的获取方法为:
将目标频率的两侧相同位置之间能量的差异,作为每个位置的同位频率能量差异值;
根据两侧同位频率能量差异值,得到目标频率的左右邻域音频能量对称性;所述左右邻域音频能量对称性与两侧同位频率能量差异值呈负相关。
优选的,所述音频呼吸共振频率的获取方法为:
将音频呼吸共振程度大于预设音频呼吸共振程度阈值的频率记为音频呼吸共振频率。
优选的,所述音频呼吸对比程度的获取方法为:
将音频有效信息频谱图中任意一个频率记为目标频率;
将目标频率与音频有效信息频谱图内频率中心之间的距离,作为目标频率的高低频分布趋向距离;
获取目标频率的最小近邻音频能量差异值;
根据高低频分布趋向距离、最小近邻音频能量差异值以及目标频率的音频呼吸共振程度,得到目标频率的音频呼吸对比程度;所述音频呼吸对比程度与所述高低频分布趋向距离呈正相关,与所述最小近邻音频能量差异值呈正相关,与所述音频呼吸共振程度呈负相关。
优选的,所述最小近邻音频能量差异值的获取方法为:
将第一目标频率与第一目标频率距离最小的音频呼吸共振频率之间能量值的差异量,作为第一目标频率的最小近邻音频能量差异值。
优选的,所述音频呼吸频率的获取方法为:
将音频呼吸对比程度大于预设音频呼吸对比程度阈值的频率记为音频呼吸频率。
优选的,所述待剔除音频呼吸频率的获取方法为:
对于任意一个音频电流数据,对音频电流数据进行傅里叶变换得到音频电流数据的傅里叶频谱图;获取傅里叶频谱图中的若干音频呼吸频率,并记为单音频呼吸频率;
在音频电流数据的傅里叶频谱图上所有单音频呼吸频率中,将与音频有效信息频谱图中音频呼吸频率之间频率数值相同的单音频呼吸频率记为待剔除音频呼吸频率。
本发明的技术方案的有益效果是:首先通过综合频率左右邻域之间的能量值分布差异以及能量共振关联情况,获取音频呼吸共振程度;并从所有频率中筛选出若干音频呼吸共振频率;其中音频呼吸共振程度用于描述呼吸声音信息与麦克风中人员有效的语音信息之间的关联程度,更加明显地表示了频率上对应的音频信息受到呼吸声音干扰的强度;其中音频呼吸共振频率用于描述基于整体数据表征的频率信息而言,呼吸声音与讲话声音能量容易共振的频率,更便于分析单个数据表征的频率信息中呼吸声音的干扰情况;然后分析所述频率的高低频分布趋向,对比所述频率与音频呼吸共振频率之间的能量差异,并结合所述频率的音频呼吸共振程度,得到音频呼吸对比程度;其中音频呼吸对比程度用于描述讲话声音信息与呼吸声音信息在同一频率上的差异程度,更易区别呼吸声音信息与讲话声音信息;然后根据音频呼吸频率筛选出若干待剔除音频呼吸频率;其中音频呼吸频率用于描述呼吸声音信息与讲话声音信息区别较大的频率,更易判断需要通过频谱相减完全去噪的频率;最后进行频谱相减,逆变换还原去噪后的数据;本发明通过分析不同频率下呼吸声音信息对音频数据信息表达的干扰情况,自适应筛选出需要进行去噪的频率,并通过频谱相减完全去噪,更有效地降低了音频数据中的噪声量,提高了去噪后的音频数据表达音频信息内容的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的一种用于无线麦克风的音频去噪方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种用于无线麦克风的音频去噪方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种用于无线麦克风的音频去噪方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种用于无线麦克风的音频去噪方法的步骤流程图,该方法包括以下步骤:
步骤S001:获取若干背景电流数据以及音频电流数据。
需要说明的是,现有技术通常利用频谱减法算法将背景噪声频谱信息与音频数据的全部频谱信息相减,逆变换得到去噪后的音频数据;在实际环境中,人员发出语音信息时会不可避免地附有部分可检测的呼吸声音信息,而这部分呼吸声音信息也会一定程度地干扰语音信息内容的正确表达;但传统的频谱减法算法并没有考虑呼吸声音信息对音频数据信息表达的干扰,无法选取合适的频谱信息进行相减,导致传统去噪后的音频数据无法准确表达音频信息内容,降低了去噪效果。
具体的,首先需要获取背景电流数据以及音频电流数据,具体过程为:使实验人员沉默5分钟,使用无线麦克风转换电流数据传输至显示器,并在沉默期间内每隔0.5秒记录一次显示器上的背景电流数据,获取若干背景电流数据;使实验人员开始即兴演讲5分钟,并在演讲期间内每隔0.5秒记录一次显示器上的音频电流数据,获取若干音频电流数据。
所需说明的是,本实施例中实验人员沉默时间、演讲时间以及电流数据的记录间隔可根据具体实施情况而定。
至此,通过上述方法得到所有背景电流数据以及音频电流数据。
步骤S002:对背景电流数据整体与音频电流数据整体进行频谱相减得到由若干频率构成的音频有效信息频谱图;综合音频有效信息频谱图中频率左右邻域之间的能量值分布差异以及能量共振关联情况,获取每个频率的音频呼吸共振程度;根据音频呼吸共振程度,从所有频率中筛选出若干音频呼吸共振频率。
需要说明的是,在常规情况下,无线麦克风会尽可能捕捉一切能达到麦克风最低声量要求的声音,并将其转换为电流数据,从而完成音量的扩大。人员在使用无线麦克风进行讲话时,讲话声音是通过声带振动空气所形成;与此同时,人员在呼吸时也会使空气存在一定程度的振动,产生一定量的微弱声音;又因人员在讲话过程中不同的语句要求的发音不同,从而对呼吸频率以及呼吸强度的影响不同,导致这部分微弱的呼吸声音会随着人员的讲话过程产生不同程度的变化,进而使部分呼吸声音可被麦克风捕捉到并一同进行音量扩大。而在实际环境中,实际需要扩大的声音通常仅有人员使用无线麦克风时的讲话声音,因此可以先将音频电流数据中的背景噪声信息去除,初始获取去噪后的音频电流数据,然后分析呼吸声音对后续音频电流数据的影响,降低呼吸声音对音频电流数据的干扰。
具体的,对所有背景电流数据构成的序列进行傅里叶变换得到背景音频信息频谱图;对所有音频电流数据构成的序列进行傅里叶变换得到音频信息频谱图;将音频有效信息频谱图与背景音频信息频谱图相减,得到相减后的频谱图,并记为音频有效信息频谱图。其中频谱图中的横轴为频率,纵轴为对应频率的能量值。另外根据数据序列获取频谱图的过程是傅里叶变换算法的公知内容,本实施例不再赘述。
进一步需要说明的是,在分析呼吸声音对音频电流数据影响的过程中,呼吸声音会与讲话声音互相叠加形成最终的音频电流数据,在不同时间下呼吸声音对讲话声音的影响关系在不断发生变化;对于音频电流数据下的任意一个频率分量而言,若该频率分量的能量较大,其两侧的能量分布趋近对称,且两侧能量变化趋近平缓,说明该频率分量下对应的呼吸声音与讲话声音之间的变化频率趋近同步,讲话声音所含能量相比于呼吸声音能量含量较多,使讲话声音较大程度地将呼吸声音表征的声音信息覆盖,从而使呼吸声音对讲话声音造成的干扰越弱,反映该频率分量内呼吸声音与讲话声音的能量共振重合情况较好,需要进行去噪的强度较弱。因此可以通过分析不同频率下的能量值、其两侧的能量分布的对称情况以及两侧能量的变化浮动差异,综合得到每个频率的音频呼吸共振程度,以便准确地确定实际存在能量共振的频率;综上可以综合频率左右邻域之间的能量值分布差异以及能量共振关联情况,获取每个频率的音频呼吸共振程度。
进一步的,预设一个频率数量,其中本实施例以为例进行叙述,本实施例不进行具体限定,其中可根据具体实施情况而定;以音频有效信息频谱图中的任意一个频率为例,将该频率的前个频率构成的数据段记为该频率的左邻音频频率数据段;将该频率的前个频率构成的数据段记为该频率的右邻音频频率数据段。
特别说明的是,其中若该频率前实际存在的频率数量不满足预设的,那么在该频率之前补充与该频率数值相同的频率,直至该频率前实际存在的频率数量满足预设的为止停止补充,获取该频率的左邻音频频率数据段;若该频率后实际存在的频率数量不满足预设的,那么在该频率之后补充与该频率数值相同的频率,直至该频率后实际存在的频率数量满足预设的为止停止补充,获取该频率的右邻音频频率数据段。
进一步的,通过对比该频率在左邻音频频率数据段与右邻音频频率数据段之间的变化浮动差异,得到该频率的左右邻域音频能量差异值。其中获取该频率的左右邻域音频能量差异值的具体过程为:获取该频率的左邻音频能量差异值;获取该频率的右邻音频能量差异值;将左邻音频能量差异值右邻音频能量差异值之间的差异量,作为该频率的左右邻域音频能量差异值。作为一种示例,可通过如下公式计算该频率的左右邻域音频能量差异值:
式中,表示该频率的左右邻域音频能量差异值;表示该频率的左邻音频频率数据段中所有频率的数量;表示该频率的能量值;表示该频率的左邻音频频率数据段中第个频率的能量值;表示该频率的右邻音频频率数据段中所有频率的数量;表示该频率的右邻音频频率数据段中第个频率的能量值;表示取绝对值。
所需说明的是,表示该频率的左邻音频能量差异值;表示该频率的右邻音频能量差异值;若该频率的左右邻域音频能量差异值越大,说明该频率两侧音频信息的能量波动越混乱,反映呼吸声音信息与麦克风中人员有效的语音信息对应能量的重合效果越差。
进一步的,对比左邻音频频率数据段与右邻音频频率数据段之间相同位置下能量分布的对称共振情况,得到该频率的左右邻域音频能量对称性。其中获取该频率的左右邻域音频能量对称性的具体过程为:获取该频率的两侧同位频率能量差异值;根据两侧同位频率能量差异值,得到该频率的左右邻域音频能量对称性;其中该左右邻域音频能量对称性与该两侧同位频率能量差异值呈负相关。作为一种示例,可通过如下公式计算该频率的左右邻域音频能量对称性:
式中,表示该频率的左右邻域音频能量对称性;表示预设的超参数,本实施例预设,用于防止分母为0;表示该频率的左邻音频频率数据段与右邻音频频率数据段之间相同位置的所有序号的数量;表示该频率的左邻音频频率数据段中第个频率的能量值;表示该频率的右邻音频频率数据段中第个频率的能量值;表示取绝对值。
所需说明的是,表示该频率的两侧同位频率能量差异值;若该频率的左右邻域音频能量对称性越大,说明该频率两侧音频信息的能量分布越对称同步,反映该频率的呼吸声音信息与麦克风中人员有效的语音信息的关联越紧密。
进一步的,通过将该频率的左右邻域音频能量差异值、左右邻域音频能量对称性以及该频率的能量值结合,得到该频率的音频呼吸共振因子;其中该音频呼吸共振因子与该左右邻域音频能量差异值呈正相关,与该左右邻域音频能量对称性呈正相关,与该能量值呈正相关。作为一种示例,可通过如下公式计算该频率的音频呼吸共振因子:
式中,表示该频率的音频呼吸共振因子;表示该频率的能量值;表示该频率的左右邻域音频能量差异值;表示该频率的左右邻域音频能量对称性。
所需说明的是,若该频率的音频呼吸共振因子越大,说明呼吸声音信息与麦克风中人员有效的语音信息之间的关联越紧密,反映该频率上对应的音频信息受到呼吸声音的干扰越弱。
进一步的,获取所有频率的音频呼吸共振因子,对所有音频呼吸共振因子进行线性归一化,将归一化后的每个音频呼吸共振因子记为音频呼吸共振程度;预设一个音频呼吸共振程度阈值,其中本实施例以为例进行叙述,本实施例不进行具体限定,其中可根据具体实施情况而定;将音频呼吸共振程度大于的频率记为音频呼吸共振频率。
至此,通过上述方法得到所有音频呼吸共振频率。
步骤S003:分析每个频率的高低频分布趋向,对比每个频率与音频呼吸共振频率之间的能量差异,并结合每个频率的音频呼吸共振程度,得到每个频率的音频呼吸对比程度;根据音频呼吸对比程度,从所有频率中筛选出若干音频呼吸频率。
需要说明的是,音频呼吸共振频率用于描述在整体音频电流数据的频率信息分布中,呼吸信息与讲话信息之间能量分布较为同步的频率;对于这部分频率而言,呼吸信息并没有对实际的讲话信息进行较为明显的干扰,对实际的数据信息表达影响不大,所以可以不对这部分频率通过频谱相减进行去噪处理;因此可以通过分析不同频率与音频呼吸共振频率之间的能量分布差异,确定频率中呼吸信息与讲话信息之间的能量区别情况。同时又因呼吸声音在不断发生变化,使对应的主要频率信息在高低频信息中都有可能出现,若呼吸声音对应的主要频率信息越远离高低频之间的分界处,那么说明呼吸声音越不容易与讲话声音混淆,可以很好地将呼吸声音单独进行剔除,而不影响讲话声音的信息内容。所以可以通过分析不同频率在频谱信息中的高低频分布趋向,确定呼吸声音与讲话声音之间所含信息的区别情况;综上,可以通过分析单个频率与音频呼吸共振频率之间的能量分布差异,以及单个频率在频谱信息中的高低频分布趋向,得到音频呼吸对比程度。
具体的,以任意一个频率为例,在除该频率以外的其他频率中,将与该频率距离最短的音频呼吸共振频率记为该频率的近邻音频对照频率;根据该频率在频谱信息中的高低频分布趋向以及与近邻音频对照频率的能量差异,得到该频率的音频呼吸对比程度。其中获取该频率的音频呼吸对比程度的具体过程为:获取该频率的高低频分布趋向距离;获取该频率的最小近邻音频能量差异值;根据高低频分布趋向距离、最小近邻音频能量差异值以及该频率的音频呼吸共振程度,得到该频率的音频呼吸对比程度;其中该音频呼吸对比程度与该高低频分布趋向距离呈正相关,与该最小近邻音频能量差异值呈正相关,与该音频呼吸共振程度呈负相关。作为一种示例,可通过如下公式计算该频率的音频呼吸对比程度:
式中,表示该频率的音频呼吸对比程度;表示该频率的近邻音频对照频率与该频率之间能量值的差值的绝对值;表示该频率的音频呼吸共振程度;表示该频率在所有频率中的序号;表示所有频率的数量;表示预设的超参数,本实施例预设,用于防止分母为0;表示取绝对值;表示向上取整;获取所有频率的音频呼吸对比程度。
所需说明的是,表示该频率的高低频分布趋向距离;表征该频率的最小近邻音频能量差异值;若该频率的音频呼吸对比程度越大,说明该频率所表征的声音信息中呼吸信息与讲话信息之间能量信息分布越不相似,反映该频率所表征的声音信息中呼吸声音与讲话声音之间的区别越明显。
进一步的,预设一个音频呼吸对比程度阈值,其中本实施例以为例进行叙述,本实施例不进行具体限定,其中可根据具体实施情况而定;将音频呼吸对比程度大于的频率记为音频呼吸频率。
至此,通过上述方法得到所有音频呼吸频率。
步骤S004:根据音频有效信息频谱图中的音频呼吸频率,从每个音频电流数据的傅里叶频谱图中筛选出若干待剔除音频呼吸频率;根据待剔除音频呼吸频率对音频有效信息频谱图进行处理得到麦克风音频去噪数据序列。
需要说明的是,由于音频电流数据整体的频谱信息是由单个音频电流数据的频谱信息整合叠加而来,所以为了更准确地对音频电流数据进行去噪,可以进一步对比单个音频电流数据整体音频电流数据之间音频呼吸频率分布,进行频谱相减,剔除呼吸声音对讲话声音干扰较大的频率信息。
具体的,对每个音频电流数据进行傅里叶变换得到每个音频电流数据的傅里叶频谱图;将任意一个音频电流数据的傅里叶频谱图中的每个频率记为单音频数据频率;参考音频有效信息频谱图中音频呼吸频率的获取方法,将音频有效信息频谱图替换为该音频电流数据的傅里叶频谱图,获取该傅里叶频谱图中的若干音频呼吸频率,并记为单音频呼吸频率;
在该音频电流数据的傅里叶频谱图上所有单音频呼吸频率中,将与音频呼吸频率之间频率数值相同的单音频呼吸频率记为待剔除音频呼吸频率,获取该音频电流数据的傅里叶频谱图中所有待剔除音频呼吸频率;获取所有音频电流数据的傅里叶频谱图中所有待剔除音频呼吸频率。
所需说明的是,待剔除音频呼吸频率用于描述单个音频电流数据中所含呼吸声音信息占比较大的频率。
进一步的,将音频有效信息频谱图与所有音频电流数据的傅里叶频谱图中的每个待剔除音频呼吸频率的能量值相减,得到相减后的频谱图记为音频去噪信息频谱图。对音频去噪信息频谱图进行逆傅里叶变换得到变换后的数据序列,并记为麦克风音频去噪数据序列。其中频谱图与频率的能量值相减的过程是频谱减法算法的公知内容,根据频谱图得到数据序列的过程是逆傅里叶变换算法的公知内容,本实施例不再赘述。
至此,本实施例完成。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种用于无线麦克风的音频去噪方法,其特征在于,该方法包括以下步骤:
获取若干背景电流数据以及音频电流数据;
对背景电流数据整体与音频电流数据整体进行频谱相减得到由若干频率构成的音频有效信息频谱图;综合音频有效信息频谱图中频率左右邻域之间的能量值分布差异以及能量共振关联情况,获取每个频率的音频呼吸共振程度;根据音频呼吸共振程度,从所有频率中筛选出若干音频呼吸共振频率;
对于任意一个频率,分析所述频率的高低频分布趋向,对比所述频率与音频呼吸共振频率之间的能量差异,并结合所述频率的音频呼吸共振程度,得到所述频率的音频呼吸对比程度;根据音频呼吸对比程度,从所有频率中筛选出若干音频呼吸频率;
根据音频有效信息频谱图中的音频呼吸频率,从每个音频电流数据的傅里叶频谱图中筛选出若干待剔除音频呼吸频率;根据待剔除音频呼吸频率对音频有效信息频谱图进行处理得到麦克风音频去噪数据序列;
所述音频呼吸共振程度的获取方法为:
将音频有效信息频谱图中任意一个频率记为目标频率,对目标频率左右两侧分布的频率进行数据段划分,得到目标频率的左邻音频频率数据段以及右邻音频频率数据段;
对比目标频率在左邻音频频率数据段与右邻音频频率数据段之间能量的变化浮动差异,获取目标频率的左右邻域音频能量差异值;
对比左邻音频频率数据段与右邻音频频率数据段之间相同位置下能量分布的对称共振情况,获取目标频率的左右邻域音频能量对称性;
根据左右邻域音频能量差异值、左右邻域音频能量对称性以及目标频率的能量值,得到目标频率的音频呼吸共振程度;所述音频呼吸共振程度与所述左右邻域音频能量差异值呈正相关,与所述左右邻域音频能量对称性呈正相关,与所述能量值呈正相关;
所述左右邻域音频能量差异值的获取方法为:
根据目标频率与左邻音频频率数据段的能量差异,获取目标频率的左邻音频能量差异值;
根据目标频率与右邻音频频率数据段的能量差异,获取目标频率的右邻音频能量差异值;
将左邻音频能量差异值右邻音频能量差异值之间的差异量,作为目标频率的左右邻域音频能量差异值;
将目标频率与左邻音频频率数据段中每个频率之间能量值的差异总量,作为目标频率的左邻音频能量差异值;将目标频率与右邻音频频率数据段中每个频率之间能量值的差异总量,作为目标频率的右邻音频能量差异值;
所述左右邻域音频能量对称性的获取方法为:
将目标频率的两侧相同位置之间能量的差异,作为每个位置的同位频率能量差异值;
根据两侧同位频率能量差异值,得到目标频率的左右邻域音频能量对称性;所述左右邻域音频能量对称性与两侧同位频率能量差异值呈负相关。
2.根据权利要求1所述一种用于无线麦克风的音频去噪方法,其特征在于,所述音频呼吸共振频率的获取方法为:
将音频呼吸共振程度大于预设音频呼吸共振程度阈值的频率记为音频呼吸共振频率。
3.根据权利要求1所述一种用于无线麦克风的音频去噪方法,其特征在于,所述音频呼吸对比程度的获取方法为:
将音频有效信息频谱图中任意一个频率记为目标频率;
将目标频率与音频有效信息频谱图内频率中心之间的距离,作为目标频率的高低频分布趋向距离;
获取目标频率的最小近邻音频能量差异值;
根据高低频分布趋向距离、最小近邻音频能量差异值以及目标频率的音频呼吸共振程度,得到目标频率的音频呼吸对比程度;所述音频呼吸对比程度与所述高低频分布趋向距离呈正相关,与所述最小近邻音频能量差异值呈正相关,与所述音频呼吸共振程度呈负相关。
4.根据权利要求3所述一种用于无线麦克风的音频去噪方法,其特征在于,所述最小近邻音频能量差异值的获取方法为:
将第一目标频率与第一目标频率距离最小的音频呼吸共振频率之间能量值的差异量,作为第一目标频率的最小近邻音频能量差异值。
5.根据权利要求1所述一种用于无线麦克风的音频去噪方法,其特征在于,所述音频呼吸频率的获取方法为:
将音频呼吸对比程度大于预设音频呼吸对比程度阈值的频率记为音频呼吸频率。
6.根据权利要求1所述一种用于无线麦克风的音频去噪方法,其特征在于,所述待剔除音频呼吸频率的获取方法为:
对于任意一个音频电流数据,对音频电流数据进行傅里叶变换得到音频电流数据的傅里叶频谱图;获取傅里叶频谱图中的若干音频呼吸频率,并记为单音频呼吸频率;
在音频电流数据的傅里叶频谱图上所有单音频呼吸频率中,将与音频有效信息频谱图中音频呼吸频率之间频率数值相同的单音频呼吸频率记为待剔除音频呼吸频率。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202410683361.4A CN118283468B (zh) | 2024-05-30 | 2024-05-30 | 一种用于无线麦克风的音频去噪方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202410683361.4A CN118283468B (zh) | 2024-05-30 | 2024-05-30 | 一种用于无线麦克风的音频去噪方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN118283468A CN118283468A (zh) | 2024-07-02 |
| CN118283468B true CN118283468B (zh) | 2024-09-06 |
Family
ID=91645365
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202410683361.4A Active CN118283468B (zh) | 2024-05-30 | 2024-05-30 | 一种用于无线麦克风的音频去噪方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN118283468B (zh) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119207487B (zh) * | 2024-09-12 | 2025-07-04 | 安徽艾德未来智能科技有限公司 | 一种用于蓝牙耳机的音频录音及转换方法 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112908302A (zh) * | 2021-01-26 | 2021-06-04 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3096880B2 (ja) * | 1994-05-18 | 2000-10-10 | 長野日本無線株式会社 | 音声信号処理方法及び装置 |
| GB0202386D0 (en) * | 2002-02-01 | 2002-03-20 | Cedar Audio Ltd | Method and apparatus for audio signal processing |
| US20080162119A1 (en) * | 2007-01-03 | 2008-07-03 | Lenhardt Martin L | Discourse Non-Speech Sound Identification and Elimination |
| EP3389477B1 (en) * | 2015-12-16 | 2023-05-10 | Dolby Laboratories Licensing Corporation | Suppression of breath in audio signals |
| CN114333901A (zh) * | 2021-12-24 | 2022-04-12 | 西交利物浦大学 | 呼吸异常分类模型的训练、呼吸异常检测方法及电子设备 |
-
2024
- 2024-05-30 CN CN202410683361.4A patent/CN118283468B/zh active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112908302A (zh) * | 2021-01-26 | 2021-06-04 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种音频处理方法、装置、设备及可读存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN118283468A (zh) | 2024-07-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN118283468B (zh) | 一种用于无线麦克风的音频去噪方法 | |
| US20200015709A1 (en) | Methods and apparatus for cough detection in background noise environments | |
| CN103229517B (zh) | 包括多个音频传感器的设备及其操作方法 | |
| CN106601265B (zh) | 一种消除毫米波生物雷达语音中噪声的方法 | |
| US20120253807A1 (en) | Speaker state detecting apparatus and speaker state detecting method | |
| CN103544961B (zh) | 语音信号处理方法及装置 | |
| CN107610712B (zh) | 一种结合mmse和谱减法的语音增强方法 | |
| KR20220062598A (ko) | 오디오 신호 생성을 위한 시스템 및 방법 | |
| JP2023517175A (ja) | 音声録音と体内からの音の聴音を使用した医学的状態の診断 | |
| WO2020077413A1 (en) | A method and apparatus for diagnosis of maladies from patient sounds | |
| CN116935880B (zh) | 基于人工智能的一体机人机交互系统和方法 | |
| CN120030518B (zh) | 一种基于呼吸音的用户身份认证方法及系统 | |
| CN117711419B (zh) | 用于数据中台的数据智能清洗方法 | |
| JP2020513914A (ja) | 睡眠呼吸障害の特徴付け方法 | |
| CN106653004B (zh) | 感知语谱规整耳蜗滤波系数的说话人识别特征提取方法 | |
| EP4254409A1 (en) | Voice detection method | |
| JP7061126B6 (ja) | 睡眠呼吸障害を特徴付ける方法 | |
| CN110931034B (zh) | 一种送话拾音麦克风内置型耳机的拾音降噪方法 | |
| CN119694328A (zh) | 一种基于声音特征的录音除噪方法、系统、设备及介质 | |
| CN118609586B (zh) | 一种声音数据处理方法及系统 | |
| CN109036472B (zh) | 一种改进的病理嗓音基音频率提取方法 | |
| CN118484667A (zh) | 一种先进泳衣生产数据异常检测方法及系统 | |
| JP2003510665A (ja) | 適応フィルタリングアルゴリズムを用いるデエッサーのための装置および方法 | |
| CN111341327A (zh) | 一种基于粒子群算法的说话人语音识别方法、装置和设备 | |
| US20210007703A1 (en) | Method and system for recognizing crackles |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |