CN102044249B - 一种适用于文件播出系统的音频响度一致性控制方法 - Google Patents
一种适用于文件播出系统的音频响度一致性控制方法 Download PDFInfo
- Publication number
- CN102044249B CN102044249B CN2010105822269A CN201010582226A CN102044249B CN 102044249 B CN102044249 B CN 102044249B CN 2010105822269 A CN2010105822269 A CN 2010105822269A CN 201010582226 A CN201010582226 A CN 201010582226A CN 102044249 B CN102044249 B CN 102044249B
- Authority
- CN
- China
- Prior art keywords
- loudness
- value
- audio
- file
- adjustment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000005070 sampling Methods 0.000 claims abstract description 6
- 230000008676 import Effects 0.000 claims abstract description 4
- 238000004364 calculation method Methods 0.000 claims description 15
- 238000000605 extraction Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 12
- 230000001172 regenerating effect Effects 0.000 abstract description 3
- 239000000463 material Substances 0.000 description 9
- 238000011045 prefiltration Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000005259 measurement Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Landscapes
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
本发明涉及一种适用于文件播出系统的音频响度一致性控制方法,该方法将在播出前对待播出节目文件中的音频进行扫描分析,获取待播文件的响度特征,根据响度控制目标确定响度调整值。具体包括对待播音频文件从头至尾以一定的窗口宽度进行划分,提取所有窗口的平均响度值和该音频文件的最大峰值电平以及总体平均响度;将大于总体平均响度值并出现次数最多的响度值作为响度特征值;导入响度调整目标值、并确定响度调整值;将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频。本发明对现有技术的贡献是:响度一致性的控制效果好;不会改变节目动态范围,对原有的艺术效果没有破坏;既保证了响度控制的质量,又解决了重新生成文件所带来的低效问题。
Description
技术领域
本发明涉及一种适用于文件播出系统的音频响度一致性控制方法,该方法将对播出文件中的响度控制信息与素材文件分离开,既保证了响度控制的质量,又解决了重新生成文件所带来的低效问题,而且素材的内容没有进行过二次处理,保证了素材的原始效果。
背景技术
目前播出系统中,由于音频校准电平不统一、动态处理不当等各种原因,存在不同电视台之间、不同频道之间,甚至是同一频道不同的节目之间、节目与广告之间声音响度不同的问题,导致观众在收看电视节目过程中,在切换频道或者节目、广告切换过程中需要不断调整电视机输出音量的不便。要想做到不同的节目之间都能让观众得到一个满意的相对声音响度,需要解决测量与调整两方面的问题。有的电视台对提交的节目提出了一些音频的参数指标,希望能够得到响度一致的节目,但是由于这些指标并不能真正反映音频的真实响度,因此控制效果并不理想;有一些设备厂商有自己的响度解决方案,这样能够比较好地对不同节目进行响度控制,但是受限于的特殊的音频格式,以及在传输过程中需要携带特殊的元数据信息,因此并不能适应所有情况。再加上电视台节目的来源比较广泛,有自产的,也有外购、收录的,情况比较复杂,要求送到播出部门的待播节目的响度一致是非常困难的。
如何能够达到响度一致是目前各家电视台都非常关心的问题,现有的解决方法主要包括响度的整体调整和实时调整;前者按照不同音频的平均响度进行整体调整,调整后不同音频的平均响度均与目标响度保持一致;后者对音频作部分调整,对音频中响度小的部分进行提升,响度大的部分进行衰减。但这两种方式都有各自优缺点:整体调整可保持节目的动态范围,但该调整把平均响度作为描述音频的唯一信息,对不同类型的节目作统一处理可能导致调整后不同节目听起来声音并不相同;实时调整可以使节目内(节目间)响度趋于一致,但会破坏音频的动态范围,音频声音效果将大打折扣。
发明内容
本发明的目的是提出一种适用于文件播出系统的音频响度一致性控制方法,该方法对不同类型音频引入动态指标,将响度控制信息与源素材文件分离开,既保证了响度控制的质量,又解决了重新生成文件所带来的低效问题,而且源素材的内容没有进行过二次处理,保证了素材的原始效果。
为了实现上述目的,本发明的技术方案是,一种适用于文件播出系统的音频响度一致性控制方法,在素材文件中分离出在播出前对待播出节目文件中的音频数据进行扫描分析,获取待播出节目文件的响度特征,根据响度控制目标确定响度调整值,将带有响度调整值的响度控制信息连同待播出节目文件一同送入播出服务器,在播出服务器中作最终的响度调整并播出,对响度文件调整值的分析提取使用了ITU-BS.1770标准中的响度计算,控制方法步骤包括:
a.提取待播出文件中的音频数据,对音频数据从头至尾以50至1000毫秒的窗口宽度进行划分,提取所有窗口的平均响度值和该音频文件的最大峰值电平;
b.将大于平均响度值、并出现次数最多的响度值作为响度特征值;
c.导入响度调整目标值并确定响度调整值;
d.将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频。
所述窗口宽度最佳是200毫秒。
所述窗口相互交叠,交叠的宽度是1/10窗口宽度至1/2窗口宽度。
所述交叠的宽度最佳是1/4窗口宽度。
所述确定响度调整值的步骤是:首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’adj;再通过计算方法Ladj=min(L’adj, - Vpeak)确定响度调整值,其中Vpeak是该待播文件最大响度峰值电平。
本发明对现有技术的贡献是:响度一致性的控制效果好;不会改变节目动态范围,对原有的艺术效果没有破坏;对播出设备的改造要求小;对播出设备的调节能力要求低。
下面结合实施例和附图对本发明做一详细描述。
附图说明
图1为播出系统流程框图;
图2为本发明控制方法流程图;
图3为多声道响度算法方框图;
图4为头部声学效应的前置滤波器响应图;
图5为二阶滤波器的信号流程图;
图6为 RLB加权曲线图;
图7为实时响度曲线和计算示意图。
具体实施方式
一种适用于文件播出系统的音频响度一致性控制方法实施例,参见图1至图7;如图1所示,该方法是在一个播出系统中实现,其播出系统包括响度控制服务器1,近线存储2和播出服务器3,响度控制服务器从近线存储中的素材文件中分离出音频数据进行扫描分析,获取待播文件的响度特征,根据响度控制目标确定响度调整值,将带有响度调整值的响度文件送回到近线服务器,连同源素材文件一同送入播出服务器,在播出服务器中作最终的响度调整并播出,对响度调整值的分析提取中利用ITU-BS.1770标准中的响度计算方法,对待播出文件中的音频信息以响度特征值为核心进行调整,如图2所示,所述控制方法步骤包括:
a.提取待播出节目文件中的音频数据,对音频数据进行响度扫描分析,即对音频文件从头至尾以50至1000毫秒的窗口宽度进行划分,提取所有窗口的平均响度值和该音频文件的最大峰值电平;其中,所述窗口宽度最佳是200毫秒;
b.确定响度特征值,即将大于平均响度值、并出现次数最多的响度值作为响度特征值;
c.导入响度调整目标值并确定响度调整值;
d.确定最终调整音频;即将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频。
为了提高分析的准确性,所述窗口相互交叠,交叠的宽度是1/10窗口宽度至1/2窗口宽度;交叠的宽度最佳是1/4窗口宽度。
其中,所述确定响度调整值的步骤是:首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’adj;在通过计算方法Ladj=min(L’adj, - Vpeak)确定响度调整值,其中Vpeak是待播出节目文件最大响度峰值电平。
下面对上述方案进行具体的描述:
本实施例使用的音频节目响度计算方法,采用的是ITU-R BS.1770-1 建议书中所阐释的方法。该方法规定了多声道响度测量算法,图3所示的是该算法各个组成部件的方框图;方框图显示了五个主要通道的输入,左边XL、中间XC、右边XR、左边环绕XLS和右边环绕XRS,分别经过前置滤波器、RLB滤波器,从RLB滤波器输出YL、YC、YR、YLS、YRS、到均方,从均方输出ZL、ZC、ZR、ZLS、ZRS到GL、GC、GR、GLS、GRS汇总到∑输出,这样允许监听包含一至五个通道的节目。对于少于五个通道的节目,一些输入将不会使用。该测量法中不包括低频效应(LFE)通道。
算法的第一步是在Leq(RLB)测量之前,对信号进行前置滤波,图4 示了前置滤波用于说明头部的声学效应,这里把头部模拟为一个固定的球体。
前置滤波器定义为如图5 所示的滤波器,滤波器系数见表1。
表1 模拟球形头部的前置滤波器的滤波器系数
算法的第二步是应用RLB 加权曲线,该曲线由如图6所示的一个简单的高通滤波器组成。
RLB 加权曲线定义为如图5所示的一个2 阶滤波器,其系数见表2。
表2 RLB 加权曲线的滤波器系数
随着前置滤波器和RLB 滤波的应用,于是测量间隔T 内的均方能量计量如下:
其中,yi是经过模拟头部效应的前置滤波器和RLB 加权曲线滤波以后的输入信号。(i = L,R,C,Ls,Rs,N,这里N 为通道的数量)。
一旦计算出每一个通道的加权均方电平Zi,最后一步就是求N个通道的和,如下所示响度计算公式:
在该算法中使用的频率加权,是前置滤波器和RLB 加权的级联,并定名为“K”加权。上面计算的响度值的数值结果之后应有“LKFS”标志,表示“K 加权的相对满刻度的响度”。该LKFS 单位等于一个分贝,其中信号电平每增加1 dB,将导致响度数值增加1LKFS。
表3 给出了不同通道的加权系数。
表3 各个音频通道的加权
如果将ITU-BS.1770-1建议书中的响度算法记为:LoudnessCalc(W)。其中W是图7所示为待计算响度的音频片段的窗口长度。
当W为音频节目的长度时,计算结果即为该节目的总体平均响度值,记为:Lavg;是图中Lreal(0)、Lreal(1)、Lreal(2)。。。。Lreal(n)的平均值。
对音频文件从头至尾以宽度为W的窗口进行局部的响度扫描计算,连续两次计算交叠大小为O。每次计算可以得到一个局部的响度平均值:
Lreal(t)= LoudnessCalc (t,w,o) t∈[1,N]
其中N为音频按照计算窗口宽度W进行的分段数量。W的取值范围为50到1000毫秒,考虑人耳对声音的分辨率和计算精度的要求,W取值最佳是200毫秒。O的取值通常为W/10到W/2,本实施例建议采用W/4。
Lreal(t)形成的集合即为如图7所示构成该音频文件的实时响度曲线计算值。
响度特征值Leigen的计算方法
响度特征值是能体现人对音频节目响度最敏感响度的值。本实施例对该值的选取思想是,大于总体平均响度的、并出现次数最多的响度值作为响度特征值。通过以下步骤可以获得该值:
1) 对获得的实时响度数据集合Lreal(t),按照1LKFS的分辨率,在-80LKFS到10LKFS范围内进行响度值分布情况统计,得到每个响度值出现的数量S(L)。
2) 如果W为窗口宽度(通常选取W为6LKFS),则以某响度L为中心的响度分布情况F(L)为:
取F(L,W)的最大值Fmax=max(F(L,W)),将它对应的响度值称为最集中响度Lmost。
综合考虑人耳对高响度的敏感性和减少大段静音对最集中响度的影响,我们对高于平均响度的响度值进行统计Fmax,其对应的最集中响度Lmost即作为该文件的响度特征值Leigen。
在实际的播出工作中,每个电视台会根据本台节目声音特点,设定一个各频道、各类节目统一的响度标准值。结合本方法的使用,如果各个频道的不同节目都使用同一个响度标准值作为调整目标,进行响度一致性控制,那么观众收看这个电视台的不同节目时将会感受到大致相同的音量,也就达到了想读一执行控制的目的。因此,我们使用电视台事先确定的响度标准值来作为响度调整目标,该响度调整目标一般事先通过计算机软件设置在响度控制服务器中。如果设定的响度调整目标为Ltarg,则初始响度调整值L’adj为:L’adj=Ltarg-Leigen
数字音频的最小访问单位为采样点,理论最大电平值为0dBFs。如果音频文件中采样点的最大峰值电平为Vpeak(单位dBFs),那么在不失真情况下能够进行的最大增益调整量(峰值储备)为Vmadj ,则有:
Vmadj =0-Vpeak=- Vpeak
因此,考虑峰值储备对响度调整的限制,那么最终的响度调整值Ladj为
Ladj=min(L’adj,Vmadj)
响度控制服务器在确定一个待播出节目文件的响度调整值Ladj后,通常生成一个与该待播出节目文件对应的响度控制文件存放这个调整值;并将这个响度控制文件送回到近线服务器,最终这个响度控制文件连同待播出节目文件一同送入播出服务器,在播出服务器中作最终的响度调整并播出。播出服务器在播出过程中,对播出音频的调整方式如下:
Sampletag(s) =Samplesrc(s)+Ladj s∈[1,N]
其中N为采样点数量。
播出服务器输出的音频就是最终的调整音频。
最后应说明的是,以上仅用以说明本发明的技术方案而非限制,尽管参照较佳布置方案对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案(比如响度控制信息传入播出服务器的方法等)进行修改或者等同替换,而不脱离本发明技术方案的精神和范围。
Claims (4)
1.一种适用于文件播出系统的音频响度一致性控制方法:在播出前对待播出节目文件中的音频数据进行扫描分析,获取待播出节目文件的响度特征,根据响度控制目标确定响度调整值,对响度调整值的分析提取使用了ITU-BS.1770标准中的响度计算,其特征在于,将带有响度调整值的响度控制信息连同待播出节目文件一同送入播出服务器,在播出服务器中作最终的响度调整并播出,所述控制方法步骤包括:
a.提取待播出文件中的音频数据,对音频数据从头至尾以50至1000毫秒的窗口宽度进行划分,提取所有窗口的平均响度值和该音频数据的最大峰值电平和整体平均响度;
b.将大于整体平均响度值、并出现次数最多的响度值作为响度特征值;
c.导入响度调整目标值并确定响度调整值;
d.将响度调整值与原始音频的每个采样点的电平值相加,得到的结果为最终的调整音频;
所述确定响度调整值的步骤是:首先由响度调整目标值减去响度特征值后得到一个响度调整初始值L’adj;再通过计算方法Ladj=min(L’adj, -Vpeak)确定响度调整值,其中Vpeak是该待播文件最大响度峰值电平。
2.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法,其特征在于,所述窗口宽度是200毫秒。
3.根据权利要求1所述的一种适用于文件播出系统的音频响度一致性控制方法,其特征在于,所述窗口相互交叠,交叠的宽度是1/10窗口宽度至1/2窗口宽度。
4.根据权利要求3所述的一种适用于文件播出系统的音频响度一致性控制方法,其特征在于,所述交叠的宽度是1/4窗口宽度。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN2010105822269A CN102044249B (zh) | 2010-12-10 | 2010-12-10 | 一种适用于文件播出系统的音频响度一致性控制方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN2010105822269A CN102044249B (zh) | 2010-12-10 | 2010-12-10 | 一种适用于文件播出系统的音频响度一致性控制方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN102044249A CN102044249A (zh) | 2011-05-04 |
| CN102044249B true CN102044249B (zh) | 2012-05-30 |
Family
ID=43910330
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN2010105822269A Expired - Fee Related CN102044249B (zh) | 2010-12-10 | 2010-12-10 | 一种适用于文件播出系统的音频响度一致性控制方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN102044249B (zh) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103763498B (zh) * | 2014-01-24 | 2017-08-01 | 深圳市影歌科技有限公司 | Hdmi信号处理系统及处理方法 |
| CN103888868A (zh) * | 2014-03-21 | 2014-06-25 | 刘海东 | 一种基于响度调控的声音还原方法 |
| CN104079726B (zh) * | 2014-07-14 | 2016-03-30 | 努比亚技术有限公司 | 一种移动终端及其智能断开通话的方法和装置 |
| CN105681876A (zh) * | 2015-12-30 | 2016-06-15 | 惠州市伟乐科技股份有限公司 | 用于广电播出系统的音频响度一致性控制方法及系统 |
| CN112700784B (zh) * | 2020-12-24 | 2023-12-15 | 惠州市德赛西威汽车电子股份有限公司 | 一种基于itu-r bs.1770的响度校准方法及存储介质 |
| CN113963726B (zh) * | 2021-09-29 | 2023-11-07 | 稿定(厦门)科技有限公司 | 音频响度均衡方法及装置 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19520779C1 (de) * | 1995-06-07 | 1996-05-09 | Loewe Opta Gmbh | Automatische Lautstärkekorrektur |
| US20040199933A1 (en) * | 2003-04-04 | 2004-10-07 | Michael Ficco | System and method for volume equalization in channel receivable in a settop box adapted for use with television |
| US20080095385A1 (en) * | 2004-06-30 | 2008-04-24 | Koninklijke Philips Electronics, N.V. | Method of and System for Automatically Adjusting the Loudness of an Audio Signal |
| US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
| RU2426180C2 (ru) * | 2006-04-04 | 2011-08-10 | Долби Лэборетериз Лайсенсинг Корпорейшн | Расчет и регулировка воспринимаемой громкости и/или воспринимаемого спектрального баланса звукового сигнала |
-
2010
- 2010-12-10 CN CN2010105822269A patent/CN102044249B/zh not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| CN102044249A (zh) | 2011-05-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102686742B1 (ko) | 객체 기반 오디오 신호 균형화 | |
| JP7717925B2 (ja) | 多様な再生環境のためのダイナミックレンジ制御 | |
| US10070243B2 (en) | Loudness adjustment for downmixed audio content | |
| US9859858B2 (en) | Correction of unknown audio content | |
| US11330385B2 (en) | Audio device | |
| JP7595968B2 (ja) | ラウドネスレベルを制御するオーディオ信号処理方法及び装置 | |
| CN102044249B (zh) | 一种适用于文件播出系统的音频响度一致性控制方法 | |
| EP2903301B1 (en) | Improving at least one of intelligibility or loudness of an audio program | |
| EP2614586B1 (en) | Dynamic compensation of audio signals for improved perceived spectral imbalances | |
| KR20210020751A (ko) | 복수의 소비자 장치에 개인화된 오디오 재생 기능을 제공하기 위한 시스템 및 방법 | |
| CN108711435A (zh) | 一种面向响度的高效音频控制方法 | |
| JP2010513974A (ja) | 音声データを処理するシステム | |
| WO2018066383A1 (ja) | 情報処理装置および方法、並びにプログラム | |
| Li et al. | Modeling perceived externalization of a static, lateral sound image | |
| CN103812462A (zh) | 响度控制方法及装置 | |
| EP2828853B1 (en) | Method and system for bias corrected speech level determination | |
| US20240236613A1 (en) | A method, device, storage medium, and headphones of headphone virtual spatial sound playback | |
| Seefeldt | Loudness domain signal processing | |
| US20240276143A1 (en) | Signal normalization using loudness metadata for audio processing | |
| CN117119358B (zh) | 一种声像偏侧的补偿方法、装置、电子设备及存储设备 | |
| CN116964665A (zh) | 提高去混响的感知质量 | |
| US9743214B2 (en) | Sound processing apparatus and parameter setting method | |
| JP2016032199A (ja) | 音量制御装置及び方法、視聴調査システム及び方法 | |
| Lee et al. | Low delay automatic loudness control for broadcasting services | |
| CN116614668A (zh) | 一种直播音量的自适应控制方法、系统、设备及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant | ||
| CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120530 |
|
| CF01 | Termination of patent right due to non-payment of annual fee |