[go: up one dir, main page]

KR101710113B1 - 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 - Google Patents

위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 Download PDF

Info

Publication number
KR101710113B1
KR101710113B1 KR1020100087613A KR20100087613A KR101710113B1 KR 101710113 B1 KR101710113 B1 KR 101710113B1 KR 1020100087613 A KR1020100087613 A KR 1020100087613A KR 20100087613 A KR20100087613 A KR 20100087613A KR 101710113 B1 KR101710113 B1 KR 101710113B1
Authority
KR
South Korea
Prior art keywords
decoding
signal
stereo
sbr
phase information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020100087613A
Other languages
English (en)
Other versions
KR20110044693A (ko
Inventor
김중회
오은미
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to US12/926,054 priority Critical patent/US8948404B2/en
Priority to PCT/KR2010/007332 priority patent/WO2011049416A2/en
Priority to EP10825241.2A priority patent/EP2502421A4/en
Priority to EP18163389.2A priority patent/EP3358566A1/en
Priority to JP2012535143A priority patent/JP5833557B2/ja
Priority to EP15185423.9A priority patent/EP2978233A1/en
Priority to CN201510917488.9A priority patent/CN105323632A/zh
Priority to CN201080047876.1A priority patent/CN102577384B/zh
Publication of KR20110044693A publication Critical patent/KR20110044693A/ko
Priority to US14/598,297 priority patent/US10163445B2/en
Priority to JP2015213316A priority patent/JP6219903B2/ja
Application granted granted Critical
Publication of KR101710113B1 publication Critical patent/KR101710113B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4382Demodulation or channel decoding, e.g. QPSK demodulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Digital Transmission Methods That Use Modulated Carrier Waves (AREA)

Abstract

복수의 채널 신호를 부호화/복호화하는 시스템 및 방법이 개시된다. 위상 정보와 잔여 신호를 이용하여 복수의 채널 신호를 업믹싱함으로써 원래 신호에 가까운 음질로 복원할 수 있다.

Description

위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법{APPARATUS AND METHOD FOR ENCODING/DECODING USING PHASE INFORMATION AND RESIDUAL SIGNAL}
본 발명의 실시예들은 복수의 채널 신호를 부호화/복호화하는 장치 및 방법에 관한 것으로서, 더욱 상세하게는 위상 정보와 잔여 신호를 이용하여 복수의 채널 신호를 부호화/복호화하는 장치 및 방법과 관련한 것이다.
복수의 채널 신호를 코딩하는 방법으로 MPEG Surround 코딩이 있다. MPEG Surround는 입력된 스테레오 신호를 다운믹싱하여 모노 신호를 생성하고, 스테레오 신호의 파라미터를 추출한 후 모노 신호와 파라미터를 부호화할 수 있다. MPEG Surround 기술은 1-to-2(one-to-two)와 2-to-3(Two-to-Three)를 기본으로 복수의 채널 신호에 대해 다운믹스/업믹스 할 수 있다.
MPEG Surround의 경우, 복수의 채널 신호를 파라미터로 표현하여 코딩할 때, 파라미터로 인해 비트레이트를 증가시켜도 원래 신호를 복원하기 힘든 문제가 있다. 따라서, 복수의 채널 신호를 파라미터로 표현하더라도 원래 신호에 가깝게 복원할 수 있는 방법이 요구된다.
본 발명의 일실시예에 따른 부호화 장치는 N개의 채널 신호에 대해 위상 정보와 관련된 공간 파라미터를 추출하여 부호화하는 파라미터 부호화부; 상기 공간 파라미터를 이용하여 상기 N개의 채널 신호를 M개의 채널 신호로 다운믹싱하는 다운믹싱부; 상기 공간 파라미터에 따라 추출된 잔여 신호를 부호화하는 잔여 신호 부호화부; 및 상기 다운믹싱된 M개의 채널 신호를 부호화하는 채널 신호 부호화부를 포함할 수 있다.
본 발명의 일실시예에 따른 복호화 장치는 부호화된 M개의 채널 신호를 복호화하는 채널 신호 복호화부; 부호화된 공간 파라미터를 복호화하는 파라미터 복호화부; 상기 공간 파라미터를 이용하여 위상 정보를 추정하는 위상 정보 추정부; 부호화된 잔여 신호를 복호화하는 잔여 신호 복호화부; 상기 위상 정보를 이용하여 상기 M개의 채널 신호에 대한 업믹싱 매트릭스를 계산하는 매트릭스 계산부; 및 상기 잔여 신호 및 업믹싱 매트릭스를 이용하여 상기 M개의 채널 신호를 N개의 채널 신호로 업믹싱하는 업믹싱부를 포함할 수 있다.
본 발명의 일실시예에 따른 복호화 장치는 MPEG USAC(Unified Speech and Audio Coder)에서 부호화된 M개의 채널 신호를 동작하는 LPD(Linear Prediction Domain)에 기초한 ACELP(Algebraic Code Excited Linear Prediction), wLPT(weighted Linear Predictive Transform) 또는 FD(Frequency Domain)에 기초한 AAC(Advanced Audio Coding)중 어느 하나에 따라 복호화하는 채널 신호 복호화부; 부호화된 공간 파라미터를 복호화하는 파라미터 복호화부; 상기 공간 파라미터를 이용하여 위상 정보를 추정하는 위상 정보 추정부; 부호화된 잔여 신호를 복호화하는 잔여 신호 복호화부; 상기 위상 정보를 이용하여 상기 M개의 채널 신호에 대한 업믹싱 매트릭스를 계산하는 매트릭스 계산부; 및 상기 잔여 신호와 업믹싱 매트릭스를 이용하여 상기 M개의 채널 신호를 N개의 채널 신호로 업믹싱하는 업믹싱부를 포함할 수 있다.
본 발명의 일실시예에 따른 부호화 방법은 N개의 채널 신호에 대해 위상 정보와 관련된 공간 파라미터를 추출하여 부호화하는 단계; 상기 공간 파라미터를 이용하여 상기 N개의 채널 신호를 M개의 채널 신호로 다운믹싱하는 단계; 상기 공간 파라미터에 따라 추출된 잔여 신호를 부호화하는 단계; 및 상기 다운믹싱된 M개의 채널 신호를 부호화하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따른 복호화 방법은 부호화된 M개의 채널 신호를 복호화하는 단계; 부호화된 공간 파라미터를 복호화하는 단계; 상기 공간 파라미터를 이용하여 위상 정보를 추정하는 단계; 부호화된 잔여 신호를 복호화하는 단계; 상기 위상 정보를 이용하여 상기 M개의 채널 신호에 대한 업믹싱 매트릭스를 계산하는 단계; 및 상기 잔여 신호 및 업믹싱 매트릭스를 이용하여 상기 M개의 채널 신호를 N개의 채널 신호로 업믹싱하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따른 복호화 방법은 MPEG USAC(Unified Speech and Audio Coder)에서 부호화된 M개의 채널 신호를 동작하는 LPD(Linear Prediction Domain)에 기초한 ACELP(Algebraic Code Excited Linear Prediction), wLPT(weighted Linear Predictive Transform) 또는 FD(Frequency Domain)에 기초한 AAC(Advanced Audio Coding)중 어느 하나에 따라 복호화하는 단계; 부호화된 공간 파라미터를 복호화하는 단계; 상기 공간 파라미터를 이용하여 위상 정보를 추정하는 단계; 부호화된 잔여 신호를 복호화하는 단계; 상기 위상 정보를 이용하여 상기 M개의 채널 신호에 대한 업믹싱 매트릭스를 계산하는 단계; 및 상기 잔여 신호와 업믹싱 매트릭스를 이용하여 상기 M개의 채널 신호를 N개의 채널 신호로 업믹싱하는 단계를 포함할 수 있다.
본 발명의 일실시예에 따르면, 위상 정보와 잔여 신호를 통해 다운믹스된 채널 신호를 업믹싱함으로써 원래 신호에 가깝게 복원할 수 있다.
도 1은 본 발명의 일실시예에 따른 부호화 장치 및 복호화 장치를 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 부호화 장치의 세부 구성을 도시한 블록 다어어그램이다.
도 3은 본 발명의 일실시예에 따른 복호화 장치의 세부 구성을 도시한 블록 다이어그램이다.
도 4는 본 발명의 일실시예에 따른 업믹싱 매트릭스를 계산하는 과정을 나타낸 도면이다.
도 5는 본 발명의 일실시예에 따른 부호화 과정을 나타낸 도면이다.
도 6은 본 발명의 일실시예에 따른 복호화 과정을 나타낸 도면이다.
도 7은 본 발명의 일실시예에 따른 복호화 순서를 나타낸 도면이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 부호화 장치 및 복호화 장치를 도시한 도면이다.
도 1을 참고하면, 부호화 장치(101)는 N개의 채널 신호를 다운믹싱한 M개의 채널 신호를 부호화할 수 있다. 이 때, N은 M보다 큰 값을 나타낸다. 예를 들어, 부호화 장치(101)는 2개의 채널 신호로 구성된 스테레오 신호를 입력받으면, 1개의 채널 신호로 구성된 모노 신호로 다운믹싱하여 부호화할 수 있다. N은 2이상의 값을 나타내고, M은 1 이상의 값을 나타낼 수 있다.
본 발명의 일실시예에 따른 부호화 장치(101)는 N개의 채널 신호 간의 관계를 나타내는 공간 파라미터를 추출하여 부호화할 수 있다. 이 때, 공간 파라미터는 복호화 장치(102)에서 추정하는 위상 정보와 관련이 있다. 그리고, 부호화 장치(101)는 N개의 채널 신호를 공간 파라미터를 표현함으로써 발생하는 에러 신호인 잔여 신호를 추출하여 부호화할 수 있다. 그러면, 부호화 장치(101)는 다운믹싱된 M개의 채널 신호, 공간 파라미터 및 잔여 신호를 부호화한 후 비트스트림을 통해 복호화 장치(101)에 전송할 수 있다.
복호화 장치(102)는 비트스트림에 포함된 잔여 신호와 공간 파라미터를 복호화할 수 있다. 그리고, 복호화 장치(102)는 공간 파라미터를 통해 추정된 위상 정보를 이용하여 업믹싱 매트릭스를 계산할 수 있다. 이 후, 복호화 장치(102)는 계산된 업믹싱 매트릭스와 잔여 신호를 이용하여 M개의 채널 신호를 업믹싱하여 N개의 채널 신호를 복원할 수 있다.
본 발명의 일실시예에 따른 복호화 장치는 N개의 채널 신호 간의 관계를 나타내는 공간 파라미터를 통해 추정된 위상 정보와 잔여 신호를 이용함으로써, 원래 신호인 N개의 채널 신호에 가깝게 복원할 수 있다.
도 2는 본 발명의 일실시예에 따른 부호화 장치의 세부 구성을 도시한 블록 다어어그램이다.
도 2를 참고하면, 부호화 장치(201)는 파라미터 부호화부(201), 다운믹싱부(203), 잔여 신호 부호화부(204) 및 채널 신호 부호화부(205)를 포함할 수 있다.
파라미터 부호화부(201)는 N개의 채널 신호에 대해 위상 정보와 관련된 공간 파라미터를 추출하여 부호화할 수 있다. 예를 들어, 파라미터 부호화부(201)는 2개의 채널 신호를 나타내는 스테레오 신호가 입력되면, 좌측 신호와 우측 신호 간의 관계를 나타내는 공간 파라미터를 추출하여 부호화할 수 있다.
일례로, 파라미터 부호화부(201)는 N개의 채널 신호를 QMF(Quadrature Mirror Filter) 분석과 Nyquist Filter Bank 분석을 통해 서브 샘플로 변환하여 공간 파라미터를 추출할 수 있다. 그러면, 파라미터 부호화부(201)는 추출된 공간 파라미터를 양자화한 후 무손실 부호화를 수행할 수 있다.
이 때, 공간 파라미터는 N개의 채널 신호의 에너지 레벨에 따른 강도 차를 나타내는 IID(Inter-channel Intensity Difference) 혹은 CLD(channel level differences), N개의 채널 신호의 파형의 유사성에 따른 상관도를 나타내는 ICC(Inter-channel Coherence 혹은 Inter-channel Correlation), N개의 채널 신호 사이의 위상 차를 나타내는 IPD(Inter-channel Phase Difference)를 포함할 수 있다. 이 때, 입력 신호가 2개의 채널 신호로 구성된 스테레오 신호인 경우, 공간 파라미터는 스테레오 신호에 포함된 2개의 채널 간의 관계를 나타낸다.
다운믹싱부(202)는 공간 파라미터를 이용하여 N개의 채널 신호를 M개의 채널 신호로 다운믹싱할 수 있다. 여기서, N은 M보다 큰 값이다. 예를 들어, 다운믹싱부(202)는 스테레오 신호(N=2)를 모노 신호(M=1)로 다운믹싱할 수 있다.
잔여 신호 부호화부(203)는 공간 파라미터에 따라 추출된 잔여 신호를 부호화할 수 있다. 잔여 신호는 N개의 채널 신호를 공간 파라미터를 표현함으로써 발생하는 에러 신호를 의미한다. 일례로, 잔여 신호는 MDCT 방식에 따라 MPEG AAC(Advanced Audio Coding)로 부호화될 수 있다.
채널 신호 부호화부(204)는 다운믹싱된 M개의 채널 신호를 부호화할 수 있다. 구체적으로, 채널 신호 부호화부(204)는 다운믹싱된 M개의 채널 신호를 Nyquist Filter Bank를 통해 QMF 도메인으로 변환한 후, SBR(Spectral Bandwidth Replication) 부호화를 수행할 수 있다. 그런 후, 채널 신호 부호화부(204)는 QMF synthesis를 통해 시간 도메인으로 변환한 후 코어 부호화될 수 있다. 이 때, 코어 부호화는 MPEG USAC(Unified Speech and Audio Coder)에서 동작하는 LPD(Linear Prediction Domain)에 기초한 ACELP(Algebraic Code Excited Linear Prediction), wLPT(weighted Linear Predictive Transform) 또는 FD(Frequency Domain)에 기초한 AAC(Advanced Audio Coding)중 어느 하나일 수 있다.
도 3은 본 발명의 일실시예에 따른 복호화 장치의 세부 구성을 도시한 블록 다이어그램이다.
도 3을 참고하면, 복호화 장치(301)는 채널 신호 복호화부(302), 파라미터 복호화부(303), 위상 정보 추정부(304), 잔여 신호 복호화부(305), 매트릭스 계산부(306) 및 업믹싱부(307)를 포함할 수 있다.
채널 신호 복호화부(302)는 부호화된 M개의 채널 신호를 복호화할 수 있다. 이 때, 채널 신호 복호화부(302)는 MPEG USAC(Unified Speech and Audio Coder)에서 동작하는 LPD(Linear Prediction Domain)에 기초한 ACELP(Algebraic Code Excited Linear Prediction), wLPT(weighted Linear Predictive Transform) 또는 FD(Frequency Domain)에 기초한 AAC(Advanced Audio Coding)중 어느 하나에 따라 비트스트림으로부터 부호화된 M개의 채널 신호를 복호화할 수 있다. 그리고, 채널 신호 복호화부(302)는 QMF analysis를 통해 복원된 M개의 채널 신호를 서브 밴드 신호로 변환한다. 이 후, 복원된 M개의 채널 신호는 서브 밴드 신호로 변환된 M개의 채널 신호에 대해 SBR 복호화를 수행할 수 있다. SBR 복호화가 수행된 M개의 채널 신호는 Nyquist filterbank anlysis가 적용될 수 있다.
파라미터 복호화부(303)는 비트스트림으로부터 부호화된 공간 파라미터를 복호화할 수 있다. 이 때, 공간 파라미터는 N개의 채널 신호의 에너지 레벨에 따른 강도 차를 나타내는 IID(Inter-channel Intensity Difference) 혹은 CLD(channel level differences), N개의 채널 신호의 파형의 유사성에 따른 상관도를 나타내는 ICC(Inter-channel Coherence 혹은 Inter-channel Correlation), N개의 채널 신호 사이의 위상 차를 나타내는 IPD(Inter-channel Phase Difference)를 포함할 수 있다.
위상 정보 추정부(304)는 공간 파라미터를 이용하여 위상 정보를 추정할 수 있다. 일례로, 위상 정보 추정부(304)는 공간 파라미터를 이용하여 N개의 채널 신호 간의 위상 차가 M개의 채널 신호를 기준으로 분포하는 정도를 나타내는 파라미터(OPD: Overall Phase Diference)를 추정할 수 있다.
잔여 신호 복호화부(305)는 부호화된 잔여 신호를 복호화할 수 있다. 이 때, 잔여 신호 복호화부(305)는 MDCT(Modified Discrete Cosine Transform)를 이용하여 비트스트림으로부터 잔여 신호를 복호화할 수 있다. 그런 후, 잔여 신호 복호화부(305)는 복호화된 잔여 신호를 QMF 도메인으로 변환할 수 있다. 만약, 비트스트림에 잔여 신호가 포함되지 않은 경우, 잔여 신호 복호화부(305)는 디코릴레이터(decorrelator)를 이용하여 별도의 신호를 생성할 수 있다.
매트릭스 계산부(306)는 위상 정보를 이용하여 M개의 채널 신호에 대한 업믹싱 매트릭스를 계산할 수 있다.
업믹싱부(307)는 잔여 신호와 업믹싱 매트릭스를 이용하여 M개의 채널 신호를 N개의 채널 신호로 업믹싱할 수 있다. 만약, 잔여 신호가 복호화되지 않은 경우, 업믹싱부(307)는 디코릴레이터(decorrelator)를 통해 생성된 별도의 신호를 이용하여 업믹싱할 수 있다. 업믹싱된 N개의 채널 신호는 Nyquist FilterBank Analysis와 QMF Synthesis를 통해 최종적으로 복원될 수 있다.
도 4는 본 발명의 일실시예에 따른 업믹싱 매트릭스를 계산하는 과정을 나타낸 도면이다.
도 4에서, 복호화 장치(301)의 입력 신호는 다운믹스된 모노 신호이고, 출력 신호는 스테레오 신호라고 가정한다. 도 4를 참고하면, 복호화 장치(301)의 매트릭스 계산부(306)는 공간 파라미터로부터 추정된 위상 정보를 이용하여 모노 신호를 좌측 신호와 우측 신호로 구성된 스테레오 신호로 업믹싱하기 위한 업믹싱 매트릭스를 계산할 수 있다. 여기서, 모노 신호는 1개의 채널 신호를 의미하고, 스테레오 신호는 2개의 채널 신호를 의미한다. 그리고, 공간 파라미터는 IPD와 CLD를 통해 추정된 OPD를 의미한다.
스테레오 신호에 대해 IPD는 하기 수학식 1에 따라 결정된다.
Figure 112010058200897-pat00001
여기서, LㆍR은 좌채널 신호와 우채널 신호의 내적(dot product),, IPD는 좌채널 신호와 우채널 신호가 이루는 각도, *는 복소 공액(complex conjugate)을 각각 의미한다.
스테레오 신호에 대해 OPD는 하기 수학식 2에 따라 결정된다.
Figure 112010058200897-pat00002
여기서, LㆍM은 좌채널 신호와 모노 신호의 내적, OPD는 좌채널 신호와 모노 신호가 이루는 각도, *는 복소 공액(complex conjugate)을 각각 의미한다.
이 때, OPD는 하기 수학식 3에 따라 표현될 수 있다.
Figure 112010058200897-pat00003
with
Figure 112010058200897-pat00004
매트릭스 계산부(306)는 수학식 3을 통해 계산된 위상 정보인 OPD를 이용하여 하기 수학식 4의 업믹싱 매트릭스를 계산할 수 있다.
Figure 112010058200897-pat00005
그러면, 업믹싱부(307)는 잔여 신호와 다운믹스된 모노 신호에 수학식 4의 업믹싱 매트릭스를 적용하여 업믹싱한 후, 위상 합성을 수행할 수 있다.
또한, 매트릭스 계산부(306)는 수학식 3을 통해 계산된 위상 정보인 OPD를 이용하여 하기 수학식 5의 업믹싱 매트릭스를 계산할 수 있다. 여기서, resBand는 잔여 신호의 부호화가 수행될 band를 의미한다.
Figure 112010058200897-pat00006
업믹싱부(307)는 잔여 신호와 다운믹스된 모노 신호에 수학식 5의 업믹싱 매트릭스를 적용하여 업믹싱할 수 있다. 이 때, 위상 합성은 다운믹스된 모노 신호에만 적용되고, 잔여 신호를 이용하여 최종적인 스테레오 신호가 생성된다.
수학식 4와 수학식 5에서
Figure 112010058200897-pat00007
Figure 112010058200897-pat00008
는 하기 수학식 6에 따라 결정된다.
Figure 112010058200897-pat00009
Figure 112010058200897-pat00010
그리고,
Figure 112010058200897-pat00011
는 하기 수학식 7에 따라 결정된다.
Figure 112010058200897-pat00012
,with
Figure 112010058200897-pat00013
.
for
Figure 112010058200897-pat00014
.
또한,
Figure 112010058200897-pat00015
이 때, 업믹싱부(307)는 하기 수학식 8에 따라 잔여 신호와 다운믹싱된 모노 신호에 수학식 4 또는 수학식 5의 업믹싱 매트릭스를 적용하여 업믹싱할 수 있다. 업믹싱을 통해 스테레오 신호가 생성된다.
Figure 112010058200897-pat00016
여기서, x는 QMF(Quadrature Mirror Filter) 도메인의 다운믹스된 모노 신호이며 q는 스테레오 신호의 잔여 신호이다. 만약, 잔여 신호가 없다면, 디코릴레이터(decorrelator)를 통해 생성된 별도의 신호가 사용될 수 있다.
도 4에 도시된 업믹싱 매트릭스는 MPEG Surround의 OTT(one-to-two) 모듈에 적용되는 것으로 다채널로 확장이 용이하다.
도 5는 본 발명의 일실시예에 따른 부호화 과정을 나타낸 도면이다.
도 5에 도시된 부호화 과정은 도 2에 도시된 부호화 장치에 의해 수행될 수 있다. 그리고, 도 5는 입력 신호로 2개의 채널 신호로 구성된 스테레오 신호인 경우를 나타낸다.
부호화 장치(201)는 입력된 스테레오 신호에 대해 QMF 분석을 수행하고(S501), Nyquist FilterBank 분석을 수행하여(S502) 서브 샘플로 변환할 수 있다. 그런 후, 부호화 장치(201)는 서브 샘플로 변환된 스테레오 신호에 대해 공간 파라미터를 추출할 수 있다(S503). 부호화 장치(201)는 추출된 공간 파라미터를 양자화 및 무손실 부호화하여 비트스트림을 생성할 수 있다.
그리고, 부호화 장치(201)는 공간 파라미터를 이용하여 스테레오 신호를 모노 신호로 다운믹싱할 수 있다(S508). 이 후, 부호화 장치(201)는 다운믹싱된 모노 신호를 Nyquist FilterBank synthesis를 통해 QMF 도메인으로 변환할 수 있다(S509).
한편, 부호화 장치(201)는 스테레오 신호를 공간 파라미터로 표현함으로써 발생하는 에러 신호인 잔여 신호(residual signal)을 추출할 수 있다(S504). 부호화 장치는 추출된 잔여 신호에 MDCT을 수행하고(S505), 부호화하여(S506) 비트스트림을 생성할 수 있다. 이 때, 부호화 장치는 MDCT 도메인에서 MPEG AAC를 이용하여 잔여 신호를 부호화할 수 있다.
단계(S501)에서 단계(S508)의 과정이 MPEG Surround 부호화부에서 수행된다. 이 때, MPEG Surround 부호화부는 도 2의 파라미터 부호화부(202), 다운믹싱부(203) 및 잔여 신호 부호화부(204)를 포함할 수 있다.
부호화 장치는 QMF 도메인으로 변환된 모노 신호에 SBR 부호화를 수행할 수 있다(S510). 그런 후, 부호화 장치는 QMF synthesis를 통해 시간 도메인으로 변환한 후(S511), USAC 코어 부호화를 수행하여(S512) 모노 신호의 비트스트림을 생성할 수 있다. 단계(S510)의 과정이 SBR 부호화부에서 수행되고, 단계(S512)의 과정이 USAC 코어 부호화부에서 수행된다. 이 때, USAC 코어 부호화부는 도 2의 채널 신호 부호화부(205)를 포함할 수 있다.
도 6은 본 발명의 일실시예에 따른 복호화 과정을 나타낸 도면이다.
도 6에 도시된 부호화 과정은 도 3에 도시된 복호화 장치에 의해 수행될 수 있다. 복호화 장치는 USAC 코어 복호화를 통해 비트스트림로부터 모노 신호를 복호화할 수 있다(S601). 이 때, 복호화 장치는 ACELP, weighted Linear Predictive Transform 및 AAC 중 어느 하나의 방식을 통해 모노 신호를 복호화할 수 있다.
그리고, 복호화 장치는 QMF anlysis를 통해 시간 도메인의 모노 신호를 서브 밴드 신호로 변환할 수 있다(S602). 이 후, 복호화 장치는 서브 밴드 신호로 변환된 모노 신호에 대해 SBR 복호화를 수행할 수 있다(S603). 단계(S601)의 과정이 USAC 코어 복호화부에서 수행되고, 단계(S603)의 과정이 SBR 복호화부에서 수행된다. 이 때, USAC 복호화부는 도 3의 채널 신호 복호화부(302)를 포함할 수 있다.
복호화 장치는 SBR 복호화가 수행된 모노 신호에 Nyquist FilterBank Analysis를 적용할 수 있다(S604). 그리고, 복호화 장치는 비트스트림으로부터 공간 파라미터를 복호화한 후(S605), 위상 정보인 OPD를 추정할 수 있다(S606). 그러면, 복호화 장치는 추정된 OPD를 이용하여 업믹싱 매트릭스를 계산할 수 있다(S607).
한편, 복호화 장치는 비트스트림으로부터 잔여 신호를 복호화할 수 있다(S609). 그리고, 복호화 장치는 MDCT 도메인의 잔여 신호를 QMF 도메인으로 변환할 수 있다(S610). 그러면, 복호화 장치는 모노 신호와 잔여 신호에 업믹싱 매트릭스를 적용하여 업믹싱할 수 있다(S611). 만약, 비트스트림에 잔여 신호가 포함되지 않았다면, 복호화 장치는 디코릴레이터를 통해 특정 신호를 생성하고(S608), 모노 신호와 특정 신호에 업믹싱 매트릭스를 적용하여 업믹싱할 수 있다. 이 후, 복호화 장치는 Nyquist FilterBank Analysis와 QMF Synthesis를 수행하여(S612), 시간 도메인의 스테레오 신호를 복원할 수 있다.
단계(S604) 내지 단계(S612)는 MPEG Surround 복호화부에서 수행될 수 있으며, MPEG Surround 복호화부는 도 3의 파라미터 복호화부(303), 위상 정보 추정부(304), 잔여 신호 복호화부(305), 매트릭스 계산부(306) 및 업믹싱부(307)를 포함할 수 있다.
도 7은 본 발명의 일실시예에 따른 복호화 순서를 나타낸 도면이다.
특히, 도 7은 복호화가 진행될 때, 이를 시그널링하는 방법에 관한 것이다.
본 발명의 일실시예에 따르면, 다음 syntax에 따라 복호화를 위한 기본 정보가 헤더로 표현되어 비트스트림에 포함될 수 있다.
Figure 112010058200897-pat00017
이 때, bsStereoSbr와 bsPseudoLr는 잔여 신호를 코딩하기 위해 필요한 구성요소로, 다음과 같이 정의될 수 있다.
bsStereoSbr: 이 플래그는 MPEG 서라운드 복호화(MPEG Surround decoding)와 결합된 스테레오 SBR(stereo SBR) 복호화의 이용을 시그널링한다.
bsStereoSbr는 아래 표 1과 같이 정의된다. bsStereoSbr로 인해 도 7과 같은 복호화 순서가 결정된다.
Figure 112010058200897-pat00018
bsStereoSbr 정보는 MPEG Surround 모듈과 조합할 수 있는 SBR (Spectral Band Replication) 모듈의 위치와 채널수를 나타낸다. Mono SBR이 적용되면, 다운믹스 신호가 입력되어 SBR 복호화가 수행된 후 MPEG Surround 스테레오 복호화가 수행된다. 그리고, Stereo SBR이 적용되면, MPEG Surround 스테레오 복호화가 수행된 후 SBR 복호화가 수행되어 최종적인 스테레오 신호가 복원된다.
bsPseudoLr: 이 플래그는 MPEG 서라운드 처리(MPEG Surround processing) 이전에 인버스 미드/사이드 로테이션(inverse mid/side rotation)이 코어 신호(core signal)에 적용되어야 하는지를 시그널링한다.
bsPseudoLr는 아래 표 2와 같이 정의된다.
Figure 112010058200897-pat00019
channelConfiguration는 USAC core coder의 채널수를 나타내는 것으로 Syntax of USACSpecificConfig()에 따르면 USAC core coder가 스테레오 신호인 2개의 채널 신호로 부호화된 경우, SBR configuration에 대해 signaling한다. 하지만 MPEG Surround를 채용하고 있는 USAC 기술은 5-2-5 및 7-2-7 트리 구조를 지원하여 이때 channelConfiguration는 2로 전송된다. 이때 5.1 채널 신호로 업믹스하기 위해 bsStereoSbr로 해당 SBR configuration를 정의할 수 없다. 기본적으로 5-2-5, 7-2-7 구조에서 SBR이 적용된 경우, 다운믹스된 신호에 먼저 SBR을 적용하고 최종 복수의 채널 신호로 업믹스될 수 있다.
이러한 이유로, Syntax of USACSpecificConfig()는 다음과 같이 수정될 수 있다.
Figure 112010058200897-pat00020
Modified Syntax of USACSpecificConfig()에서는 SpatialSpecificConfig()를 먼저 해석하고 이후에 취득된 bsTreeConfig에 따라 bsStereoSbr과 bsPseudoLr가 전송된다. 이러한 과정으로 인해, 기존의 5-2-5 및 7-2-7와의 호환성 문제가 해결된다. bsTreeConfig가 0x07인 경우, 2-1-2를 의미하며 이는 스테레오 신호를 생성하는 것을 나타낸다.
또한 잔여 신호의 부호화는 높은 비트율에 적용되므로 MPEG Surround의 bitrate mode를 나타내는 bs212Mode에 의해 선택적으로 복호화될 수 있다. 또한 bsResidualCoding 정보를 이용하여 잔여 신호가 선택적으로 복호화될 수 있다.
Figure 112010058200897-pat00021
bs212Mode indicates operation mode of SpatialFrame() according to:
bsStereoSbr는 아래 표 3과 같이 정의된다.
Figure 112010058200897-pat00022
다른 구현 예로는 상기 조건은 bsTreeConfig 혹은 bs212Mode 혹은 bsResidualCoding을 적용하여 판단할 수도 있다.
본 발명의 실시 예에 따른 방법들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
101: 부호화 장치
102: 복호화 장치

Claims (13)

  1. 삭제
  2. 삭제
  3. 비트스트림으로부터 모노 신호를 복호화하는 채널 신호 복호화부;
    상기 모노 신호로부터 스테레오 신호를 복원하는 MPEG 서라운드 복호화부; 및
    상기 모노 신호 또는 상기 스테레오 신호에 기초하여 SBR (Spectral Bandwidth Replication) 복호화를 수행하는 SBR 복호화부
    를 포함하고,
    상기 비트스트림은, MPEG 서라운드 복호화와 결합된 스테레오 SBR 복호화의 이용을 시그널링하는 플래그를 포함하고,
    상기 플래그의 값에 따라, 상기 모노 신호에 기초하여 상기 SBR 복호화가 수행된 경우, 상기 MPEG 서라운드 복호화는 상기 SBR 복호화가 수행된 모노 신호에 기초하여 수행되며,
    상기 플래그의 값에 따라, 상기 스테레오 신호에 기초하여 상기 SBR 복호화가 수행되는 경우, 상기 MPEG 서라운드 복호화는 상기 SBR 복호화가 수행되기 전의 모노 신호에 기초하여 수행되는, 복호화 장치.
  4. 제3항에 있어서,
    상기 MPEG 서라운드 복호화부는,
    상기 비트스트림으로부터 공간 파라미터를 복호화하는 파라미터 복호화부;
    상기 공간 파라미터를 이용하여 위상 정보를 추정하는 위상 정보 추정부;
    상기 위상 정보를 이용하여 상기 모노 신호에 대한 업믹스 매트릭스를 계산하는 매트릭스 계산부; 및
    상기 업믹스 매트릭스를 이용하여 상기 모노 신호를 상기 스테레오 신호로 업믹스하는 업 믹싱부
    를 포함하는 복호화 장치.
  5. 제4항에 있어서,
    상기 공간 파라미터는,
    스테레오 신호의 에너지 레벨에 따른 강도 차를 나타내는 에너지 차 파라미터(CLD: Channel Level Differences) 및 스테레오 신호 사이의 위상 차를 나타내는 위상차 파라미터(IPD: Inter-channel Phase Difference) 중 적어도 하나를 포함하고,
    상기 위상 정보 추정부는,
    상기 공간 파라미터를 이용하여 상기 스테레오 신호 간의 위상 차가 모노 신호를 기준으로 분포하는 정도를 나타내는 파라미터(OPD: Overall Phase Diference)를 추정하는 것을 특징으로 하는 복호화 장치.
  6. 삭제
  7. 삭제
  8. 삭제
  9. 비트스트림으로부터 모노 신호를 복호화하는 단계;
    상기 모노 신호로부터 스테레오 신호를 복원하는 단계; 및
    상기 모노 신호 또는 상기 스테레오 신호에 기초하여 SBR(Spectral Bandwidth Replication) 복호화를 수행하는 단계
    를 포함하고,
    상기 비트스트림은, MPEG 서라운드 복호화와 결합된 스테레오 SBR 복호화의 이용을 시그널링하는 플래그를 포함하고,
    상기 플래그의 값에 따라, 상기 모노 신호에 기초하여 상기 SBR 복호화가 수행된 경우, 상기 MPEG 서라운드 복호화는 상기 SBR 복호화가 수행된 모노 신호에 기초하여 수행되며,
    상기 플래그의 값에 따라, 상기 스테레오 신호에 기초하여 상기 SBR 복호화가 수행되는 경우, 상기 MPEG 서라운드 복호화는 상기 SBR 복호화가 수행되기 전의 모노 신호에 기초하여 수행되는, 복호화 방법.
  10. 제9항에 있어서,
    상기 스테레오 신호를 복원하는 단계는,
    상기 비트스트림으로부터 공간 파라미터를 복호화하는 단계;
    상기 공간 파라미터를 이용하여 위상 정보를 추정하는 단계;
    상기 위상 정보를 이용하여 상기 모노 신호에 대한 업믹스 매트릭스를 계산하는 단계; 및
    상기 업믹스 매트릭스를 이용하여 상기 모노 신호를 스테레오 신호로 업믹스하는 단계
    를 포함하는 복호화 방법.
  11. 제10항에 있어서,
    상기 공간 파라미터는,
    스테레오 신호의 에너지 레벨에 따른 강도 차를 나타내는 에너지 차 파라미터(CLD: Channel Level Differences) 및 스테레오 신호 사이의 위상 차를 나타내는 위상차 파라미터(IPD: Inter-channel Phase Difference) 중 적어도 하나를 포함하고,
    상기 위상 정보를 추정하는 단계는,
    상기 공간 파라미터를 이용하여 상기 스테레오 신호 간의 위상 차가 모노 신호를 기준으로 분포하는 정도를 나타내는 파라미터(OPD: Overall Phase Diference)를 추정하는 것을 특징으로 하는 복호화 방법.
  12. 삭제
  13. 제9항 내지 제11항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.
KR1020100087613A 2009-10-23 2010-09-07 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 Active KR101710113B1 (ko)

Priority Applications (10)

Application Number Priority Date Filing Date Title
US12/926,054 US8948404B2 (en) 2009-10-23 2010-10-22 Apparatus and method encoding/decoding with phase information and residual information
CN201080047876.1A CN102577384B (zh) 2009-10-23 2010-10-25 用相位信息和残差信息进行编码/解码的设备和方法
EP18163389.2A EP3358566A1 (en) 2009-10-23 2010-10-25 Decoding method with phase information and residual information
JP2012535143A JP5833557B2 (ja) 2009-10-23 2010-10-25 位相情報と残余信号を用いる符号化/復号化装置及び方法
EP15185423.9A EP2978233A1 (en) 2009-10-23 2010-10-25 Decoding method with phase information and residual information
CN201510917488.9A CN105323632A (zh) 2009-10-23 2010-10-25 用相位信息和残差信息进行编码/解码的设备和方法
PCT/KR2010/007332 WO2011049416A2 (en) 2009-10-23 2010-10-25 Apparatus and method encoding/decoding with phase information and residual information
EP10825241.2A EP2502421A4 (en) 2009-10-23 2010-10-25 APPARATUS AND METHOD FOR ENCODING / DECODING USING PHASE INFORMATION AND RESIDUAL INFORMATION
US14/598,297 US10163445B2 (en) 2009-10-23 2015-01-16 Apparatus and method encoding/decoding with phase information and residual information
JP2015213316A JP6219903B2 (ja) 2009-10-23 2015-10-29 復号化装置及び復号化方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US25441909P 2009-10-23 2009-10-23
US61/254,419 2009-10-23

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020170022281A Division KR101835850B1 (ko) 2009-10-23 2017-02-20 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20110044693A KR20110044693A (ko) 2011-04-29
KR101710113B1 true KR101710113B1 (ko) 2017-02-27

Family

ID=44049382

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020100087613A Active KR101710113B1 (ko) 2009-10-23 2010-09-07 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
KR1020170022281A Active KR101835850B1 (ko) 2009-10-23 2017-02-20 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
KR1020180024809A Active KR101945309B1 (ko) 2009-10-23 2018-02-28 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020170022281A Active KR101835850B1 (ko) 2009-10-23 2017-02-20 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
KR1020180024809A Active KR101945309B1 (ko) 2009-10-23 2018-02-28 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법

Country Status (6)

Country Link
US (2) US8948404B2 (ko)
EP (3) EP2978233A1 (ko)
JP (2) JP5833557B2 (ko)
KR (3) KR101710113B1 (ko)
CN (2) CN105323632A (ko)
WO (1) WO2011049416A2 (ko)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
ES2763367T3 (es) 2010-04-09 2020-05-28 Dolby Int Ab Codificación estéreo de predicción compleja basada en MDCT
KR20130093798A (ko) * 2012-01-02 2013-08-23 한국전자통신연구원 다채널 신호 부호화 및 복호화 장치 및 방법
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
KR20140016780A (ko) * 2012-07-31 2014-02-10 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 방법 및 장치
WO2014023443A1 (en) * 2012-08-10 2014-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, system and method employing a residual concept for parametric audio object coding
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
JP6094322B2 (ja) * 2013-03-28 2017-03-15 富士通株式会社 直交変換装置、直交変換方法及び直交変換用コンピュータプログラムならびにオーディオ復号装置
TWI546799B (zh) * 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
RU2676041C1 (ru) 2013-05-24 2018-12-25 Долби Интернэшнл Аб Аудиокодер и аудиодекодер
CN104299615B (zh) * 2013-07-16 2017-11-17 华为技术有限公司 一种声道间电平差处理方法及装置
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
KR102114440B1 (ko) 2013-07-30 2020-05-22 디티에스, 인코포레이티드 일정-파워 페어와이즈 패닝을 갖는 매트릭스 디코더
CN103413553B (zh) * 2013-08-20 2016-03-09 腾讯科技(深圳)有限公司 音频编码方法、音频解码方法、编码端、解码端和系统
TW202514598A (zh) 2013-09-12 2025-04-01 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
ES2641538T3 (es) * 2013-09-12 2017-11-10 Dolby International Ab Codificación de contenido de audio multicanal
KR102294767B1 (ko) 2013-11-27 2021-08-27 디티에스, 인코포레이티드 고채널 카운트 멀티채널 오디오에 대한 멀티플렛 기반 매트릭스 믹싱
US9866986B2 (en) 2014-01-24 2018-01-09 Sony Corporation Audio speaker system with virtual music performance
KR101641645B1 (ko) * 2014-06-11 2016-07-22 전자부품연구원 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템
KR102144332B1 (ko) * 2014-07-01 2020-08-13 한국전자통신연구원 다채널 오디오 신호 처리 방법 및 장치
WO2016108655A1 (ko) * 2014-12-31 2016-07-07 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
KR20160081844A (ko) 2014-12-31 2016-07-08 한국전자통신연구원 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US12125492B2 (en) 2015-09-25 2024-10-22 Voiceage Coproration Method and system for decoding left and right channels of a stereo sound signal
WO2017049400A1 (en) * 2015-09-25 2017-03-30 Voiceage Corporation Method and system for encoding left and right channels of a stereo sound signal selecting between two and four sub-frames models depending on the bit budget
US9826332B2 (en) * 2016-02-09 2017-11-21 Sony Corporation Centralized wireless speaker system
US9924291B2 (en) 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
FR3048808A1 (fr) 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
US9826330B2 (en) 2016-03-14 2017-11-21 Sony Corporation Gimbal-mounted linear ultrasonic speaker assembly
US9794724B1 (en) 2016-07-20 2017-10-17 Sony Corporation Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating
US9924286B1 (en) 2016-10-20 2018-03-20 Sony Corporation Networked speaker system with LED-based wireless communication and personal identifier
US9854362B1 (en) 2016-10-20 2017-12-26 Sony Corporation Networked speaker system with LED-based wireless communication and object detection
US10075791B2 (en) 2016-10-20 2018-09-11 Sony Corporation Networked speaker system with LED-based wireless communication and room mapping
US10535357B2 (en) * 2017-10-05 2020-01-14 Qualcomm Incorporated Encoding or decoding of audio signals
US10839814B2 (en) * 2017-10-05 2020-11-17 Qualcomm Incorporated Encoding or decoding of audio signals
US10580420B2 (en) * 2017-10-05 2020-03-03 Qualcomm Incorporated Encoding or decoding of audio signals
TWI812658B (zh) 2017-12-19 2023-08-21 瑞典商都比國際公司 用於統一語音及音訊之解碼及編碼去關聯濾波器之改良之方法、裝置及系統
KR102697685B1 (ko) 2017-12-19 2024-08-23 돌비 인터네셔널 에이비 통합 음성 및 오디오 디코딩 및 인코딩 qmf 기반 고조파 트랜스포저 개선을 위한 방법, 장치 및 시스템
US11532316B2 (en) 2017-12-19 2022-12-20 Dolby International Ab Methods and apparatus systems for unified speech and audio decoding improvements
CN114708874A (zh) * 2018-05-31 2022-07-05 华为技术有限公司 立体声信号的编码方法和装置
US11443737B2 (en) 2020-01-14 2022-09-13 Sony Corporation Audio video translation into multiple languages for respective listeners
CN114360559B (zh) * 2021-12-17 2022-09-27 北京百度网讯科技有限公司 语音合成方法、装置、电子设备和存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6854841B1 (en) 1998-04-17 2005-02-15 Elesys, Inc. Point-of-incidence ink-curing mechanisms for radial printing
US7181019B2 (en) 2003-02-11 2007-02-20 Koninklijke Philips Electronics N. V. Audio coding
US20080260048A1 (en) * 2004-02-16 2008-10-23 Koninklijke Philips Electronics, N.V. Transcoder and Method of Transcoding Therefore
EP3573055B1 (en) * 2004-04-05 2022-03-23 Koninklijke Philips N.V. Multi-channel decoder
US7646875B2 (en) * 2004-04-05 2010-01-12 Koninklijke Philips Electronics N.V. Stereo coding and decoding methods and apparatus thereof
WO2005098821A2 (en) * 2004-04-05 2005-10-20 Koninklijke Philips Electronics N.V. Multi-channel encoder
JP4950040B2 (ja) * 2004-06-21 2012-06-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチチャンネルオーディオ信号を符号化及び復号する方法及び装置
US7835918B2 (en) 2004-11-04 2010-11-16 Koninklijke Philips Electronics N.V. Encoding and decoding a set of signals
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
KR101194902B1 (ko) * 2005-02-24 2012-10-25 파나소닉 주식회사 데이터 재생장치
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
TWI396188B (zh) * 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
CN101253557B (zh) 2005-08-31 2012-06-20 松下电器产业株式会社 立体声编码装置及立体声编码方法
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
CN101479785B (zh) * 2006-09-29 2013-08-07 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
MX2008012246A (es) * 2006-09-29 2008-10-07 Lg Electronics Inc Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto.
EP2082397B1 (en) * 2006-10-16 2011-12-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
JP4930320B2 (ja) * 2006-11-30 2012-05-16 ソニー株式会社 再生方法及び装置、プログラム並びに記録媒体
KR101411901B1 (ko) 2007-06-12 2014-06-26 삼성전자주식회사 오디오 신호의 부호화/복호화 방법 및 장치
KR20090004778A (ko) * 2007-07-05 2009-01-12 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CN101350197B (zh) * 2007-07-16 2011-05-11 华为技术有限公司 立体声音频编/解码方法及编/解码器
TWI395204B (zh) * 2007-10-17 2013-05-01 Fraunhofer Ges Forschung 一種使用下混合的音頻編碼的音頻解碼器、音頻物件編碼器、多音頻物件編碼方法、用於對多音頻物件信號進行解碼的方法,以及執行這些方法的具有程式碼的程式
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
CA2705968C (en) * 2007-11-21 2016-01-26 Lg Electronics Inc. A method and an apparatus for processing a signal
BR122019023924B1 (pt) * 2009-03-17 2021-06-01 Dolby International Ab Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ISO/IEC SC29/WG11 N10215 WD on USAC, 86th MPEG meeting, oct. 2008*

Also Published As

Publication number Publication date
KR20170021821A (ko) 2017-02-28
JP2016029500A (ja) 2016-03-03
US20110103592A1 (en) 2011-05-05
CN102577384A (zh) 2012-07-11
KR101945309B1 (ko) 2019-04-17
CN105323632A (zh) 2016-02-10
US20150124974A1 (en) 2015-05-07
EP3358566A1 (en) 2018-08-08
KR101835850B1 (ko) 2018-03-08
CN102577384B (zh) 2016-01-06
JP5833557B2 (ja) 2015-12-16
JP6219903B2 (ja) 2017-10-25
JP2013508770A (ja) 2013-03-07
KR20110044693A (ko) 2011-04-29
EP2502421A2 (en) 2012-09-26
WO2011049416A2 (en) 2011-04-28
US10163445B2 (en) 2018-12-25
EP2978233A1 (en) 2016-01-27
EP2502421A4 (en) 2013-09-11
US8948404B2 (en) 2015-02-03
KR20180023941A (ko) 2018-03-07
WO2011049416A3 (en) 2011-10-27

Similar Documents

Publication Publication Date Title
KR101945309B1 (ko) 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
CN103052983B (zh) 音频或视频编码器、音频或视频解码器及编码和解码方法
TWI444990B (zh) 用以利用複數預測來處理多聲道音訊信號之音訊編碼器、音訊解碼器及相關方法
CN103219010B (zh) 对音频和/或语音信号进行编码和/或解码的方法和设备
CN115148215A (zh) 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法
KR20090089638A (ko) 신호 부호화 및 복호화 방법 및 장치
JP2014139674A (ja) 音声/音楽統合信号の符号化/復号化装置
KR20150126651A (ko) 스테레오 오디오 인코더 및 디코더
KR20090043921A (ko) 멀티 채널 신호의 부호화/복호화 방법 및 장치
CN101361114B (zh) 用于处理媒体信号的装置及其方法
KR101500972B1 (ko) 멀티 채널 신호의 부호화/복호화 방법 및 장치
HK1183740B (en) Audio or video encoder, audio or video decoder and method of encoding and decoding
TR201900830T4 (tr) Karmaşık öngörü ve gerçek gösterge kullanarak çok kanallı ses kodlama.

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20100907

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20150901

Comment text: Request for Examination of Application

Patent event code: PA02011R01I

Patent event date: 20100907

Comment text: Patent Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20160330

Patent event code: PE09021S01D

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20160927

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20161118

A107 Divisional application of patent
GRNT Written decision to grant
PA0107 Divisional application

Comment text: Divisional Application of Patent

Patent event date: 20170220

Patent event code: PA01071R01D

PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20170220

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20170221

End annual number: 3

Start annual number: 1

PG1601 Publication of registration
FPAY Annual fee payment

Payment date: 20200130

Year of fee payment: 4

PR1001 Payment of annual fee

Payment date: 20200130

Start annual number: 4

End annual number: 4

PR1001 Payment of annual fee

Payment date: 20210128

Start annual number: 5

End annual number: 5

PR1001 Payment of annual fee

Payment date: 20220127

Start annual number: 6

End annual number: 6

PR1001 Payment of annual fee

Payment date: 20240130

Start annual number: 8

End annual number: 8

PR1001 Payment of annual fee

Payment date: 20250124

Start annual number: 9

End annual number: 9