[go: up one dir, main page]

WO2016021365A1 - 送信装置、送信方法および受信装置 - Google Patents

送信装置、送信方法および受信装置 Download PDF

Info

Publication number
WO2016021365A1
WO2016021365A1 PCT/JP2015/069793 JP2015069793W WO2016021365A1 WO 2016021365 A1 WO2016021365 A1 WO 2016021365A1 JP 2015069793 W JP2015069793 W JP 2015069793W WO 2016021365 A1 WO2016021365 A1 WO 2016021365A1
Authority
WO
WIPO (PCT)
Prior art keywords
image data
format
encoded image
unit
identification information
Prior art date
Application number
PCT/JP2015/069793
Other languages
English (en)
French (fr)
Inventor
塚越 郁夫
Original Assignee
ソニー株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ソニー株式会社 filed Critical ソニー株式会社
Priority to ES15830176T priority Critical patent/ES2885548T3/es
Priority to KR1020177000890A priority patent/KR102366503B1/ko
Priority to EP21183996.4A priority patent/EP3910960A1/en
Priority to CN201580041287.5A priority patent/CN106664445B/zh
Priority to US15/323,773 priority patent/US10397642B2/en
Priority to MX2017001415A priority patent/MX368827B/es
Priority to EP15830176.2A priority patent/EP3179729B1/en
Priority to PL15830176T priority patent/PL3179729T3/pl
Priority to JP2016540130A priority patent/JP6652058B2/ja
Priority to RU2017103077A priority patent/RU2687956C2/ru
Publication of WO2016021365A1 publication Critical patent/WO2016021365A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/436Interfacing a local distribution network, e.g. communicating with another STB or one or more peripheral devices inside the home
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2351Processing of additional data, e.g. scrambling of additional data or processing content descriptors involving encryption of additional data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/454Content or additional data filtering, e.g. blocking advertisements
    • H04N21/4545Input to filtering algorithms, e.g. filtering a region of the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/633Control signals issued by server directed to the network components or client
    • H04N21/6332Control signals issued by server directed to the network components or client directed to client
    • H04N21/6336Control signals issued by server directed to the network components or client directed to client directed to decoder

Definitions

  • the present technology relates to a transmission device, a transmission method, and a reception device, and relates to a transmission device that transmits a predetermined number of high-quality format image data together with basic format image data.
  • Patent Literature 1 includes media encoding that is scalable to generate a base layer stream for a low resolution video service and an enhancement layer stream for a high resolution video service. It is described that a broadcast signal is transmitted.
  • the high quality format includes a high frame frequency, a high dynamic range, a wide color gamut, a high bit length, and the like.
  • the purpose of this technology is to satisfactorily transmit a predetermined number of high-quality format image data together with basic format image data.
  • An image encoding unit for generating an extended video stream including encoded video data of each of a basic video stream including encoded image data of basic format image data and a predetermined number of high-quality format image data;
  • a transmission unit that transmits a container of a predetermined format including the basic video stream and the extended video stream generated by the image encoding unit;
  • the image encoding unit is in a transmitting apparatus that inserts identification information for identifying a corresponding format into each encoded image data of the basic format image data and the predetermined number of high quality format image data.
  • a basic video stream including encoded image data of basic format image data and an extended video stream including encoded image data of each of a predetermined number of high quality format image data are generated by the image encoding unit.
  • a predictive encoding process in the basic format image data is performed.
  • a predictive encoding process in the high quality format image data or a predictive encoding process with the basic format image data or other high quality format image data is performed.
  • the transmission unit transmits a container having a predetermined format including the basic video stream and the extended video stream generated by the image encoding unit.
  • the container may be a transport stream (MPEG-2 TS) adopted in the digital broadcasting standard.
  • the container may be MP4 used for Internet distribution or the like, or a container of other formats.
  • the image encoding unit identification information for identifying the corresponding format is inserted into each of the encoded image data of the basic format image data and the predetermined number of high quality format image data.
  • the encoded image data may have a NAL unit structure, and the image encoding unit may insert identification information into the header of the NAL unit.
  • the image encoding unit may insert the identification information using the “nuh_layer_id” field of the header of the NAL unit.
  • the image encoding unit may insert the identification information using the fields “nuh_layer_id” and “nuh_temporal_id_plus1” of the header of the NAL unit.
  • identification information for identifying a corresponding format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data. Therefore, on the receiving side, based on the identification information, it is possible to easily perform decoding processing on predetermined encoded image data and obtain image data corresponding to display capability.
  • the container layer further includes an information insertion unit that inserts information defining what format the encoded image data indicates the identification information inserted into the encoded image data.
  • the container is MPEG2-TS
  • the information insertion unit is configured to insert information into a video elementary stream loop corresponding to an extended video stream existing under the program map table. Also good.
  • the receiving side it is possible to grasp in advance in the container layer what format the identification information inserted into the encoded image data indicates.
  • a receiving unit for receiving a container of a predetermined format having a basic video stream including encoded image data of the basic format image data and an extended video stream including encoded image data of each of a predetermined number of high-quality format image data; Identification information for identifying a corresponding format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data,
  • the receiving apparatus further includes a processing unit that processes each video stream included in the received container based on the identification information and the display capability information.
  • a container having a predetermined format including a basic video stream and an extended video stream is received by the receiving unit.
  • the basic video stream includes encoded image data of basic format image data.
  • the extended video stream includes each encoded image data of a predetermined number of high quality format image data.
  • Identification information for identifying the corresponding format is inserted into each encoded image data of the basic format image data and a predetermined number of high quality format image data.
  • the encoded image data may have a NAL unit structure, and the identification information may be inserted in the header of the NAL unit.
  • Each video stream of the received container is processed by the processing unit based on the identification information and the display capability information.
  • the identification information for identifying the corresponding format and the display capability information inserted into the encoded image data of the basic format image data and the predetermined number of high quality format image data are included. Based on this, the extended video stream of the received container is processed. Therefore, it is possible to easily obtain image data corresponding to display capability by selectively performing decoding processing on predetermined encoded image data.
  • information defining what format the encoded image data indicates the identification information inserted in the encoded image data is inserted in the container layer. Based on the information inserted in the layer, it may be configured to grasp what format the encoded image data indicates the identification information inserted into the encoded image data.
  • An image encoding unit that generates a video stream including encoded image data of basic format image data and encoded image data of each of a predetermined number of high-quality format image data;
  • a transmission unit that transmits a container of a predetermined format including the video stream generated by the image encoding unit;
  • the image encoding unit inserts identification information for identifying a corresponding format into encoded image data of basic format image data and encoded image data of a predetermined number of high-quality format image data. is there.
  • a video stream including encoded image data of each of basic format image data and a predetermined number of high quality format image data is generated by the image encoding unit. For example, with respect to the basic format image data, a predictive encoding process in the basic format image data is performed. Further, with respect to the high quality format image data, a predictive encoding process in the high quality format image data or a predictive encoding process with the basic format image data or other high quality format image data is performed.
  • the transmission unit transmits a container of a predetermined format including the video stream generated by the image encoding unit.
  • the container may be a transport stream (MPEG-2 TS) adopted in the digital broadcasting standard.
  • the container may be MP4 used for Internet distribution or the like, or a container of other formats.
  • the image encoding unit identification information for identifying the corresponding format is inserted into each of the encoded image data of the basic format image data and the predetermined number of high quality format image data.
  • the encoded image data may have a NAL unit structure, and the image encoding unit may insert identification information into the header of the NAL unit.
  • the image encoding unit may insert the identification information using the “nuh_layer_id” field of the header of the NAL unit.
  • the image encoding unit may insert the identification information using the fields “nuh_layer_id” and “nuh_temporal_id_plus1” of the header of the NAL unit.
  • identification information for identifying a corresponding format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data. Therefore, on the receiving side, based on the identification information, it is possible to easily perform decoding processing on predetermined encoded image data and obtain image data corresponding to display capability.
  • the container layer further includes an information insertion unit that inserts information defining what format the encoded image data indicates the identification information inserted into the encoded image data. May be.
  • the container is MPEG2-TS, and the information insertion unit may insert the information into a video elementary stream loop corresponding to the video stream existing under the program map table. Good.
  • the receiving side it is possible to grasp in advance in the container layer what format the identification information inserted into the encoded image data indicates.
  • a receiving unit that receives a container of a predetermined format having a video stream that includes encoded image data of basic format image data and encoded image data of a predetermined number of high-quality format image data; Identification information for identifying a corresponding format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data,
  • the receiving apparatus further includes a processing unit that processes the video stream of the received container based on the identification information and the display capability information.
  • the receiving unit receives a container of a predetermined format having a video stream including the encoded image data of the basic format image data and the encoded image data of a predetermined number of high quality format image data.
  • Identification information for identifying the corresponding format is inserted into each encoded image data of the basic format image data and a predetermined number of high quality format image data.
  • the encoded image data may have a NAL unit structure, and the identification information may be inserted in the header of the NAL unit.
  • the processing unit processes the video stream of the received container based on the identification information and the display capability information.
  • the identification information for identifying the corresponding format and the display capability information inserted into the encoded image data of the basic format image data and the predetermined number of high quality format image data are included. Based on this, the video stream of the received container is processed. Therefore, it is possible to easily obtain image data corresponding to display capability by selectively performing decoding processing on predetermined encoded image data.
  • information defining what format the encoded image data indicates the identification information inserted in the encoded image data is inserted in the container layer. Based on the information inserted in the layer, it may be configured to grasp what format the encoded image data indicates the identification information inserted into the encoded image data.
  • a predetermined number of high-quality format image data can be satisfactorily transmitted together with the basic format image data.
  • the effects described here are not necessarily limited, and may be any of the effects described in the present disclosure.
  • FIG. 1 shows a configuration example of a transmission / reception system 10 as an embodiment.
  • the transmission / reception system 10 includes a transmission device 100 and a reception device 200.
  • a transport stream TS as a container is transmitted from the transmission device 100 to the reception device 200 on a broadcast wave or a net packet.
  • the transport stream TS has a two-stream configuration having two video streams of a basic video stream and an extended video stream, and (2) the video stream has one transport stream TS.
  • the transmission device 100 transmits a transport stream TS as a container on a broadcast wave or a network packet.
  • the transport stream TS includes two video streams, a basic video stream and an extended video stream.
  • the basic video stream includes encoded image data of basic format image data.
  • the basic video stream is, for example, H.264 to basic format image data. H.264 / AVC, H.H. This is generated by performing a predictive coding process such as H.265 / HEVC.
  • the extended video stream includes encoded image data of each of a predetermined number of high quality format image data.
  • This extended video stream is converted into a predetermined number of high-quality image data, for example, H.264, H.264 / AVC, H.H. This is generated by performing a predictive coding process such as H.265 / HEVC.
  • Identification information for identifying the corresponding format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data. On the receiving side, based on this identification information, it is possible to easily perform predetermined decoding processing on predetermined encoded image data to obtain image data corresponding to the display capability. In this embodiment, the identification information is inserted into the header of the NAL unit.
  • the information that defines what format the encoded image data indicates the identification information inserted into the encoded image data is inserted into the container layer. On the receiving side, this information makes it possible to grasp in advance in the container layer what format the identification information inserted into the encoded image data indicates.
  • information is inserted into each video elementary stream loop corresponding to an extended video stream existing under the program map table.
  • the receiving device 200 receives the transport stream TS transmitted from the transmitting device 100 on broadcast waves or net packets.
  • the transport stream TS includes a basic video stream including encoded image data of basic format image data and an extended video stream including encoded image data of a predetermined number of high quality format image data. is doing.
  • identification information for identifying a corresponding format is inserted into each encoded image data of a predetermined number of high-quality format image data.
  • the receiving device 200 processes each video stream included in the transport stream TS based on the identification information and the display capability information, and acquires image data corresponding to the display capability.
  • the transmission device 100 transmits a transport stream TS as a container on a broadcast wave or a network packet.
  • This transport stream TS includes one video stream.
  • the video stream includes encoded image data of basic format image data and encoded image data of a predetermined number of high quality format image data.
  • This video stream is converted into basic format image data and a predetermined number of high-quality format image data, for example, H.264, respectively.
  • This is generated by performing a predictive coding process such as H.265 / HEVC.
  • Identification information for identifying the basic format or the corresponding high quality format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data. On the receiving side, based on this identification information, it is possible to easily perform predetermined decoding processing on predetermined encoded image data to obtain image data corresponding to the display capability. In this embodiment, the identification information is inserted into the header of the NAL unit.
  • the information that defines what format the encoded image data indicates the identification information inserted into the encoded image data is inserted into the container layer. On the receiving side, this information makes it possible to grasp in advance in the container layer what format the identification information inserted into the encoded image data indicates.
  • information is inserted into each video elementary stream loop corresponding to the video stream existing under the program map table.
  • the receiving device 200 receives the transport stream TS transmitted from the transmitting device 100 on broadcast waves or net packets.
  • the transport stream TS includes a video stream including encoded image data of basic format image data and encoded image data of each of a predetermined number of high quality format image data.
  • identification information for identifying the corresponding format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data.
  • the receiving apparatus 200 processes the video stream included in the transport stream TS based on the identification information and the display capability information, and acquires image data corresponding to the display capability.
  • FIG. 2 shows a configuration example of the transmission device 100.
  • the transmission apparatus 100 handles basic format image data Vb and three high-quality format image data Vh1, Vh2, and Vh3 as transmission image data.
  • the basic format image data Vb is LDR (Low Dynamic Lange) image data having a frame frequency of 50 Hz.
  • the high quality format image data Vh1 is LDR image data having a frame frequency of 100 Hz.
  • the LDR image data has a luminance range of 0% to 100% with respect to the brightness of the white peak of the conventional LDR image.
  • the high quality format image data Vh2 is HDR (High Dynamic Range) image data having a frame frequency of 50 Hz.
  • the high quality format image data Vh3 is HDR image data having a frame frequency of 100 Hz.
  • This HDR image data has a brightness in the range of 0 to 100% * N, for example, 0 to 1000% or more, assuming that the brightness of the white peak of the conventional LDR image is 100%.
  • FIG. 3 shows a configuration example of the image data generation unit 150 that generates basic format image data Vb and three high-quality format image data Vh1, Vh2, and Vh3.
  • the image data generation unit 150 includes an HDR camera 151, a frame rate conversion unit 152, a dynamic range conversion unit 153, and a frame rate conversion unit 154.
  • the HDR camera 151 images a subject and outputs HDR image data having a frame frequency of 100 Hz, that is, high-quality format image data Vh3.
  • the frame rate conversion unit 152 performs processing for converting the frame frequency from 100 Hz to 50 Hz on the high-quality format image data Vh3 output from the HDR camera 151, so that the HDR image data whose frame frequency is 50 Hz, that is, high Quality format image data Vh2 is output.
  • the dynamic range conversion unit 153 performs processing for converting HDR to LDR on the high quality format image data Vh3 output from the HDR camera 151, so that LDR image data having a frame frequency of 100 Hz, that is, a high quality format image.
  • Data Vh1 is output.
  • the frame rate conversion unit 154 performs processing for converting the frame frequency from 100 Hz to 50 Hz on the high-quality format image data Vh1 output from the dynamic range conversion unit 153, and LDR image data having a frame frequency of 50 Hz. That is, the basic format image data Vb is output.
  • the transmission apparatus 100 includes a control unit 101, LDR photoelectric conversion units 102 and 103, HDR photoelectric conversion units 104 and 105, a video encoder 106, a system encoder 107, and a transmission unit 108.
  • the control unit 101 includes a CPU (CentralCPUProcessing ⁇ Unit), and controls the operation of each unit of the transmission device 100 based on a control program.
  • CPU CentralCPUProcessing ⁇ Unit
  • the LDR photoelectric conversion unit 102 applies LDR photoelectric conversion characteristics (LDR OETF curve) to the basic format image data Vb to obtain basic format image data Vb ′ for transmission.
  • the LDR photoelectric conversion unit 103 applies the LDR image photoelectric conversion characteristics to the high quality format image data Vh1 to obtain high quality format image data Vh1 ′ for transmission.
  • the HDR photoelectric conversion unit 104 applies the HDR image photoelectric conversion characteristic (HDR-OETF curve) to the high-quality format image data Vh2 to obtain high-quality format image data Vh2 ′ for transmission.
  • the HDR photoelectric converter 105 applies the HDR image photoelectric conversion characteristics to the high quality format image data Vh3 to obtain high quality format image data Vh3 ′ for transmission.
  • the video encoder 106 includes four encoding units 106-0, 106-1, 106-2, and 106-3.
  • the encoding unit 106-0 applies H.264 to the basic format image data Vb ′ for transmission. H.264 / AVC, H.H.
  • Predictive encoding processing such as H.265 / HEVC is performed to obtain encoded image data Cb. In this case, the encoding unit 106-0 performs prediction in the image data Vb ′.
  • the encoding unit 106-1 is H.264 for high quality format image data Vh1 ′ for transmission. H.264 / AVC, H.H. Predictive encoding processing such as H.265 / HEVC is performed to obtain encoded image data Ch1. In this case, the encoding unit 106-1 selectively performs prediction within the image data Vh1 ′ or prediction with the image data Vb ′ for each coding block in order to reduce the prediction residual.
  • Encoding section 106-2 is H.264 for high quality format image data Vh2 'for transmission.
  • Predictive encoding processing such as H.265 / HEVC is performed to obtain encoded image data Ch2.
  • the encoding unit 106-2 selectively performs prediction within the image data Vh2 ′ or prediction with the image data Vb ′ for each coding block in order to reduce the prediction residual.
  • the encoding unit 106-3 performs H.264 transmission on high-quality format image data Vh3 ′ for transmission.
  • Predictive encoding processing such as H.265 / HEVC is performed to obtain encoded image data Ch3.
  • the encoding unit 106-3 selectively performs prediction within the image data Vh3 ′ or prediction with the image data Vh2 ′ for each coding block in order to reduce the prediction residual.
  • FIG. 4 shows a configuration example of a main part of the encoding unit 160.
  • the encoding unit 160 can be applied to the encoding units 106-1, 106-2, and 106-3.
  • the encoding unit 160 includes an intra-layer prediction unit 161, an inter-layer prediction unit 162, a prediction adjustment unit 163, a selection unit 164, and an encoding function unit 165.
  • the intra-layer prediction unit 161 performs prediction (intra-layer prediction) on the image data V1 to be encoded to obtain prediction residual data.
  • the inter-layer prediction unit 162 performs prediction (inter-layer prediction) with the reference target image data V2 on the encoding target image data V1 to obtain prediction residual data.
  • the prediction adjustment unit 163 performs the following processing according to the type of scalable extension of the image data V1 with respect to the image data V2 in order to efficiently perform the inter-layer prediction in the inter-layer prediction unit 162.
  • level adjustment for conversion from LDR to HDR is performed.
  • spatial scalable extension a block obtained by scaling a block of another layer to a predetermined size is targeted.
  • Bypass for frame rate expansion is performed for each of luminance and color difference.
  • bit length extension conversion for aligning the MSBs of pixels is performed.
  • the image data V1 is high-quality format image data Vh1 ′ (100 Hz, LDR)
  • the image data V2 is basic format image data Vb ′ (50 Hz, LDR).
  • the type corresponds to frame rate expansion. Therefore, the prediction adjustment unit 163 bypasses the image data Vb ′ as it is.
  • the image data V1 is high-quality format image data Vh2 ′ (50 Hz, HDR)
  • the image data V2 is basic format image data Vb ′ (50 Hz, LDR), which is scalable.
  • the type of expansion corresponds to dynamic range expansion. Therefore, the prediction adjustment unit 163 performs level adjustment for converting the LDR to HDR for the image data Vb ′.
  • the level adjustment may be performed based on information supplied from the dynamic range conversion unit 153.
  • the image data V1 is high-quality format image data Vh3 ′ (100 Hz, HDR)
  • the image data V2 is high-quality format image data Vh2 ′ (50 Hz, HDR).
  • the type of scalable extension corresponds to frame rate extension. Therefore, the prediction adjustment unit 163 bypasses the image data Vb ′ as it is.
  • the selection unit 164 selectively extracts the prediction residual data obtained by the intra-layer prediction unit 161 or the prediction residual data obtained by the inter-layer prediction unit 162 for each coding block, and sends it to the encoding function unit 165. In this case, the selection unit 164 extracts, for example, the one having the smaller prediction residual.
  • the encoding function unit 165 performs encoding processing such as transform coding, quantization, and entropy coding on the prediction residual data extracted from the selection unit 164 to obtain encoded image data CV.
  • the video encoder 106 inserts identification information for identifying the corresponding format into each of the encoded image data Cb, Ch1, Ch2, and Ch3.
  • the video encoder 106 inserts this identification information into the header of the NAL unit, for example.
  • FIG. 5A shows a structure example (Syntax) of the NAL unit header
  • FIG. 5B shows contents (Semantics) of main parameters in the structure example.
  • the 1-bit field of “forbidden_zero_bit” 0 is essential.
  • a 6-bit field of “nal_unit_type” indicates a NAL unit type.
  • the 6-bit field of “nuh_layer_id” is an ID indicating the layer extension type of the stream.
  • a 3-bit field of “nuh_temporal_id_plus1” indicates temporal_id (0 to 6) and takes a value (1 to 7) obtained by adding 1.
  • the 6-bit field of “nuh_layer_id” indicates identification information for identifying the format corresponding to the NAL unit (encoded image data). For example, “0” indicates basic. “1” indicates spatial expansion. “2” indicates frame rate extension. “3” indicates bit length extension. “4” indicates dynamic range expansion. “5” indicates wide color gamut expansion. “6” indicates frame rate extension and dynamic range extension. “7” indicates spatial extension and frame rate extension.
  • the encoded image data Cb corresponds to the basic format image data Vb, and “nuh_layer_id” of the encoded image data Cb is set to “0”.
  • the encoded image data Ch1 corresponds to the frame rate extended format image data Vh1, and “nuh_layer_id” of the encoded image data Ch1 is set to “2”.
  • the encoded image data Ch2 corresponds to the dynamic range extended format image data Vh2, and “nuh_layer_id” of the encoded image data Ch2 is set to “4”.
  • the encoded image data Ch3 corresponds to the format image data Vh3 for frame rate extension and dynamic range extension, and the encoded image data Ch3 “nuh_layer_id” is set to “6”.
  • FIG. 6 shows a configuration example of the encoded image data Cb, Ch1, Ch2, and Ch3.
  • the horizontal axis shows the display order (POC: picture order of composition), the display time is on the left, and the display time is on the right.
  • POC picture order of composition
  • Each of the rectangular frames indicates a picture, and an arrow indicates an example of a picture reference relationship in predictive encoding processing.
  • the target picture changes for each block, and the direction of prediction and the number of references are not limited to the illustrated example.
  • the encoded image data Cb is composed of encoded image data of pictures “00”, “01”,.
  • the encoded image data Ch1 is composed of encoded image data of pictures “10”, “11”,... Positioned between the pictures of the encoded image data Cb.
  • the encoded image data Ch2 includes encoded image data of pictures “20”, “21”,... At the same position as each picture of the encoded image data Cb.
  • the encoded image data Ch3 includes encoded image data of pictures “30”, “31”,... Positioned between the pictures of the encoded image data Ch2.
  • the system encoder 107 generates a video stream using the encoded image data Cb, Ch1, Ch2, and Ch3 generated by the video encoder 106, performs PES packetization and TS packetization, A transport stream TS is generated. Then, the transmission unit 108 transmits the transport stream TS to the reception device 200 by placing it on a broadcast wave or a network packet.
  • the system encoder 107 generates a basic video stream including the encoded image data Cb and an extended video stream including the encoded image data Ch1, Ch2, and Ch3. That is, in this case, the transport stream TS has two video streams of a basic video stream that includes the encoded image data Cb and an extended video stream that includes the encoded image data Ch1, Ch2, and Ch3.
  • the system encoder 107 In the case of one stream configuration, the system encoder 107 generates a video stream including the encoded image data Cb, Ch1, Ch2, and Ch3. That is, in this case, the transport stream TS has one video stream including the encoded image data Cb, Ch1, Ch2, and Ch3.
  • the system encoder 107 inserts into the container (transport stream) layer information that defines what format the encoded image data represents the identification information inserted into the encoded image data.
  • scalable is included in a video elementary stream loop corresponding to an extended video stream (including encoded data Ch1, Ch2, and Ch3) existing under the PMT (Program (Map Table). • Insert an extension descriptor (Scalable extension descriptor).
  • MPT Program (Map Table).
  • a video elementary stream loop corresponding to a video stream (including encoded image data Cb, Ch1, Ch2, and Ch3) existing under the PMT (Program Map Table).
  • PMT Program Map Table
  • a scalable extension descriptor Scalable extension descriptor
  • FIG. 7 shows a structural example (Syntax) of the scalable extension descriptor.
  • FIG. 8 shows the contents (Semantics) of main information in the structural example shown in FIG.
  • the 8-bit field of “descriptor_tag” indicates a descriptor type, and here indicates that it is a scalable extension descriptor.
  • the 8-bit field of “descriptor_length” indicates the length (size) of the descriptor, and indicates the number of subsequent bytes as the descriptor length.
  • the “Extended_spatial_resolution_flag” flag indicates whether an extended component of spatial resolution is included. “1” indicates that a spatial resolution extension component is included, and “0” indicates that a spatial resolution extension component is not included.
  • the flag “Extended_frame_rate_flag” indicates whether a frame rate extension component is included. “1” indicates that a frame rate extension component is included, and “0” indicates that a frame rate extension component is not included.
  • the “Extended_bit_depth_flag” flag indicates whether a bit length extended component is included. “1” indicates that a bit length extension component is included, and “0” indicates that a bit length extension component is not included.
  • the flag “Extended_dynamic_range_flag” indicates whether a dynamic range extended component is included. “1” indicates that a dynamic range expansion component is included, and “0” indicates that a dynamic range expansion component is not included.
  • the flag “Extended_color_gamut_flag” indicates whether a color gamut extension component is included. “1” indicates that a color gamut expansion component is included, and “0” indicates that a color gamut expansion component is not included.
  • the 8-bit field of“ number_of_layerIDs ” indicates the number of layers included in the stream. There are as many 6-bit fields of “layerID” as there are layers. The field of “layerID” indicates a layer ID (Layer_id).
  • “Extended_spatial_resolution_flag”, “Extended_bit_depth_flag”, and “Extended_color_gamut_flag” are set to “0”.
  • “Extended_frame_rate_flag” and “Extended_dynamic_range_flag” are set to “1”.
  • “number_of_layerIDs” is set to “3”, and “2”, “4”, and “6” are sequentially set as “layerID”.
  • FIG. 10 shows a configuration example of the transport stream TS in the case of a two-stream configuration.
  • the transport stream TS includes two video streams, a basic video stream STb and an extended video stream STe.
  • the packet identifier (PID) of the basic video stream STb is, for example, PID1.
  • the basic video stream STb includes encoded image data of each picture in the basic format.
  • the encoded image data of each picture of this basic format includes NAL units such as AUD, VPS, SPS, PPS, PSEI, SLICE, SSEI, and EOS. “Nuh_layer_id” in the headers of these NAL units is set to “0”, for example, indicating that it is encoded image data according to the basic format.
  • the packet identifier (PID) of the extended video stream STe is, for example, PID2.
  • the extended video stream STe includes encoded image data of each picture in three high quality formats, ie, frame rate extension, dynamic range extension, and further frame rate extension and dynamic range extension.
  • NAL units such as AUD, SPS, PPS, PSEI, SLICE, SSEI, and EOS exist in the encoded image data of each picture in the high quality format.
  • the SPS in the encoded image data of each picture in the basic format and the SPS in the encoded image data of each picture in the high quality format have the same “nal_unit_type” value, and differ depending on whether or not an extension is included therein. . That is, the SPS in the encoded image data of each picture in the high quality format includes an SPS extension. Note that the SPS of the basic format and the SPS of the high quality format can be set to different “nal_unit_type” values.
  • “Nuh_layer_id” in the header of the NAL unit constituting the encoded image data of each picture of the frame rate extension is “2”, which indicates that the encoded image data is related to the frame rate extension.
  • “nuh_layer_id” in the header of the NAL unit constituting the encoded image data of each picture for dynamic range expansion is set to “4”, indicating that the encoded image data is related to dynamic range expansion.
  • “nuh_layer_id” in the header of the NAL unit constituting the encoded image data of each picture of frame rate extension and dynamic range extension is set to “6”, which is encoded image data related to frame rate extension and dynamic range extension. It is shown that there is.
  • the transport stream TS includes a PMT (Program Map Table) as PSI (Program Specific Information).
  • PSI Program Specific Information
  • PMT has a program loop that describes information related to the entire program. Further, the PMT includes an elementary stream loop having information related to each elementary stream. In this configuration example, there are two video elementary stream loops (video ES loop) corresponding to two video streams of the basic video stream STb and the extended video stream STe. In the video elementary stream loop corresponding to the basic video stream STb, information such as a stream type (ST0) and a packet identifier (PID1) is arranged.
  • video ES loop video elementary stream loop
  • ST0 stream type
  • PID1 packet identifier
  • the video elementary stream loop corresponding to the extended video stream STe information such as a stream type (ST1) and a packet identifier (PID2) is arranged, and a descriptor describing information related to the extended video stream STe. Also arranged. As one of the descriptors, the above-described scalable extension descriptor (see FIG. 7) is inserted.
  • “Extended_frame_rate_flag” and “Extended_dynamic_range_flag” are set to “1”, “number_of_layerIDs” is set to “3”, and “layerID” is set to “2”, “4”, “6” in this order. Is done.
  • FIG. 11 shows a configuration example of the transport stream TS in the case of one stream configuration.
  • This transport stream TS includes one video stream ST.
  • the packet identifier (PID) of this video stream ST is, for example, PID1.
  • the video stream ST includes encoded image data of each picture of the basic format, and each picture of three high quality formats of frame rate extension, dynamic range extension, frame rate extension and dynamic range extension. Encoded image data is included.
  • the encoded image data of each picture in the basic format includes NAL units such as AUD, VPS, SPS, PPS, PSEI, SLICE, SSEI, and EOS. “Nuh_layer_id” in the headers of these NAL units is set to “0”, for example, indicating that it is encoded image data according to the basic format.
  • NAL units such as AUD, SPS, PPS, PSEI, SLICE, SSEI, and EOS exist in the encoded image data of each picture in the high quality format.
  • the SPS in the encoded image data of each picture in the basic format and the SPS in the encoded image data of each picture in the high quality format have the same “nal_unit_type” value, and differ depending on whether or not an extension is included therein. . That is, the SPS in the encoded image data of each picture in the high quality format includes an SPS extension.
  • “Nuh_layer_id” in the header of the NAL unit constituting the encoded image data of each picture of the frame rate extension is “2”, which indicates that the encoded image data is related to the frame rate extension.
  • “nuh_layer_id” in the header of the NAL unit constituting the encoded image data of each picture for dynamic range expansion is set to “4”, indicating that the encoded image data is related to dynamic range expansion.
  • “nuh_layer_id” in the header of the NAL unit constituting the encoded image data of each picture of frame rate extension and dynamic range extension is set to “6”, which is encoded image data related to frame rate extension and dynamic range extension. It is shown that there is.
  • the transport stream TS includes a PMT (Program Map Table) as PSI (Program Specific Information).
  • PSI Program Specific Information
  • PMT has a program loop that describes information related to the entire program. Further, the PMT includes an elementary stream loop having information related to each elementary stream. In this configuration example, one video elementary stream loop (video ES loop) exists corresponding to one video stream ST.
  • video ES loop video elementary stream loop
  • information such as a stream type (ST0) and a packet identifier (PID1) is arranged, and a descriptor describing information related to the video stream ST is also arranged.
  • the above-described scalable extension descriptor see FIG. 7 is inserted.
  • “Extended_frame_rate_flag” and “Extended_dynamic_range_flag” are set to “1”, “number_of_layerIDs” is set to “4”, and “layerID” is “0”, “2”, “4”, “ 6 "is set.
  • Basic format image data Vb which is LDR image data with a frame frequency of 50 Hz, is supplied to the LDR photoelectric conversion unit 102.
  • LDR image photoelectric conversion characteristics LDR OETF curve
  • the basic format image data Vb ′ is supplied to the encoding units 106-0, 106-1 and 106-2 of the video encoder 106.
  • high-quality format image data Vh1 that is LDR image data with a frame frequency of 100 Hz is supplied to the LDR photoelectric conversion unit 103.
  • the LDR photoelectric conversion characteristics (LDR OETF curve) are applied to the high quality format image data Vh1, and high quality format image data Vh1 ′ for transmission is obtained.
  • the high quality format image data Vh1 ′ is supplied to the encoding unit 106-1 of the video encoder 106.
  • high-quality format image data Vh2 that is HDR image data with a frame frequency of 50 Hz is supplied to the HDR photoelectric conversion unit 104.
  • the HDR image photoelectric conversion characteristics HDR OETF curve
  • the high quality format image data Vh2 ′ is supplied to the encoding units 106-2 and 106-3 of the video encoder 106.
  • high-quality format image data Vh3 which is HDR image data with a frame frequency of 100 Hz, is supplied to the HDR photoelectric conversion unit 105.
  • the HDR image photoelectric conversion characteristic HDR OETF curve
  • the high quality format image data Vh3 ′ is supplied to the encoding unit 106-3 of the video encoder 106.
  • the basic format image data Vb ′ and the high-quality format image data Vh1 ′, Vh2 ′, Vh3 ′ are subjected to encoding processing, and the encoded image data Cb, Ch1, Ch2, and Ch3 are converted into the encoded image data Cb, Ch1, Ch2, and Ch3.
  • the encoding unit 106-0 performs H.264 transmission on the basic format image data Vb ′ for transmission.
  • Predictive encoding processing such as H.265 / HEVC is performed, and encoded image data Cb is obtained.
  • the encoding unit 106-1 performs H.264 transmission on the high quality format image data Vh1 ′ for transmission.
  • Predictive encoding processing such as H.265 / HEVC is performed, and encoded image data Ch1 is obtained.
  • the encoding unit 106-2 applies H.264 to the high-quality format image data Vh2 ′ for transmission.
  • Predictive encoding processing such as H.265 / HEVC is performed to obtain encoded image data Ch2.
  • the encoding unit 106-3 performs H.264 transmission on the high-quality format image data Vh3 ′ for transmission.
  • Predictive encoding processing such as H.265 / HEVC is performed, and encoded image data Ch3 is obtained.
  • identification information for identifying a corresponding format is inserted into each of the encoded image data Cb, Ch1, Ch2, and Ch3. That is, in the video encoder 106, identification information for identifying the format corresponding to the NAL unit (encoded image data) is inserted into the “nuh_layer_id” field of the NAL unit header.
  • the encoded image data Cb, Ch1, Ch2, and Ch3 obtained by the video encoder 106 are supplied to the system encoder 107.
  • a video stream is generated using the encoded image data Cb, Ch1, Ch2, and Ch3, PES packetization and TS packetization are performed, and a transport stream TS is generated.
  • two video streams of a basic video stream including the encoded image data Cb and an extended video stream including the encoded image data Ch1, Ch2, and Ch3 are generated.
  • one video stream including encoded image data Cb, Ch1, Ch2, and Ch3 is generated.
  • information defining what format the encoded image data indicates the identification information inserted into the encoded image data is inserted into the layer of the container (transport stream).
  • a scalable extension descriptor is inserted into a video elementary stream loop corresponding to an extended video stream (including encoded image data Ch1, Ch2, and Ch3) existing under the PMT.
  • a scalable extension descriptor is inserted into a video elementary stream loop corresponding to a video stream (including encoded image data Cb, Ch1, Ch2, and Ch3) existing under the PMT.
  • the transport stream TS generated by the system encoder 107 is sent to the transmission unit 108.
  • the transport stream TS is transmitted to the reception device 200 on a broadcast wave or a net packet.
  • FIG. 12 shows a configuration example of the receiving device 200.
  • the receiving apparatus 200 corresponds to the configuration example of the transmitting apparatus 100 in FIG.
  • the receiving apparatus 200 includes a control unit 201, a reception unit 202, a system decoder 203, a compressed data buffer (cpb) 204, a video decoder 205, LDR light conversion units 206 and 207, an HDR light conversion unit 208, 209 and a display unit (display device) 210.
  • the control unit 201 includes a CPU (Central Processing Unit) and controls the operation of each unit of the receiving device 200 based on a control program.
  • the reception unit 202 receives the transport stream TS transmitted from the transmission device 100 on broadcast waves or net packets.
  • the system decoder 203 extracts a video stream from the transport stream TS.
  • the system decoder 203 extracts various information inserted in the container (transport stream) layer and sends it to the control unit 201.
  • This information includes the scalable extension descriptor described above.
  • the control unit 201 determines in what format the identification information inserted in the encoded image data (in this embodiment, “nuh_layer_id” in the header of the NAL unit) indicates the encoded image data. Can be grasped in advance in the container layer.
  • the compressed data buffer 204 temporarily stores the video stream extracted by the system decoder 203.
  • the video decoder 205 includes four decoding units 205-0, 205-1, 205-2, and 205-3.
  • the decoding unit 205-0 performs decoding processing on the encoded image data (basic component) Cb of the basic format that is selectively read from the compressed data buffer 204 to generate basic format image data Vb ′. In this case, the decoding unit 205-0 performs prediction compensation in the image data Vb ′.
  • the decoding unit 205-1 performs a decoding process on the frame rate extension encoded image data (frame rate extension component) Ch1, which is selectively read from the compressed data buffer 204, and outputs the high quality format image data Vh1 ′. Is generated. In this case, the decoding unit 205-1 performs prediction compensation in the image data Vh1 ′ or prediction compensation with the image data Vb ′ for each coding block in association with prediction at the time of encoding.
  • the decoding unit 205-2 performs a decoding process on the dynamic range extended encoded image data (dynamic range extended component) Ch2 that is selectively read from the compressed data buffer 204 to obtain high-quality format image data Vh2 ′. Is generated. In this case, the decoding unit 205-2 performs prediction compensation in the image data Vh2 ′ or prediction compensation with the image data Vb ′ for each coding block in association with the prediction at the time of encoding.
  • the decoding unit 205-3 performs a decoding process on frame rate extension and dynamic range extension encoded image data (frame rate extension component and dynamic range extension component) Ch3 that is selectively read from the compressed data buffer 204. Thus, high-quality format image data Vh3 ′ is generated. In this case, the decoding unit 205-3 performs prediction compensation in the image data Vh3 ′ or prediction compensation with the image data Vh2 ′ for each coding block in association with the prediction at the time of encoding.
  • FIG. 13 shows a configuration example of a main part of the decoding unit 250.
  • the decoding unit 250 can be applied to the decoding units 205-1, 205-2, and 205-3.
  • the decoding unit 250 performs a process opposite to the process of the encoding unit 165 of FIG.
  • the decoding unit 250 includes a decoding function unit 251, an intra-layer prediction compensation unit 252, an inter-layer prediction compensation unit 253, a prediction adjustment unit 254, and a selection unit 255.
  • the decoding function unit 251 performs decoding processing other than prediction compensation on the encoded image data CV to obtain prediction residual data.
  • the intra-layer prediction compensation unit 252 performs prediction compensation (intra-layer prediction compensation) in the image data V1 on the prediction residual data to obtain image data V1.
  • the inter-layer prediction compensation unit 253 performs prediction compensation (inter-layer prediction compensation) with the reference target image data V2 on the prediction residual data to obtain image data V1.
  • the prediction adjustment unit 254 performs processing according to the type of scalable extension of the image data V1 with respect to the image data V2, similarly to the prediction adjustment unit 163 of the encoding unit 160 in FIG.
  • the selection unit 255 selectively selects the image data V1 obtained by the intra-layer prediction compensation unit 252 or the image data V1 obtained by the inter-layer prediction compensation unit 253 for each coding block in association with the prediction at the time of coding. To output.
  • the LDR electro-optic conversion unit 206 performs electro-optic conversion with characteristics opposite to those of the LDR photoelectric conversion unit 102 in the transmission device 100 described above, on the basic format image data Vb ′ obtained by the decoding unit 205-0.
  • Basic format image data Vb is obtained.
  • This basic format image data is LDR image data having a frame frequency of 50 Hz.
  • the LDR electro-optic conversion unit 207 performs electro-optic conversion with characteristics opposite to those of the LDR photoelectric conversion unit 103 in the transmission device 100 described above on the high-quality format image data Vh1 ′ obtained by the decoding unit 205-1 to obtain a high-quality format.
  • Image data Vh1 is obtained.
  • the high quality format image data Vh1 is LDR image data having a frame frequency of 100 Hz.
  • the HDR electro-optic conversion unit 208 performs electro-optic conversion with characteristics opposite to those of the HDR photoelectric conversion unit 104 in the transmission apparatus 100 described above on the high-quality format image data Vh2 ′ obtained by the decoding unit 205-2, thereby obtaining a high-quality format.
  • Image data Vh2 is obtained.
  • the high quality format image data Vh2 is HDR image data having a frame frequency of 50 Hz.
  • the HDR electro-optic conversion unit 209 performs electro-optic conversion with characteristics opposite to those of the HDR photoelectric conversion unit 105 in the transmission device 100 described above on the high-quality format image data Vh3 ′ obtained by the decoding unit 205-3.
  • Image data Vh3 is obtained.
  • the high quality format image data Vh3 is HDR image data having a frame frequency of 100 Hz.
  • the display unit 210 includes, for example, an LCD (Liquid Crystal Display), an organic EL (Organic Electro-Luminescence) panel, and the like.
  • the display unit 210 displays an image based on one of the basic format image data Vb and the high quality format image data Vh1, Vh2, and Vh3 according to the display capability.
  • control unit 201 controls image data to be supplied to the display unit 210. This control is performed based on the basic format and high-quality format identification information inserted into each encoded image data and the display capability information of the display unit 209.
  • the display unit 210 cannot display a high frame frequency or a high dynamic range
  • the basic format image related to the decoding of the basic format encoded image data (basic component) Cb is displayed on the display unit 210.
  • Control is performed so that data Vb is supplied.
  • the control unit 201 selectively extracts the encoded image data Cb in the basic format from the compressed data buffer 204 and sends it to the decoding unit 205-0.
  • the control unit 201 controls the decoding unit 205-0 to decode the encoded image data Cb and the LDR electro-optic conversion unit 206 to output the basic format image data Vb.
  • the display unit 210 When the display unit 210 can display a high frame frequency but cannot display a high dynamic range, the display unit 210 decodes encoded image data (frame rate extension component) Ch1 for frame rate extension.
  • the high-quality format image data Vh1 is controlled so as to be supplied.
  • control unit 201 selectively extracts the encoded image data Cb in the basic format from the compressed data buffer 204 and sends the encoded image data Cb to the decoding unit 205-0, and also encodes the encoded image data Ch1 with frame rate extension from the compressed data buffer 204. Are selectively extracted and sent to the decoding unit 205-1. Then, in the control unit 201, the decoding unit 205-0 decodes the encoded image data Cb, the decoding unit 205-1 decodes the encoded image data Ch1, and the LDR electro-optic conversion unit 207 converts the high quality format image data Vh1. Control to output.
  • the display unit 210 When the display unit 210 cannot display a high frame frequency but can display a high dynamic range, the display unit 210 decodes encoded image data (dynamic range expansion component) Ch2 for dynamic range expansion. Control is performed so that the high-quality format image data Vh2 is supplied.
  • encoded image data dynamic range expansion component
  • control unit 201 selectively retrieves the encoded image data Cb of the basic format from the compressed data buffer 204 and sends it to the decoding unit 205-0, and also encodes the encoded image data Ch2 of dynamic range extension from the compressed data buffer 204. Are selectively extracted and sent to the decoding unit 205-2. Then, in the control unit 201, the decoding unit 205-0 decodes the encoded image data Cb, the decoding unit 205-2 decodes the encoded image data Ch2, and the LDR electro-optical conversion unit 208 converts the high-quality format image data Vh2. Control to output.
  • the display unit 210 can display a high frame frequency and a high dynamic range
  • the encoded image data (frame rate extension component and dynamic range extension) is displayed on the display unit 210.
  • Component) Control is performed so that high-quality format image data Vh3 related to decoding of Ch3 is supplied.
  • control unit 201 selectively retrieves the encoded image data Cb of the basic format from the compressed data buffer 204 and sends it to the decoding unit 205-0, and also encodes the encoded image data Ch2 of dynamic range extension from the compressed data buffer 204. Is selectively extracted and sent to the decoding unit 205-1, and the encoded image data Ch3 for frame rate extension and dynamic range extension is selectively extracted from the compressed data buffer 204 and sent to the decoding unit 205-3.
  • the decoding unit 205-0 decodes the encoded image data Cb
  • the decoding unit 205-2 decodes the encoded image data Ch2
  • the decoding unit 205-3 decodes the encoded image data Ch3.
  • the HDR electro-optic conversion unit 209 controls to output the high-quality format image data Vh3.
  • FIG. 14 schematically shows the output of the compressed data buffer (cpb) 204 in the case of the two-stream configuration and the distribution of the encoded image data Cb, Ch1, Ch2, and Ch3 to “corresponding decoding units” by “nuh_layer_id”. Yes.
  • the encoded image data Cb and the extended video stream (PID2) of the basic format included in the basic video stream (PID1) are sent from the compressed data buffer (cpb) 204.
  • the encoded image data of each picture of the high-quality format encoded image data Ch1, Ch2, and Ch3 included in () is sequentially read out.
  • “30”, “31”,... Indicate the encoded image data of each picture constituting the encoded image data Ch3, and “nuh_layer_id” of the NAL unit header is set to “6”. ing.
  • the encoded image data of each picture read from the compressed data buffer 204 is sent to the corresponding decoding unit based on “nuh_layer_id” as shown in FIG. In this case, the encoded image data of the layer not related to decoding is. It is thrown away.
  • the illustrated example shows an example in which everything is decoded.
  • FIG. 15 schematically shows the output of the compressed data buffer (cpb) 204 in the case of one stream configuration and the distribution of the encoded image data Cb, Ch1, Ch2, and Ch3 to “corresponding decoding units” by “nuh_layer_id”. Yes.
  • the encoded image data Cb of the basic format included in one video stream (PID1) and the high quality format are sequentially read out.
  • “30”, “31”,... Indicate the encoded image data of each picture constituting the encoded image data Ch3, and “nuh_layer_id” of the NAL unit header is set to “6”. ing.
  • the encoded image data of each picture read from the compressed data buffer 204 is sent to a corresponding decoding unit based on “nuh_layer_id” as shown in FIG.
  • the encoded image data of the layer not related to decoding is. It is thrown away.
  • the illustrated example shows an example in which everything is decoded.
  • step ST1 the control unit 201 starts processing.
  • step ST2 the control unit 201 refers to the scalable extension descriptor and grasps “nuh_layer_id” of each format.
  • “nuh_layer_id” “0” in the basic format
  • “nuh_layer_id” “2” in the frame rate extension
  • “nuh_layer_id” “4” in the dynamic range rate extension
  • step ST3 the control unit 201 determines whether or not display of 100pHDR, that is, display of HDR is possible at a frame frequency of 100Hz.
  • step ST4 the control unit 201 sets encoded image data whose “nuh_layer_id” is “0”, “4”, “6”, that is, encoded image data Cb, Ch2, and Ch3 as a decoding range. Thereafter, in step ST11, the process is terminated.
  • step ST5 determines in step ST5 whether 50pHDR is displayed, that is, whether the frame frequency is 50 Hz and HDR can be displayed.
  • the control unit 201 sets the encoded image data whose “nuh_layer_id” is “0”, “4”, that is, the encoded image data Cb and Ch2, in step ST6, and then in step ST11. The process is terminated.
  • step ST5 determines in step ST7 whether 100pLDR is displayed, that is, whether the frame frequency is 100 Hz and LDR can be displayed.
  • the control unit 201 sets the encoded image data whose “nuh_layer_id” is “0” and “2”, that is, the encoded image data Cb and Ch1, in step ST8, and then in step ST11. The process is terminated.
  • step ST9 the control unit 201 determines in step ST9 whether 50pLDR is displayed, that is, whether the frame frequency is 50 Hz and LDR can be displayed.
  • step ST10 the control unit 201 sets the encoded image data whose “nuh_layer_id” is “0”, that is, the encoded image data Cb, as a decoding range, and then ends the process in step ST11. Note that when it is not possible in step ST9, the control unit 201 ends the process in step ST11.
  • the reception unit 202 receives the transport stream TS transmitted from the transmission device 100 on broadcast waves or net packets.
  • This transport stream TS is supplied to the system decoder 203.
  • the system decoder 203 extracts a video stream from the transport stream TS. This video stream is temporarily stored in the compressed data buffer 204.
  • a basic video stream that includes encoded image data Cb of basic format image data and an extended video stream that includes encoded image data Ch1, Ch2, and Ch3 of high-quality format image data. These two video streams are extracted.
  • one video stream including the encoded image data Cb of the basic format image data and the encoded image data Ch1, Ch2, and Ch3 of the high quality format image data is extracted.
  • the system decoder 203 various information inserted in the container (transport stream) layer is extracted and sent to the control unit 201.
  • This information also includes a scalable extension descriptor.
  • the identification information inserted in the encoded image data indicates the format of the encoded image data. Is grasped.
  • the basic format image data Vb is supplied from the LDR electro-optic conversion unit 206 to the display unit 210.
  • the display unit 210 displays this basic format image data Vb, that is, a 50pLDR image based on LDR image data with a frame frequency of 50 Hz.
  • the encoded image data Cb of the basic format whose “nuh_layer_id” of the NAL unit header is “0” is selectively extracted from the compressed data buffer 204 and supplied to the decoding unit 205-0.
  • decoding processing is performed on the encoded image data Cb to generate basic format image data Vb ′.
  • This basic format image data Vb ′ is supplied to the LDR electro-optic conversion unit 206.
  • the LDR electro-optical conversion unit 206 performs electro-optical conversion on the basic format image data Vb ′ to obtain basic format image data Vb, which is supplied to the display unit 210.
  • the display unit 210 when the display unit 210 can display a high frame frequency but cannot display a high dynamic range, the high-quality format image data Vh1 is supplied from the LDR electro-optic conversion unit 207 to the display unit 210.
  • the display unit 210 displays the high quality format image data Vh1, that is, an image based on LDR image data with a frame frequency of 100 Hz.
  • the encoded image data Cb of the basic format whose “nuh_layer_id” of the NAL unit header is “0” is selectively extracted from the compressed data buffer 204 and supplied to the decoding unit 205-0.
  • decoding processing is performed on the encoded image data Cb to generate basic format image data Vb ′.
  • encoded image data Ch1 with frame rate extension whose “nuh_layer_id” of the NAL unit header is “2” is selectively extracted from the compressed data buffer 204 and supplied to the decoding unit 205-1.
  • the decoding unit 205-1 performs decoding processing on the encoded image data Ch1 with reference to the basic format image data Vb ′, and generates high-quality format image data Vh1 ′.
  • the high quality format image data Vh1 ′ generated by the decoding unit 205-1 is supplied to the LDR electro-optic conversion unit 207.
  • the LDR electro-optical conversion unit 207 performs electro-optical conversion on the high-quality format image data Vh1 ′ to obtain high-quality format image data Vh1, and supplies the high-quality format image data Vh1 to the display unit 210.
  • the high-quality format image data Vh2 is supplied from the HDR electrical conversion unit 208 to the display unit 210.
  • the display unit 210 displays the high-quality format image data Vh2, that is, an image based on the HDR image data with a frame frequency of 50 Hz.
  • the encoded image data Cb of the basic format whose “nuh_layer_id” of the NAL unit header is “0” is selectively extracted from the compressed data buffer 204 and supplied to the decoding unit 205-0.
  • decoding processing is performed on the encoded image data Cb to generate basic format image data Vb ′.
  • the encoded image data Ch2 of dynamic range extension whose “nuh_layer_id” of the NAL unit header is “4” is selectively extracted from the compressed data buffer 204 and supplied to the decoding unit 205-2.
  • the encoded image data Ch2 is decoded with reference to the basic format image data Vb ′, and high-quality format image data Vh2 ′ is generated.
  • the high quality format image data Vh2 ′ generated by the decoding unit 205-2 is supplied to the HDR electro-optic conversion unit 208.
  • the high-quality format image data Vh2 ′ is subjected to electro-optic conversion, and high-quality format image data Vh2 is obtained and supplied to the display unit 210.
  • the display unit 210 can display a high frame frequency and a high dynamic range
  • the high-quality format image data Vh3 is supplied from the HDR electro-optic conversion unit 209 to the display unit 210.
  • the display unit 210 displays the high-quality format image data Vh3, that is, an image based on the HDR image data with a frame frequency of 100 Hz.
  • the encoded image data Cb of the basic format whose “nuh_layer_id” of the NAL unit header is “0” is selectively extracted from the compressed data buffer 204 and supplied to the decoding unit 205-0.
  • decoding processing is performed on the encoded image data Cb to generate basic format image data Vb ′.
  • the encoded image data Ch2 of dynamic range extension whose “nuh_layer_id” of the NAL unit header is “4” is selectively extracted from the compressed data buffer 204 and supplied to the decoding unit 205-2.
  • the encoded image data Ch2 is decoded with reference to the basic format image data Vb ′, and high-quality format image data Vh2 ′ is generated.
  • encoded image data Ch3 for frame rate extension and dynamic range extension whose “nuh_layer_id” of the NAL unit header is “6” is selectively extracted from the compressed data buffer 204 and supplied to the decoding unit 205-3.
  • the high-quality format image data Vh2 ′ is referred to the high-quality format image data Vh2 ′, and the decoding process is performed to generate the high-quality format image data Vh3 ′.
  • the high quality format image data Vh3 ′ generated by the decoding unit 205-3 is supplied to the HDR electro-optic conversion unit 209.
  • the high-quality format image data Vh3 ′ is subjected to electro-optic conversion, and high-quality format image data Vh3 is obtained and supplied to the display unit 210.
  • the transmission apparatus 100 identifies the formats corresponding to the encoded image data of the basic format image data and the predetermined number of high quality format image data. Identification information is inserted. Therefore, on the receiving side, based on the identification information, it is possible to easily perform decoding processing on predetermined encoded image data and obtain image data corresponding to display capability.
  • the transmission device 100 information defining what format the encoded image data indicates the identification information inserted into the encoded image data is inserted into the container layer. Is. Therefore, on the receiving side, it is possible to grasp in advance in the container layer what format the identification information inserted into the encoded image data indicates.
  • “nuh_layer_id” and “nuh_temporal_id_plus1” of the encoded image data Cb, Ch1, Ch2, and Ch3 are set as shown in FIG. 17, for example. That is, for the encoded image data Cb in the basic format, “nuh_layer_id” is set to “0” and “nuh_temporal_id_plus1” is set to “1 to 6”. Also, for the encoded image data Ch1 with frame rate extension, “nuh_layer_id” is set to “0”, and “nuh_temporal_id_plus1” is set to “7”.
  • “nuh_layer_id” is set to “4” and “nuh_temporal_id_plus1” is set to “1 to 6”. Further, for encoded image data Ch3 for frame rate extension and dynamic range extension, “nuh_layer_id” is set to “4” and “nuh_temporal_id_plus1” is set to “7”.
  • the scalable extension descriptor (see FIG. 7) is set as follows. That is, in the case of a two-stream configuration, when encoded data Ch2 and Ch3 are included in an extended video stream, “Extended_spatial_resolution_flag”, “Extended_bit_depth_flag”, and “Extended_color_gamut_flag” are set to “0”, and “Extended_frame_rate_flag” and “Extended_dynamic_range_flag” is set to “1”. Further, “number_of_layer IDs” is set to “3”, and “4” and “4” are sequentially set as “layerID”.
  • “Extended_spatial_resolution_flag”, “Extended_bit_depth_flag”, and “Extended_color_gamut_flag” are set to “0”.
  • “Extended_frame_rate_flag” and “Extended_dynamic_range_flag” are set to “1”.
  • “number_of_layer ⁇ IDs ” is set to“ 4 ”, and“ 0 ”,“ 0 ”,“ 4 ”, and“ 4 ”are sequentially set as“ layerID ”.
  • the flowchart of FIG. 19 shows that the control unit 201 displays the two fields “nuh_layer_id” and “nuh_temporal_id_plus1” in the header of the NAL unit in order to insert identification information into the encoded image data as described above.
  • An example of processing for determining a decoding range from capability information (display performance information) is shown.
  • the control unit 201 starts processing in step ST21.
  • the control unit 201 refers to the scalable extension descriptor and grasps “nuh_layer_id” and “nuh_temporal_id_plus1” of each format.
  • step ST23 the control unit 201 determines whether or not it is possible to display 100pHDR, that is, display HDR at a frame frequency of 100Hz.
  • step ST25 the control unit 201 determines in step ST25 whether 50pHDR is displayed, that is, whether the frame frequency is 50 Hz and HDR can be displayed.
  • step ST27 the control unit 201 determines whether or not 100pLDR can be displayed, that is, whether or not LDR can be displayed with a frame frequency of 100Hz.
  • step ST29 determines in step ST29 whether 50pLDR is displayed, that is, whether the frame frequency is 50 Hz and LDR can be displayed.
  • the transmission / reception system 10 including the transmission device 100 and the reception device 200 is shown, but the configuration of the transmission / reception system to which the present technology can be applied is not limited thereto.
  • the configuration of the receiver 200 may be a set-top box and a monitor connected by a digital interface such as HDMI (High-Definition Multimedia Interface).
  • the set-top box can obtain the display capability information by acquiring EDID (Extended display identification data) from the monitor.
  • EDID Extended display identification data
  • HDMI High-Definition Multimedia Interface
  • the container is a transport stream (MPEG-2 TS)
  • MPEG-2 TS transport stream
  • the present technology can be similarly applied to a system configured to be distributed to receiving terminals using a network such as the Internet.
  • the Internet distribution it is often distributed in a container of MP4 or other formats.
  • containers of various formats such as transport stream (MPEG-2 TS) adopted in the digital broadcasting standard and MP4 used in Internet distribution correspond to the container.
  • this technique can also take the following structures.
  • an image encoding unit that generates an extended video stream including encoded video data of each of a basic video stream including encoded image data of basic format image data and a predetermined number of high-quality format image data;
  • a transmission unit that transmits a container of a predetermined format including the basic video stream and the extended video stream generated by the image encoding unit;
  • the transmitting apparatus that inserts identification information for identifying a corresponding format into each encoded image data of the basic format image data and the predetermined number of high quality format image data.
  • the encoded image data has a NAL unit structure, The transmission apparatus according to (1), wherein the image encoding unit inserts the identification information into a header of the NAL unit.
  • the transmission apparatus inserts the identification information using a field of “nuh_layer_id” of the header of the NAL unit.
  • the information processing device further includes an information insertion unit that inserts information defining in what format the identification information inserted into the encoded image data indicates the encoded image data in the container layer. 4) The transmission apparatus according to any one of the above.
  • the container is MPEG2-TS
  • the information insertion part The transmission apparatus according to (5), wherein the information is inserted into a video elementary stream loop corresponding to the extended video stream existing under a program map table.
  • an image encoding step for generating an extended video stream including encoded video data of each of a basic video stream including encoded image data of basic format image data and a predetermined number of high quality format image data;
  • identification information for identifying a corresponding format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data.
  • a receiving unit that receives a container of a predetermined format having a basic video stream including encoded image data of basic format image data and an extended video stream including encoded image data of each of a predetermined number of high-quality format image data. Prepared, Identification information for identifying a corresponding format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data, A receiving apparatus, further comprising: a processing unit that processes each video stream included in the received container based on the identification information and display capability information. (9)
  • the encoded image data has a NAL unit structure, The receiving apparatus according to (8), wherein the identification information is inserted into a header of the NAL unit.
  • the processing unit grasps what format the encoded image data indicates the identification information inserted in the encoded image data based on the information inserted in the layer of the container.
  • the receiving device according to (9). (11) an image encoding unit that generates a video stream including encoded image data of basic format image data and encoded image data of a predetermined number of high-quality format image data; A transmission unit that transmits a container of a predetermined format including the video stream generated by the image encoding unit; The transmitting apparatus that inserts identification information for identifying a corresponding format into each encoded image data of the basic format image data and the predetermined number of high quality format image data.
  • the encoded image data has a NAL unit structure
  • the information processing unit further includes an information insertion unit that inserts into the container layer, information that defines what format the encoded image data indicates the identification information inserted into the encoded image data.
  • the transmission apparatus according to any one of the above.
  • the container is MPEG2-TS, The information insertion part The transmission apparatus according to (15), wherein the information is inserted into a video elementary stream loop corresponding to the video stream existing under a program map table.
  • identification information for identifying a corresponding format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data.
  • a reception unit that receives a container of a predetermined format having a video stream including the encoded image data of the basic format image data and the encoded image data of a predetermined number of high-quality format image data; Identification information for identifying a corresponding format is inserted into each encoded image data of the basic format image data and the predetermined number of high quality format image data,
  • a receiving apparatus further comprising: a processing unit that processes the video stream of the received container based on the identification information and display capability information.
  • the encoded image data has a NAL unit structure, The receiving apparatus according to (18), wherein the identification information is inserted into a header of the NAL unit.
  • the processing unit grasps what format the encoded image data indicates the identification information inserted in the encoded image data based on the information inserted in the layer of the container (18) or (19) The receiving apparatus according to (19).
  • the main feature of this technology is that the identification information for identifying the corresponding format is inserted into the encoded image data of the basic format image data and the predetermined number of high-quality format image data, and transmitted. On the side, it is easy to selectively perform decoding processing on predetermined encoded image data to obtain image data according to display capability (see FIGS. 10 and 11).
  • DESCRIPTION OF SYMBOLS 10 Transmission / reception system 100 ... Transmission apparatus 101 ... Control part 102,103 ... LDR photoelectric conversion part 104,105 ... HDR photoelectric conversion part 106 ... Video encoder 106-0,106- DESCRIPTION OF SYMBOLS 1,106-2,106-3 ... Encoding part 107 ... System encoder 108 ... Transmission part 150 ... Image data generation part 151 ... HDR camera 152,154 ... Frame rate conversion part 153: Dynamic range conversion unit 160: Encoding unit 161: In-layer prediction unit 162 ... Inter-layer prediction unit 163 ... Prediction adjustment unit 164 ... Selection unit 165 ... Encoding function unit DESCRIPTION OF SYMBOLS 200 ...
  • Receiver 201 ... Control part 202 ... Receiver 203 ... System decoder 204 ... Compressed data buffer 05: Video decoder 205-0, 205-1, 205-2, 205-3 ... Decoding unit 206, 207 ... LDR light conversion unit 208, 209 ... HDR light conversion unit 210 ... Display unit 250... Decoding unit 251... Decoding function unit 252. Intra-layer prediction compensation unit 253... Inter-layer prediction compensation unit 254.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

 基本フォーマット画像データと共に所定数の高品質フォーマット画像データを良好に送信する。 基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームを生成する、あるいは、基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを生成する。生成されたビデオストリームを含む所定フォーマットのコンテナを送信する。基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する。

Description

送信装置、送信方法および受信装置
 本技術は、送信装置、送信方法および受信装置に関し、基本フォーマット画像データと共に所定数の高品質フォーマット画像データを送信する送信装置等に関する。
 従来、基本フォーマット画像データと共に高品質フォーマット画像データを送信し、受信側において、基本フォーマット画像データまたは高品質フォーマット画像データを選択的に用いることが知られている。例えば、特許文献1には、メディア符号化をスケーラブルに行って、低解像度のビデオサービスのためのベースレイヤのストリームと、高解像度のビデオサービスのための拡張レイヤのストリームを生成し、これらを含む放送信号を送信することが記載されている。なお、高品質フォーマットには、高解像度の他に、高フレーム周波数、高ダイナミックレンジ、広色域、高ビット長などがある。
特表2008-543142号公報
 本技術の目的は、基本フォーマット画像データと共に所定数の高品質フォーマット画像データを良好に送信することにある。
 本技術の概念は、
 基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームを生成する画像符号化部と、
 上記画像符号化部で生成された上記基本ビデオストリームおよび上記拡張ビデオストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
 上記画像符号化部は、上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する
 送信装置にある。
 本技術において、画像符号化部により、基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと、所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームが生成される。例えば、基本フォーマット画像データに関しては、この基本フォーマット画像データ内の予測符号化処理が行われる。また、高品質フォーマット画像データに関しては、この高品質フォーマット画像データ内の予測符号化処理または基本フォーマット画像データあるいは他の高品質フォーマット画像データとの間の予測符号化処理が行われる。
 送信部により、画像符号化部で生成された基本ビデオストリームおよび拡張ビデオストリームを含む所定フォーマットのコンテナが送信される。例えば、コンテナは、デジタル放送規格で採用されているトランスポートストリーム(MPEG-2 TS)であってもよい。また、例えば、コンテナは、インターネットの配信などで用いられるMP4、あるいはそれ以外のフォーマットのコンテナであってもよい。
 画像符号化部では、基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入される。例えば、符号化画像データは、NALユニット構造を有し、画像符号化部は、識別情報をNALユニットのヘッダに挿入する、ようにされてもよい。この場合、例えば、画像符号化部は、識別情報を、NALユニットのヘッダの「nuh_layer_id」のフィールドを用いて挿入する、ようにされてもよい。また、この場合、例えば、画像符号化部は、識別情報を、NALユニットのヘッダの「nuh_layer_id」および「nuh_temporal_id_plus1」のフィールドを用いて挿入する、ようにされてもよい。
 このように本技術においては、基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されるものである。そのため、受信側では、識別情報に基づいて、所定の符号化画像データに選択的に復号化処理を行って表示能力に応じた画像データを得ることが容易に可能となる。
 なお、本技術において、例えば、コンテナのレイヤに、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報を挿入する情報挿入部をさらに備える、ようにされてもよい。この場合、例えば、コンテナは、MPEG2-TSであり、情報挿入部は、情報を、プログラムマップテーブルの配下に存在する拡張ビデオストリームに対応したビデオエレメンタリストリームループ内に挿入する、ようにされてもよい。この場合、受信側では、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを、コンテナのレイヤで、予め把握することが可能となる。
 また、本技術の他の概念は、
 基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
 上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されており、
 上記受信されたコンテナが有する各ビデオストリームを、上記識別情報と表示能力情報に基づいて処理する処理部をさらに備える
 受信装置にある。
 本技術において、受信部により、基本ビデオストリームおよび拡張ビデオストリームを有する所定フォーマットのコンテナが受信される。ここで、基本ビデオストリームには、基本フォーマット画像データの符号化画像データが含まれる。拡張ビデオストリームには、所定数の高品質フォーマット画像データのそれぞれの符号化画像データが含まれる。
 基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されている。例えば、符号化画像データは、NALユニット構造を有し、識別情報は、NALユニットのヘッダに挿入されている、ようにされてもよい。処理部により、受信されたコンテナが有する各ビデオストリームが、識別情報と表示能力情報に基づいて処理される。
 このように本技術においては、基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに挿入されている、対応するフォーマットを識別するための識別情報と、表示能力情報に基づいて、受信されたコンテナが有する拡張ビデオストリームが処理されるものである。そのため、所定の符号化画像データに選択的に復号化処理を行って表示能力に応じた画像データを得ることが容易に可能となる。
 なお、本技術において、例えば、コンテナのレイヤに、符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報が挿入されており、処理部は、コンテナのレイヤに挿入されている情報に基づいて、符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを把握する、ようにされてもよい。
 また、本技術の他の概念は、
 基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを生成する画像符号化部と、
 上記画像符号化部で生成された上記ビデオストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
 上記画像符号化部は、基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する
 送信装置にある。
 本技術において、画像符号化部により、基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームが生成される。例えば、基本フォーマット画像データに関しては、この基本フォーマット画像データ内の予測符号化処理が行われる。また、高品質フォーマット画像データに関しては、この高品質フォーマット画像データ内の予測符号化処理または基本フォーマット画像データあるいは他の高品質フォーマット画像データとの間の予測符号化処理が行われる。
 送信部により、画像符号化部で生成されたビデオストリームを含む所定フォーマットのコンテナが送信される。例えば、コンテナは、デジタル放送規格で採用されているトランスポートストリーム(MPEG-2 TS)であってもよい。また、例えば、コンテナは、インターネットの配信などで用いられるMP4、あるいはそれ以外のフォーマットのコンテナであってもよい。
 画像符号化部では、基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入される。例えば、符号化画像データは、NALユニット構造を有し、画像符号化部は、識別情報をNALユニットのヘッダに挿入する、ようにされてもよい。この場合、例えば、画像符号化部は、識別情報を、NALユニットのヘッダの「nuh_layer_id」のフィールドを用いて挿入する、ようにされてもよい。また、この場合、例えば、画像符号化部は、識別情報を、NALユニットのヘッダの「nuh_layer_id」および「nuh_temporal_id_plus1」のフィールドを用いて挿入する、ようにされてもよい。
 このように本技術においては、基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されるものである。そのため、受信側では、識別情報に基づいて、所定の符号化画像データに選択的に復号化処理を行って表示能力に応じた画像データを得ることが容易に可能となる。
 なお、本技術において、例えば、コンテナのレイヤに、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報を挿入する情報挿入部をさらに備える、ようにされてもよい。この場合、例えば、コンテナは、MPEG2-TSであり、情報挿入部は、情報を、プログラムマップテーブルの配下に存在するビデオストリームに対応したビデオエレメンタリストリームループ内に挿入する、ようにされてもよい。この場合、受信側では、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを、コンテナのレイヤで、予め把握することが可能となる。
 また、本技術の他の概念は、
 基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
 上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されており、
 上記受信されたコンテナが有する上記ビデオストリームを、上記識別情報と表示能力情報に基づいて処理する処理部をさらに備える
 受信装置にある。
 本技術において、受信部により、基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを有する所定フォーマットのコンテナを受が受信される。
 基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されている。例えば、符号化画像データは、NALユニット構造を有し、識別情報は、NALユニットのヘッダに挿入されている、ようにされてもよい。処理部により、受信されたコンテナが有するビデオストリームが、識別情報と表示能力情報に基づいて処理される。
 このように本技術においては、基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに挿入されている、対応するフォーマットを識別するための識別情報と、表示能力情報に基づいて、受信されたコンテナが有するビデオストリームが処理されるものである。そのため、所定の符号化画像データに選択的に復号化処理を行って表示能力に応じた画像データを得ることが容易に可能となる。
 なお、本技術において、例えば、コンテナのレイヤに、符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報が挿入されており、処理部は、コンテナのレイヤに挿入されている情報に基づいて、符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを把握する、ようにされてもよい。
 本技術によれば、基本フォーマット画像データと共に所定数の高品質フォーマット画像データを良好に送信できる。なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
実施の形態としての送受信システムの構成例を示すブロック図である。 送信装置の構成例を示すブロック図である。 基本フォーマット画像データVbと、3つの高品質フォーマット画像データVh1,Vh2,Vh3を生成する画像データ生成部の構成例を示すブロック図である。 エンコード部の主要部の構成例を示すブロック図である。 NALユニットヘッダの構造例と、その構造例における主要なパラメータの内容を示す図である。 符号化画像データCb,Ch1,Ch2,Ch3の構成例を示す図である。 スケーラブル・エクステンション・デスクリプタの構造例を示す図である。 スケーラブル・エクステンション・デスクリプタの構造例における主要な情報の内容を示す図である。 NALユニットヘッダの「nuh_layer_id」の値と、スケーラブル・エクステンション・デスクリプタの記述との対応関係を示す図である。 トランスポートストリームTSの構成例(2ストリームの場合)を示す図である。 トランスポートストリームTSの構成例(1ストリームの場合)を示す図である。 受信装置の構成例を示すブロック図である。 デコード部の主要部の構成例を示すブロック図である。 2ストリーム構成の場合における圧縮データバッファ(cpb)の出力と、「nuh_layer_id」による符号化画像データCb,Ch1,Ch2,Ch3の対応するデコード部への振り分けを概略的に示す図である。 1ストリーム構成の場合における圧縮データバッファ(cpb)の出力と、「nuh_layer_id」による符号化画像データCb,Ch1,Ch2,Ch3の対応するデコード部への振り分けを概略的に示す図である。 表示能力情報(表示性能情報)からデコード範囲を判断する処理の一例を示すフローチャートである。 符号化画像データCb,Ch1,Ch2,Ch3の構成例を示す図である。 NALユニットヘッダの「nuh_layer_id」、「nuh_temporal_id_plus1」の値と、スケーラブル・エクステンション・デスクリプタの記述との対応関係を示す図である。 表示能力情報(表示性能情報)からデコード範囲を判断する処理の他の一例を示すフローチャートである。
 以下、発明を実施するための形態(以下、「実施の形態」とする)について説明する。なお、説明は以下の順序で行う。
 1.実施の形態
 2.変形例
 <1.実施の形態>
 [送受信システム]
 図1は、実施の形態としての送受信システム10の構成例を示している。この送受信システム10は、送信装置100と、受信装置200とを有している。送信装置100から受信装置200にコンテナとしてのトランスポートストリームTSが放送波あるいはネットのパケットに載せて送信される。この実施の形態においては、(1)トランスポートストリームTSが基本ビデオストリームおよび拡張ビデオストリームの2本のビデオストリームを有する2ストリーム構成の場合と、(2)トランスポートストリームTSが1本のビデオストリームを有する1ストリーム構成の場合の2通りがある。
 「2ストリーム構成の場合」
 送信装置100は、コンテナとしてのトランスポートストリームTSを放送波あるいはネットのパケットに載せて送信する。このトランスポートストリームTSには、基本ビデオストリームと拡張ビデオストリームの2本のビデオストリームが含まれる。基本ビデオストリームは、基本フォーマット画像データの符号化画像データを含むものである。基本ビデオストリームは、例えば、基本フォーマット画像データにH.264/AVC、H.265/HEVCなどの予測符号化処理が施されて生成されたものである。
 拡張ビデオストリームは、所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むものである。この拡張ビデオストリームは、所定数の高品質画像データに、それぞれ、例えば、H.264/AVC、H.265/HEVCなどの予測符号化処理が施されて生成されたものである。
 基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入される。受信側では、この識別情報に基づいて、所定の符号化画像データに選択的に復号化処理を行って表示能力に応じた画像データを得ることが容易に可能となる。この実施の形態において、識別情報は、NALユニットのヘッダに挿入される。
 コンテナのレイヤに、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報が挿入される。受信側では、この情報により、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを、コンテナのレイヤで、予め把握することが可能となる。この実施の形態において、情報は、プログラムマップテーブルの配下に存在する拡張ビデオストリームに対応した各ビデオエレメンタリストリームループ内に挿入される。
 受信装置200は、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSを受信する。このトランスポートストリームTSは、上述したように、基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと、所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームを有している。
 所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、上述したように、対応するフォーマットを識別するための識別情報が挿入されている。受信装置200は、この識別情報と表示能力情報に基づいて、トランスポートストリームTSに含まれている各ビデオストリームを処理し、表示能力に応じた画像データを取得する。
 「1ストリーム構成の場合」
 送信装置100は、コンテナとしてのトランスポートストリームTSを放送波あるいはネットのパケットに載せて送信する。このトランスポートストリームTSには、1本のビデオストリームが含まれる。このビデオストリームは、基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むものである。このビデオストリームは、基本フォーマット画像データおよび所定数の高品質フォーマット画像データに、それぞれ、例えば、H.264/AVC、H.265/HEVCなどの予測符号化処理が施されて生成されたものである。
 基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、基本フォーマットあるいは対応する高品質フォーマットを識別するための識別情報が挿入される。受信側では、この識別情報に基づいて、所定の符号化画像データに選択的に復号化処理を行って表示能力に応じた画像データを得ることが容易に可能となる。この実施の形態において、識別情報は、NALユニットのヘッダに挿入される。
 コンテナのレイヤに、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報が挿入される。受信側では、この情報により、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを、コンテナのレイヤで、予め把握することが可能となる。この実施の形態において、情報は、プログラムマップテーブルの配下に存在するビデオストリームに対応した各ビデオエレメンタリストリームループ内に挿入される。
 受信装置200は、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSを受信する。このトランスポートストリームTSは、上述したように、基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを有している。
 基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、上述したように、対応するフォーマットを識別するための識別情報が挿入されている。受信装置200は、この識別情報と表示能力情報に基づいて、トランスポートストリームTSに含まれているビデオストリームを処理し、表示能力に応じた画像データを取得する。
 「送信装置の構成」
 図2は、送信装置100の構成例を示している。この送信装置100は、送信画像データとして、基本フォーマット画像データVbと、3つの高品質フォーマット画像データVh1,Vh2,Vh3を取り扱う。ここで、基本フォーマット画像データVbは、フレーム周波数が50HzであるLDR(Low Dynamic Lange)画像データである。高品質フォーマット画像データVh1は、フレーム周波数が100HzであるLDR画像データである。LDR画像データは、従来のLDR画像の白ピークの明るさに対して0%から100%の輝度範囲を持つ。
 高品質フォーマット画像データVh2は、フレーム周波数が50HzであるHDR(High Dynamic Range)画像データである。高品質フォーマット画像データVh3は、フレーム周波数が100HzであるHDR画像データである。このHDR画像データは、従来のLDR画像の白ピークの明るさを100%とすると、0~100%*N、例えば0~1000%あるいはそれ以上の範囲の輝度をもつ。
 図3は、基本フォーマット画像データVbと、3つの高品質フォーマット画像データVh1,Vh2,Vh3を生成する画像データ生成部150の構成例を示している。この画像データ生成部150は、HDRカメラ151と、フレームレート変換部152と、ダイナミックレンジ変換部153と、フレームレート変換部154を有している。
 HDRカメラ151は、被写体を撮像し、フレーム周波数が100HzであるHDR画像データ、つまり高品質フォーマット画像データVh3を出力する。フレームレート変換部152は、HDRカメラ151から出力される高品質フォーマット画像データVh3に対して、フレーム周波数を100Hzから50Hzに変換する処理をおこなって、フレーム周波数が50HzであるHDR画像データ、つまり高品質フォーマット画像データVh2を出力する。
 ダイナミックレンジ変換部153は、HDRカメラ151から出力される高品質フォーマット画像データVh3に対して、HDRからLDRに変換する処理をおこなって、フレーム周波数が100HzであるLDR画像データ、つまり高品質フォーマット画像データVh1を出力する。フレームレート変換部154は、ダイナミックレンジ変換部153から出力される高品質フォーマット画像データVh1に対して、フレーム周波数を100Hzから50Hzに変換する処理をおこなって、フレーム周波数が50HzであるLDR画像データ、つまり基本フォーマット画像データVbを出力する。
 図2に戻って、送信装置100は、制御部101と、LDR光電変換部102,103と、HDR光電変換部104,105と、ビデオエンコーダ106と、システムエンコーダ107と、送信部108を有している。制御部101は、CPU(Central Processing Unit)を備えて構成され、制御プログラムに基づいて、送信装置100の各部の動作を制御する。
 LDR光電変換部102は、基本フォーマット画像データVbに対して、LDR画像用の光電変換特性(LDR OETFカーブ)を適用して、伝送用の基本フォーマット画像データVb´を得る。LDR光電変換部103は、高品質フォーマット画像データVh1に対して、LDR画像用の光電変換特性を適用して、伝送用の高品質フォーマット画像データVh1´を得る。
 HDR光電変換部104は、高品質フォーマット画像データVh2に対して、HDR画像用の光電変換特性(HDR OETFカーブ)を適用して、伝送用の高品質フォーマット画像データVh2´を得る。HDR光電変換部105は、高品質フォーマット画像データVh3に対して、HDR画像用の光電変換特性を適用して、伝送用の高品質フォーマット画像データVh3´を得る。
 ビデオエンコーダ106は、4つのエンコード部106-0,106-1,106-2,106-3を有する。エンコード部106-0は、伝送用の基本フォーマット画像データVb´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理を行って、符号化画像データCbを得る。この場合、エンコード部106-0は、画像データVb´内の予測を行う。
 エンコード部106-1は、伝送用の高品質フォーマット画像データVh1´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理を行って、符号化画像データCh1を得る。この場合、エンコード部106-1は、予測残差を小さくするために、符号化ブロック毎に、画像データVh1´内の予測、または画像データVb´との間の予測を、選択的に行う。
 エンコード部106-2は、伝送用の高品質フォーマット画像データVh2´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理を行って、符号化画像データCh2を得る。この場合、エンコード部106-2は、予測残差を小さくするために、符号化ブロック毎に、画像データVh2´内の予測、または画像データVb´との間の予測を、選択的に行う。
 エンコード部106-3は、伝送用の高品質フォーマット画像データVh3´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理を行って、符号化画像データCh3を得る。この場合、エンコード部106-3は、予測残差を小さくするために、符号化ブロック毎に、画像データVh3´内の予測、または画像データVh2´との間の予測を、選択的に行う。
 図4は、エンコード部160の主要部の構成例を示している。このエンコード部160は、エンコード部106-1,106-2,106-3に適用し得るものである。このエンコード部160は、レイヤ内予測部161と、レイヤ間予測部162と、予測調整部163と、選択部164と、エンコード機能部165を有している。
 レイヤ内予測部161は、符号化対象の画像データV1に対して、この画像データV1内での予測(レイヤ内予測)を行って予測残差データを得る。レイヤ間予測部162は、符号化対象の画像データV1に対して、参照対象の画像データV2との間での予測(レイヤ間予測)を行って予測残差データを得る。
 予測調整部163は、レイヤ間予測部162におけるレイヤ間予測を効率よく行うために、画像データV1の、画像データV2に対するスケーラブル拡張のタイプに応じて、以下の処理を行う。ダイナミックレンジ拡張の場合は、LDRからHDRに変換するためのレベル調整を行う。空間スケーラブル拡張の場合は、他のレイヤのブロックを所定のサイズにスケーリング処理を施したものを対象とする。フレームレート拡張の場合は、バイパスする。色域拡張の場合は、輝度・色差のそれぞれに対してマッピングを行う。ビット長拡張の場合は、画素のMSBを揃える変換を行う。
 例えば、エンコード部106-1の場合、画像データV1は高品質フォーマット画像データVh1´(100Hz、LDR)であり、画像データV2は基本フォーマット画像データVb´(50Hz、LDR)であり、スケーラブル拡張のタイプはフレームレート拡張に当たる。そのため、予測調整部163では、画像データVb´がそのままバイパスされる。
 また、例えば、エンコード部106-2の場合、画像データV1は高品質フォーマット画像データVh2´(50Hz、HDR)であり、画像データV2は基本フォーマット画像データVb´(50Hz、LDR)であり、スケーラブル拡張のタイプはダイナミックレンジ拡張に当たる。そのため、予測調整部163では、画像データVb´に対してLDRからHDRに変換するためのレベル調整が行われる。なお、レベル調整は、ダイナミックレンジ変換部153から供給される情報を元に行われてもよい。
 また、例えば、エンコード部106-3の場合、画像データV1は高品質フォーマット画像データVh3´(100Hz、HDR)であり、画像データV2は高品質フォーマット画像データVh2´(50Hz、HDR)であり、スケーラブル拡張のタイプはフレームレート拡張に当たる。そのため、予測調整部163では、画像データVb´がそのままバイパスされる。
 選択部164は、符号化ブロック毎に、レイヤ内予測部161で得られる予測残差データ、またはレイヤ間予測部162で得られる予測残差データを選択的に取り出し、エンコード機能部165に送る。この場合、選択部164では、例えば、予測残差の小さい方が取り出される。エンコード機能部165は、選択部164から取り出された予測残差データに対して、変換符号化、量子化、エントロピー符号化などのエンコード処理を行って、符号化画像データCVを得る。
 図2に戻って、ビデオエンコーダ106は、符号化画像データCb,Ch1,Ch2,Ch3のそれぞれに、対応するフォーマットを識別するための識別情報を挿入する。ビデオエンコーダ106は、この識別情報を、例えば、NALユニットのヘッダに挿入する。
 図5(a)は、NALユニットヘッダの構造例(Syntax)を示し、図5(b)は、その構造例における主要なパラメータの内容(Semantics)を示している。「forbidden_zero_bit」の1ビットフィールドは、0が必須である。「nal_unit_type」の6ビットフィールドは、NALユニットタイプを示す。「nuh_layer_id」の6ビットフィールドは、ストリームのレイヤ拡張種別を示すIDである。「nuh_temporal_id_plus1」の3ビットフィールドは、temporal_id(0~6)を示し、1を加えた値(1~7)を取る。
 この実施の形態において、「nuh_layer_id」の6ビットフィールドは、当該NALユニット(符号化画像データ)が対応するフォーマットを識別するための識別情報を示す。例えば、“0”は、基本を示す。“1”は、空間拡張を示す。“2”は、フレームレート拡張を示す。“3”は、ビット長拡張を示す。“4”は、ダイナミックレンジ拡張を示す。“5”は、広色域拡張を示す。“6”は、フレームレート拡張とダイナミックレンジ拡張を示す。“7”は、空間拡張とフレームレート拡張を示す。
 符号化画像データCbは基本フォーマット画像データVbに対応し、この符号化画像データCbの「nuh_layer_id」は“0”とされる。また、符号化画像データCh1は、フレームレート拡張フォーマット画像データVh1に対応し、この符号化画像データCh1の「nuh_layer_id」は“2”とされる。また、符号化画像データCh2は、ダイナミックレンジ拡張フォーマット画像データVh2に対応し、この符号化画像データCh2の「nuh_layer_id」は“4”とされる。また、符号化画像データCh3は、フレームレート拡張とダイナミックレンジ拡張のフォーマット画像データVh3に対応し、この符号化画像データCh3「nuh_layer_id」は“6”とされる。
 図6は、符号化画像データCb,Ch1,Ch2,Ch3の構成例を示している。横軸は表示順(POC:picture order of composition)を示し、左側は表示時刻が前で、右側は表示時刻が後になる。矩形枠のそれぞれがピクチャを示し、矢印は、予測符号化処理におけるピクチャの参照関係の一例を示している。レイヤ間、レイヤ内の双方とも予測はブロックごとに対象ピクチャが変わり、また、予測の向き、参照数は図示の例に限定されるわけではない。
 符号化画像データCbは、「00」、「01」、・・・のピクチャの符号化画像データで構成される。符号化画像データCh1は、符号化画像データCbの各ピクチャの間に位置する「10」、「11」、・・・のピクチャの符号化画像データで構成される。符号化画像データCh2は、符号化画像データCbの各ピクチャと同じ位置の「20」、「21」、・・・のピクチャの符号化画像データで構成される。そして、符号化画像データCh3は、符号化画像データCh2の各ピクチャの間に位置する「30」、「31」、・・・のピクチャの符号化画像データで構成される。
 図2に戻って、システムエンコーダ107は、ビデオエンコーダ106で生成された符号化画像データCb,Ch1,Ch2,Ch3を用いて、ビデオストリームを生成し、PESパケット化およびTSパケット化を行って、トランスポートストリームTSを生成する。そして、送信部108は、このトランスポートストリームTSを、放送波あるいはネットのパケットに載せて、受信装置200に送信する。
 ここで、2ストリーム構成の場合、システムエンコーダ107は、符号化画像データCbを含む基本ビデオストリームと符号化画像データCh1,Ch2,Ch3を含む拡張ビデオストリームを生成する。つまり、この場合、トランスポートストリームTSは、符号化画像データCbを含む基本ビデオストリームと符号化画像データCh1,Ch2,Ch3を含む拡張ビデオストリームの2本のビデオストリームを有するものとなる。
 また、1ストリーム構成の場合、システムエンコーダ107は、符号化画像データCb,Ch1,Ch2,Ch3を含むビデオストリームを生成する。つまり、この場合、トランスポートストリームTSは、符号化画像データCb,Ch1,Ch2,Ch3を含む1本のビデオストリームを有するものとなる。
 システムエンコーダ107は、コンテナ(トランスポートストリーム)のレイヤに、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報を挿入する。
 この実施の形態において、2ストリーム構成の場合、PMT(Program Map Table)の配下に存在する拡張ビデオストリーム(符号化データCh1,Ch2,Ch3を含む)に対応したビデオエレメンタリストリームループ中に、スケーラブル・エクステンション・デスクリプタ(Scalable extension descriptor)を挿入する。この場合、符号化画像データCh1,Ch2,Ch3に挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する。
 また、この実施の形態において、1ストリーム構成の場合、PMT(Program Map Table)の配下に存在するビデオストリーム(符号化画像データCb,Ch1,Ch2,Ch3を含む)に対応したビデオエレメンタリストリームループ中に、スケーラブル・エクステンション・デスクリプタ(Scalable extension descriptor)を挿入する。この場合、符号化画像データCb,Ch1,Ch2,Ch3に挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する。
 図7は、このスケーラブル・エクステンション・デスクリプタの構造例(Syntax)を示している。図8は、図7に示す構造例における主要な情報の内容(Semantics)を示している。「descriptor_tag」の8ビットフィールドは、デスクリプタタイプを示し、ここでは、スケーラブル・エクステンション・デスクリプタであることを示す。「descriptor_length」の8ビットフィールドは、デスクリプタの長さ(サイズ)を示し、デスクリプタの長さとして以降のバイト数を示す。
 「Extended_spatial_resolution_flag」のフラグは、空間解像度の拡張成分を含むかを示す。“1”は空間解像度拡張成分を含むことを示し、“0”は空間解像度拡張成分を含まないことを示す。「Extended_frame_rate_flag」のフラグは、フレームレート拡張成分を含むかを示す。“1”はフレームレート拡張成分を含むことを示し、“0”はフレームレート拡張成分を含まないことを示す。
 「Extended_bit_depth_flag」のフラグは、ビット長拡張成分を含むかを示す。“1”はビット長拡張成分を含むことを示し、“0”はビット長拡張成分を含まないことを示す。「Extended_dynamic_range_flag」のフラグは、ダイナミックレンジ拡張成分を含むかを示す。“1”はダイナミックレンジ拡張成分を含むことを示し、“0”はダイナミックレンジ拡張成分を含まないことを示す。「Extended_color_gamut_flag」のフラグは、色域拡張成分を含むかを示す。“1”は色域拡張成分を含むことを示し、“0”は色域拡張成分を含まないことを示す。
 「number_of_layerIDs」の8ビットフィールドは、ストリームが含むレイヤ数を示す。レイヤ数分だけ「layerID」の6ビットフィールドが存在する。この「layerID」のフィールドは、レイヤID(Layer_id)を示す。
 ここで、2ストリーム構成の場合であって、拡張ビデオストリームに符号化画像データCh1,Ch2,Ch3が含まれるとき、「Extended_spatial_resolution_flag」、「Extended_bit_depth_flag」および「Extended_color_gamut_flag」は“0”に設定され、「Extended_frame_rate_flag」および「Extended_dynamic_range_flag」は“1”に設定される。また、「number_of_layerIDs」は“3”に設定され、「layerID」として、順に、“2”、“4”、“6”が設定される。
 このような設定により、「layerID」=“2”はフレームレート拡張を示し、従ってNALユニットのヘッダの「nuh_layer_id」=“2”はフレームレート拡張の符号化画像データを示すものと定義される。また、「layerID」=“4”はダイナミックレンジ拡張を示し、従ってNALユニットのヘッダの「nuh_layer_id」=“4”はダイナミックレンジ拡張の符号化画像データを示すものと定義される。さらに、「layerID」=“6”はフレームレート拡張およびダイナミックレンジ拡張を示し、従ってNALユニットのヘッダの「nuh_layer_id」=“6”はフレームレート拡張およびダイナミックレンジ拡張の符号化画像データを示すものと定義される。
 また、1ストリーム構成の場合であって、ビデオストリームに符号化データCb,Ch1,Ch2,Ch3が含まれるとき、「Extended_spatial_resolution_flag」、「Extended_bit_depth_flag」および「Extended_color_gamut_flag」は“0”に設定され、「Extended_frame_rate_flag」および「Extended_dynamic_range_flag」は“1”に設定される。また、「number_of_layerIDs」は“4”に設定され、「layerID」として、順に、“0”、“2”、“4”、“6”が設定される。
 このような設定により、「layerID」=“0”は基本を示し、従ってNALユニットのヘッダの「nuh_layer_id」=“0”は基本フォーマットの符号化画像データを示すものと定義される。また、「layerID」=“2”はフレームレート拡張を示し、従ってNALユニットのヘッダの「nuh_layer_id」=“2”はフレームレート拡張の符号化画像データを示すものと定義される。また、「layerID」=“4”はダイナミックレンジ拡張を示し、従ってNALユニットのヘッダの「nuh_layer_id」=“4”はダイナミックレンジ拡張の符号化画像データを示すものと定義される。さらに、「layerID」=“6”はフレームレート拡張およびダイナミックレンジ拡張を示し、従ってNALユニットのヘッダの「nuh_layer_id」=“6”はフレームレート拡張およびダイナミックレンジ拡張の符号化画像データを示すものと定義される。
 図9は、NALユニットヘッダの「nuh_layer_id」の値と、スケーラブル・エクステンション・デスクリプタの記述との対応関係を示している。すなわち、ストリームに、「nuh_layer_id」=“0”である基本フォーマットの符号化画像データ(基本成分)が含まれる場合、「layerID」として、“0”が設定される。
 また、ストリームに、「nuh_layer_id」=“1”である空間拡張の符号化画像データ(空間拡張成分)が含まれる場合、「Extended_spatial_resolution_flag」は“1”とされ、「layerID」として、“1”が設定される。また、ストリームに、「nuh_layer_id」=“2”であるフレームレート拡張の符号化画像データ(フレームレート拡張成分)が含まれる場合、「Extended_frame_rate_flag」は“1”とされ、「layerID」として、“2”が設定される。また、ストリームに、「nuh_layer_id」=“3”であるフレームレート拡張の符号化画像データ(ビット長拡張成分)が含まれる場合、「Extended_bit_depth_flag」は“1”とされ、「layerID」として、“3”が設定される。
 また、ストリームに、「nuh_layer_id」=“4”であるダイナミックレンジ拡張の符号化画像データ(ダイナミックレンジ拡張成分)が含まれる場合、「Extended_dynamic_range_flag」は“1”とされ、「layerID」として、“4”が設定される。また、ストリームに、「nuh_layer_id」=“5”である色域拡張の符号化画像データ(色域拡張成分)が含まれる場合、「Extended_color_gamut_flag」は“1”とされ、「layerID」として、“5”が設定される。
 また、ストリームに、「nuh_layer_id」=“6”であるフレームレート拡張とダイナミックレンジ拡張の符号化画像データ(フレームレート拡張成分とダイナミックレンジ拡張成分)が含まれる場合、「Extended_frame_rate_flag」および「Extended_dynamic_range_flag」は“1”とされ、「layerID」として、“6”が設定される。また、ストリームに、「nuh_layer_id」=“7”である空間拡張とフレームレート拡張の符号化画像データ(空間拡張成分とフレームレート拡張成分)が含まれる場合、「Extended_spatial_resolution_flag」および「Extended_frame_rate_flag」は“1”とされ、「layerID」として、“7”が設定される。
 [トランスポートストリームTSの構成]
 図10は、2ストリーム構成の場合におけるトランスポートストリームTSの構成例を示している。このトランスポートストリームTSには、基本ビデオストリームSTbと拡張ビデオストリームSTeの2本のビデオストリームが含まれている。この構成例では、各ビデオストリームのPESパケット「video PES」が存在する。
 基本ビデオストリームSTbのパケット識別子(PID)は例えばPID1とされている。この基本ビデオストリームSTbには、基本フォーマットの各ピクチャの符号化画像データが含まれている。この基本フォーマットの各ピクチャの符号化画像データには、AUD、VPS、SPS、PPS、PSEI、SLICE、SSEI、EOSなどのNALユニットが存在する。これらのNALユニットのヘッダにおける「nuh_layer_id」は、例えば、“0”とされ、基本フォーマットに係る符号化画像データであることが示される。
 また、拡張ビデオストリームSTeのパケット識別子(PID)は例えばPID2とされている。この拡張ビデオストリームSTeには、フレームレート拡張、ダイナミックレンジ拡張、さらにはフレームレート拡張およびダイナミックレンジ拡張の3つの高品質フォーマットの各ピクチャの符号化画像データが含まれている。この高品質フォーマットの各ピクチャの符号化画像データには、AUD、SPS、PPS、PSEI、SLICE、SSEI、EOSなどのNALユニットが存在する。
 なお、基本フォーマットの各ピクチャの符号化画像データにおけるSPSと、高品質フォーマットの各ピクチャの符号化画像データにおけるSPSとは、「nal_unit_type」の値は同じで、中にエクステンションを含むかどうかで異なる。すなわち、高品質フォーマットの各ピクチャの符号化画像データにおけるSPSは、SPSエクステンションを含む。なお、基本フォーマットのSPSと高品質フォーマットのSPSとを別の「nal_unit_type」の値とすることも可能である。
 フレームレート拡張の各ピクチャの符号化画像データを構成するNALユニットのヘッダにおける「nuh_layer_id」は、“2”とされ、フレームレート拡張に係る符号化画像データであることが示される。また、ダイナミックレンジ拡張の各ピクチャの符号化画像データを構成するNALユニットのヘッダにおける「nuh_layer_id」は、“4”とされ、ダイナミックレンジ拡張に係る符号化画像データであることが示される。また、フレームレート拡張およびダイナミックレンジ拡張の各ピクチャの符号化画像データを構成するNALユニットのヘッダにおける「nuh_layer_id」は、“6”とされ、フレームレート拡張およびダイナミックレンジ拡張に係る符号化画像データであることが示される。
 また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。このPSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。
 PMTには、プログラム全体に関連する情報を記述するプログラム・ループ(Program loop)が存在する。また、PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリストリームループが存在する。この構成例では、基本ビデオストリームSTbと拡張ビデオストリームSTeの2本のビデオストリームに対応して2つのビデオエレメンタリストリームループ(video ES loop)が存在する。基本ビデオストリームSTbに対応したビデオエレメンタリストリームループには、ストリームタイプ(ST0)、パケット識別子(PID1)等の情報が配置される。
 また、拡張ビデオストリームSTeに対応したビデオエレメンタリストリームループには、ストリームタイプ(ST1)、パケット識別子(PID2)等の情報が配置されると共に、この拡張ビデオストリームSTeに関連する情報を記述するデスクリプタも配置される。このデスクリプタの一つとして、上述したスケーラブル・エクステンション・デスクリプタ(Scalable extension descriptor)(図7参照)が挿入される。
 このデスクリプタにおいて、「Extended_frame_rate_flag」および「Extended_dynamic_range_flag」は“1”に設定され、「number_of_layerIDs」は“3”に設定され、「layerID」として、順に、“2”、“4”、“6”が設定される。これにより、NALユニットのヘッダの「nuh_layer_id」=“2”はフレームレート拡張の符号化画像データを示すものと定義される。また、NALユニットのヘッダの「nuh_layer_id」=“4”はダイナミックレンジ拡張の符号化画像データを示すものと定義される。さらに、NALユニットのヘッダの「nuh_layer_id」=“6”はフレームレート拡張およびダイナミックレンジ拡張の符号化画像データを示すものと定義される。
 図11は、1ストリーム構成の場合におけるトランスポートストリームTSの構成例を示している。このトランスポートストリームTSには、1本のビデオストリームSTが含まれている。この構成例では、このビデオストリームSTのPESパケット「video PES」が存在する。
 このビデオストリームSTのパケット識別子(PID)は例えばPID1とされている。このビデオストリームSTには、基本フォーマットの各ピクチャの符号化画像データが含まれていると共に、フレームレート拡張、ダイナミックレンジ拡張、さらにはフレームレート拡張およびダイナミックレンジ拡張の3つの高品質フォーマットの各ピクチャの符号化画像データが含まれている。
 基本フォーマットの各ピクチャの符号化画像データには、AUD、VPS、SPS、PPS、PSEI、SLICE、SSEI、EOSなどのNALユニットが存在する。これらのNALユニットのヘッダにおける「nuh_layer_id」は、例えば、“0”とされ、基本フォーマットに係る符号化画像データであることが示される。
 また、高品質フォーマットの各ピクチャの符号化画像データには、AUD、SPS、PPS、PSEI、SLICE、SSEI、EOSなどのNALユニットが存在する。なお、基本フォーマットの各ピクチャの符号化画像データにおけるSPSと、高品質フォーマットの各ピクチャの符号化画像データにおけるSPSとは、「nal_unit_type」の値は同じで、中にエクステンションを含むかどうかで異なる。すなわち、高品質フォーマットの各ピクチャの符号化画像データにおけるSPSは、SPSエクステンションを含む。
 フレームレート拡張の各ピクチャの符号化画像データを構成するNALユニットのヘッダにおける「nuh_layer_id」は、“2”とされ、フレームレート拡張に係る符号化画像データであることが示される。また、ダイナミックレンジ拡張の各ピクチャの符号化画像データを構成するNALユニットのヘッダにおける「nuh_layer_id」は、“4”とされ、ダイナミックレンジ拡張に係る符号化画像データであることが示される。また、フレームレート拡張およびダイナミックレンジ拡張の各ピクチャの符号化画像データを構成するNALユニットのヘッダにおける「nuh_layer_id」は、“6”とされ、フレームレート拡張およびダイナミックレンジ拡張に係る符号化画像データであることが示される。
 また、トランスポートストリームTSには、PSI(Program Specific Information)として、PMT(Program Map Table)が含まれている。このPSIは、トランスポートストリームに含まれる各エレメンタリストリームがどのプログラムに属しているかを記した情報である。
 PMTには、プログラム全体に関連する情報を記述するプログラム・ループ(Program loop)が存在する。また、PMTには、各エレメンタリストリームに関連した情報を持つエレメンタリストリームループが存在する。この構成例では、1本のビデオストリームSTに対応して1つのビデオエレメンタリストリームループ(video ES loop)が存在する。
 このビデオエレメンタリストリームループには、ストリームタイプ(ST0)、パケット識別子(PID1)等の情報が配置されると共に、このビデオストリームSTに関連する情報を記述するデスクリプタも配置される。このデスクリプタの一つとして、上述したスケーラブル・エクステンション・デスクリプタ(Scalable extension descriptor)(図7参照)が挿入される。
 このデスクリプタにおいて、「Extended_frame_rate_flag」および「Extended_dynamic_range_flag」は“1”に設定され、「number_of_layerIDs」は“4”に設定され、「layerID」として、順に、“0”、“2”、“4”、“6”が設定される。これにより、NALユニットのヘッダの「nuh_layer_id」=“0”は基本フォーマットの符号化画像データを示すものと定義される。NALユニットのヘッダの「nuh_layer_id」=“2”はフレームレート拡張の符号化画像データを示すものと定義される。また、NALユニットのヘッダの「nuh_layer_id」=“4”はダイナミックレンジ拡張の符号化画像データを示すものと定義される。さらに、NALユニットのヘッダの「nuh_layer_id」=“6”はフレームレート拡張およびダイナミックレンジ拡張の符号化画像データを示すものと定義される。
 図2に示す送信装置100の動作を簡単に説明する。フレーム周波数が50HzのLDR画像データである基本フォーマット画像データVbは、LDR光電変換部102に供給される。このLDR光電変換部102では、基本フォーマット画像データVbに対して、LDR画像用の光電変換特性(LDR OETFカーブ)が適用されて、伝送用の基本フォーマット画像データVb´が得られる。この基本フォーマット画像データVb´は、ビデオエンコーダ106のエンコード部106-0,106-1,106-2に供給される。
 また、フレーム周波数が100HzのLDR画像データである高品質フォーマット画像データVh1は、LDR光電変換部103に供給される。このLDR光電変換部103では、高品質フォーマット画像データVh1に対して、LDR画像用の光電変換特性(LDR OETFカーブ)が適用されて、伝送用の高品質フォーマット画像データVh1´が得られる。この高品質フォーマット画像データVh1´は、ビデオエンコーダ106のエンコード部106-1に供給される。
 また、フレーム周波数が50HzのHDR画像データである高品質フォーマット画像データVh2は、HDR光電変換部104に供給される。このHDR光電変換部104では、高品質フォーマット画像データVh2に対して、HDR画像用の光電変換特性(HDR OETFカーブ)が適用されて、伝送用の高品質フォーマット画像データVh2´が得られる。この高品質フォーマット画像データVh2´は、ビデオエンコーダ106のエンコード部106-2,106-3に供給される。
 また、フレーム周波数が100HzのHDR画像データである高品質フォーマット画像データVh3は、HDR光電変換部105に供給される。このHDR光電変換部105では、高品質フォーマット画像データVh3に対して、HDR画像用の光電変換特性(HDR OETFカーブ)が適用されて、伝送用の高品質フォーマット画像データVh3´が得られる。この高品質フォーマット画像データVh3´は、ビデオエンコーダ106のエンコード部106-3に供給される。
 ビデオエンコーダ106では、基本フォーマット画像データVb´、高品質フォーマット画像データVh1´,Vh2´,Vh3´のそれぞれに対して符号化処理が施されて、符号化画像データCb,Ch1,Ch2,Ch3が生成される。すなわち、エンコード部106-0では、伝送用の基本フォーマット画像データVb´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理が行われて、符号化画像データCbが得られる。
 また、エンコード部106-1では、伝送用の高品質フォーマット画像データVh1´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理が行われて、符号化画像データCh1が得られる。また、エンコード部106-2では、伝送用の高品質フォーマット画像データVh2´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理が行われて、符号化画像データCh2が得られる。さらに、エンコード部106-3では、伝送用の高品質フォーマット画像データVh3´に対してH.264/AVC、H.265/HEVCなどの予測符号化処理が行われて、符号化画像データCh3が得られる。
 ビデオエンコーダ106では、符号化画像データCb,Ch1,Ch2,Ch3のそれぞれに、対応するフォーマットを識別するための識別情報が挿入される。すなわち、ビデオエンコーダ106では、NALユニットのヘッダの「nuh_layer_id」のフィールドに、当該NALユニット(符号化画像データ)が対応するフォーマットを識別するための識別情報が挿入される。
 ビデオエンコーダ106で得られる符号化画像データCb,Ch1,Ch2,Ch3は、システムエンコーダ107に供給される。システムエンコーダ107では、符号化画像データCb,Ch1,Ch2,Ch3を用いて、ビデオストリームが生成され、PESパケット化およびTSパケット化が行われて、トランスポートストリームTSが生成される。
 ここで、2ストリーム構成の場合、符号化画像データCbを含む基本ビデオストリームと符号化画像データCh1,Ch2,Ch3を含む拡張ビデオストリームの2本のビデオストリームが生成される。また、1ストリーム構成の場合、符号化画像データCb,Ch1,Ch2,Ch3を含む1本のビデオストリームが生成される。
 システムエンコーダ107では、コンテナ(トランスポートストリーム)のレイヤに、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報が挿入される。
 ここで、2ストリーム構成の場合、PMTの配下に存在する拡張ビデオストリーム(符号化画像データCh1,Ch2,Ch3を含む)に対応したビデオエレメンタリストリームループ中に、スケーラブル・エクステンション・デスクリプタが挿入される。また、1ストリーム構成の場合、PMTの配下に存在するビデオストリーム(符号化画像データCb,Ch1,Ch2,Ch3を含む)に対応したビデオエレメンタリストリームループ中に、スケーラブル・エクステンション・デスクリプタが挿入される。
 システムエンコーダ107で生成されるトランスポートストリームTSは、送信部108に送られる。送信部108では、このトランスポートストリームTSが、放送波あるいはネットのパケットに載せて、受信装置200に送信される。
 「受信装置の構成」
 図12は、受信装置200の構成例を示している。この受信装置200は、図2の送信装置100の構成例に対応したものである。この受信装置200は、制御部201と、受信部202と、システムデコーダ203と、圧縮データバッファ(cpb)204と、ビデオデコーダ205と、LDR電光変換部206,207と、HDR電光変換部208、209と、表示部(表示デバイス)210を有している。
 制御部201は、CPU(Central Processing Unit)を備えて構成され、制御プログラムに基づいて、受信装置200の各部の動作を制御する。受信部202は、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSを受信する。システムデコーダ203は、このトランスポートストリームTSからビデオストリームを抽出する。
 2ストリーム構成の場合(図10参照)、基本フォーマット画像データの符号化画像データCbを含む基本ビデオストリームと高品質フォーマット画像データの符号化画像データCh1,Ch2,Ch3を含む拡張ビデオストリームの2本のビデオストリームを抽出する。また、1ストリーム構成の場合(図11参照)、基本フォーマット画像データの符号化画像データCbおよび高品質フォーマット画像データの符号化画像データCh1,Ch2,Ch3を含む1本のビデオストリームを抽出する。
 また、システムデコーダ203は、コンテナ(トランスポートストリーム)のレイヤに挿入されている種々の情報を抽出し、制御部201に送る。この情報には、上述したスケーラブル・エクステンション・デスクリプタも含まれる。制御部201は、このデスクリプタに基づいて、符号化画像データに挿入されている識別情報(この実施の形態においては、NALユニットのヘッダの「nuh_layer_id」)がいかなるフォーマットの符号化画像データを示すかを、コンテナのレイヤで、予め把握することが可能となる。
 圧縮データバッファ204は、システムデコーダ203で抽出されるビデオストリームを、一時的に蓄積する。ビデオデコーダ205は、4つのデコード部205-0,205-1,205-2,205-3を有する。デコード部205-0は、圧縮データバッファ204から選択的に読み出される、基本フォーマットの符号化画像データ(基本成分)Cbに対して復号化処理を行って、基本フォーマット画像データVb´を生成する。この場合、デコード部205-0は、画像データVb´内で予測補償を行う。
 デコード部205-1は、圧縮データバッファ204から選択的に読み出される、フレームレート拡張の符号化画像データ(フレームレート拡張成分)Ch1に対して復号化処理を行って、高品質フォーマット画像データVh1´を生成する。この場合、デコード部205-1は、符号化時における予測に対応させて、符号化ブロック毎に、画像データVh1´内の予測補償、または画像データVb´との間の予測補償を、行う。
 デコード部205-2は、圧縮データバッファ204から選択的に読み出される、ダイナミックレンジ拡張の符号化画像データ(ダイナミックレンジ拡張成分)Ch2に対して復号化処理を行って、高品質フォーマット画像データVh2´を生成する。この場合、デコード部205-2は、符号化時における予測に対応させて、符号化ブロック毎に、画像データVh2´内の予測補償、または画像データVb´との間の予測補償を、行う。
 デコード部205-3は、圧縮データバッファ204から選択的に読み出される、フレームレート拡張とダイナミックレンジ拡張の符号化画像データ(フレームレート拡張成分とダイナミックレンジ拡張成分)Ch3に対して復号化処理を行って、高品質フォーマット画像データVh3´を生成する。この場合、デコード部205-3は、符号化時における予測に対応させて、符号化ブロック毎に、画像データVh3´内の予測補償、または画像データVh2´との間の予測補償を、行う。
 図13は、デコード部250の主要部の構成例を示している。このデコード部250は、デコード部205-1,205-2,205-3に適用し得るものである。このデコード部250は、図4のエンコード部165の処理とは逆の処理を行う。このデコード部250は、デコード機能部251と、レイヤ内予測補償部252と、レイヤ間予測補償部253と、予測調整部254と、選択部255と、を有している。
 デコード機能部251は、符号化画像データCVに対して、予測補償以外のデコード処理を行って予測残差データを得る。レイヤ内予測補償部252は、予測残差データに対して、画像データV1内での予測補償(レイヤ内予測補償)を行って、画像データV1を得る。レイヤ間予測補償部253は、予測残差データに対して、参照対象の画像データV2との間での予測補償(レイヤ間予測補償)を行って、画像データV1を得る。
 予測調整部254は、詳細説明は省略するが、図4のエンコード部160の予測調整部163と同様に、画像データV1の、画像データV2に対するスケーラブル拡張のタイプに応じた処理を行う。選択部255は、符号化時における予測に対応させて、符号化ブロック毎に、レイヤ内予測補償部252で得られる画像データV1、またはレイヤ間予測補償部253で得られる画像データV1を選択的に取り出して、出力とする。
 図12に戻って、LDR電光変換部206は、デコード部205-0で得られる基本フォーマット画像データVb´に、上述した送信装置100におけるLDR光電変換部102とは逆特性の電光変換を施し、基本フォーマット画像データVbを得る。この基本フォーマット画像データは、フレーム周波数が50HzのLDR画像データである。
 また、LDR電光変換部207は、デコード部205-1で得られる高品質フォーマット画像データVh1´に、上述した送信装置100におけるLDR光電変換部103とは逆特性の電光変換を施し、高品質フォーマット画像データVh1を得る。この高品質フォーマット画像データVh1は、フレーム周波数が100HzのLDR画像データである。
 また、HDR電光変換部208は、デコード部205-2で得られる高品質フォーマット画像データVh2´に、上述した送信装置100におけるHDR光電変換部104とは逆特性の電光変換を施し、高品質フォーマット画像データVh2を得る。この高品質フォーマット画像データVh2は、フレーム周波数が50HzのHDR画像データである。
 また、HDR電光変換部209は、デコード部205-3で得られる高品質フォーマット画像データVh3´に、上述した送信装置100におけるHDR光電変換部105とは逆特性の電光変換を施し、高品質フォーマット画像データVh3を得る。この高品質フォーマット画像データVh3は、フレーム周波数が100HzのHDR画像データである。
 表示部210は、例えば、LCD(Liquid Crystal Display)、有機EL(Organic Electro-Luminescence)パネル等で構成されている。表示部210は、表示能力に応じて、基本フォーマット画像データVb、高品質フォーマット画像データVh1,Vh2,Vh3のいずれかによる画像を表示する。
 この場合、制御部201は、表示部210に供給すべき画像データを制御する。この制御は、各符号化画像データに挿入されている基本フォーマット、高品質フォーマットの識別情報と、表示部209の表示能力情報に基づいて、行われる。
 すなわち、表示部210が高フレーム周波数の表示も高ダイナミックレンジの表示も不可能である場合には、表示部210に基本フォーマットの符号化画像データ(基本成分)Cbの復号化に係る基本フォーマット画像データVbが供給されるように制御する。この場合、制御部201は、圧縮データバッファ204から基本フォーマットの符号化画像データCbを選択的に取り出してデコード部205-0に送る。そして、制御部201は、デコード部205-0が符号化画像データCbを復号化し、LDR電光変換部206が基本フォーマット画像データVbを出力するように制御する。
 また、表示部210が高フレーム周波数の表示は可能だが高ダイナミックレンジの表示が不可能である場合には、表示部210にフレームレート拡張の符号化画像データ(フレームレート拡張成分)Ch1の復号化に係る高品質フォーマット画像データVh1が供給されるように制御する。
 この場合、制御部201は、圧縮データバッファ204から基本フォーマットの符号化画像データCbを選択的に取り出してデコード部205-0に送ると共に、圧縮データバッファ204からフレームレート拡張の符号化画像データCh1を選択的に取り出してデコード部205-1に送る。そして、制御部201は、デコード部205-0が符号化画像データCbを復号化し、デコード部205-1が符号化画像データCh1を復号化し、LDR電光変換部207が高品質フォーマット画像データVh1を出力するように制御する。
 また、表示部210が高フレーム周波数の表示は不可能だが高ダイナミックレンジの表示が可能である場合には、表示部210にダイナミックレンジ拡張の符号化画像データ(ダイナミックレンジ拡張成分)Ch2の復号化に係る高品質フォーマット画像データVh2が供給されるように制御する。
 この場合、制御部201は、圧縮データバッファ204から基本フォーマットの符号化画像データCbを選択的に取り出してデコード部205-0に送ると共に、圧縮データバッファ204からダイナミックレンジ拡張の符号化画像データCh2を選択的に取り出してデコード部205-2に送る。そして、制御部201は、デコード部205-0が符号化画像データCbを復号化し、デコード部205-2が符号化画像データCh2を復号化し、LDR電光変換部208が高品質フォーマット画像データVh2を出力するように制御する。
 また、表示部210が高フレーム周波数の表示も高ダイナミックレンジの表示も可能である場合には、表示部210にフレームレート拡張およびダイナミックレンジ拡張の符号化画像データ(フレームレート拡張成分およびダイナミックレンジ拡張成分)Ch3の復号化に係る高品質フォーマット画像データVh3が供給されるように制御する。
 この場合、制御部201は、圧縮データバッファ204から基本フォーマットの符号化画像データCbを選択的に取り出してデコード部205-0に送ると共に、圧縮データバッファ204からダイナミックレンジ拡張の符号化画像データCh2を選択的に取り出してデコード部205-1に送り、さらに、圧縮データバッファ204からフレームレート拡張とダイナミックレンジ拡張の符号化画像データCh3を選択的に取り出してデコード部205-3に送る。
 そして、制御部201は、デコード部205-0が符号化画像データCbを復号化し、デコード部205-2が符号化画像データCh2を復号化し、デコード部205-3が符号化画像データCh3を復号化し、HDR電光変換部209が高品質フォーマット画像データVh3を出力するように制御する。
 図14は、2ストリーム構成の場合における圧縮データバッファ(cpb)204の出力と、「nuh_layer_id」による符号化画像データCb,Ch1,Ch2,Ch3の対応するデコード部への振り分けを概略的に示している。
 2ストリーム構成の場合、図14(a)に示すように、圧縮データバッファ(cpb)204から、基本ビデオストリーム(PID1)に含まれていた基本フォーマットの符号化画像データCbおよび拡張ビデオストリーム(PID2)に含まれていた高品質フォーマットの符号化画像データCh1,Ch2,Ch3の各ピクチャの符号化画像デーが順次読み出されていく。
 ここで、「00」、「01」、・・・は、符号化画像データCbを構成する各ピクチャの符号化画像データを示しており、NALユニットのヘッダの「nuh_layer_id」は“0”に設定されている。制御部201は、この符号化画像データCbが基本ビデオストリームに含まれていたものであることから、「nuh_layer_id」=“0”は基本フォーマットの符号化画像データを示すものと把握する。
 また、「10」、「11」、・・・は、符号化画像データCh1を構成する各ピクチャの符号化画像データを示しており、NALユニットのヘッダの「nuh_layer_id」は“2”に設定されている。制御部201は、スケーラブル・エクステンション・デスクリプタによる定義から、「nuh_layer_id」=“2”はフレームレート拡張の符号化画像データを示すものと把握する。
 また、「20」、「21」、・・・は、符号化画像データCh2を構成する各ピクチャの符号化画像データを示しており、NALユニットのヘッダの「nuh_layer_id」は“4”に設定されている。制御部201は、スケーラブル・エクステンション・デスクリプタによる定義から、「nuh_layer_id」=“4”はダイナミックレンジ拡張の符号化画像データを示すものと把握する。
 さらに、「30」、「31」、・・・は、符号化画像データCh3を構成する各ピクチャの符号化画像データを示しており、NALユニットのヘッダの「nuh_layer_id」は“6”に設定されている。制御部201は、スケーラブル・エクステンション・デスクリプタによる定義から、「nuh_layer_id」=“6”はフレームレート拡張およびダイナミックレンジ拡張の符号化画像データを示すものと把握する。
 圧縮データバッファ204から読み出された各ピクチャの符号化画像データは、図14(b)に示すように、「nuh_layer_id」に基づいて、対応するデコード部に送られる。この場合、デコードに関係しないレイヤの符号化画像データは。読み捨てられる。図示の例は、全てをデコードする場合の例を示している。
 図15は、1ストリーム構成の場合における圧縮データバッファ(cpb)204の出力と、「nuh_layer_id」による符号化画像データCb,Ch1,Ch2,Ch3の対応するデコード部への振り分けを概略的に示している。
 1ストリーム構成の場合、図15(a)に示すように、圧縮データバッファ(cpb)204から、1本のビデオストリーム(PID1)に含まれていた基本フォーマットの符号化画像データCbおよび高品質フォーマットの符号化画像データCh1,Ch2,Ch3の各ピクチャの符号化画像デーが順次読み出されていく。
 ここで、「00」、「01」、・・・は、符号化画像データCbを構成する各ピクチャの符号化画像データを示しており、NALユニットのヘッダの「nuh_layer_id」は“0”に設定されている。制御部201は、スケーラブル・エクステンション・デスクリプタによる定義から、「nuh_layer_id」=“0”は基本フォーマットの符号化画像データを示すものと把握する。
 また、「10」、「11」、・・・は、符号化画像データCh1を構成する各ピクチャの符号化画像データを示しており、NALユニットのヘッダの「nuh_layer_id」は“2”に設定されている。制御部201は、スケーラブル・エクステンション・デスクリプタによる定義から、「nuh_layer_id」=“2”はフレームレート拡張の符号化画像データを示すものと把握する。
 また、「20」、「21」、・・・は、符号化画像データCh2を構成する各ピクチャの符号化画像データを示しており、NALユニットのヘッダの「nuh_layer_id」は“4”に設定されている。制御部201は、スケーラブル・エクステンション・デスクリプタによる定義から、「nuh_layer_id」=“4”はダイナミックレンジ拡張の符号化画像データを示すものと把握する。
 さらに、「30」、「31」、・・・は、符号化画像データCh3を構成する各ピクチャの符号化画像データを示しており、NALユニットのヘッダの「nuh_layer_id」は“6”に設定されている。制御部201は、スケーラブル・エクステンション・デスクリプタによる定義から、「nuh_layer_id」=“6”はフレームレート拡張およびダイナミックレンジ拡張の符号化画像データを示すものと把握する。
 圧縮データバッファ204から読み出された各ピクチャの符号化画像データは、図15(b)に示すように、「nuh_layer_id」に基づいて、対応するデコード部に送られる。この場合、デコードに関係しないレイヤの符号化画像データは。読み捨てられる。図示の例は、全てをデコードする場合の例を示している。
 図16のフローチャートは、制御部201が、表示能力情報(表示性能情報)から、デコード範囲を判断する処理の一例を示している。制御部201は、ステップST1において、処理を開始する。
 次に、制御部201は、ステップST2において、スケーラブル・エクステンション・デスクリプタを参照して、各フォーマットの「nuh_layer_id」を把握する。この実施の形態では、基本フォーマットでは「nuh_layer_id」=“0”であり、フレームレート拡張では「nuh_layer_id」=“2”であり、ダイナミックレンジレート拡張では「nuh_layer_id」=“4”であり、フレームレート拡張およびダイナミックレンジレート拡張では「nuh_layer_id」=“6”であることを把握する。
 次に、制御部201は、ステップST3において、100pHDRの表示、つまりフレーム周波数が100HzでHDRの表示が可能か否かを判断する。可能であるとき、制御部201は、ステップST4において、「nuh_layer_id」が“0”,“4”,“6”である符号化画像データ、つまり符号化画像データCb,Ch2,Ch3をデコード範囲とし、その後、ステップST11において、処理を終了する。
 ステップST3で可能でないとき、制御部201は、ステップST5において、50pHDRの表示、つまりフレーム周波数が50HzでHDRの表示が可能か否かを判断する。可能であるとき、制御部201は、ステップST6において、「nuh_layer_id」が“0”,“4”である符号化画像データ、つまり符号化画像データCb,Ch2をデコード範囲とし、その後、ステップST11において、処理を終了する。
 ステップST5で可能でないとき、制御部201は、ステップST7において、100pLDRの表示、つまりフレーム周波数が100HzでLDRの表示が可能か否かを判断する。可能であるとき、制御部201は、ステップST8において、「nuh_layer_id」が“0”,“2”である符号化画像データ、つまり符号化画像データCb,Ch1をデコード範囲とし、その後、ステップST11において、処理を終了する。
 ステップST7で可能でないとき、制御部201は、ステップST9において、50pLDRの表示、つまりフレーム周波数が50HzでLDRの表示が可能か否かを判断する。可能であるとき、制御部201は、ステップST10において、「nuh_layer_id」が“0”である符号化画像データ、つまり符号化画像データCbをデコード範囲とし、その後、ステップST11において、処理を終了する。なお、ステップST9で可能でないとき、制御部201は、ステップST11において、処理を終了する。
 図12に示す受信装置200の動作を簡単に説明する。受信部202では、送信装置100から放送波あるいはネットのパケットに載せて送られてくるトランスポートストリームTSが受信される。このトランスポートストリームTSは、システムデコーダ203に供給される。システムデコーダ203では、このトランスポートストリームTSからビデオストリームが抽出される。このビデオストリームは、圧縮データバッファ204に一時的に蓄積される。
 ここで、2ストリーム構成の場合(図10参照)、基本フォーマット画像データの符号化画像データCbを含む基本ビデオストリームと高品質フォーマット画像データの符号化画像データCh1,Ch2,Ch3を含む拡張ビデオストリームの2本のビデオストリームが抽出される。また、1ストリーム構成の場合((図11参照)、基本フォーマット画像データの符号化画像データCbおよび高品質フォーマット画像データの符号化画像データCh1,Ch2,Ch3を含む1本のビデオストリームが抽出される。
 また、システムデコーダ203では、コンテナ(トランスポートストリーム)のレイヤに挿入されている種々の情報が抽出され、制御部201に送られる。この情報には、スケーラブル・エクステンション・デスクリプタも含まれる。制御部201では、このデスクリプタに基づいて、符号化画像データに挿入されている識別情報(この実施の形態においては、NALユニットのヘッダの「nuh_layer_id」)がいかなるフォーマットの符号化画像データを示すかが把握される。
 表示部210が高フレーム周波数の表示も高ダイナミックレンジの表示も不可能である場合には、LDR電光変換部206から表示部210に基本フォーマット画像データVbが供給される。表示部210には、この基本フォーマット画像データVb、つまりフレーム周波数が50HzでLDR画像データによる50pLDR画像が表示される。
 この場合、圧縮データバッファ204からNALユニットのヘッダの「nuh_layer_id」が“0”である基本フォーマットの符号化画像データCbが選択的に取り出されてデコード部205-0に供給される。デコード部205-0では、符号化画像データCbに対して復号化処理が行われ、基本フォーマット画像データVb´が生成される。この基本フォーマット画像データVb´は、LDR電光変換部206に供給される。LDR電光変換部206では、この基本フォーマット画像データVb´に電光変換が施され、基本フォーマット画像データVbが得られて、表示部210に供給される。
 また、表示部210が高フレーム周波数の表示は可能だが高ダイナミックレンジの表示が不可能である場合には、LDR電光変換部207から表示部210に高品質フォーマット画像データVh1が供給される。表示部210には、この高品質フォーマット画像データVh1、つまりフレーム周波数が100HzでLDR画像データによる画像が表示される。
 この場合、圧縮データバッファ204からNALユニットのヘッダの「nuh_layer_id」が“0”である基本フォーマットの符号化画像データCbが選択的に取り出されてデコード部205-0に供給される。デコード部205-0では、符号化画像データCbに対して復号化処理が行われ、基本フォーマット画像データVb´が生成される。
 また、圧縮データバッファ204からNALユニットのヘッダの「nuh_layer_id」が“2”であるフレームレート拡張の符号化画像データCh1が選択的に取り出されてデコード部205-1に供給される。デコード部205-1では、符号化画像データCh1に対して、基本フォーマット画像データVb´が参照されて復号化処理が行われ、高品質フォーマット画像データVh1´が生成される。
 デコード部205-1で生成される高品質フォーマット画像データVh1´は、LDR電光変換部207に供給される。LDR電光変換部207では、この高品質フォーマット画像データVh1´に電光変換が施され、高品質フォーマット画像データVh1が得られて、表示部210に供給される。
 また、表示部210が高フレーム周波数の表示は不可能だが高ダイナミックレンジの表示が可能である場合には、HDR電光変換部208から表示部210に高品質フォーマット画像データVh2が供給される。表示部210には、この高品質フォーマット画像データVh2、つまりフレーム周波数が50HzでHDR画像データによる画像が表示される。
 この場合、圧縮データバッファ204からNALユニットのヘッダの「nuh_layer_id」が“0”である基本フォーマットの符号化画像データCbが選択的に取り出されてデコード部205-0に供給される。デコード部205-0では、符号化画像データCbに対して復号化処理が行われ、基本フォーマット画像データVb´が生成される。
 また、圧縮データバッファ204からNALユニットのヘッダの「nuh_layer_id」が“4”であるダイナミックレンジ拡張の符号化画像データCh2が選択的に取り出されてデコード部205-2に供給される。デコード部205-2では、符号化画像データCh2に対して、基本フォーマット画像データVb´が参照されて復号化処理が行われ、高品質フォーマット画像データVh2´が生成される。
 デコード部205-2で生成される高品質フォーマット画像データVh2´は、HDR電光変換部208に供給される。HDR電光変換部208では、この高品質フォーマット画像データVh2´に電光変換が施され、高品質フォーマット画像データVh2が得られて、表示部210に供給される。
 また、表示部210が高フレーム周波数の表示も高ダイナミックレンジの表示も可能である場合には、HDR電光変換部209から表示部210に高品質フォーマット画像データVh3が供給される。表示部210には、この高品質フォーマット画像データVh3、つまりフレーム周波数が100HzでHDR画像データによる画像が表示される。
 この場合、圧縮データバッファ204からNALユニットのヘッダの「nuh_layer_id」が“0”である基本フォーマットの符号化画像データCbが選択的に取り出されてデコード部205-0に供給される。デコード部205-0では、符号化画像データCbに対して復号化処理が行われ、基本フォーマット画像データVb´が生成される。
 また、圧縮データバッファ204からNALユニットのヘッダの「nuh_layer_id」が“4”であるダイナミックレンジ拡張の符号化画像データCh2が選択的に取り出されてデコード部205-2に供給される。デコード部205-2では、符号化画像データCh2に対して、基本フォーマット画像データVb´が参照されて復号化処理が行われ、高品質フォーマット画像データVh2´が生成される。
 また、圧縮データバッファ204からNALユニットのヘッダの「nuh_layer_id」が“6”であるフレームレート拡張およびダイナミックレンジ拡張の符号化画像データCh3が選択的に取り出されてデコード部205-3に供給される。デコード部205-3では、符号化画像データCh2に対して、高品質フォーマット画像データVh2´が参照されて復号化処理が行われ、高品質フォーマット画像データVh3´が生成される。
 デコード部205-3で生成される高品質フォーマット画像データVh3´は、HDR電光変換部209に供給される。HDR電光変換部209では、この高品質フォーマット画像データVh3´に電光変換が施され、高品質フォーマット画像データVh3が得られて、表示部210に供給される。
 以上説明したように、図1に示す送受信システム10において、送信装置100では、基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されるものである。そのため、受信側では、識別情報に基づいて、所定の符号化画像データに選択的に復号化処理を行って表示能力に応じた画像データを得ることが容易に可能となる。
 また、図1に示す送受信システム10において、送信装置100では、コンテナのレイヤに、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報が挿入されるものである。そのため、受信側では、符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを、コンテナのレイヤで、予め把握することが可能となる。
 <2.変形例>
 なお、上述実施の形態においては、符号化画像データに識別情報を挿入するためにNALユニットのヘッダの「nuh_layer_id」のフィールドを用いる例を示したが、「nuh_layer_id」および「nuh_temporal_id_plus1」の2つのフィールドを用いることも考えられる。
 例えば、符号化画像データCb,Ch1,Ch2,Ch3の「nuh_layer_id」および「nuh_temporal_id_plus1」は、例えば、図17に示すように、設定される。すなわち、基本フォーマットの符号化画像データCbについては、「nuh_layer_id」は“0”とされ、「nuh_temporal_id_plus1」は“1~6”とされる。また、フレームレート拡張の符号化画像データCh1については、「nuh_layer_id」は“0”とされ、「nuh_temporal_id_plus1」は“7”とされる。
 また、ダイナミックレンジ拡張の符号化画像データCh2については、「nuh_layer_id」は“4”とされ、「nuh_temporal_id_plus1」は“1~6”とされる。さらに、フレームレート拡張およびダイナミックレンジ拡張の符号化画像データCh3については、「nuh_layer_id」は“4”とされ、「nuh_temporal_id_plus1」は“7”とされる。
 この場合、スケーラブル・エクステンション・デスクリプタ(図7参照)は、以下のように設定される。すなわち、2ストリーム構成の場合であって、拡張ビデオストリームに符号化データCh2,Ch3が含まれるとき、「Extended_spatial_resolution_flag」、「Extended_bit_depth_flag」および「Extended_color_gamut_flag」は“0”に設定され、「Extended_frame_rate_flag」および「Extended_dynamic_range_flag」は“1”に設定される。また、「number_of_layer IDs」は“3”に設定され、「layerID」として、順に、“4”、“4”が設定される。
 このような設定により、「nuh_layer_id」=“0”、「nuh_temporal_id_plus1」=“7”はフレームレート拡張の符号化画像データを示すものと定義される。また、「nuh_layer_id」=“4”、「nuh_temporal_id_plus1」=“1~6”はダイナミックレンジ拡張の符号化画像データを示すものと定義される。さらに、「nuh_layer_id」=“4”、「nuh_temporal_id_plus1」=“7”は、レームレート拡張およびダイナミックレンジ拡張の符号化画像データを示すものと定義される。
 また、1ストリーム構成の場合であって、拡張ビデオストリームに符号化データCb,Ch1,Ch2,Ch3が含まれるとき、「Extended_spatial_resolution_flag」、「Extended_bit_depth_flag」および「Extended_color_gamut_flag」は“0”に設定され、「Extended_frame_rate_flag」および「Extended_dynamic_range_flag」は“1”に設定される。また、「number_of_layer IDs」は“4”に設定され、「layerID」として、順に、“0”、“0”、“4”、“4”が設定される。
 このような設定により、「nuh_layer_id」=“0”、「nuh_temporal_id_plus1」=“1~6”は基本フォーマットの符号化画像データを示すものと定義される。また、「nuh_layer_id」=“0”、「nuh_temporal_id_plus1」=“7”はフレームレート拡張の符号化画像データを示すものと定義される。また、「nuh_layer_id」=“4”、「nuh_temporal_id_plus1」=“1~6”はダイナミックレンジ拡張の符号化画像データを示すものと定義される。さらに、「nuh_layer_id」=“4”、「nuh_temporal_id_plus1」=“7”は、レームレート拡張およびダイナミックレンジ拡張の符号化画像データを示すものと定義される。
 図18は、NALユニットヘッダの「nuh_layer_id」、「nuh_temporal_id_plus1」の値と、スケーラブル・エクステンション・デスクリプタの記述との対応関係を示している。すなわち、ストリームに、「nuh_layer_id」=“0”、「nuh_temporal_id_plus1」=“1~6”である基本フォーマットの符号化画像データ(基本成分)が含まれる場合、「layerID」として、“0”が設定される。また、ストリームに、「nuh_layer_id」=“0”、「nuh_temporal_id_plus1」=“7”であるフレームレート拡張の符号化画像データ(フレームレート拡張成分)が含まれる場合、「Extended_spatial_resolution_flag」は“1”とされ、「layerID」として、“0”が設定される。
 また、ストリームに、「nuh_layer_id」=“4”、「nuh_temporal_id_plus1」=“1~6”であるダイナミックレンジ拡張の符号化画像データ(フレームレート拡張成分)が含まれる場合、「Extended_dynamic_range_flag」は“1”とされ、「layerID」として、“4”が設定される。また、ストリームに、「nuh_layer_id」=“4”、「nuh_temporal_id_plus1」=“7”であるフレームレート拡張およびダイナミックレンジ拡張の符号化画像データ(フレームレート拡張成分およびダイナミックレンジ拡張成分)が含まれる場合、「Extended_frame_rate_flag」および「Extended_dynamic_range_flag」は“1”とされ、「layerID」として、“4”が設定される。
 図19のフローチャートは、上述したように符号化画像データに識別情報を挿入するためにNALユニットのヘッダの「nuh_layer_id」および「nuh_temporal_id_plus1」の2つのフィールドを用いた場合において、制御部201が、表示能力情報(表示性能情報)から、デコード範囲を判断する処理の一例を示している。
 制御部201は、ステップST21において、処理を開始する。次に、制御部201は、ステップST22において、スケーラブル・エクステンション・デスクリプタを参照して、各フォーマットの「nuh_layer_id」、「nuh_temporal_id_plus1」を把握する。
 ここでは、基本フォーマットでは「nuh_layer_id」=“0”、「nuh_temporal_id_plus1」=“1~6”であり、フレームレート拡張では「nuh_layer_id」=“0”、「nuh_temporal_id_plus1」=“7”であり、ダイナミックレンジ拡張では「nuh_layer_id」=“4”、「nuh_temporal_id_plus1」=“1~6”であり、フレームレート拡張およびダイナミックレンジ拡張では、「nuh_layer_id」=“4”、「nuh_temporal_id_plus1」=“7”であることを把握する。
 次に、制御部201は、ステップST23において、100pHDRの表示、つまりフレーム周波数が100HzでHDRの表示が可能か否かを判断する。可能であるとき、制御部201は、ステップST24において、「nuh_layer_id」=“0”かつ「nuh_temporal_id_plus1」=“1~6”である符号化画像データCbと、「nuh_layer_id」=“4”かつ「nuh_temporal_id_plus1」=“1~7”である符号化画像データCh2,Ch3をデコード範囲とし、その後、ステップST31において、処理を終了する。
 ステップST23で可能でないとき、制御部201は、ステップST25において、50pHDRの表示、つまりフレーム周波数が50HzでHDRの表示が可能か否かを判断する。可能であるとき、制御部201は、ステップST26において、「nuh_layer_id」=“0”かつ「nuh_temporal_id_plus1」=“1~6”である符号化画像データCbと、「nuh_layer_id」=“4”かつ「nuh_temporal_id_plus1」=“1~6”である符号化画像データCh2をデコード範囲とし、その後、ステップST31において、処理を終了する。
 ステップST25で可能でないとき、制御部201は、ステップST27において、100pLDRの表示、つまりフレーム周波数が100HzでLDRの表示が可能か否かを判断する。可能であるとき、制御部201は、ステップST28において、「nuh_layer_id」=“0” かつ「nuh_temporal_id_plus1」=“1~7”である符号化画像データCb,Ch1をデコード範囲とし、その後、ステップST31において、処理を終了する。
 ステップST27で可能でないとき、制御部201は、ステップST29において、50pLDRの表示、つまりフレーム周波数が50HzでLDRの表示が可能か否かを判断する。可能であるとき、制御部201は、ステップST30において、「nuh_layer_id」=“0”かつ「nuh_temporal_id_plus1」=“1~6”である符号化画像データCbをデコード範囲とし、その後、ステップST31において、処理を終了する。なお、ステップST29で可能でないとき、制御部201は、ステップST31において、処理を終了する。
 また、上述実施の形態においては、送信装置100と受信装置200とからなる送受信システム10を示したが、本技術を適用し得る送受信システムの構成は、これに限定されるものではない。例えば、受信装置200の部分が、HDMI(High-Definition Multimedia Interface)などのデジタルインタフェースで接続されたセットトップボックスおよびモニタの構成などであってもよい。この場合、セットトップボックスは、モニタからEDID(Extended display identification data)を取得する等して表示能力情報を得ることができる。なお、「HDMI」は、登録商標である。
 また、上述実施の形態においては、コンテナがトランスポートストリーム(MPEG-2 TS)である例を示した。しかし、本技術は、インターネット等のネットワークを利用して受信端末に配信される構成のシステムにも同様に適用できる。インターネットの配信では、MP4やそれ以外のフォーマットのコンテナで配信されることが多い。つまり、コンテナとしては、デジタル放送規格で採用されているトランスポートストリーム(MPEG-2 TS)、インターネット配信で使用されているMP4などの種々のフォーマットのコンテナが該当する。
 また、本技術は、以下のような構成を取ることもできる。
 (1)基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームを生成する画像符号化部と、
 上記画像符号化部で生成された上記基本ビデオストリームおよび上記拡張ビデオストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
 上記画像符号化部は、上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する
 送信装置。
 (2)上記符号化画像データは、NALユニット構造を有し、
 上記画像符号化部は、上記識別情報を上記NALユニットのヘッダに挿入する
 前記(1)に記載の送信装置。
 (3)上記画像符号化部は、上記識別情報を、上記NALユニットのヘッダの「nuh_layer_id」のフィールドを用いて挿入する
 前記(2)に記載の送信装置。
 (4)上記画像符号化部は、上記識別情報を、上記NALユニットのヘッダの「nuh_layer_id」および「nuh_temporal_id_plus1」のフィールドを用いて挿入する
 前記(2)に記載の送信装置。
 (5)上記コンテナのレイヤに、上記符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報を挿入する情報挿入部をさらに備える
 前記(1)から(4)のいずれかに記載の送信装置。
 (6)上記コンテナは、MPEG2-TSであり、
 上記情報挿入部は、
 上記情報を、プログラムマップテーブルの配下に存在する上記拡張ビデオストリームに対応したビデオエレメンタリストリームループ内に挿入する
 前記(5)に記載の送信装置。
 (7)基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームを生成する画像符号化ステップと、
 送信部により、上記画像符号化ステップで生成された上記基本ビデオストリームおよび上記拡張ビデオストリームを含む所定フォーマットのコンテナを送信する送信ステップを有し、
 上記画像符号化ステップでは、上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する
 送信方法。
 (8)基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
 上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されており、
 上記受信されたコンテナが有する各ビデオストリームを、上記識別情報と表示能力情報に基づいて処理する処理部をさらに備える
 受信装置。
 (9)上記符号化画像データは、NALユニット構造を有し、
 上記識別情報は、上記NALユニットのヘッダに挿入されている
 前記(8)に記載の受信装置。
 (10)上記コンテナのレイヤに、上記符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報が挿入されており、
 上記処理部は、上記コンテナのレイヤに挿入されている情報に基づいて、上記符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを把握する
 前記(8)または(9)に記載の受信装置。
 (11)基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを生成する画像符号化部と、
 上記画像符号化部で生成された上記ビデオストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
 上記画像符号化部は、上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する
 送信装置。
 (12)上記符号化画像データは、NALユニット構造を有し、
 上記画像符号化部は、上記識別情報を上記NALユニットのヘッダに挿入する
 前記(11)に記載の送信装置。
 (13)上記画像符号化部は、上記識別情報を、上記NALユニットのヘッダの「nuh_layer_id」のフィールドを用いて挿入する
 前記(12)に記載の送信装置。
 (14)上記画像符号化部は、上記識別情報を、上記NALユニットのヘッダの「nuh_layer_id」および「nuh_temporal_id_plus1」のフィールドを用いて挿入する
 前記(12)に記載の送信装置。
 (15)上記コンテナのレイヤに、上記符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報を挿入する情報挿入部をさらに備える
 前記(11)から(14)のいずれかに記載の送信装置。
 (16)上記コンテナは、MPEG2-TSであり、
 上記情報挿入部は、
 上記情報を、プログラムマップテーブルの配下に存在する上記ビデオストリームに対応したビデオエレメンタリストリームループ内に挿入する
 前記(15)に記載の送信装置。
 (17)基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを生成する画像符号化ステップと、
 送信部により、上記画像符号化ステップで生成された上記ビデオストリームを含む所定フォーマットのコンテナを送信する送信ステップを有し、
 上記画像符号化ステップでは、上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する
 送信方法。
 (18)基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
 上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されており、
 上記受信されたコンテナが有する上記ビデオストリームを、上記識別情報と表示能力情報に基づいて処理する処理部をさらに備える
 受信装置。
 (19)上記符号化画像データは、NALユニット構造を有し、
 上記識別情報は、上記NALユニットのヘッダに挿入されている
 前記(18)に記載の受信装置。
 (20)上記コンテナのレイヤに、上記符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報が挿入されており、
 上記処理部は、上記コンテナのレイヤに挿入されている情報に基づいて、上記符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを把握する
 前記(18)または(19)に記載の受信装置。
 本技術の主な特徴は、基本フォーマット画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入して送信することで、受信側において、所定の符号化画像データに選択的に復号化処理を行って表示能力に応じた画像データを得ることを容易としたことである(図10、図11参照)。
 10・・・送受信システム
 100・・・送信装置
 101・・・制御部
 102,103・・・LDR光電変換部
 104,105・・・HDR光電変換部
 106・・・ビデオエンコーダ
 106-0,106-1,106-2,106-3・・・エンコード部
 107・・・システムエンコーダ
 108・・・送信部
 150・・・画像データ生成部
 151・・・HDRカメラ
 152,154・・・フレームレート変換部
 153・・・ダイナミックレンジ変換部
 160・・・エンコード部
 161・・・レイヤ内予測部
 162・・・レイヤ間予測部
 163・・・予測調整部
 164・・・選択部
 165・・・エンコード機能部
 200・・・受信装置
 201・・・制御部
 202・・・受信部
 203・・・システムデコーダ
 204・・・圧縮データバッファ
 205・・・ビデオデコーダ
 205-0,205-1,205-2,205-3・・・デコード部
 206,207・・・LDR電光変換部
 208,209・・・HDR電光変換部
 210・・・表示部
 250・・・デコード部
 251・・・デコード機能部
 252・・・レイヤ内予測補償部
 253・・・レイヤ間予測補償部
 254・・・予測調整部
 255・・・選択部

Claims (20)

  1.  基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームを生成する画像符号化部と、
     上記画像符号化部で生成された上記基本ビデオストリームおよび上記拡張ビデオストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
     上記画像符号化部は、上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する
     送信装置。
  2.  上記符号化画像データは、NALユニット構造を有し、
     上記画像符号化部は、上記識別情報を上記NALユニットのヘッダに挿入する
     請求項1に記載の送信装置。
  3.  上記画像符号化部は、上記識別情報を、上記NALユニットのヘッダの「nuh_layer_id」のフィールドを用いて挿入する
     請求項2に記載の送信装置。
  4.  上記画像符号化部は、上記識別情報を、上記NALユニットのヘッダの「nuh_layer_id」および「nuh_temporal_id_plus1」のフィールドを用いて挿入する
     請求項2に記載の送信装置。
  5.  上記コンテナのレイヤに、上記符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報を挿入する情報挿入部をさらに備える
     請求項1に記載の送信装置。
  6.  上記コンテナは、MPEG2-TSであり、
     上記情報挿入部は、
     上記情報を、プログラムマップテーブルの配下に存在する上記ビデオストリームに対応したビデオエレメンタリストリームループ内に挿入する
     請求項5に記載の送信装置。
  7.  基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームを生成する画像符号化ステップと、
     送信部により、上記画像符号化ステップで生成された上記基本ビデオストリームおよび上記拡張ビデオストリームを含む所定フォーマットのコンテナを送信する送信ステップを有し、
     上記画像符号化ステップでは、上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する
     送信方法。
  8.  基本フォーマット画像データの符号化画像データを含む基本ビデオストリームと所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含む拡張ビデオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
     上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されており、
     上記受信されたコンテナが有する各ビデオストリームを、上記識別情報と表示能力情報に基づいて処理する処理部をさらに備える
     受信装置。
  9.  上記符号化画像データは、NALユニット構造を有し、
     上記識別情報は、上記NALユニットのヘッダに挿入されている
     請求項8に記載の受信装置。
  10.  上記コンテナのレイヤに、上記符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報が挿入されており、
     上記処理部は、上記コンテナのレイヤに挿入されている情報に基づいて、上記符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを把握する
     請求項8に記載の受信装置。
  11.  基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを生成する画像符号化部と、
     上記画像符号化部で生成された上記ビデオストリームを含む所定フォーマットのコンテナを送信する送信部を備え、
     上記画像符号化部は、上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する
     送信装置。
  12.  上記符号化画像データは、NALユニット構造を有し、
     上記画像符号化部は、上記識別情報を上記NALユニットのヘッダに挿入する
     請求項11に記載の送信装置。
  13.  上記画像符号化部は、上記識別情報を、上記NALユニットのヘッダの「nuh_layer_id」のフィールドを用いて挿入する
     請求項12に記載の送信装置。
  14.  上記画像符号化部は、上記識別情報を、上記NALユニットのヘッダの「nuh_layer_id」および「nuh_temporal_id_plus1」のフィールドを用いて挿入する
     請求項12に記載の送信装置。
  15.  上記コンテナのレイヤに、上記符号化画像データに挿入される識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報を挿入する情報挿入部をさらに備える
     請求項11に記載の送信装置。
  16.  上記コンテナは、MPEG2-TSであり、
     上記情報挿入部は、
     上記情報を、プログラムマップテーブルの配下に存在する上記ビデオストリームに対応したビデオエレメンタリストリームループ内に挿入する
     請求項15に記載の送信装置。
  17.  基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを生成する画像符号化ステップと、
     送信部により、上記画像符号化ステップで生成された上記ビデオストリームを含む所定フォーマットのコンテナを送信する送信ステップを有し、
     上記画像符号化ステップでは、上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報を挿入する
     送信方法。
  18.  基本フォーマット画像データの符号化画像データおよび所定数の高品質フォーマット画像データのそれぞれの符号化画像データを含むビデオストリームを有する所定フォーマットのコンテナを受信する受信部を備え、
     上記基本フォーマット画像データおよび上記所定数の高品質フォーマット画像データのそれぞれの符号化画像データに、対応するフォーマットを識別するための識別情報が挿入されており、
     上記受信されたコンテナが有する上記ビデオストリームを、上記識別情報と表示能力情報に基づいて処理する処理部をさらに備える
     受信装置。
  19.  上記符号化画像データは、NALユニット構造を有し、
     上記識別情報は、上記NALユニットのヘッダに挿入されている
     請求項18に記載の受信装置。
  20.  上記コンテナのレイヤに、上記符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを定義する情報が挿入されており、
     上記処理部は、上記コンテナのレイヤに挿入されている情報に基づいて、上記符号化画像データに挿入されている識別情報がいかなるフォーマットの符号化画像データを示すかを把握する
     請求項18に記載の受信装置。
PCT/JP2015/069793 2014-08-07 2015-07-09 送信装置、送信方法および受信装置 WO2016021365A1 (ja)

Priority Applications (10)

Application Number Priority Date Filing Date Title
ES15830176T ES2885548T3 (es) 2014-08-07 2015-07-09 Dispositivo de transmisión, método de transmisión y dispositivo de recepción
KR1020177000890A KR102366503B1 (ko) 2014-08-07 2015-07-09 송신 장치, 송신 방법 및 수신 장치
EP21183996.4A EP3910960A1 (en) 2014-08-07 2015-07-09 Transmission device, transmission method, and reception device
CN201580041287.5A CN106664445B (zh) 2014-08-07 2015-07-09 发送设备、发送方法和接收设备
US15/323,773 US10397642B2 (en) 2014-08-07 2015-07-09 Transmission device, transmission method, and reception device
MX2017001415A MX368827B (es) 2014-08-07 2015-07-09 Dispositivo de transmision, metodo de transmision y dispositivo de recepcion.
EP15830176.2A EP3179729B1 (en) 2014-08-07 2015-07-09 Transmission device, transmission method and reception device
PL15830176T PL3179729T3 (pl) 2014-08-07 2015-07-09 Urządzenie nadawcze, sposób nadawania i urządzenie odbiorcze
JP2016540130A JP6652058B2 (ja) 2014-08-07 2015-07-09 送信装置、送信方法および受信装置
RU2017103077A RU2687956C2 (ru) 2014-08-07 2015-07-09 Передающее устройство, способ передачи и приемное устройство

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014161833 2014-08-07
JP2014-161833 2014-08-07

Publications (1)

Publication Number Publication Date
WO2016021365A1 true WO2016021365A1 (ja) 2016-02-11

Family

ID=55263639

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/069793 WO2016021365A1 (ja) 2014-08-07 2015-07-09 送信装置、送信方法および受信装置

Country Status (12)

Country Link
US (1) US10397642B2 (ja)
EP (2) EP3179729B1 (ja)
JP (5) JP6652058B2 (ja)
KR (1) KR102366503B1 (ja)
CN (1) CN106664445B (ja)
ES (1) ES2885548T3 (ja)
HU (1) HUE055488T2 (ja)
MX (1) MX368827B (ja)
PL (1) PL3179729T3 (ja)
PT (1) PT3179729T (ja)
RU (1) RU2687956C2 (ja)
WO (1) WO2016021365A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017164595A1 (ko) * 2016-03-21 2017-09-28 엘지전자(주) 방송 신호 송수신 장치 및 방법
FR3070566B1 (fr) * 2017-08-30 2020-09-04 Sagemcom Broadband Sas Procede de recuperation d'un fichier cible d'un logiciel d'exploitation et dispositif d'utilisation
US11606528B2 (en) * 2018-01-03 2023-03-14 Saturn Licensing Llc Advanced television systems committee (ATSC) 3.0 latency-free display of content attribute
WO2021128295A1 (en) * 2019-12-27 2021-07-01 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods for inter prediction

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013151814A1 (en) * 2012-04-06 2013-10-10 Vidyo, Inc. Level signaling for layered video coding

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5144425A (en) * 1991-08-26 1992-09-01 General Electric Company Apparatus for hierarchically dividing video signals
JPH10248051A (ja) * 1997-03-05 1998-09-14 Matsushita Electric Ind Co Ltd ディジタルデータ送信方法、ディジタルデータ送信装置およびディジタルデータ受信装置
EP1835745A3 (en) * 1997-03-17 2010-09-29 Panasonic Corporation Receiving terminal and method to receive a sub-program relating to a program
US6490705B1 (en) * 1998-10-22 2002-12-03 Lucent Technologies Inc. Method and apparatus for receiving MPEG video over the internet
US6263022B1 (en) * 1999-07-06 2001-07-17 Philips Electronics North America Corp. System and method for fine granular scalable video with selective quality enhancement
US6501797B1 (en) * 1999-07-06 2002-12-31 Koninklijke Phillips Electronics N.V. System and method for improved fine granular scalable video using base layer coding information
US8284845B1 (en) * 2000-01-24 2012-10-09 Ati Technologies Ulc Method and system for handling data
US7095782B1 (en) * 2000-03-01 2006-08-22 Koninklijke Philips Electronics N.V. Method and apparatus for streaming scalable video
US6496217B1 (en) * 2001-06-12 2002-12-17 Koninklijke Philips Electronics N.V. Video communication system using model-based coding and prioritzation techniques
US7958532B2 (en) * 2001-06-18 2011-06-07 At&T Intellectual Property Ii, L.P. Method of transmitting layered video-coded information
JP4329358B2 (ja) * 2003-02-24 2009-09-09 富士通株式会社 ストリーム配信方法、及びストリーム配信システム
US20040208239A1 (en) * 2003-04-21 2004-10-21 Lars Karlsson Method and apparatus for the intelligent and automatic gathering of sudden short duration communications signals
EP1851948A1 (fr) * 2005-02-09 2007-11-07 Previsite Procede de realisation en masse de visites virtuelles interactives pour diffusion multimedia, ainsi que systeme de misse en oeuvre
JP4693444B2 (ja) * 2005-03-09 2011-06-01 株式会社東芝 情報記録方法および情報記録装置
EP1869888B1 (en) * 2005-04-13 2016-07-06 Nokia Technologies Oy Method, device and system for effectively coding and decoding of video data
WO2006125850A1 (en) 2005-05-24 2006-11-30 Nokia Corporation Method and apparatuses for hierarchical transmission/reception in digital broadcast
EP1905200A1 (en) * 2005-07-01 2008-04-02 Terahop Networks, Inc. Nondeterministic and deterministic network routing
US8072943B2 (en) * 2005-12-09 2011-12-06 Samsung Electronics Co., Ltd. Wireless communication system and methodology for communicating via multiple information streams
KR100961743B1 (ko) * 2005-12-09 2010-06-07 삼성전자주식회사 다중 홉 중계방식의 광대역 무선 접속통신시스템에서 중계서비스를 지원하기 위한 장치 및 방법
US7836016B2 (en) * 2006-01-13 2010-11-16 International Business Machines Corporation Method and apparatus for disseminating new content notifications in peer-to-peer networks
US9209934B2 (en) * 2006-06-09 2015-12-08 Qualcomm Incorporated Enhanced block-request streaming using cooperative parallel HTTP and forward error correction
US8576858B2 (en) * 2006-12-13 2013-11-05 Viasat, Inc. Multiple transmission paths for hierarchical layers
US8467457B2 (en) * 2007-01-16 2013-06-18 Mobixell Networks (Israel) Ltd System and a method for controlling one or more signal sequences characteristics
EP2153658B1 (en) * 2007-04-13 2013-08-14 Nokia Corporation A video coder
EP2147555B1 (en) * 2007-04-18 2012-07-25 Thomson Licensing Coding systems
KR20090004660A (ko) * 2007-07-02 2009-01-12 엘지전자 주식회사 디지털 방송 시스템 및 데이터 처리 방법
CA2650151C (en) * 2008-01-17 2013-04-02 Lg Electronics Inc. An iptv receiving system and data processing method
KR101580516B1 (ko) * 2008-04-07 2015-12-28 엘지전자 주식회사 방송 신호 수신 방법 및 방송 신호 수신 장치
JP2009267537A (ja) * 2008-04-22 2009-11-12 Toshiba Corp 階層化されたエレメンタリーストリームの多重化装置、分離装置及び多重化方法並びにプログラム
WO2010032636A1 (ja) * 2008-09-17 2010-03-25 シャープ株式会社 スケーラブルビデオストリーム復号装置およびスケーラブルビデオストリーム生成装置
JP5541488B2 (ja) * 2009-02-09 2014-07-09 ソニー株式会社 コンテンツ受信装置および方法
JP2010263615A (ja) * 2009-04-08 2010-11-18 Sony Corp 情報処理装置、情報処理方法、再生装置、再生方法
JP2012523804A (ja) * 2009-04-13 2012-10-04 リアルディー インコーポレイテッド 向上した解像度の立体ビデオのエンコード、デコード、および配信
US20110096828A1 (en) * 2009-09-22 2011-04-28 Qualcomm Incorporated Enhanced block-request streaming using scalable encoding
US20110187503A1 (en) * 2010-02-01 2011-08-04 Mario Costa Method and System for Data Center Rack Brackets For Automatic Location Tracking of Information Technology Components
KR20110101099A (ko) * 2010-03-05 2011-09-15 한국전자통신연구원 복수 전송 계층 연동형 3dtv 방송 서비스 제공을 위한 송신 및 수신 방법, 송신 및 수신 장치
EP2375747B1 (en) * 2010-04-12 2019-03-13 Sun Patent Trust Filter positioning and selection
AU2011285474B2 (en) * 2010-08-09 2016-06-09 Panasonic Corporation Image coding method, image decoding method, image coding apparatus, and image decoding apparatus
KR20120084234A (ko) * 2011-01-19 2012-07-27 삼성전자주식회사 Mpeg media transport(mmt)에서 mmt au를 전송하는 방법
AU2012207719B2 (en) * 2011-01-19 2016-05-19 Samsung Electronics Co., Ltd. Apparatus and method for configuring a control message in a broadcast system
US8904445B2 (en) * 2011-01-24 2014-12-02 At&T Intellectual Property I, L.P. Methods and apparatus to manage bandwidth allocations in media delivery networks
US20120224651A1 (en) * 2011-03-03 2012-09-06 Yutaka Murakami Signal generation method and signal generation apparatus
WO2012147365A1 (ja) * 2011-04-28 2012-11-01 パナソニック株式会社 記録媒体、再生装置、及び記録装置
CN103718562B (zh) * 2011-07-26 2017-06-20 Lg电子株式会社 发送视频流的装置、接收视频流的装置、发送视频流的方法、接收视频流的方法
RU2013122634A (ru) * 2011-10-28 2015-12-10 Панасоник Корпорэйшн Носитель записи, устройство воспроизведения, устройство записи, способ воспроизведения и способ записи для редактирования записанного контента при поддержании совместимости со старым форматом
EP3288187B1 (en) * 2011-11-30 2023-01-04 Samsung Electronics Co., Ltd. Apparatus and method for transmiting layered source data
EP2725804A4 (en) 2012-04-24 2015-02-25 Sony Corp IMAGE DATA TRANSMISSION DEVICE, IMAGE DATA TRANSMISSION METHOD, IMAGE DATA RECEIVING DEVICE, AND IMAGE DATA RECEIVING METHOD
BR112014032108B1 (pt) * 2012-06-28 2022-12-27 Sony Corporation Dispositivos transmissor, receptor, de codificação e de decodificação, e, métodos de transmissão e de recepção
CN104584562B (zh) * 2012-08-27 2018-10-09 索尼公司 发送设备、发送方法、接收设备和接收方法
HUE047946T2 (hu) * 2012-09-07 2020-05-28 Saturn Licensing Llc Átviteli eszköz, átviteli eljárás, vevõ eszköz és vételi eljárás
EP2876882A4 (en) * 2012-09-09 2016-03-09 Lg Electronics Inc IMAGE DECODING METHOD AND APPARATUS USING THE SAME
US9161039B2 (en) * 2012-09-24 2015-10-13 Qualcomm Incorporated Bitstream properties in video coding
KR102028696B1 (ko) * 2012-10-04 2019-10-07 삼성전자주식회사 고 해상도 컨텐츠를 처리하는 컨텐츠 처리 장치 및 그 방법
CN104756500B (zh) * 2012-10-09 2018-07-17 思科技术公司 向经编码视频的子层提供共同参数集
WO2014069920A1 (en) * 2012-11-01 2014-05-08 Samsung Electronics Co., Ltd. Recording medium, reproducing device for providing service based on data of recording medium, and method thereof
US20140211861A1 (en) * 2013-01-25 2014-07-31 Electronics And Telecommunications Research Institute Method and system for providing high definition (hd) broadcasting service and ultra high definition (uhd) broadcasting service
EP2984847B1 (en) * 2013-04-07 2018-10-31 Dolby International AB Signaling change in output layer sets
FR3008245B1 (fr) * 2013-07-03 2017-05-26 Abb France Dispositif de protection a l’encontre de surtensions electriques transitoires
KR102121947B1 (ko) * 2013-09-27 2020-06-11 삼성전자주식회사 신호 처리 장치 및 그의 신호 처리 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013151814A1 (en) * 2012-04-06 2013-10-10 Vidyo, Inc. Level signaling for layered video coding

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MISKA M. HANNUKSELA ET AL.: "Draft Text for Scalable Extensions of High Efficiency Video Coding (HEVC)", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP3 AND ISO/IEC JTC1/SC29/WG11 11TH MEETING, 10 October 2012 (2012-10-10) - 19 October 2012 (2012-10-19), Shanghai, CN, pages 7, XP055398477, Retrieved from the Internet <URL:http://phenix.it-sudparis.eu/jct2/doc_end_user/documents/3_Geneva/wg11/JCT3V-C0238-v1.zip><JCTVC-L0452-spec-text.doc> *
SAM NARASIMHAN ET AL.: "Extensions to support layer addition and removal, access unit structure and changes to HRD model in scalable HEVC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11 14TH MEETING, 25 July 2013 (2013-07-25) - 2 August 2013 (2013-08-02), Vienna, Austria, AT, XP030114476, Retrieved from the Internet <URL:http://phenix.it-sudparis.eu/jct/doc_end_user/documents/14_Vienna/wg11/JCTVC-N0048-v1.zip> *

Also Published As

Publication number Publication date
MX2017001415A (es) 2017-05-09
JP7147903B2 (ja) 2022-10-05
ES2885548T3 (es) 2021-12-14
PL3179729T3 (pl) 2021-12-20
JP6856105B2 (ja) 2021-04-07
KR20170040189A (ko) 2017-04-12
US20170164033A1 (en) 2017-06-08
JP6652058B2 (ja) 2020-02-19
JP2024026562A (ja) 2024-02-28
KR102366503B1 (ko) 2022-02-23
RU2687956C2 (ru) 2019-05-17
EP3910960A1 (en) 2021-11-17
CN106664445A (zh) 2017-05-10
JP2021093772A (ja) 2021-06-17
RU2017103077A (ru) 2018-07-31
MX368827B (es) 2019-10-18
HUE055488T2 (hu) 2021-11-29
JP2022171957A (ja) 2022-11-11
EP3179729A4 (en) 2017-12-06
EP3179729A1 (en) 2017-06-14
JP2020014256A (ja) 2020-01-23
JPWO2016021365A1 (ja) 2017-05-18
US10397642B2 (en) 2019-08-27
EP3179729B1 (en) 2021-08-25
CN106664445B (zh) 2020-04-21
RU2017103077A3 (ja) 2018-11-15
PT3179729T (pt) 2021-09-21
JP7662023B2 (ja) 2025-04-15
JP7416164B2 (ja) 2024-01-17

Similar Documents

Publication Publication Date Title
JP6888717B2 (ja) 送信方法および送信装置
JP7147903B2 (ja) 送信方法および送信装置
JP7552825B2 (ja) 送信方法および送信装置
JP6801662B2 (ja) 送信装置、送信方法、受信装置および受信方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15830176

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016540130

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 15323773

Country of ref document: US

ENP Entry into the national phase

Ref document number: 20177000890

Country of ref document: KR

Kind code of ref document: A

REEP Request for entry into the european phase

Ref document number: 2015830176

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2017103077

Country of ref document: RU

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: MX/A/2017/001415

Country of ref document: MX

NENP Non-entry into the national phase

Ref country code: DE