[go: up one dir, main page]

JP2009278481A - Video content reception device, video content distribution apparatus and video content distribution method - Google Patents

Video content reception device, video content distribution apparatus and video content distribution method Download PDF

Info

Publication number
JP2009278481A
JP2009278481A JP2008129124A JP2008129124A JP2009278481A JP 2009278481 A JP2009278481 A JP 2009278481A JP 2008129124 A JP2008129124 A JP 2008129124A JP 2008129124 A JP2008129124 A JP 2008129124A JP 2009278481 A JP2009278481 A JP 2009278481A
Authority
JP
Japan
Prior art keywords
video content
video
feature amount
metadata
streaming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008129124A
Other languages
Japanese (ja)
Inventor
Masahiro Kato
雅弘 加藤
Junichi Kimura
淳一 木村
Yasuhide Mori
靖英 森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2008129124A priority Critical patent/JP2009278481A/en
Publication of JP2009278481A publication Critical patent/JP2009278481A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

【課題】要約の作成をより精度良く作成できる映像コンテンツ配信装置、映像コンテンツをダウンロードする前にその要約映像だけをストリーミング視聴して内容を確認することにより、視聴する映像コンテンツを的確に取捨選択することができる映像コンテンツ受信装置を提供する。
【解決手段】映像コンテンツ受信装置において、ストリーミング受信部3021と、ストリーミング再生部3024と、コンテンツ受信部3022と、コンテンツ管理部3023と、映像再生部3025と、映像コンテンツの選択画面を表示するユーザインターフェース3026とを備え、ユーザインターフェース3026により表示される画面に対する操作者からの操作入力情報による映像コンテンツの再生の際、最初に映像コンテンツの要約のストリーミング映像を受信して再生した後、映像コンテンツを受信して再生する。
【選択図】図2
Video content distribution apparatus capable of creating summary with higher accuracy, and streaming only the summary video and confirming the content before downloading the video content, thereby accurately selecting the video content to be viewed Provided is a video content receiving apparatus capable of performing the above.
In a video content receiving apparatus, a streaming receiving unit 3021, a streaming playback unit 3024, a content receiving unit 3022, a content management unit 3023, a video playback unit 3025, and a user interface for displaying a video content selection screen are displayed. 3026, and when the video content is played back by the operation input information from the operator for the screen displayed by the user interface 3026, the streaming video of the video content summary is first received and played, and then the video content is received. And play it.
[Selection] Figure 2

Description

本発明は、映像コンテンツ受信装置、映像コンテンツ配信装置および映像コンテンツ配信方法に関し、特に、テレビジョン受像機のように放送番組などの映像コンテンツを表示する映像コンテンツ視聴端末などにより、ビデオメールなどの映像コンテンツをダウンロードする前に要約だけを視聴して内容を確認する技術に関する。   The present invention relates to a video content receiving device, a video content distribution device, and a video content distribution method, and in particular, video such as video mail by a video content viewing terminal that displays video content such as a broadcast program such as a television receiver. The present invention relates to a technology for confirming contents by viewing only a summary before downloading the contents.

従来、映像コンテンツの要約を作成する技術として、大量の映像の概要の把握を可能としつつ、映像に対する興味の低下を回避し得る要約映像を作成するものとして、特開2007−184781号公報(特許文献1)記載の技術があった。   Conventionally, as a technique for creating a summary of video content, Japanese Laid-Open Patent Publication No. 2007-184781 (Patent Document) discloses a technique for creating a summary video that enables an overview of a large amount of video to be grasped while avoiding a decrease in interest in the video. There was a technique described in Reference 1).

これは、録画映像または蓄積映像等から要約映像を作成する要約映像作成装置において、ユーザの視聴履歴情報および録画方法情報を利用することによって、各映像に対してユーザが必要であると考えられるシーンの選択や区間の抽出、そして一定の映像再生構成に収束しないユーザの嗜好に適応的な映像を再生する際の構成を可能とし、最終的にユーザの視聴スタイルに合致する要約映像を作成することを可能とするものである。
特開2007−184781号公報
This is a scene that is considered to be required for each video by using the user's viewing history information and recording method information in a summary video creation device that creates summary video from recorded video or stored video, etc. Selection, segment extraction, and configuration that plays back video that is adaptive to user preferences that do not converge to a fixed video playback configuration, and finally creates a summary video that matches the user's viewing style Is possible.
JP 2007-184781 A

特許文献1に開示された技術は、要約映像を作成する際にユーザの視聴履歴情報や録画方法情報を利用しており、興味が無い映像コンテンツに対しては視聴履歴情報や録画方法情報が得られない場合がある。それでも特許文献1に開示された装置および方法で興味が無い映像コンテンツを無理に要約すると要約映像としての信頼性が低くなるという問題があった。   The technology disclosed in Patent Document 1 uses viewing history information and recording method information of a user when creating a summary video, and viewing history information and recording method information are obtained for video content that is not of interest. It may not be possible. Nevertheless, forcibly summarizing video content that is not of interest with the apparatus and method disclosed in Patent Document 1 has a problem that reliability as a summary video is lowered.

また、特許文献1に開示された技術で、ポータルサーバで映像要約を行うためにはポータルサーバが視聴履歴情報および録画方法情報を収集する必要が生じる。すなわちポータルサーバは全加入者の視聴履歴と録画方法を管理する必要が生じてサーバ側のシステムが煩雑になるという問題があった。   In addition, with the technology disclosed in Patent Document 1, in order to perform video summarization on the portal server, the portal server needs to collect viewing history information and recording method information. That is, there is a problem that the portal server needs to manage the viewing history and recording method of all subscribers, and the server system becomes complicated.

また、ユーザがこれらの情報をプライバシー情報だと考えて開示することを拒んだ場合には、要約映像としての信頼性がさらに低下するという問題があった。   In addition, when the user refuses to disclose such information as privacy information, there is a problem that the reliability of the summary video is further lowered.

そこで、本発明の目的は、要約の作成をより精度良く作成できる映像コンテンツ配信装置、映像コンテンツをダウンロードする前にその要約映像だけをストリーミング視聴して内容を確認することにより、視聴する映像コンテンツを的確に取捨選択することができる映像コンテンツ受信装置を提供することである。   Therefore, an object of the present invention is to provide a video content distribution apparatus capable of creating a summary with higher accuracy, and by streaming and viewing only the summary video and confirming the content before downloading the video content. It is an object of the present invention to provide a video content receiving apparatus that can be appropriately selected.

本発明の前記ならびにその他の目的と新規な特徴は、本明細書の記述および添付図面から明らかになるであろう。   The above and other objects and novel features of the present invention will be apparent from the description of this specification and the accompanying drawings.

本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次のとおりである。   Of the inventions disclosed in the present application, the outline of typical ones will be briefly described as follows.

すなわち、代表的なものの概要は、映像コンテンツ受信装置では、ユーザインターフェースにより表示される画面に対する操作者からの操作入力情報による映像コンテンツの再生の際、最初に映像コンテンツの要約のストリーミング映像を受信して再生した後、映像コンテンツを受信して再生する。   That is, an outline of a typical one is that a video content receiving apparatus first receives a streaming video of a summary of video content when reproducing video content based on operation input information from an operator for a screen displayed by a user interface. Video content is received and played back.

また、映像コンテンツ配信装置では、コンテンツ管理部は、映像コンテンツを送信する際、最初に前記映像コンテンツの要約映像をストリーミング送信する。   In the video content distribution apparatus, when transmitting the video content, the content management unit first transmits the summary video of the video content by streaming.

本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。   Among the inventions disclosed in the present application, effects obtained by typical ones will be briefly described as follows.

すなわち、代表的なものによって得られる効果は、映像コンテンツ受信装置のユーザは映像コンテンツ配信装置から映像コンテンツをダウンロードする前にストリーミングなどでその内容を知ることができ、また、映像コンテンツ配信装置では、人間の感性に対応した代表シーンを抽出して連結するので生成した要約の品質が高くなる。   In other words, the effect obtained by the representative one is that the user of the video content receiving device can know the content by streaming before downloading the video content from the video content distribution device. Since representative scenes corresponding to human sensitivity are extracted and connected, the quality of the generated summary is improved.

以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一の部材には原則として同一の符号を付し、その繰り返しの説明は省略する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Note that components having the same function are denoted by the same reference symbols throughout the drawings for describing the embodiment, and the repetitive description thereof will be omitted.

<ハードウェア構成>
図1により、本発明の一実施の形態に係る映像コンテンツ受信装置のハードウェアについて説明する。図1は本発明の一実施の形態に係る映像コンテンツ受信装置のハードウェアを示す構成図である。
<Hardware configuration>
With reference to FIG. 1, hardware of a video content receiving apparatus according to an embodiment of the present invention will be described. FIG. 1 is a configuration diagram showing hardware of a video content receiving apparatus according to an embodiment of the present invention.

図1において、映像コンテンツ受信装置は、動画を表示可能な表示部を備えた(内蔵した)機器であり、テレビジョン受像機などの各種情報表示装置である。ただし、表示部が別体(外付け)であってもよい。   In FIG. 1, a video content receiving device is a device including (incorporating) a display unit capable of displaying a moving image, and various information display devices such as a television receiver. However, the display unit may be a separate body (external).

映像コンテンツ受信装置は、装置の動作を制御する中央制御ユニット(CPU)1001、ROM1002、RAM1003、ネットワークインターフェース1004、ユーザインターフェースコントローラ1005、操作部1006、受光部1007、表示部1008、グラフィックコントローラ1009、VRAM1010から構成されている。   The video content receiving apparatus includes a central control unit (CPU) 1001 that controls the operation of the apparatus, a ROM 1002, a RAM 1003, a network interface 1004, a user interface controller 1005, an operation unit 1006, a light receiving unit 1007, a display unit 1008, a graphic controller 1009, and a VRAM 1010. It is composed of

CPU1001には、ROM1002とRAM1003が内部バスラインを介して接続してあり、さらに外部のネットワークと接続するためのネットワークインターフェース1004が接続されている。   A ROM 1002 and a RAM 1003 are connected to the CPU 1001 via an internal bus line, and a network interface 1004 for connecting to an external network is further connected.

CPU1001は、後述するメタデータの運用と映像ナビゲーション機能を実行する制御部として機能し、接続されたROM1002とRAM1003がメタデータの記憶部としても機能する。   The CPU 1001 functions as a control unit that executes metadata operation and a video navigation function, which will be described later, and the connected ROM 1002 and RAM 1003 also function as a metadata storage unit.

また、メタデータの運用と映像ナビゲーション機能を実行させるプログラムが、ROM1002またはRAM1003に実装させてあり、そのプログラムに基づいてCPU1001がメタデータの運用と映像ナビゲーション機能を実行する。RAM1003などの記憶部については、半導体メモリの他に、ハードディスクなどの記憶部を使用してもよく、あるいはメモリカードなどの着脱自在の記憶部であってもよい。ハードディスクなどの大容量の記憶部(記録部)を備えた場合には、例えばテレビジョン受像機の場合、放送番組を蓄積する録画機能を備えてもよい。   Further, a program for executing the metadata operation and the video navigation function is installed in the ROM 1002 or the RAM 1003, and the CPU 1001 executes the metadata operation and the video navigation function based on the program. The storage unit such as the RAM 1003 may be a storage unit such as a hard disk in addition to the semiconductor memory, or may be a detachable storage unit such as a memory card. When a large-capacity storage unit (recording unit) such as a hard disk is provided, for example, in the case of a television receiver, a recording function for accumulating broadcast programs may be provided.

ネットワークインターフェース1004としては、例えば、アナログ電話回線用のアナログモデム、ISDN回線用のモデム、ADSL(Asymmetric Digital Subscriber Line)用のルータまたはモデム、LAN(Local Area Network:構内情報通信網)用のアダプタ、無線電話用のアダプタ、Bluetooth(商標)などの無線通信用のアダプタなどが適用可能である。これらの構成のネットワークインターフェース1004を経由して、インターネットに接続できる構成としてある。   Examples of the network interface 1004 include an analog modem for an analog telephone line, a modem for an ISDN line, a router or modem for an ADSL (Asymmetric Digital Subscriber Line), an adapter for a LAN (Local Area Network). An adapter for wireless telephone, an adapter for wireless communication such as Bluetooth (trademark), and the like are applicable. The network interface 1004 having these configurations can be connected to the Internet.

また、各種情報や動画の表示制御を行うためのグラフィックコントローラ1009を備える。このグラフィックコントローラ1009に映像データを保持するVRAM1010が接続してあり、グラフィックコントローラ1009の制御で描画された映像を、表示部1008で表示させる。   In addition, a graphic controller 1009 for performing display control of various information and moving images is provided. A VRAM 1010 that holds video data is connected to the graphic controller 1009, and a video drawn under the control of the graphic controller 1009 is displayed on the display unit 1008.

表示部1008としては、液晶表示パネルなどの表示部が使用される。尚、表示部1008には、図示しないチューナが受信した映像信号や外部から入力した映像信号(例えばビデオ再生装置から再生した映像信号)による映像(画像)を表示させることもできる。   As the display unit 1008, a display unit such as a liquid crystal display panel is used. Note that the display unit 1008 can display a video (image) based on a video signal received by a tuner (not shown) or a video signal input from the outside (for example, a video signal reproduced from a video playback device).

これらの映像信号による映像と、後述するインターネットのウェブページなどによる映像とは、グラフィックコントローラ1009の制御で、1つの画面上に同時に表示させることも可能であり、また後述するキーワードなどの文字情報を重ねて表示させる処理も可能である。   The video based on these video signals and the video based on the Internet web page, which will be described later, can be simultaneously displayed on one screen under the control of the graphic controller 1009, and character information such as keywords described later can be displayed. It is also possible to display the images in a superimposed manner.

また、各種操作キー,操作ボタンなどで構成されている操作部1006と、その操作部1006の操作を受け付けるユーザインターフェースコントローラ1005を備え、ユーザインターフェースコントローラ1005が受け付けた操作データがCPU1001に供給される。また、受光部1007が受光(受信)した赤外線信号を、ユーザインターフェースコントローラ1005で判別する構成としてあり、リモートコントロール装置などからの遠隔制御も可能としてある。   In addition, an operation unit 1006 configured by various operation keys, operation buttons, and the like, and a user interface controller 1005 that receives operations of the operation unit 1006 are provided, and operation data received by the user interface controller 1005 is supplied to the CPU 1001. In addition, the infrared signal received (received) by the light receiving unit 1007 is determined by the user interface controller 1005, and remote control from a remote control device or the like is also possible.

図1の説明および以下の説明では、映像コンテンツの流通を行う部分を中心に説明するため、放送信号を受けるチューナや、デマルチプレックサ(デマックス)や、デコーダなどの例えばMPEG形式のAVコンテンツを受信して再生するための基本的な構成の詳細については省略しているが、実装している。   In the description of FIG. 1 and the following description, in order to explain mainly the portion where video content is distributed, for example, an AV content in MPEG format such as a tuner that receives a broadcast signal, a demultiplexer (demultiplexer), a decoder, or the like. Details of the basic configuration for receiving and playing back are omitted, but are implemented.

また、映像コンテンツ管理装置および映像コンテンツ配信装置も、CPU1001、ROM1002、RAM1003などにより、情報処理する構成としては、同様の構成である。   The video content management device and the video content distribution device have the same configuration for information processing by the CPU 1001, the ROM 1002, the RAM 1003, and the like.

<映像コンテンツ管理装置、映像コンテンツ配信装置、映像コンテンツ受信装置のソフトウェア構成>
次に、図2により、本発明の一実施の形態に係る映像コンテンツ管理装置、映像コンテンツ配信装置、映像コンテンツ受信装置のソフトウェア構成について説明する。図2は本発明の一実施の形態に係る映像コンテンツ管理装置、映像コンテンツ配信装置、映像コンテンツ受信装置のソフトウェア構成を示す構成図である。
<Software configuration of video content management device, video content distribution device, and video content reception device>
Next, the software configuration of the video content management apparatus, the video content distribution apparatus, and the video content reception apparatus according to an embodiment of the present invention will be described with reference to FIG. FIG. 2 is a block diagram showing a software configuration of the video content management apparatus, the video content distribution apparatus, and the video content reception apparatus according to the embodiment of the present invention.

図2において、全体構成として、カムコーダなどで撮影した映像コンテンツにメタデータを付与する映像コンテンツ管理装置2001、映像コンテンツとメタデータを管理する映像コンテンツ配信装置2010、前記メタデータが指定する再生制御方法で映像コンテンツを再生する映像コンテンツ受信装置3020から構成されている。   In FIG. 2, as an overall configuration, a video content management device 2001 that gives metadata to video content shot by a camcorder or the like, a video content distribution device 2010 that manages video content and metadata, and a playback control method specified by the metadata The video content receiver 3020 reproduces video content.

映像コンテンツ管理装置2001は、パーソナルコンピュータや映像コンテンツ編集機器や映像コンテンツ受信装置3020に内蔵されているものとする。   Assume that the video content management apparatus 2001 is built in a personal computer, a video content editing device, or a video content receiving apparatus 3020.

映像コンテンツ管理装置2001は、映像コンテンツとメタデータを管理するコンテンツ管理部2004、映像コンテンツとメタデータを保存するストレージ装置2006、メタデータを生成するメタデータ生成部2003、インタラクティブな操作環境でユーザによるメタデータ生成作業やコンテンツ管理作業を支援するユーザインターフェース2002、映像コンテンツとメタデータを前記映像コンテンツ配信装置2010に送信するコンテンツ送信部2005から構成されている。   The video content management device 2001 includes a content management unit 2004 that manages video content and metadata, a storage device 2006 that stores video content and metadata, a metadata generation unit 2003 that generates metadata, and a user in an interactive operation environment. A user interface 2002 that supports metadata generation work and content management work, and a content transmission unit 2005 that transmits video content and metadata to the video content distribution apparatus 2010 are configured.

映像コンテンツ配信装置2010は、映像コンテンツ管理装置2001のコンテンツ送信部2005から送信されたデータを受信するコンテンツ受信部2011、受信したデータを管理するコンテンツ管理部2013、受信したデータを保存するストレージ装置2016と映像コンテンツの要約を生成する要約生成部2012、ストリーミング要求を受けて要約映像をストリーミング送信するストリーミング送信部2014、映像コンテンツ受信装置3020からのダウンロード要求を受けて映像コンテンツとメタデータを送信するコンテンツ送信部2015から構成されている。   The video content distribution device 2010 includes a content reception unit 2011 that receives data transmitted from the content transmission unit 2005 of the video content management device 2001, a content management unit 2013 that manages the received data, and a storage device 2016 that stores the received data. A summary generation unit 2012 for generating a summary of video content, a streaming transmission unit 2014 for streaming transmission of summary video in response to a streaming request, and a content for transmitting video content and metadata in response to a download request from the video content receiving device 3020 The transmission unit 2015 is configured.

映像コンテンツ受信装置3020は、映像コンテンツ配信装置2010からストリーミング送信された要約映像を受信するストリーミング受信部3021、受信した映像コンテンツを蓄積しないで再生表示のみ行うストリーミング再生部3024、映像コンテンツ配信装置2010から送信された映像コンテンツとメタデータを受信するコンテンツ受信部3022、受信した映像コンテンツとメタデータを管理するコンテンツ管理部3023、映像コンテンツとメタデータを保存するストレージ装置3027、ストレージ装置3027に保存された映像コンテンツをメタデータが指定する再生制御方法で再生する映像再生部3025、操作画面の表示や操作画面を用いたインタラクティブな操作環境を提供するユーザインターフェース3026から構成されている。   The video content receiving device 3020 includes a streaming receiving unit 3021 that receives the summary video stream-transmitted from the video content distributing device 2010, a streaming playback unit 3024 that performs only playback display without accumulating the received video content, and the video content distribution device 2010. A content receiver 3022 that receives the transmitted video content and metadata, a content management unit 3023 that manages the received video content and metadata, a storage device 3027 that stores the video content and metadata, and a storage device 3027 that stores the video content and metadata. A video playback unit 3025 that plays back video content by a playback control method specified by metadata, and a user interface 302 that provides an operation screen display and an interactive operation environment using the operation screen It is constructed from.

<画面の説明>
次に、図3〜図5により、本発明の一実施の形態に係る映像コンテンツ受信装置のユーザインターフェースの表示画面の構成と操作方法について説明する。図3〜図5は、本発明の一実施の形態に係る映像コンテンツ受信装置のユーザインターフェースの表示画面の構成を示す図であり、この例はビデオメールを想定した例である。
<Description of screen>
Next, the configuration and operation method of the display screen of the user interface of the video content receiving apparatus according to the embodiment of the present invention will be described with reference to FIGS. 3 to 5 are diagrams showing the configuration of the display screen of the user interface of the video content receiving apparatus according to the embodiment of the present invention, and this example is an example assuming video mail.

図3(a)を初期画面とする。この画面4001はビデオメールに添付された映像コンテンツのタイトル欄4002とこのタイトルの属性情報を表示する属性情報欄4003とビデオメールの差出人を表示する差出人欄4004とビデオメールの件名を表示する件名欄4005とビデオメールの受信日時を表示する受信日時欄4006と画面に表示しきれない情報をスクロール表示するスクロールバー4007から構成されている。   FIG. 3A is an initial screen. This screen 4001 includes a title column 4002 of video content attached to the video mail, an attribute information column 4003 that displays attribute information of the title, a sender column 4004 that displays the sender of the video mail, and a subject column that displays the subject of the video mail. 4005, a reception date and time column 4006 for displaying the reception date and time of video mail, and a scroll bar 4007 for scrolling and displaying information that cannot be displayed on the screen.

タイトル欄4002には映像コンテンツ配信装置2010からダウンロードが可能なタイトルの候補としてタイトルA4008とタイトルB4009とタイトルC4010とタイトルD4011がサムネイルで表示されている。   Title A 4008, title B 4009, title C 4010, and title D 4011 are displayed as thumbnails in the title column 4002 as title candidates that can be downloaded from the video content distribution apparatus 2010.

属性情報欄4003にはタイトルの属性情報として、動画を表す動画マーク4012やミュージックを表すミュージックマーク4013がこれらの再生時間4014と一緒に表示されている。   In the attribute information column 4003, as a title attribute information, a moving image mark 4012 representing a moving image and a music mark 4013 representing music are displayed together with the reproduction time 4014.

差出人欄4004には差出人の名前4015が表示されている。件名欄4005には件名4016が表示されている。受信日時欄4006には受信日時4017が表示されている。   A sender name 4005 is displayed in the sender field 4004. A subject 4016 is displayed in the subject column 4005. In the reception date / time column 4006, a reception date / time 4017 is displayed.

今、図3(a)の画面4001のタイトルA4008を含む行がハイライトされているとする。この状態でリモコンの「決定」ボタンを押すと、図3(b)の画面に遷移する。この画面にはコマンド表示領域4019が新たに表示されてその中に「要約視聴」ボタン4020と図3(a)の画面へ遷移する「戻る」ボタン4021が表示される。   Assume that the line including the title A 4008 on the screen 4001 in FIG. 3A is highlighted. When the “OK” button on the remote control is pressed in this state, the screen transitions to the screen of FIG. In this screen, a command display area 4019 is newly displayed, and a “summary viewing” button 4020 and a “return” button 4021 for transitioning to the screen of FIG.

この状態で「要約視聴」ボタン4020を選択すると、図4(a)に示す要約映像再生画面5001に遷移してハイライトされたタイトルの要約映像を再生する。この画面には要約映像5002を表示する。画面左下には要約映像の再生制御ボタン群5003を表示する。このボタン群は左から順に「一時停止」ボタン、「停止」ボタン、「再生」ボタンが表示されている。画面中央下には「ダウンロード」ボタン5004と「削除」ボタン5005が表示されている。   When the “summary viewing” button 4020 is selected in this state, the summary video of the highlighted title is reproduced by transitioning to the summary video reproduction screen 5001 shown in FIG. A summary video 5002 is displayed on this screen. A summary video playback control button group 5003 is displayed at the lower left of the screen. In this button group, a “pause” button, a “stop” button, and a “play” button are displayed in order from the left. A “download” button 5004 and a “delete” button 5005 are displayed at the bottom center of the screen.

「ダウンロード」ボタン5004と「削除」ボタン5005は、要約映像を再生している最中でも、要約映像の再生を終了した後でも、好きなタイミングで押すことができる。「ダウンロード」ボタン5004と「削除」ボタン5005の機能は、図4(b)で説明する「ダウンロード」ボタン5007と「削除」ボタン5008と同じものとする。   The “download” button 5004 and the “delete” button 5005 can be pressed at any time during playback of the summary video and after the playback of the summary video. The functions of the “download” button 5004 and the “delete” button 5005 are the same as those of the “download” button 5007 and the “delete” button 5008 described with reference to FIG.

要約映像を全て再生し終えるか、もしくは「停止」ボタンを押すと図4(b)の画面に遷移する。この画面にはコマンド表示領域5006が新たに表示されて、その中に「ダウンロード」ボタン5007と「削除」ボタン5008が表示される。「ダウンロード」ボタン5007を押すと前記タイトルA4008の映像コンテンツをダウンロードする。   When all the summary videos have been reproduced or the “Stop” button is pressed, the screen transitions to the screen of FIG. A command display area 5006 is newly displayed on this screen, and a “download” button 5007 and a “delete” button 5008 are displayed therein. When a “download” button 5007 is pressed, the video content of the title A 4008 is downloaded.

また、「削除」ボタン5008を押すとタイトルA4008を含む1行を削除する。タイトルA4008の映像コンテンツのダウンロードが完了すると、図5に示す映像コンテンツ表示画面6001に遷移して映像コンテンツの表示を開始する。   When a “delete” button 5008 is pressed, one line including the title A 4008 is deleted. When the download of the video content of the title A 4008 is completed, the display transitions to the video content display screen 6001 shown in FIG. 5 and the display of the video content is started.

例えば、図3(a)のタイトル4009は見たくない映像コンテンツだったとする。ただし見たくないかどうかは、タイトルを見ただけでは分からない。「要約視聴」ボタン4020をこのようなときに押すと、図4(a)の画面で要約映像を視聴できるので見たくない映像コンテンツであることが分かる。   For example, it is assumed that the title 4009 in FIG. But if you don't want to see it, you can't tell by just looking at the title. When the “summary viewing” button 4020 is pressed at this time, it can be seen that the video content is not desired because the summary video can be viewed on the screen of FIG.

直に再生制御ボタン群5003の「停止」ボタンを押して図4(b)の画面に遷移してから「削除」ボタン5006を押して見たくない映像コンテンツを削除することができる。   The video content that the user does not want to view can be deleted by pressing the “stop” button of the playback control button group 5003 to change to the screen of FIG. 4B and then pressing the “delete” button 5006.

映像コンテンツ表示画面6001は、映像6002の右側にメッセージ表示領域6010を表示する。メッセージ表示領域6010は上下2段構成となっていて上段にメッセージ6011、下段に映像コンテンツの特定シーンに対応したキーワードリスト6012が表示されている。メッセージ6011には「この連休をハワイで家族と過ごしました。」が表示されている。また、キーワードリスト6012には「息子と散歩」「ホテルで」「空港で」が表示されている。   The video content display screen 6001 displays a message display area 6010 on the right side of the video 6002. The message display area 6010 has an upper and lower two-tier structure, and a message 6011 is displayed in the upper part, and a keyword list 6012 corresponding to a specific scene of the video content is displayed in the lower part. The message 6011 displays “I spent this holiday with my family in Hawaii”. The keyword list 6012 displays “walking with son”, “at hotel”, and “at airport”.

また、画面最下段には再生制御ボタン群6003と映像トラックバー6004が表示されている。再生制御ボタン群6003は「一時停止」ボタン、「停止」ボタン、「戻りジャンプ」ボタン、「再生」ボタン、「送りジャンプ」ボタンから構成されている。トラックバー6004にはチャプタ6006、チャプタ6007、チャプタ6008、チャプタ6009が表示されている。また現在の再生位置6005が表示されている。   Also, a playback control button group 6003 and a video track bar 6004 are displayed at the bottom of the screen. The playback control button group 6003 includes a “pause” button, a “stop” button, a “return jump” button, a “play” button, and a “feed jump” button. In the track bar 6004, a chapter 6006, a chapter 6007, a chapter 6008, and a chapter 6009 are displayed. A current playback position 6005 is displayed.

チャプタ6007は「息子と散歩」と関連付けられている。チャプタ6008は「ホテルで」と関連付けられている。チャプタ6009は「空港で」と関連付けられている。   Chapter 6007 is associated with “walking with son”. Chapter 6008 is associated with “At Hotel”. Chapter 6009 is associated with “At the Airport”.

図5は、キーワードリスト6012から「息子と散歩」を選択した例である。「息子と散歩」を選択すると「息子と散歩」に対応したチャプタ6007から再生が始まる。メッセージ6011は、チャプタに6007に付与したメッセージ「この連休をハワイで家族と過ごしました。」を表示する。映像6002は息子とハワイ海岸で散歩しているシーンになる。   FIG. 5 shows an example in which “walk with son” is selected from the keyword list 6012. When “walk with son” is selected, playback starts from chapter 6007 corresponding to “walk with son”. The message 6011 displays the message “I spent this consecutive holiday with my family in Hawaii” given to the chapter 6007. Video 6002 is a scene of taking a walk with my son on the Hawaiian coast.

<映像コンテンツ受信装置3020の処理フロー>
次に、図6により、本発明の一実施の形態に係る映像コンテンツ受信装置の処理フローについて説明する。図6は本発明の一実施の形態に係る映像コンテンツ受信装置の処理フローである。
<Processing Flow of Video Content Receiving Device 3020>
Next, a processing flow of the video content receiving apparatus according to the embodiment of the present invention will be described with reference to FIG. FIG. 6 is a processing flow of the video content receiving apparatus according to the embodiment of the present invention.

図6は、図2に示す映像コンテンツ受信装置3020にビデオメールの映像コンテンツをダウンロードするまでの処理フローを示している。   FIG. 6 shows a processing flow until the video content of the video mail is downloaded to the video content receiver 3020 shown in FIG.

まず、ステップ7001でビデオメールを起動する。映像コンテンツ受信装置には図3(a)の画面4001が表示される。   First, in step 7001, video mail is activated. A screen 4001 shown in FIG. 3A is displayed on the video content receiving apparatus.

ステップ7002で受信メールリストのタイトル4002とその属性情報4003と差出人4004と件名4005と受信日時4006を見てビデオメールを選択する。   In step 7002, a video mail is selected by looking at the title 4002 of the received mail list, its attribute information 4003, the sender 4004, the subject 4005, and the received date and time 4006.

ステップ7003で図3(b)に示すコマンド表示領域4019に表示された「要約視聴」ボタン4020と「戻る」ボタン4021のどちらかを選択する。もしも「戻る」ボタン4021が選択された場合にはステップ7002に戻る。もしも「要約視聴」ボタン4020が選択された場合にはステップ7004に進む。   In step 7003, one of the “summary viewing” button 4020 and the “return” button 4021 displayed in the command display area 4019 shown in FIG. If the “Return” button 4021 is selected, the process returns to Step 7002. If the “summary viewing” button 4020 is selected, the process proceeds to step 7004.

ステップ7004で映像コンテンツ配信装置2010に要約映像のストリーミング配信を要求する。   In step 7004, the video content distribution apparatus 2010 is requested to perform streaming distribution of the summary video.

ステップ7005で図4(a)に示す要約映像再生画面5001に遷移して要約映像をストリーミング再生する。ただし要約映像をダウンロードしない。   In step 7005, the summary video playback screen 5001 shown in FIG. However, the summary video is not downloaded.

ステップ7006でストリーミング再生が終了するか「停止」ボタンが押されるまで待機する。   In step 7006, the process waits until the streaming reproduction ends or the “stop” button is pressed.

もしもこのどちらかが起こったらステップ7007に進む。   If either of these happens, go to Step 7007.

ステップ7007で図4(b)の画面に遷移して「ダウンロード」ボタン5007と「削除」ボタン5008のどちらかを選択する。もしも「ダウンロード」ボタン5007が選択された場合にはステップ7008に進む。ステップ7008で映像コンテンツ配信装置2010に映像コンテンツの配信を要求する。もしも「削除」ボタン5008が選択された場合にはステップ7009に進む。   In step 7007, the screen is changed to the screen of FIG. 4B and either a “download” button 5007 or a “delete” button 5008 is selected. If the “Download” button 5007 is selected, the process proceeds to Step 7008. In step 7008, the video content distribution apparatus 2010 is requested to distribute video content. If the “Delete” button 5008 is selected, the process proceeds to Step 7009.

ステップ7008では映像コンテンツ配信装置2010からビデオメールの映像コンテンツとメタデータをダウンロードする。ステップ7009では映像コンテンツ配信装置2010に対して映像コンテンツの削除要求を出す。   In step 7008, the video content and metadata of the video mail are downloaded from the video content distribution apparatus 2010. In step 7009, a video content deletion request is issued to the video content distribution apparatus 2010.

尚、ステップ7006において、もしも図4(a)に示す「ダウンロード」ボタン5004か「削除」ボタン5005が押された場合には、図6のフロー図には記載していないが、これらに対応するステップ7008、ステップ7009にジャンプする。   In step 7006, if the “download” button 5004 or the “delete” button 5005 shown in FIG. 4A is pressed, it is not shown in the flowchart of FIG. Jump to Step 7008 and Step 7009.

<映像コンテンツ配信装置2010の処理フロー>
次に、図7により、本発明の一実施の形態に係る映像コンテンツ配信装置の処理フローについて説明する。図7は本発明の一実施の形態に係る映像コンテンツ配信装置の処理フローである。
<Processing Flow of Video Content Distribution Device 2010>
Next, a processing flow of the video content distribution apparatus according to the embodiment of the present invention will be described with reference to FIG. FIG. 7 is a processing flow of the video content distribution apparatus according to the embodiment of the present invention.

まず、ステップ8001で映像コンテンツ管理装置2001からビデオメールを受信する。   First, in step 8001, a video mail is received from the video content management apparatus 2001.

ステップ8002でビデオメールの映像コンテンツとメタデータをストレージ装置2016に保存する。ステップ8003で要約映像を生成する。   In step 8002, the video mail video content and metadata are stored in the storage device 2016. In step 8003, a summary video is generated.

ステップ8004で、もしもビデオメールサービスの加入者から要約映像のストリーミング配信を要求されたら、ステップ8005に進み前記加入者の映像コンテンツ受信装置に要約映像をストリーミング配信する。ここで映像コンテンツ受信装置の機器ID等は特に記載しないが映像コンテンツ配信装置2010が管理しているものとする。   In step 8004, if the video mail service subscriber requests streaming distribution of the summary video, the flow advances to step 8005 to stream the summary video to the subscriber's video content receiving apparatus. Here, the device ID and the like of the video content receiving device are not particularly described, but are assumed to be managed by the video content distribution device 2010.

ステップ8006で、もしもビデオメールサービスの加入者から映像コンテンツの配信を要求されたら、ステップ8007に進み映像コンテンツ受信装置の機器ID等を確認してから映像コンテンツとメタデータを配信する。   In step 8006, if a video mail service subscriber requests distribution of video content, the flow advances to step 8007 to check the device ID of the video content receiving apparatus and distribute the video content and metadata.

ステップ8008で、もしもビデオメールサービスの加入者から映像コンテンツの削除を要求されたら、ステップ8009に進み対象となる映像コンテンツとメタデータを削除する。   In step 8008, if a video mail service subscriber requests deletion of video content, the flow advances to step 8009 to delete the target video content and metadata.

<映像コンテンツ管理装置2001の処理フロー>
次に、図8により、本発明の一実施の形態に係る映像コンテンツ管理装置の処理フローについて説明する。図8は本発明の一実施の形態に係る映像コンテンツ管理装置の処理フローであり、ビデオメールの送信処理を表している。
<Processing Flow of Video Content Management Device 2001>
Next, a processing flow of the video content management apparatus according to the embodiment of the present invention will be described with reference to FIG. FIG. 8 is a processing flow of the video content management apparatus according to the embodiment of the present invention and represents a video mail transmission process.

まず、ステップ9001で撮影した映像コンテンツをストレージ装置2006に保存する。   First, the video content shot in step 9001 is stored in the storage device 2006.

ステップ9002で、撮影した映像コンテンツのメタデータを生成して、ストレージ装置2006に保存する。ここで生成するメタデータは、図5に示すメッセージ6011とキーワードリスト6012に対応する。   In step 9002, metadata of the captured video content is generated and stored in the storage device 2006. The metadata generated here corresponds to the message 6011 and the keyword list 6012 shown in FIG.

ステップ9003で、ビデオメールのあて先(機器ID)と映像コンテンツのタイトルと再生時間と種類とビデオメールの件名を記述したメタデータをストレージ装置2006に保存する。ここで生成したメタデータはステップ9002で生成したメタデータに追加して記入するもとのとする。   In step 9003, metadata describing the destination of the video mail (device ID), the title of the video content, the playback time and type, and the subject of the video mail is stored in the storage device 2006. The metadata generated here is assumed to be added to the metadata generated in step 9002 and entered.

このメタデータに記述された情報は、映像コンテンツと一緒に映像コンテンツ配信装置2010から映像コンテンツ受信装置3020に配信されるとき、図3(a)に示す映像コンテンツ受信装置3020の画面4001に表示されるタイトル4002、属性情報4003、差出人4004、件名4005に対応している。   When the information described in the metadata is distributed together with the video content from the video content distribution apparatus 2010 to the video content reception apparatus 3020, the information is displayed on the screen 4001 of the video content reception apparatus 3020 shown in FIG. Corresponding title 4002, attribute information 4003, sender 4004, and subject 4005.

ステップ9004でストレージ装置2006から映像コンテンツと対応するメタデータを選択して、映像コンテンツ配信装置2010に送信する。   In step 9004, metadata corresponding to the video content is selected from the storage device 2006 and transmitted to the video content distribution device 2010.

<要約生成部2012のソフトウェア構成>
次に、図9により、本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部の詳細なソフトウェア構成について説明する。図9は本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部の詳細なソフトウェア構成を示す図である。
<Software Configuration of Summary Generation Unit 2012>
Next, a detailed software configuration of the summary generation unit of the video content distribution apparatus according to the embodiment of the present invention will be described with reference to FIG. FIG. 9 is a diagram showing a detailed software configuration of the summary generation unit of the video content distribution apparatus according to the embodiment of the present invention.

図9において、要約生成部2012はコンテンツ管理部2013から引き渡された映像コンテンツから音響特徴量を抽出する音響特徴量抽出部10001、映像特徴量を抽出する映像特徴量抽出部10002、特徴量の分布変化を検出する分布変化検出部10003、検出された分布変化を利用して要約映像のメタデータを生成するメタデータ生成部10004から構成されている。メタデータ生成部10004で生成した要約映像のメタデータはコンテンツ管理部2013に引き渡す。   In FIG. 9, the summary generation unit 2012 includes an acoustic feature amount extraction unit 10001 that extracts an acoustic feature amount from video content delivered from the content management unit 2013, a video feature amount extraction unit 10002 that extracts a video feature amount, and a distribution of feature amounts. A distribution change detection unit 10003 for detecting a change and a metadata generation unit 10004 for generating metadata of the summary video using the detected distribution change. The summary video metadata generated by the metadata generation unit 10004 is delivered to the content management unit 2013.

<要約生成部2012の処理フロー>
次に、図10により、本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部の処理フローについて説明する。図10は本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部の処理フローである。
<Processing Flow of Summary Generation Unit 2012>
Next, a processing flow of the summary generation unit of the video content distribution apparatus according to the embodiment of the present invention will be described with reference to FIG. FIG. 10 is a processing flow of the summary generation unit of the video content distribution apparatus according to the embodiment of the present invention.

まず、ステップ11001で要約生成部2012がコンテンツ管理部2013からビデオメールの映像コンテンツを受け取る。   First, in step 11001, the summary generation unit 2012 receives video mail video content from the content management unit 2013.

ステップ11002で音響特徴量抽出部10001が映像コンテンツから音響特徴量を抽出する。   In step 11002, the acoustic feature amount extraction unit 10001 extracts an acoustic feature amount from the video content.

ステップ11003で映像特徴量抽出部10002が映像コンテンツから映像特徴量を抽出する。   In step 11003, the video feature quantity extraction unit 10002 extracts video feature quantities from the video content.

ステップ11004で分布変化検出部10003が特徴量の分布変化を検出する。   In step 11004, the distribution change detection unit 10003 detects a distribution change of the feature amount.

ステップ11005で分布変化検出部10003が特徴量分布の変化点を算出する。   In step 11005, the distribution change detection unit 10003 calculates a change point of the feature amount distribution.

ステップ11006でメタデータ生成部10004がメタデータに変化点の位置と変化点の重要度を記述する。   In step 11006, the metadata generation unit 10004 describes the position of the change point and the importance of the change point in the metadata.

ステップ11007でメタデータをコンテンツ管理部2013に引き渡す。   In step 11007, the metadata is delivered to the content management unit 2013.

<要約生成の具体例>
次に、図11により、本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部による要約生成の具体例について説明する。図11は本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部による要約生成の具体例を説明するための説明図である。
<Specific example of summary generation>
Next, a specific example of summary generation by the summary generation unit of the video content distribution apparatus according to the embodiment of the present invention will be described with reference to FIG. FIG. 11 is an explanatory diagram for explaining a specific example of summary generation by the summary generation unit of the video content distribution apparatus according to the embodiment of the present invention.

尚、図11は録画番組(ドラマ)を例として取り上げたが、ここで説明する要約生成の方法は放送された映像コンテンツ特有の音響特徴や映像特徴を利用しない。それゆえ個人撮影の映像コンテンツにも適用することができる。また、特徴量の抽出方法はこの後で説明する。   Note that although FIG. 11 shows a recorded program (drama) as an example, the summary generation method described here does not use the acoustic features and video features unique to the broadcast video content. Therefore, it can also be applied to video content taken by individuals. Also, a feature amount extraction method will be described later.

図11において、要約生成部2012がコンテンツ管理部2013から受け取った映像コンテンツ12001は、CM(コマーシャル)と主題歌と本編で構成されている。図11の例では、映像コンテンツ12001は、CM12007、CM12008、CM12009を含んでいる。図11は3本のCMを連結して1つのCM区間を構成した例である。   In FIG. 11, the video content 12001 received by the summary generation unit 2012 from the content management unit 2013 is composed of a CM (commercial), a theme song, and a main part. In the example of FIG. 11, the video content 12001 includes CM12007, CM12008, and CM12009. FIG. 11 shows an example in which one CM section is formed by connecting three CMs.

また、映像コンテンツ12001は主題歌12005、主題歌12006を含んでいる。そして、映像コンテンツ12001からCMと主題歌を差引いた残りの部分が本編となる。   The video content 12001 includes a theme song 12005 and a theme song 12006. The remaining part obtained by subtracting the CM and the theme song from the video content 12001 is the main part.

そこで、映像コンテンツ12001をCMと主題歌と本編に分類して、本編以外を黒色でハッチング表示した図が映像コンテンツ12010となる。   Therefore, a video content 12010 is obtained by classifying the video content 12001 into a commercial, a theme song, and a main part, and displaying other than the main part in black.

次に、映像コンテンツ12010の音響信号の周波数特徴に着目して音声と楽曲を同定する。映像コンテンツ12010から音声と楽曲の両方もしくはどちらか一方が重畳した部分とを黒色でハッチング表示すると映像コンテンツ12020となる。以後、音声と楽曲の両方もしくはどちらか一方が重畳した部分を「音声・楽曲区間」と表記する。   Next, paying attention to the frequency characteristics of the audio signal of the video content 12010, the sound and music are identified. If the video content 12010 is hatched and displayed in black from a portion where either or both of audio and music are superimposed, the video content 12020 is obtained. Hereinafter, a portion in which both or one of the voice and the music are superimposed is referred to as “voice / music section”.

図11に明示していないが全く楽曲を含まないCMや全く音声を含まない主題歌があってもよい。   Although not explicitly shown in FIG. 11, there may be a CM that does not include any music or a theme song that does not include any sound.

映像コンテンツ12020はCMに含まれる「音声・楽曲区間」をC1、C2、C3、C4、C5、C6、C7、C8、C9と表記した。本編に含まれる「音声・楽曲区間」をP1、P2、P3、P4、P5、P6、P7、P8、P9、P10、P11、P12、P13と表記した。   In the video content 12020, “audio / music section” included in the CM is expressed as C1, C2, C3, C4, C5, C6, C7, C8, and C9. “Speech / music section” included in the main part is expressed as P1, P2, P3, P4, P5, P6, P7, P8, P9, P10, P11, P12, and P13.

主題歌に含まれる「音声・楽曲区間」をM1、M2と表記した。映像コンテンツ12020に音声と楽曲が重畳した波形の振幅を白色で重ね書きした。   “Speech / music section” included in the theme song is denoted as M1 and M2. The amplitude of the waveform in which audio and music are superimposed on the video content 12020 is overwritten in white.

本編の中で音声あるいは楽曲の振幅が所定の閾値以上になる部分を抽出すると映像コンテンツ12030となる。映像コンテンツ12030では抽出した部分を黒色でハッチング表示して示した。抽出した部分を1つにまとめると要約映像12031となる。   Extracting a part of the main part where the amplitude of the sound or music is greater than or equal to a predetermined threshold value results in video content 12030. In the video content 12030, the extracted portion is indicated by hatching in black. When the extracted parts are combined into one, a summary video 12031 is obtained.

本例は映像コンテンツの音響信号に周波数フィルタを使って音声成分と楽曲成分を抽出した後、両成分の波形を重畳すると重要なシーンの振幅が大きくなり、所定の閾値を越えるという仮説を用いた例である。音響信号の周波数特徴量の例を以下で説明する。   This example uses the hypothesis that if the audio and music components are extracted from the audio signal of the video content using a frequency filter, then the amplitude of the important scene will increase if the waveforms of both components are superimposed and exceed the predetermined threshold. It is an example. An example of the frequency feature amount of the acoustic signal will be described below.

<音響特徴量を抽出する方法>
次に、図12および図13により、本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部での音響特徴量を抽出する方法について説明する。図12および図13は本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部での音響特徴量を抽出する方法を説明するための説明図であり、音響信号から音声を抽出する方法を示している。
<Method for extracting acoustic features>
Next, with reference to FIGS. 12 and 13, a method for extracting an acoustic feature amount in the summary generation unit of the video content distribution apparatus according to the embodiment of the present invention will be described. 12 and 13 are explanatory diagrams for explaining a method of extracting an acoustic feature amount in the summary generation unit of the video content distribution apparatus according to the embodiment of the present invention, and a method of extracting sound from an acoustic signal. Is shown.

図12(a)は音響信号に音声が重畳した周波数スペクトルの例を示している。図12(b)は音響信号に音声が重畳していない周波数スペクトルの例を示している。周波数スペクトルの観測レンジを25kHz(可聴周波数レンジ)とする。   FIG. 12A shows an example of a frequency spectrum in which sound is superimposed on an acoustic signal. FIG. 12B shows an example of a frequency spectrum in which sound is not superimposed on the acoustic signal. The observation range of the frequency spectrum is 25 kHz (audible frequency range).

図12(a)と図12(b)はともに6個の卓越周波数成分(左から順にf1,f2,f3,f4,f5,f6)を持つとする。このうちf1とf2を音声帯域から観測される卓越成分とする。   12 (a) and 12 (b) both have six dominant frequency components (f1, f2, f3, f4, f5, f6 in order from the left). Among these, let f1 and f2 be the dominant components observed from the voice band.

すると卓越周波数成分の中心周波数(f1,f2)が所定の帯域(帯域13011,帯域13012)に含まれていて、かつ、(f1,f2)の応答倍率(Q値)が所定の範囲に入っている場合を音声信号の周波数特徴とする。   Then, the center frequency (f1, f2) of the dominant frequency component is included in the predetermined band (band 13011, band 13012), and the response magnification (Q value) of (f1, f2) is within the predetermined range. Is the frequency characteristic of the audio signal.

図12(a)の音声信号の周波数特徴量を周波数スペクトルパワーを要素とするベクトル量(A1,A2)と表記する。   The frequency feature quantity of the audio signal in FIG. 12A is expressed as a vector quantity (A1, A2) having frequency spectrum power as an element.

例えば、図12(b)はF1のQ値が低すぎたため音声信号とみなされない例である。   For example, FIG. 12B is an example in which the Q value of F1 is too low to be regarded as an audio signal.

図13にQ値の定義を示す。Q値は公知の量であり、共振周波数における周波数スペクトラムのエンベロープの先鋭度を表す。   FIG. 13 shows the definition of the Q value. The Q value is a known quantity and represents the sharpness of the envelope of the frequency spectrum at the resonance frequency.

音声は声帯の振動により発生する。声帯は人体組織で構成されているため組織特異な減衰係数を持つ。この減衰係数がQ値に一定の影響を与えるため、Q値がとり得る値は生態組織特異の値になる。楽曲の特徴量も同様の考え方で抽出できる。   Voice is generated by vibration of the vocal cords. Since the vocal cord is composed of human tissue, it has a tissue-specific attenuation coefficient. Since this attenuation coefficient has a certain influence on the Q value, the value that the Q value can take is a value specific to the ecosystem. The feature amount of music can be extracted in the same way.

このように特徴量はベクトル量で表記されて多次元空間の1点に対応する。本例では音声特徴量のみを取り上げて(A1,A2)と定義した。空間の次元数を拡張すれば同じ方式で映像特徴量も追加できる。映像特徴量としては空間周波数に対応したマザーウェーブレットを用いることができる。   In this way, the feature amount is expressed as a vector amount and corresponds to one point in the multidimensional space. In this example, only the audio feature amount is taken up and defined as (A1, A2). If the number of dimensions in the space is expanded, video features can be added in the same way. As the video feature amount, a mother wavelet corresponding to a spatial frequency can be used.

<音響特徴量に意味を付ける方法>
次に、音響特徴量に意味を付ける方法について説明する。
<Method of giving meaning to acoustic features>
Next, a method for giving meaning to the acoustic feature amount will be described.

可聴帯域の音響信号を発生する声帯の振動を観測するためには25kHzレンジが必要になる。一方、人が様々な音素を発する周期は0.1秒(10Hz)程度で観測できる。   In order to observe the vibration of the vocal cords that generate the audible sound signal, the 25 kHz range is required. On the other hand, the period in which a person emits various phonemes can be observed in about 0.1 seconds (10 Hz).

そこで音響信号の観測周期を0.1秒として観測時の周波数レンジを25kHzレンジとする。音声だけでなく楽曲も含めて、ここでは人が音を聞き分ける時間分解能を10Hzとして説明する。   Therefore, the observation period of the acoustic signal is set to 0.1 second, and the frequency range at the time of observation is set to the 25 kHz range. Here, it is assumed that the time resolution with which a person listens to sound, including not only voice but also music, is 10 Hz.

音響信号を周期0.1秒で観測すると、0.1秒ごとに音声信号の周波数特徴量を収集できる。収集した音声信号の周波数特徴量Tをベクトル量の要素を時間の関数として、以下の数1の式で表記する。   When the acoustic signal is observed at a period of 0.1 second, the frequency feature amount of the voice signal can be collected every 0.1 second. The frequency feature amount T of the collected audio signal is expressed by the following equation 1 using the element of the vector amount as a function of time.

T(t)=(A1(t),A2(t)) …(数1)
ベクトル量の要素をさらに細分化して人物音声(A1)、クラシック音響(A2)、ジャズ音響(A3)、歌謡曲(A4)などと定義する。人物音声の特徴量の場合には上記の特徴量を以下の数2の式で表記できる。
T (t) = (A1 (t), A2 (t)) (Equation 1)
The elements of the vector quantity are further subdivided and defined as human voice (A1), classical sound (A2), jazz sound (A3), pop song (A4) and the like. In the case of a human voice feature quantity, the above feature quantity can be expressed by the following equation (2).

T(t)=(A11(t),A12(t)) …(数2)
また、人物音声とクラシック音響が同時にある場合には、以下の数3の式のようにリストを拡張して表現する。
T (t) = (A11 (t), A12 (t)) (Expression 2)
Further, when human voice and classical sound are present at the same time, the list is expanded and expressed as the following equation (3).

T(t)=((A11(t),A12(t)),
(A21(t),A22(t),A23(t))) …(数3)
例えば、この特徴量を1時間の映像コンテンツ(の音響データ)に適用すると、周期0.1秒ごとに新しい特徴量を収集できるので36000個の特徴量を収集できる。
T (t) = ((A11 (t), A12 (t)),
(A21 (t), A22 (t), A23 (t))) (Equation 3)
For example, when this feature amount is applied to video content (acoustic data thereof) for one hour, a new feature amount can be collected every period of 0.1 seconds, so that 36,000 feature amounts can be collected.

この36000個の特徴量に対して個々の特徴量がどの程度の出現頻度で出現するかを計算する。   The frequency of appearance of individual feature quantities with respect to the 36,000 feature quantities is calculated.

計算結果から出現頻度が高い特徴量と、逆に出現頻度が低い特徴量を抽出する。抽出した結果に対して、以下の(1) 、(2) のように意味を付ける。この意味には厳密性と確実性が無いが、そうなる可能性が高いという程度の信頼性がある。   A feature quantity having a high appearance frequency and a feature quantity having a low appearance frequency are extracted from the calculation result. The extracted results are given meaning as shown in (1) and (2) below. There is no strictness or certainty in this sense, but there is a certain degree of reliability that is likely to happen.

(1) 1つの映像コンテンツの中で出現頻度が高い特徴量を「頻繁に出現した特徴量」と意味付ける。この特徴量をT1と表記する。   (1) A feature quantity having a high appearance frequency in one video content is defined as “a frequently appearing feature quantity”. This feature amount is denoted as T1.

(2) 1つの映像コンテンツの中で出現頻度が低い特徴量を「印象深い特徴量」と意味付ける。この特徴量をT2と表記する。   (2) A feature quantity having a low appearance frequency in one video content is defined as an “impressive feature quantity”. This feature amount is denoted as T2.

次に、複数の映像コンテンツを旅行、懇親会、音楽会などにジャンル分けする。   Next, a plurality of video contents are classified into genres such as travel, social gatherings, and music parties.

1つのジャンルを決めて、そこから抽出される特徴量に対する1つの特徴量の出現頻度を計算する。   One genre is determined, and the appearance frequency of one feature amount with respect to the feature amount extracted therefrom is calculated.

例えば、音楽会の映像コンテンツが30本あったとする。1本あたりの再生時間を1時間と仮定すると合計30時間となる。この映像コンテンツに前述の特徴量を適用すると1080000個の特徴量を収集できる。   For example, it is assumed that there are 30 video contents of a music meeting. Assuming that the reproduction time per one is 1 hour, the total time is 30 hours. When the above-described feature amount is applied to this video content, 1080,000 feature amounts can be collected.

この1080000個の特徴量に対して個々の特徴量がどの程度の出現頻度で出現するかを計算する。   The frequency of appearance of individual feature amounts with respect to the 1080,000 feature amounts is calculated.

計算結果から出現頻度が高い特徴量と、逆に出現頻度が低い特徴量を抽出する。   A feature quantity having a high appearance frequency and a feature quantity having a low appearance frequency are extracted from the calculation result.

抽出した結果に対して、ここでは、例えば以下の(3) 、(4) のように意味を付ける。   Here, for example, the following (3) and (4) are given meanings to the extracted results.

(3) 同一ジャンルの映像コンテンツの中で出現頻度が高い特徴量を「馴染み深い特徴量」と意味付ける。この特徴量をT3と表記する。   (3) A feature quantity that appears frequently in video content of the same genre is defined as a “familiar feature quantity”. This feature amount is denoted as T3.

(4) 同一ジャンルの映像コンテンツの中で出現頻度が低い特徴量「珍しい特徴量」と意味付ける。この特徴量をT4と表記する。   (4) A feature quantity with a low frequency of appearance in video content of the same genre, meaning “unusual feature quantity”. This feature amount is denoted as T4.

このようにして、(1) (T1)、(2) (T2)、(3) (T3)、(4) (T4)の特徴量に意味を付ける。     In this way, the feature quantities of (1) (T1), (2) (T2), (3) (T3), and (4) (T4) are given meaning.

<シーンを抽出してランク付ける方法>
次に、シーンを抽出してランク付ける方法について説明する。
<Method to extract and rank scenes>
Next, a method for extracting and ranking scenes will be described.

下記の手順で、(1) (T1)、(2) (T2)、(3) (T3)、(4) (T4)の特徴量を含むシーンSを抽出して、ランクRを付ける。   The scene S including the feature quantities (1) (T1), (2) (T2), (3) (T3), and (4) (T4) is extracted by the following procedure, and the rank R is assigned.

まず、シーンSを「(1) (T1)、(2) (T2)、(3) (T3)、(4) (T4)の特徴量の内、少なくとも1つの特徴量が所定の個数以上連続して含まれている区間」と定義する。   First, scene S is defined as “(1) (T1), (2) (T2), (3) (T3), (4) (T4). Defined as a section included.

そして1つのシーンSに含まれる前記の(1) (T1)、(2) (T2)、(3) (T3)、(4) (T4)の特徴量の個数をNT1、NT2、NT3、NT4と表記する。   The number of feature quantities (1) (T1), (2) (T2), (3) (T3), (4) (T4) included in one scene S is NT1, NT2, NT3, NT4. Is written.

1つのシーンに含まれる特徴量の個数が最大となる特徴量をこのシーンの代表特徴量とする。   The feature quantity that maximizes the number of feature quantities included in one scene is set as the representative feature quantity of this scene.

例えば、K番目のシーンSKから特徴量T1が最も多く抽出されたとする。K番目のシーンSKから特徴量T1がNT1個連続して抽出された場合には、T1をシーンSKの代表特徴量とする。そしてシーンSKのランクRKをNT1とする。   For example, it is assumed that the feature quantity T1 is extracted most from the Kth scene SK. When NT1 feature values T1 are continuously extracted from the Kth scene SK, T1 is set as the representative feature value of the scene SK. The rank RK of the scene SK is assumed to be NT1.

<映像特徴量を抽出して映像を要約する方法>
次に、図14および図15により、本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部での映像特徴量を抽出して映像を要約する方法について説明する。図14および図15は本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部での映像特徴量を抽出して映像を要約する方法を説明するための説明図である。
<Method for extracting video feature and summarizing video>
Next, with reference to FIGS. 14 and 15, a method of extracting video feature amounts and summarizing video in the summary generation unit of the video content distribution apparatus according to the embodiment of the present invention will be described. 14 and 15 are explanatory diagrams for explaining a method of extracting video feature amounts and summarizing videos in the summary generation unit of the video content distribution apparatus according to the embodiment of the present invention.

映像特徴量の例として、例えば、映像に含まれる画像の空間周波数がある。この空間周波数を顔、人物、動物、車、道、建物、木、山、空などの意味を持つ画像領域と対応付ける。同様にテロップなどの文字に対応付けることもできる。   As an example of the video feature amount, for example, there is a spatial frequency of an image included in the video. This spatial frequency is associated with an image area having a meaning such as a face, a person, an animal, a car, a road, a building, a tree, a mountain, and the sky. Similarly, it can be associated with characters such as telop.

例えば、人の顔は、目、鼻、口などの要素で構成し、各要素は卓越周波数成分を持っている。例えば、目は瞳、白目、まぶたから構成する。まぶたは、円弧状で目玉を上と下から挟み込む構造になっている。   For example, a human face is composed of elements such as eyes, nose, and mouth, and each element has a dominant frequency component. For example, the eyes are composed of pupils, white eyes, and eyelids. The eyelid has an arc shape and has a structure in which the eyeball is sandwiched from above and below.

さらに、まぶたは一重まぶた、二重まぶたなどの特徴を持っている。従って画像を2次元の波形と考えると、目玉は、瞳を中心とした同心円状の局在波形と、上まぶたと下まぶたに対応した円弧状の局在波形を組合せた構造となる。   Furthermore, the eyelid has features such as a single eyelid and a double eyelid. Accordingly, when the image is considered as a two-dimensional waveform, the eyeball has a structure in which a concentric local waveform centered on the pupil and an arc-shaped local waveform corresponding to the upper and lower eyelids are combined.

そして、これらの局在波形は、それぞれが直交する波形素の線形和に級数展開することができる。この直交する波形素の例を図14に示す。波形素は周波数fと方向θで定義される空間周波数を持つ。   These localized waveforms can be expanded into a series of linear sums of waveform elements orthogonal to each other. An example of this orthogonal waveform element is shown in FIG. A waveform element has a spatial frequency defined by a frequency f and a direction θ.

ここで1つの波形素を1つの空間周波数に対応させる。このとき前記級数を構成する項の係数が卓越した項に対応した空間周波数を卓越周波数と呼ぶ。このようにすると例えば目を例としてみても、複数の卓越周波数を発見することができる。   Here, one waveform element is associated with one spatial frequency. At this time, the spatial frequency corresponding to the term in which the coefficient of the term constituting the series is dominant is called the dominant frequency. In this way, for example, even if the eye is taken as an example, a plurality of dominant frequencies can be found.

図15は瞳付近16001から3個の卓越周波数16002,16003,16004を発見した例である。   FIG. 15 shows an example in which three dominant frequencies 16002, 16003, and 16004 are found from the vicinity of the pupil 16001.

従って、前述した<音響特徴量を抽出する方法>と同様に要素数がn個の空間周波数特徴量を空間周波数スペクトルパワーを要素とするベクトル量(A1,A2,...,An)と定義することができる。このように音響特徴量と映像特徴量に同一の定義を適用したことにより、それ以後の<特徴量に意味を付ける方法>と<シーンを抽出してランクを付ける方法>を同様に適用することができる。   Accordingly, the spatial frequency feature quantity having n elements is defined as a vector quantity (A1, A2,..., An) having the spatial frequency spectrum power as an element, as in the above-described <Method for extracting acoustic feature quantity>. can do. By applying the same definition to the acoustic feature quantity and the video feature quantity in this way, the subsequent <method for assigning meaning to feature quantity> and <method for extracting and ranking scenes> are applied in the same manner. Can do.

以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。   As mentioned above, the invention made by the present inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and various modifications can be made without departing from the scope of the invention. Needless to say.

本発明は、映像コンテンツ受信装置、映像コンテンツ配信装置および映像コンテンツ配信方法に関し、テレビジョン受像機のように放送番組などの映像コンテンツを表示する映像コンテンツ視聴端末などにより、ビデオメールなどの映像コンテンツをダウンロードする前に要約だけを視聴して内容を確認する機器に広く適用可能である。   The present invention relates to a video content receiving device, a video content distribution device, and a video content distribution method, and relates to video content such as video mail by a video content viewing terminal that displays video content such as a broadcast program like a television receiver. It can be widely applied to devices that view only the summary before downloading and confirm the contents.

本発明の一実施の形態に係る映像コンテンツ受信装置のハードウェアを示す構成図である。It is a block diagram which shows the hardware of the video content receiver which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ管理装置、映像コンテンツ配信装置、映像コンテンツ受信装置のソフトウェア構成を示す構成図である。It is a block diagram which shows the software structure of the video content management apparatus, video content delivery apparatus, and video content receiving apparatus which concern on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ受信装置のユーザインターフェースの表示画面の構成を示す図である。It is a figure which shows the structure of the display screen of the user interface of the video content receiver which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ受信装置のユーザインターフェースの表示画面の構成を示す図である。It is a figure which shows the structure of the display screen of the user interface of the video content receiver which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ受信装置のユーザインターフェースの表示画面の構成を示す図である。It is a figure which shows the structure of the display screen of the user interface of the video content receiver which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ受信装置の処理フローである。It is a processing flow of the video content receiver which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ配信装置の処理フローである。It is a processing flow of the video content distribution apparatus which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ管理装置の処理フローであり、ビデオメールの送信処理を表している。It is a processing flow of the video content management apparatus which concerns on one embodiment of this invention, and represents the transmission process of a video mail. 本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部の詳細なソフトウェア構成を示す図である。It is a figure which shows the detailed software structure of the summary production | generation part of the video content delivery apparatus concerning one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部の処理フローである。It is a processing flow of the summary production | generation part of the video content delivery apparatus which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部による要約生成の具体例を説明するための説明図である。It is explanatory drawing for demonstrating the specific example of the summary production | generation by the summary production | generation part of the video content delivery apparatus which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部での音響特徴量を抽出する方法を説明するための説明図である。It is explanatory drawing for demonstrating the method to extract the acoustic feature-value in the summary production | generation part of the video content delivery apparatus which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部での音響特徴量を抽出する方法を説明するための説明図である。It is explanatory drawing for demonstrating the method to extract the acoustic feature-value in the summary production | generation part of the video content delivery apparatus which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部での映像特徴量を抽出する方法を説明するための説明図である。It is explanatory drawing for demonstrating the method to extract the video feature-value in the summary production | generation part of the video content delivery apparatus which concerns on one embodiment of this invention. 本発明の一実施の形態に係る映像コンテンツ配信装置の要約生成部での映像特徴量を抽出する方法を説明するための説明図である。It is explanatory drawing for demonstrating the method to extract the video feature-value in the summary production | generation part of the video content delivery apparatus which concerns on one embodiment of this invention.

符号の説明Explanation of symbols

1001…中央制御ユニット(CPU)、1002…ROM、1003…RAM、1004…ネットワークインターフェース、1005…ユーザインターフェースコントローラ、1006…操作部、1007…受光部、1008…表示部、1009…グラフィックコントローラ、1010…VRAM、2001…映像コンテンツ管理装置、2002…ユーザインターフェース、2003…メタデータ生成部、2004…コンテンツ管理部、2005…コンテンツ送信部、2006…ストレージ装置、2010…映像コンテンツ配信装置、2011…コンテンツ受信部、2012…要約生成部、2013…コンテンツ管理部、2014…ストリーミング送信部、2015…コンテンツ送信部、2016…ストレージ装置、3020…映像コンテンツ受信装置、3021…ストリーミング受信部、3022…コンテンツ受信部、3023…コンテンツ管理部、3024…ストリーミング再生部、3025…映像再生部、3026…ユーザインターフェース、3027…ストレージ装置。   DESCRIPTION OF SYMBOLS 1001 ... Central control unit (CPU), 1002 ... ROM, 1003 ... RAM, 1004 ... Network interface, 1005 ... User interface controller, 1006 ... Operation part, 1007 ... Light receiving part, 1008 ... Display part, 1009 ... Graphic controller, 1010 ... VRAM, 2001 ... Video content management device, 2002 ... User interface, 2003 ... Metadata generation unit, 2004 ... Content management unit, 2005 ... Content transmission unit, 2006 ... Storage device, 2010 ... Video content distribution device, 2011 ... Content reception unit , 2012 ... summary generation unit, 2013 ... content management unit, 2014 ... streaming transmission unit, 2015 ... content transmission unit, 2016 ... storage device, 3020 ... video content Tsu receiving apparatus, 3021 ... streaming receiver, 3022 ... content receiving unit, 3023 ... content management unit, 3024 ... streaming playback unit, 3025 ... video reproducing section, 3026 ... user interface, 3027 ... storage device.

Claims (15)

映像コンテンツの要約のストリーミング映像を受信するストリーミング受信部と、
受信したストリーミング映像を再生するストリーミング再生部と、
前記映像コンテンツおよび前記映像コンテンツに関連するメタデータを受信するコンテンツ受信部と、
前記映像コンテンツおよび前記メタデータを管理するコンテンツ管理部と、
前記映像コンテンツを前記メタデータに基づいて再生する映像再生部と、
前記映像コンテンツの選択画面を表示するユーザインターフェースとを備え、
前記ユーザインターフェースにより表示される画面に対する操作者からの操作入力情報による前記映像コンテンツの再生の際、最初に前記映像コンテンツの要約のストリーミング映像を受信して再生した後、前記映像コンテンツを受信して再生することを特徴とする映像コンテンツ受信装置。
A streaming receiver for receiving a streaming video of the video content summary;
A streaming playback unit for playing the received streaming video;
A content receiver for receiving the video content and metadata related to the video content;
A content management unit for managing the video content and the metadata;
A video playback unit for playing back the video content based on the metadata;
A user interface for displaying a selection screen of the video content,
When playing back the video content based on operation input information from the operator on the screen displayed by the user interface, the video content summary is first received and played, and then the video content is received. A video content receiving apparatus for reproducing.
請求項1記載の映像コンテンツ受信装置において、
前記メタデータは、前記映像コンテンツに含まれる複数の代表シーンの再生位置が記録され、
前記映像再生部は、前記メタデータに基づいて、前記代表シーンを連続再生することを特徴とする映像コンテンツ受信装置。
The video content receiving apparatus according to claim 1, wherein
In the metadata, playback positions of a plurality of representative scenes included in the video content are recorded,
The video content receiving apparatus, wherein the video playback unit continuously plays back the representative scene based on the metadata.
請求項1記載の映像コンテンツ受信装置において、
前記ユーザインターフェースは、前記映像コンテンツの一覧表示を表示し、前記一覧表示に対する前記操作者からの前記操作入力情報に基づいて選択された前記映像コンテンツに対して、最初にその選択された映像コンテンツの要約視聴の操作画面を表示することを特徴とする映像コンテンツ受信装置。
The video content receiving apparatus according to claim 1, wherein
The user interface displays a list display of the video content, and for the video content selected based on the operation input information from the operator for the list display, A video content receiving apparatus that displays a summary viewing operation screen.
請求項3記載の映像コンテンツ受信装置において、
前記ユーザインターフェースは、前記映像コンテンツの前記要約視聴の操作画面を表示後、前記操作者からの前記要約視聴の操作画面に対する操作入力情報による前記映像コンテンツの要約のストリーミング映像の再生が終わると、前記映像コンテンツをダウンロードして再生するかまたは削除するかを選択する操作画面を表示することを特徴とする映像コンテンツ受信装置。
The video content receiving apparatus according to claim 3, wherein
The user interface displays the summary viewing operation screen of the video content, and after the reproduction of the streaming video of the video content summary by the operation input information on the summary viewing operation screen from the operator is finished, An image content receiving apparatus that displays an operation screen for selecting whether to download and reproduce or delete a video content.
請求項1記載の映像コンテンツ受信装置において、
前記映像再生部は、映像コンテンツを再生する画面に、前記メタデータに基づいて、前記映像コンテンツの再生時刻、および前記再生時刻に対応したテキスト情報を表示させることを特徴とする映像コンテンツ受信装置。
The video content receiving apparatus according to claim 1, wherein
The video content receiving apparatus, wherein the video playback unit displays a playback time of the video content and text information corresponding to the playback time based on the metadata on a screen for playing back the video content.
映像コンテンツおよび前記映像コンテンツに関連するメタデータを受信するコンテンツ受信部と、
前記映像コンテンツおよび前記メタデータを管理するコンテンツ管理部と、
前記映像コンテンツおよび前記メタデータを保存するストレージ装置と、
前記映像コンテンツの要約となる部分を選択してその再生位置を前記メタデータに記述し、前記映像コンテンツの要約映像を生成する要約生成部と、
前記要約映像をストリーミング送信するストリーミング送信部と、
前記映像コンテンツおよび前記メタデータを送信するコンテンツ送信部とを備え、
前記コンテンツ管理部は、前記映像コンテンツを送信する際、最初に前記映像コンテンツの要約映像をストリーミング送信することを特徴とする映像コンテンツ配信装置。
A content receiver that receives video content and metadata related to the video content;
A content management unit for managing the video content and the metadata;
A storage device for storing the video content and the metadata;
Selecting a portion to be a summary of the video content, describing its playback position in the metadata, and generating a summary video of the video content;
A streaming transmitter for streaming transmission of the summary video;
A content transmission unit that transmits the video content and the metadata;
When transmitting the video content, the content management unit first transmits the summary video of the video content in a streaming manner.
請求項6記載の映像コンテンツ配信装置において、
前記要約生成部は、前記映像コンテンツの音響特徴量を抽出する音響特徴量抽出部を有し、
前記要約生成部は、前記音響特徴量抽出部で抽出された音響特徴量に基づいて、前記映像コンテンツの要約となる部分を選択することを特徴とする映像コンテンツ配信装置。
The video content distribution apparatus according to claim 6.
The summary generation unit includes an acoustic feature amount extraction unit that extracts an acoustic feature amount of the video content,
The video content distribution apparatus, wherein the summary generation unit selects a portion to be a summary of the video content based on the acoustic feature amount extracted by the acoustic feature amount extraction unit.
請求項7記載の映像コンテンツ配信装置において、
前記音響特徴量抽出部は、音声帯域から観測される卓越周波数成分の中心周波数が所定の帯域に含まれていて、かつ、中心周波数における応答倍率が所定の範囲に入っている場合に、この周波数情報を音声信号の周波数特徴として、音響特徴量を抽出することを特徴とする映像コンテンツ配信装置。
The video content distribution apparatus according to claim 7, wherein
The acoustic feature amount extraction unit, when the center frequency of the dominant frequency component observed from the voice band is included in the predetermined band and the response magnification at the center frequency is in the predetermined range, this frequency A video content distribution apparatus that extracts an acoustic feature amount using information as a frequency feature of an audio signal.
請求項8記載の映像コンテンツ配信装置において、
前記音響特徴量抽出部は、前記音響特徴量の出現頻度の情報に基づいて、前記音響特徴量を複数の意味付けされた特徴量として区分けし、
前記要約生成部は、前記意味付けされた特徴量に基づいて、前記映像コンテンツの要約となる部分を選択することを特徴とする映像コンテンツ配信装置。
The video content distribution apparatus according to claim 8, wherein
The acoustic feature amount extraction unit divides the acoustic feature amount into a plurality of meaningful feature amounts based on information on the appearance frequency of the acoustic feature amount,
The video content distribution apparatus, wherein the summary generation unit selects a part to be a summary of the video content based on the meaningful feature amount.
請求項7記載の映像コンテンツ配信装置において、
前記要約生成部は、前記映像コンテンツ内の各シーン内に含まれる前記音響特徴量に基づいて、前記シーンをランク付けし、ランク付けされた前記シーンの情報に基づいて、前記映像コンテンツの要約となる部分を選択することを特徴とする映像コンテンツ配信装置。
The video content distribution apparatus according to claim 7, wherein
The summary generation unit ranks the scene based on the acoustic feature amount included in each scene in the video content, and summarizes the video content based on the ranked scene information. A video content distribution apparatus characterized by selecting a portion to be selected.
請求項6記載の映像コンテンツ配信装置において、
前記要約生成部は、前記映像コンテンツの映像特徴量を抽出する映像特徴量抽出部を有し、
前記要約生成部は、前記映像特徴量抽出部で抽出された映像特徴量に基づいて、前記映像コンテンツの要約となる部分を選択することを特徴とする映像コンテンツ配信装置。
The video content distribution apparatus according to claim 6.
The summary generation unit includes a video feature amount extraction unit that extracts a video feature amount of the video content,
The video content distribution apparatus, wherein the summary generation unit selects a portion to be a summary of the video content based on the video feature value extracted by the video feature value extraction unit.
請求項6または11記載の映像コンテンツ配信装置において、
特徴量の分布変化を検出する分布変化検出部を有し、
前記要約生成部は、前記分布変化検出部で検出された分布変化の情報に基づいて、前記映像コンテンツの要約となる部分を選択することを特徴とする映像コンテンツ配信装置。
The video content distribution apparatus according to claim 6 or 11,
It has a distribution change detector that detects the distribution change of the feature quantity
The video content distribution apparatus, wherein the summary generation unit selects a portion to be a summary of the video content based on information on a distribution change detected by the distribution change detection unit.
映像コンテンツ配信装置から映像コンテンツ受信装置へ映像コンテンツを配信する映像コンテンツ配信方法であって、
前記映像コンテンツ受信装置からの前記映像コンテンツの配信要求に対して、最初に前記映像コンテンツの要約映像をストリーミング送信することを特徴とする映像コンテンツ配信方法。
A video content distribution method for distributing video content from a video content distribution device to a video content reception device,
In response to a request for distribution of the video content from the video content receiving apparatus, first, a summary video of the video content is transmitted by streaming.
請求項13記載の映像コンテンツ配信方法において、
前記要約映像は、前記映像コンテンツの音響特徴量に基づいて、前記映像コンテンツの要約となる部分が選択されて生成されることを特徴とする映像コンテンツ配信方法。
The video content distribution method according to claim 13.
The video content distribution method, wherein the summary video is generated by selecting a portion to be a summary of the video content based on an acoustic feature amount of the video content.
請求項13記載の映像コンテンツ配信方法において、
前記要約映像は、前記映像コンテンツの映像特徴量に基づいて、前記映像コンテンツの要約となる部分が選択されて生成されることを特徴とする映像コンテンツ配信方法。
The video content distribution method according to claim 13.
The video content distribution method, wherein the summary video is generated by selecting a portion to be a summary of the video content based on a video feature amount of the video content.
JP2008129124A 2008-05-16 2008-05-16 Video content reception device, video content distribution apparatus and video content distribution method Withdrawn JP2009278481A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008129124A JP2009278481A (en) 2008-05-16 2008-05-16 Video content reception device, video content distribution apparatus and video content distribution method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008129124A JP2009278481A (en) 2008-05-16 2008-05-16 Video content reception device, video content distribution apparatus and video content distribution method

Publications (1)

Publication Number Publication Date
JP2009278481A true JP2009278481A (en) 2009-11-26

Family

ID=41443469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008129124A Withdrawn JP2009278481A (en) 2008-05-16 2008-05-16 Video content reception device, video content distribution apparatus and video content distribution method

Country Status (1)

Country Link
JP (1) JP2009278481A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101401400B1 (en) 2013-05-16 2014-06-02 전자부품연구원 Method for providing preview in digital cinema system
RU2597232C1 (en) * 2014-08-20 2016-09-10 Сяоми Инк. Method for providing a video in real time and device for its implementation, as well as a server and a terminal device
JP2021100201A (en) * 2019-12-23 2021-07-01 横河電機株式会社 Device, system, method, and program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001320686A (en) * 2000-05-02 2001-11-16 Sony Corp Video contents distribution system, video contents distribution method, video contents distribution server and video contents reception terminal
JP2004208250A (en) * 2002-12-24 2004-07-22 I Next:Kk Video file transmission / reception system
JP2007017245A (en) * 2005-07-07 2007-01-25 Hitachi Ltd A method for mitigating stress corrosion cracking in nuclear plant structural materials.

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001320686A (en) * 2000-05-02 2001-11-16 Sony Corp Video contents distribution system, video contents distribution method, video contents distribution server and video contents reception terminal
JP2004208250A (en) * 2002-12-24 2004-07-22 I Next:Kk Video file transmission / reception system
JP2007017245A (en) * 2005-07-07 2007-01-25 Hitachi Ltd A method for mitigating stress corrosion cracking in nuclear plant structural materials.

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101401400B1 (en) 2013-05-16 2014-06-02 전자부품연구원 Method for providing preview in digital cinema system
RU2597232C1 (en) * 2014-08-20 2016-09-10 Сяоми Инк. Method for providing a video in real time and device for its implementation, as well as a server and a terminal device
KR101680714B1 (en) * 2014-08-20 2016-11-29 시아오미 아이엔씨. Method for providing real-time video and device thereof as well as server, terminal device, program, and recording medium
US9788065B2 (en) 2014-08-20 2017-10-10 Xiaomi Inc. Methods and devices for providing a video
JP2021100201A (en) * 2019-12-23 2021-07-01 横河電機株式会社 Device, system, method, and program
JP7205457B2 (en) 2019-12-23 2023-01-17 横河電機株式会社 Apparatus, system, method and program

Similar Documents

Publication Publication Date Title
US12028577B2 (en) Apparatus, systems and methods for generating an emotional-based content recommendation list
US10779016B2 (en) Apparatus, systems and methods for a content commentary community
TWI474200B (en) Scene clip playback system, method and recording medium
KR20060131981A (en) How to create content items with specific emotional impacts on users
KR20110070790A (en) Content providing server, content reproducing apparatus, content providing method, content playing method, program and content providing system
JP2007336283A (en) Information processing apparatus, information processing method, and information processing program
JP4925938B2 (en) Digest video information creation method, digest video information creation program, and video apparatus
JP2009296346A (en) Program recommendation device, method for recommending program and program for recommending program
KR101099474B1 (en) Recording playback device
EP1510076A1 (en) Presentation synthesizer
JP2008178090A (en) Video processing apparatus
JP5306550B2 (en) Video analysis information transmitting apparatus, video analysis information distribution system and distribution method, video viewing system and video viewing method
JP5209129B1 (en) Information processing apparatus, broadcast receiving apparatus, and information processing method
JP2009278481A (en) Video content reception device, video content distribution apparatus and video content distribution method
JP2022117505A (en) Content correction device, content distribution server, content correction method, content correction program, and storage medium
JP2003189218A (en) Recording and playback device
JP2015119286A (en) Content server, content playback apparatus, content playback control method, and content playback control program
JP2004364182A (en) Content playback control method, content playback control system, server device, content playback control device, and content playback control program
CA3237182A1 (en) Systems and methods to enhance segment during trick play
JP2002290954A (en) Device and method for specifying summary video, and video terminal
JPWO2019176590A1 (en) Information processing equipment, information processing equipment and programs
JP7365195B2 (en) karaoke system
JP2013229855A (en) Broadcast receiving apparatus, information processing apparatus, and information processing method
JP2008252916A (en) Summary video generation apparatus, summary video generation method, and program
JP4796466B2 (en) Content management server, content presentation device, content management program, and content presentation program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110404

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120928

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20130207