WO2018155353A1

WO2018155353A1 - 生成方法、生成装置、再生方法および再生システム

Info

Publication number: WO2018155353A1
Application number: PCT/JP2018/005615
Authority: WO
Inventors: 旭谷口; 敦宏辻; 幸　裕弘; 坂井　剛; 羊佑塩田; 浩充森下
Original assignee: パナソニックＩｐマネジメント株式会社
Priority date: 2017-02-21
Filing date: 2018-02-19
Publication date: 2018-08-30

Abstract

コンピュータを用いてコンテンツを生成する生成方法であって、所定の音を示す音データを取得し（Ｓ１１）、取得した音データにより示される所定の音が、再生装置（１００）に設定されている設定音量を超えた音量で当該再生装置（１００）により出力されるのを禁止するために用いられる制御情報であって、所定の音の最大音量を示す最大音量情報を含む制御情報の入力を受け付け（Ｓ１２）、取得した音データと、入力を受け付けた制御情報とを関連付けることによりコンテンツを生成する（Ｓ１３）。

Description

生成方法、生成装置、再生方法および再生システム

　本開示は、コンテンツを生成する生成方法および生成装置、コンテンツを再生する再生方法および再生システムに関する。

　特許文献１には、ＶＯＤ（Ｖｉｄｅｏ　Ｏｎ　Ｄｅｍａｎｄ）配信における、映像配信装置および映像再生装置が開示されている。

特開２０１５－２２２８６１号公報

　本開示は、再生装置がユーザに与える不快感を低減することができる生成方法などを提供する。

　本開示における生成方法は、コンピュータを用いてコンテンツを生成する生成方法であって、所定の音を示す音データを取得し、取得した前記音データにより示される前記所定の音が、再生装置に設定されている設定音量を超えた音量で当該再生装置により出力されるのを禁止するために用いられる制御情報であって、前記所定の音の最大音量を示す最大音量情報を含む制御情報の入力を受け付け、取得した前記音データと、前記入力を受け付けた前記制御情報とを関連付けることによりコンテンツを生成する。

　なお、これらの全般的または具体的な態様は、システム、装置、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なＣＤ－ＲＯＭなどの記録媒体で実現されてもよく、システム、装置、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

　本開示における方法は、再生装置がユーザに与える不快感を低減することができる。

図１は、実施の形態に係る再生システムの概略図である。図２は、再生装置のハードウェア構成の一例を示すブロック図である。図３は、サーバのハードウェア構成の一例を示すブロック図である。図４は、生成装置のハードウェア構成の一例を示すブロック図である。図５は、実施の形態に係る再生システムの機能構成の一例を示すブロック図である。図６は、実施の形態における生成装置のディスプレイに表示されるＵＩの一例を示す図である。図７は、コンテンツの構成の一例を示す図である。図８は、コンテンツの音量の再生時間における時間的変化を示す図である。図９は、コンテンツを再生装置で再生した場合に出力される再生音量の再生時間における時間的変化を示す図である。図１０は、第３の再生制御を行った場合に出力される再生音量の再生時間における時間的変化を示す図である。図１１は、第４の再生制御を行った場合に出力される再生音量の再生時間における時間的変化を示す図である。図１２は、実施の形態に係る生成装置による生成方法の一例を示すフローチャートである。図１３は、実施の形態に係る再生装置による再生方法の一例を示すフローチャートである。図１４は、実施の形態に係る再生装置の再生部による再生処理の詳細の一例を示すフローチャートである。図１５は、実施の形態に係る再生装置の再生部による再生処理の詳細の他の一例を示すフローチャートである。

　以下、適宜図面を参照しながら、実施の形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。

　なお、発明者は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。

　（実施の形態）
　以下、図１～図１５を用いて、実施の形態を説明する。

　［１－１．構成］
　図１は、実施の形態に係る再生システムの概略図である。

　具体的には、図１において、再生装置１００、サーバ２００、通信ネットワーク３００、および生成装置４００が示されている。例えば、再生システム１は、これらの構成要素のうち、再生装置１００およびサーバ２００を備える。また、再生システム１は、さらに、生成装置４００を備えていてもよい。なお、再生システム１では、複数の再生装置１００が通信ネットワーク３００に接続されていてもよい。また、再生システム１では、複数の生成装置４００が通信ネットワーク３００に接続されていてもよい。

　再生システム１は、サーバ２００から再生装置１００に、互いに独立した映像コンテンツおよび音コンテンツの組合せにより構成されるコンテンツを第１のユーザに提供するためのシステムである。１つの再生装置１００には、１人の第１のユーザが対応していてもよいし、複数人の第１のユーザが対応してもよい。再生システム１が複数の再生装置１００を含む場合、複数の再生装置１００それぞれには、複数人の第１のユーザが１対１で対応していてもよいし、１対多で対応していてもよい。また、複数の再生装置１００は、１人の第１のユーザに対応していてもよい。同様に、１つの生成装置４００には、１人の第２のユーザが対応していてもよいし、複数人の第２のユーザが対応してもよい。再生システム１が複数の生成装置４００を含む場合、複数の生成装置４００それぞれには、複数人の第２のユーザが１対１で対応していてもよいし、１対多で対応していてもよい。また、複数の生成装置４００は、１人の第２のユーザに対応していてもよい。サーバ２００には、例えば、コンテンツの作者などの第２のユーザから生成装置４００を介して映像コンテンツまたは音コンテンツが提供されている。

　以下、上記再生処理を行うための再生システム１の構成について具体的に説明する。

　次に、再生装置１００のハードウェア構成について図２を用いて説明する。

　図２は、再生装置のハードウェア構成の一例を示すブロック図である。

　図２に示すように、再生装置１００は、ハードウェア構成として、ＣＰＵ１０１（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）と、メインメモリ１０２と、ストレージ１０３と、通信ＩＦ（Ｉｎｔｅｒｆａｃｅ）１０４と、ディスプレイ１０５と、スピーカ１０６とを備える。

　ＣＰＵ１０１は、ストレージ１０３等に記憶された制御プログラムを実行するプロセッサである。

　メインメモリ１０２は、ＣＰＵ１０１が制御プログラムを実行するときに使用するワークエリアとして用いられる揮発性の記憶領域である。

　ストレージ１０３は、制御プログラム、コンテンツなどを保持する不揮発性の記憶領域である。

　通信ＩＦ１０４は、通信ネットワーク３００を介してサーバ２００と通信する通信インタフェースである。通信ＩＦ１０４は、例えば、有線ＬＡＮインタフェースである。なお、通信ＩＦ１０４は、無線ＬＡＮインタフェースであってもよい。また、通信ＩＦ１０４は、ＬＡＮインタフェースに限らずに、通信ネットワーク３００との通信接続を確立できる通信インタフェースであれば、どのような通信インタフェースであってもよい。

　ディスプレイ１０５は、ＣＰＵ１０１での処理結果を表示する表示装置である。ディスプレイ１０５は、例えば、映像コンテンツを再生することで得られる映像を表示する。ディスプレイ１０５は、例えば、液晶ディスプレイ、有機ＥＬディスプレイである。

　スピーカ１０６は、ＣＰＵ１０１での処理結果を出力する。スピーカ１０６は、例えば、音コンテンツを再生することで得られる音または音楽を出力する。

　サーバ２００のハードウェア構成について図３を用いて説明する。

　図３は、サーバのハードウェア構成の一例を示すブロック図である。

　図３に示すように、サーバ２００は、ハードウェア構成として、ＣＰＵ２０１（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）と、メインメモリ２０２と、ストレージ２０３と、通信ＩＦ（Ｉｎｔｅｒｆａｃｅ）２０４とを備える。

　ＣＰＵ２０１は、ストレージ２０３等に記憶された制御プログラムを実行するプロセッサである。

　メインメモリ２０２は、ＣＰＵ２０１が制御プログラムを実行するときに使用するワークエリアとして用いられる揮発性の記憶領域である。

　ストレージ２０３は、制御プログラム、コンテンツなどを保持する不揮発性の記憶領域である。

　通信ＩＦ２０４は、通信ネットワーク３００を介して再生装置１００または生成装置４００と通信する通信インタフェースである。通信ＩＦ２０４は、例えば、有線ＬＡＮインタフェースである。なお、通信ＩＦ２０４は、無線ＬＡＮインタフェースであってもよい。また、通信ＩＦ２０４は、ＬＡＮインタフェースに限らずに、通信ネットワーク３００との通信接続を確立できる通信インタフェースであれば、どのような通信インタフェースであってもよい。

　生成装置４００のハードウェア構成について図４を用いて説明する。

　図４は、生成装置のハードウェア構成の一例を示すブロック図である。

　図４に示すように、生成装置４００は、ハードウェア構成として、ＣＰＵ４０１（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）と、メインメモリ４０２と、ストレージ４０３と、通信ＩＦ（Ｉｎｔｅｒｆａｃｅ）４０４と、入力ＩＦ（Ｉｎｔｅｒｆａｃｅ）４０５と、ディスプレイ４０６とを備える。

　ＣＰＵ４０１は、ストレージ４０３等に記憶された制御プログラムを実行するプロセッサである。

　メインメモリ４０２は、ＣＰＵ４０１が制御プログラムを実行するときに使用するワークエリアとして用いられる揮発性の記憶領域である。

　ストレージ４０３は、制御プログラム、コンテンツなどを保持する不揮発性の記憶領域である。

　通信ＩＦ４０４は、通信ネットワーク３００を介してサーバ２００と通信する通信インタフェースである。通信ＩＦ４０４は、例えば、有線ＬＡＮインタフェースである。なお、通信ＩＦ４０４は、無線ＬＡＮインタフェースであってもよい。また、通信ＩＦ４０４は、ＬＡＮインタフェースに限らずに、通信ネットワーク３００との通信接続を確立できる通信インタフェースであれば、どのような通信インタフェースであってもよい。

　入力ＩＦ４０５は、例えば、テンキー、キーボード、マウスなどの入力装置である。

　ディスプレイ４０６は、例えば、ＣＰＵ４０１での処理結果を表示する表示装置である。ディスプレイ４０６は、例えば、入力ＩＦ４０５による入力を受け付けるためのＵＩ（Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ）を表示する。ディスプレイ４０６は、例えば、液晶ディスプレイ、有機ＥＬディスプレイである。

　次に、再生システム１の機能構成について図５を用いて説明する。

　図５は、実施の形態に係る再生システムの機能構成の一例を示すブロック図である。

　まず、生成装置４００の機能構成について説明する。

　生成装置４００は、データベース（ＤＢ）４１０と、取得部４２０と、入力受付部４３０と、生成部４４０と、通信部４５０とを備える。

　データベース４１０は、映像コンテンツの元となる映像データ、または、音コンテンツの元となる音データを記憶している。データベース４１０は、例えば、ストレージ４０３により実現される。

　取得部４２０は、入力受付部４３０に受け付けられた第２のユーザによる入力に応じて、データベース４１０から所定の音を示す音データを取得する。取得部４２０は、入力受付部４３０に受け付けられた第２のユーザによる入力に応じて、データベース４１０から映像データを取得してもよい。なお、取得部４２０は、音データまたは映像データを、データベース４１０から取得することに限らずに、通信部４５０を用いて、通信ネットワーク３００を介して他の情報処理装置から取得してもよいし、有線接続または無線接続された他の情報処理装置から直接取得してもよい。この場合の他の情報処理装置は、例えば、ＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）、サーバ、スマートフォン、タブレット端末、ビデオカメラ、デジタルカメラ、ＩＣレコーダなどである。取得部４２０は、例えば、ＣＰＵ４０１、メインメモリ４０２、およびストレージ４０３により実現される。

　入力受付部４３０は、第２のユーザによる入力を受け付ける。入力受付部４３０は、具体的には、第２のユーザがデータベース４１０に記憶されている映像データまたは音データからコンテンツを生成するための入力を受け付ける。入力受付部４３０は、コンテンツを生成するための入力として、コンテンツの制御情報の入力を受け付ける。

　入力受付部４３０が受け付けるコンテンツの制御情報は、例えば、取得部４２０により取得された音データにより示される所定の音が、再生装置１００に設定されている設定音量を超えた音量で当該再生装置１００により出力されるのを禁止するために用いられ、所定の音の最大音量を示す最大音量情報を含む。

　入力受付部４３０が受け付けるコンテンツの制御情報は、例えば、音データの音量の調節を許可するか否かを示す属性情報をさらに含んでいてもよい。そして、この場合の制御情報は、当該制御情報が含む最大音量情報で示される最大音量が設定音量を超えている場合、以下の再生制御を再生装置１００に行わせる情報である。この場合の再生制御は、当該制御情報が含む属性情報が音量の調節を許可することを示す場合、当該制御情報と関連付けられた音データの所定の音の音量を設定音量以下に低下させた状態で、所定の音を出力させる第２の再生制御である。また、再生制御は、当該制御情報が含む属性情報が音量の調節を許可しないことを示す場合、当該制御情報と関連付けられた音データが再生装置１００により再生されることを禁止する第１の再生制御である。再生装置１００は、この制御情報に応じてコンテンツを再生した場合、属性情報が音量の調節を許可することを示す場合、第２の再生制御を行い、属性情報が音量の調節を許可しないことを示す場合、第１の再生制御を行う。このように、第２のユーザにより設定された属性情報に応じて、再生装置１００に第１の再生制御および第２の再生制御を選択的に切り替えて行わせることができる。

　なお、第２の再生制御は、第３の再生制御および第４の再生制御を含んでいてもよい。つまり、第２の再生制御の代わりに第３の再生制御が行われてもよいし、第４の制御が行われてもよい。

　また、入力受付部４３０が受け付けるコンテンツの制御情報は、（ｉ）音データの全体の音量の調節を許可する、（ｉｉ）音データの一部の音量の調節を許可する、および（ｉｉｉ）音データの音量の調節を許可しないのいずれかを示す属性情報をさらに含んでいてもよい。そして、この場合の制御情報は、当該制御情報が含む最大音量情報で示される最大音量が設定音量を超えている場合、以下の再生制御を再生装置１００に行わせる情報である。この場合の再生制御は、当該制御情報が含む属性情報が音データの全体の音量の調節を許可することを示す場合、当該制御情報と関連付けられた音データの所定の音の音量において、当該制御情報が含む平均音量情報で示される平均音量を、当該制御情報が含む最大音量情報で示される最大音量が設定音量以下となるまで低下させた状態で、所定の音を出力させる第３の再生制御である。また、再生制御は、当該制御情報が含む属性情報が音データの一部の音量の調節を許可する場合、当該制御情報と関連付けられた音データの所定の音における設定音量を超えている部分の音量を設定音量以下に低下させた状態で、所定の音を出力させる第４の再生制御である。また、再生制御は、当該制御情報が含む属性情報が音量の調節を許可しないことを示す場合、当該制御情報と関連付けられた音データが再生装置１００により再生されることを禁止する第１の再生制御である。

　入力受付部４３０が受け付けるコンテンツの制御情報は、例えば、当該制御情報が含む最大音量情報で示される最大音量が設定音量を超えている場合、当該制御情報と関連付けられた音データが再生装置１００により再生されることを禁止するための情報であってもよい。再生装置１００は、この制御情報に応じてコンテンツを再生した場合、最大音量が設定音量を超えているコンテンツの再生を行わない第１の再生制御を行う。このため、コンテンツに含まれる所定の音が、再生装置１００に設定されている設定音量を超えた音量で当該再生装置１００により出力されるのを抑制できる。

　また、入力受付部４３０が受け付けるコンテンツの制御情報は、例えば、当該制御情報が含む最大音量情報で示される最大音量が設定音量を超えている場合、当該制御情報と関連付けられた音データの所定の音の音量を設定音量以下に低下させた状態で、所定の音を出力させる再生制御を再生装置１００に行わせるための情報であってもよい。再生装置１００は、この制御情報に応じてコンテンツを再生した場合、最大音量が設定音量を超えているコンテンツの音量を設定音量以下に低下させてコンテンツを再生する第２の再生制御を行う。このため、コンテンツに含まれる所定の音が、再生装置１００に設定されている設定音量を超えた音量で当該再生装置１００により出力されるのを抑制できる。

　また、入力受付部４３０が受け付けるコンテンツの制御情報は、例えば、音データの所定の音の平均音量を示す平均音量情報をさらに含んでいてもよい。そして、この場合の制御情報は、当該制御情報が含む最大音量情報で示される最大音量が設定音量を超えている場合、当該制御情報と関連付けられた音データの所定の音の音量において、当該制御情報が含む平均音量情報で示される平均音量を最大音量が設定音量以下となるまで低下させた状態で、所定の音を出力させる再生制御を、再生装置１００に行わせるための情報であってもよい。再生装置１００は、この制御情報に応じてコンテンツを再生した場合、最大音量が設定音量以下となるまでコンテンツの平均音量を低下させてコンテンツを再生する第３の再生制御を行う。このため、コンテンツに含まれる所定の音が、再生装置１００に設定されている設定音量を超えた音量で当該再生装置１００により出力されるのを抑制できる。

　また、入力受付部４３０が受け付けるコンテンツの制御情報は、例えば、当該制御情報が最大音量情報で示される最大音量が設定音量を超えている場合、当該制御情報と関連付けられた音データの所定の音における設定音量を超えている部分の音量を設定音量以下に低下させた状態で、所定の音を出力させる再生制御を、再生装置１００に行わせるための情報である。なお、この制御情報は、当該制御情報と関連付けられた音データの所定の音における設定音量を超えていない部分については、音量の調節を行わずにコンテンツを再生させるための情報である。再生装置１００は、この制御情報に応じてコンテンツを再生した場合、所定の音において、設定音量を超えている部分の音量を設定音量以下に低下させてコンテンツを再生する第４の再生制御を行う。このため、コンテンツに含まれる所定の音が、再生装置１００に設定されている設定音量を超えた音量で当該再生装置１００により出力されるのを抑制できる。

　なお、コンテンツの制御情報は、上記で説明した情報の他に、例えば、コンテンツのメタデータ（つまり属性情報）を含んでいてもよい。メタデータは、１つのコンテンツに対して１セット存在するものであり、再生時間、作者、アンビエント度、映像アンビエント度、又は、音アンビエント度、コンテンツのジャンルの各情報を含む。アンビエント度、映像アンビエント度、および、音アンビエント度の詳細は後述する。

　再生時間は、当該コンテンツが再生される際の時間長を示す情報である。

　作者は、当該コンテンツの作者を示す情報であり、作者の氏名、連絡先を示す情報などを含む情報である。

　アンビエント度は、当該コンテンツに紐付けられるアンビエント度である。

　映像アンビエント度は、当該コンテンツに含まれる映像部分に紐付けられるアンビエント度である。

　音アンビエント度は、当該コンテンツに含まれる音部分に紐付けられるアンビエント度である。

　このように、コンテンツのアンビエント度等は、メタデータによって設定され得る。

　メタデータは、予め定められたフォーマットで作成されている。指標は、メタデータのフォーマットに従ってメタデータを解析することにより得られる。指標は、コンテンツに紐付けられる指標であって、連続値により表現される指標である。指標の一例は、再生されているコンテンツに対してユーザが向ける注意の度合いを示す推定指標である。より具体的には、上記指標は、再生されているコンテンツに対してユーザが向ける注意の度合いが大きいほど、より小さな値を有する指標である指標、又は、再生されているコンテンツに対してユーザが向ける注意の度合いが大きいほど、より大きな値を有する指標を採用し得る。ここで、前者をアンビエント度（Ａｍｂｉｅｎｔ　ｌｅｖｅｌ）ともいい、後者をコンシャス度（Ｃｏｎｓｉｏｕｓ　ｌｅｖｅｌ）ともいう。ユーザが向ける注意の度合いが大きいほど、例えば、そのコンテンツの再生時間の最初から最後まで映像が表示されている画面を注視し続け、かつ、出力されている音を集中して視聴することがより適していると言える。

　なお、指標として、再生されているコンテンツに含まれる映像の色彩に関する指標である明度、彩度若しくは色相などを含んでもよいし、再生されているコンテンツに含まれる音の指標である音量若しくは周波数分布などを含んでもよい。さらに、指標として、これらの複数の指標から所定の算出方法によって算出される指標を含んでいてもよい。

　以降では、指標としてアンビエント度を用いて説明するが、コンシャス度、及び、その他の指標を用いても同様の説明が成立する。また、アンビエント度は、例えば０から１００までの連続値に表現される指標であるとする。アンビエント度が０である場合、ユーザが向けると推定される注意の度合いが最も大きいことを意味し、アンビエント度が１００である場合、ユーザが向けると推定される注意の度合いが最も小さいことを意味するとする。

　コンテンツに紐付けられるアンビエント度は、コンテンツの映像部分に紐付けられるアンビエント度である映像アンビエント度と、コンテンツの音部分に紐付けられるアンビエント度である音アンビエント度と、から算出され得る。なお、映像アンビエント度は、映像指標の一例である。音アンビエント度は、音指標の一例である。

　映像アンビエント度は、例えば、コンテンツの映像の明度、彩度若しくは色相、又は、シーンチェンジの態様に基づいて算出されてもよい。より具体的には、以下のように算出される。

　・コンテンツの映像の明度が高いほど、より低いアンビエント度が算出される。

　・コンテンツの映像の彩度が高いほど、より低いアンビエント度が算出される。

　・コンテンツの映像の色彩に基づいて、赤、橙又は黄のような暖色の色が多いほど、より高いアンビエントが算出され、青又は紫のような寒色の色が多いほど、より低いアンビエント度が算出される。

　・映像のシーンチェンジが多いほど、より低いアンビエント度が算出される。

　・シーンチェンジの際の映像の切り替えの態様として、一のシーンからその次のシーンへの切り替えの際に、フェードアウト、フェードイン又はクロスフェードのように画像が徐々に切り変わることが多いほど、より高いアンビエント度が算出される。一のシーンからその次のシーンへの切り替えの際に、画像が急に切り替えられることが多いほど、より低いアンビエント度が算出される。

　また、音アンビエント度は、例えば、コンテンツの音の音量、音の周波数分布、又は、音量の変化の態様に基づいて音アンビエント度が算出されてもよい。より具体的には、以下のように算出される。

　・コンテンツの音の音量が大きいほど、より低いアンビエント度が算出される。

　・コンテンツの音の周波数分布について、高音域（例えば１ｋＨｚ～２０ｋＨｚ程度）又は低音域（例えば２０Ｈｚ～２００Ｈｚ程度）の音が多いほど、より高いアンビエント度が算出され、中音域（例えば２００Ｈｚ～１ｋＨｚ程度）が多いほど、より低いアンビエント度が算出される。

　・音量の変化が急峻であるほど、より低いアンビエント度が算出される。

　なお、映像アンビエント度と音アンビエント度とからコンテンツのアンビエント度を算出する方法は、任意の方法を採用し得るが、例えば、平均又は加重平均を用いることができる。例えば、加重平均の重みを０から１までの範囲とし、映像アンビエント度の重みをαとすると、コンテンツのアンビエント度は、下記（式１）のように表わされる。

　コンテンツのアンビエント度
　　＝α×（映像アンビエント度）＋（１－α）×（音アンビエント度）　　　（式１）

　ここで、映像アンビエント度と音アンビエントとの重み付けは、例えば、以下のように定められる。

　（１）音アンビエント度の重みを大きくする場合
　一般に人が、再生装置１００等が提示する映像に対して意図的に注意を向けないようにするには、目を瞑る、又は、目若しくは身体の向きを変えること等をすればよく、比較的容易である。一方、人が、再生装置１００等が提示する音に対して意図的に注意を向けないようにするには、耳を塞ぐなどの方法があり得るが、あまり容易ではなく、また仮に耳を塞いだとしても完全にユーザが感ずる音をなくすことは難しい。従って、ユーザは、コンテンツの映像部分に関しては、映像アンビエント度に無関係に、意図的に注意を背けることができるが、コンテンツの音部分に関しては、注意の度合いが音アンビエント度に近いものにならざるを得ない。

　そこで、音アンビエント度の重みを映像アンビエント度の重みより重くする、つまり、αを０．５より小さい値にすることが有効である。このようにすると、コンテンツに紐付けられるアンビエント度において、音に対して人が向ける注意の度合いの寄与を相対的に大きくすることで、コンテンツに紐付けられるアンビエント度の振る舞いを、ユーザが向ける注意の度合いについての感覚に近づけることができる。

　（２）映像アンビエント度の重みを大きくする場合
　人間が、再生装置１００が提示する映像に対して注意を向けないようにするのは比較的容易であると述べたが、ディスプレイ１０５の寸法が大きいと、再生装置１００が提示する映像から注意を背けることが難しくなる。

　そこで、コンテンツが表示されると想定されるディスプレイ１０５の寸法が大きいほど、映像アンビエント度の重みを大きくすることが有効である。例えば、コンテンツが表示されると想定されるディスプレイ１０５の寸法に閾値を設け、その閾値を超える寸法のディスプレイ１０５によってコンテンツが表示されると想定される場合には、映像アンビエント度の重みを、音アンビエント度の重みより重くする、つまり、αが０．５より大きくすることが有効である。この閾値は、例えば、ディスプレイ１０５の対角線の長さで５０インチ、又は、７０インチ程度とすることができる。

　このようにすると、コンテンツに紐付けられる指標において、映像に対して人が向ける注意の度合いの寄与を相対的に大きくすることで、コンテンツに紐付けられるアンビエント度の振る舞いを、ユーザが向ける注意の度合いについての感覚に近づけることができる。

　なお、αは、再生システム１の運用者、コンテンツの提供者、又は、ユーザによる入力により変動できるようにしてもよい。このようにすることで、再生システム１の運用者等が柔軟に映像アンビエント度と音アンビエント度との重みを変化させることができる。その結果、ユーザの感覚に適合した、より柔軟なコンテンツの指定が可能となる利点がある。

　映像アンビエント度および音アンビエント度は、アンビエント度の大きさに応じて複数段階のランクに分類されていてもよい。この場合、映像アンビエント度の複数のランクを規定するアンビエント度の複数の範囲と、音アンビエント度の複数のランクを規定するアンビエント度の複数の範囲とは、互いに一致していなくてもよい。例えば、映像アンビエント度が０～２０の範囲でランクＡと分類され、音アンビエント度が０～３０の範囲でランクＡと分類されてもよい。つまり、映像アンビエント度と、音アンビエント度とは、同じランクであっても、異なるアンビエント度の範囲で複数のランクに分類されていてもよい。

　また、映像アンビエント度と音アンビエント度とは、最小値と最大値とが一致するように正規化されていてもよい。

　なお、コンテンツにはさまざまなコンテンツが有り得るが、ユーザによってあまり注視されることがない、壁に飾られた絵画、又は、壁紙、床若しくは天井の一部のように、環境の一部を形成するコンテンツであってもよい。なお、コンテンツは、ニュース又は教養等に関する情報を取得したり、娯楽を得たりするために注視することが想定されるコンテンツであってもよい。

　次に、図６を用いて、入力受付部４３０により入力を受け付けるためのＵＩについて説明する。

　図６は、実施の形態における生成装置のディスプレイに表示されるＵＩの一例を示す図である。

　入力受付部４３０は、ディスプレイ４０６にＵＩ４３１を表示して、入力ＩＦ４０５によるＵＩ４３１への入力を受け付ける。ＵＩ４３１は、音データのファイルの選択を受け付けるためのＵＩ４３２、最大音量の設定を受け付けるためのＵＩ４３３、平均音量の設定を受け付けるためのＵＩ４３４、音量の調節を許可するか否かを示す情報の入力を受け付けるためのＵＩ４３５、作者を示す文字列の入力を受け付けるためのＵＩ４３６を含む。なお、入力受付部４３０は、ＵＩ４３２～ＵＩ４３６の全てをディスプレイ４０６に表示させなくてもよく、少なくともＵＩ４３２およびＵＩ４３３を表示することで、音データのファイルを示す情報と、最大音量を示す最大音量情報との入力を受け付ければよい。また、入力受付部４３０は、ＵＩを表示させずに音データのファイルを示す情報と、最大音量を示す最大音量情報との入力を受け付けてもよい。

　ＵＩ４３２では、第２のユーザは、参照ボタンを押すことで、例えば生成装置４００のストレージ４０３に記憶されている音データのファイルを選択することができる。なお、図６で示すファイルは、一例であり、ｆｌａｃファイルに限らずに、ａａｃファイル、ｗａｖファイル、ｍｐ３ファイルなどの他の音声ファイルであってもよい。

　ＵＩ４３３では、スライダーのつまみを左右に移動させることで最大音量の設定を行うことができる。なお、ＵＩ４３３の代わりに、最大音量を示す数値の入力を受け付けてもよい。

　ＵＩ４３４では、スライダーのつまみを左右に移動させることで平均音量の設定を行うことができる。なお、ＵＩ４３４の代わりに、平均音量を示す数値の入力を受け付けてもよい。

　ＵＩ４３５では、ラジオボタン（オプションボタン）を選択することで、音量調節の許可または不許可を設定することができる。なお、ＵＩ４３５では、音量調節の許可または不許可を設定するＵＩであるが、（ｉ）音データの全体の音量を許可する、（ｉｉ）音データの一部の音量を許可する、および、（ｉｉｉ）音量の調節を許可しない、のうちの１つを設定するＵＩとしてもよい。

　ＵＩ４３６では、テキストボックスに入力された文字列を作者として受け付けることができる。なお、生成装置４００に予め設定されているユーザ名が作者として自動的に入力されていてもよい。

　なお、入力受付部４３０は、例えば、入力ＩＦ４０５およびディスプレイ４０６により実現される。

　生成部４４０は、取得部４２０により取得された音データと、入力を受け付けた制御情報とを関連付けることによりコンテンツを生成する。生成部４４０は、例えば、図６に示したＵＩ４３１への入力を受け付けることで、図７に示すようなコンテンツＣ１０を生成する。つまり、生成部４４０は、ＵＩ４３２で選択された音データＣ１１と、ＵＩ４３３～ＵＩ４３６で受け付けられた制御情報Ｃ１２とを関連付けることでコンテンツＣ１０を生成する。なお、再生時間は、例えば、音データＣ１１を解析するまたは音データＣ１１に予め含まれる再生時間を示す情報から得られる。また、アンビエント度は、例えば、上述した方法により音データＣ１１を解析することにより算出される。生成部４４０は、例えば、ＣＰＵ４０１、メインメモリ４０２、およびストレージ４０３により実現される。

　通信部４５０は、生成部４４０により生成されたコンテンツを、通信ネットワーク３００を介してサーバ２００に送信する。なお、通信部４５０は、当該コンテンツを、通信ネットワーク３００を介して再生装置１００に送信してもよい。通信部４５０は、例えば、ＣＰＵ４０１、メインメモリ４０２、ストレージ４０３、および通信ＩＦ４０４により実現される。

　再生装置１００の機能構成について説明する。

　再生装置１００は、通信部１１０と、再生部１３０とを備える。再生装置１００は、さらに、コンテンツＤＢ（Ｄａｔａｂａｓｅ）１２０を備えていてもよい。

　通信部１１０は、通信ネットワーク３００を介してサーバ２００から、コンテンツを取得する。コンテンツは、例えば、所定の音を示す音データを含むコンテンツであり、映像コンテンツまたは音コンテンツである。つまり、コンテンツは、再生装置１００により再生されたときに、再生装置１００のスピーカ１０６から音が出力されるコンテンツである。通信部１１０は、サーバ２００から１つのコンテンツを取得してもよいし、複数のコンテンツを取得してもよい。通信部１１０は、例えば、ＣＰＵ１０１、メインメモリ１０２、ストレージ１０３、および通信ＩＦ１０４により実現される。

　コンテンツＤＢ１２０は、通信部１１０により取得されたコンテンツを記憶する。コンテンツＤＢ１２０は、例えば、ストレージ１０３により実現される。なお、コンテンツＤＢ１２０が記憶しているコンテンツは、通信部１１０により取得されたコンテンツに限らずに、予め記憶しているコンテンツであってもよいし、通信部１１０により取得されたコンテンツと、予め記憶しているコンテンツとが混在していてもよい。なお、コンテンツＤＢ１２０は、例えば、生成装置４００により生成されたコンテンツを工場出荷前に記憶することでコンテンツを予め記憶している。

　再生部１３０は、通信部１１０により取得されたコンテンツを再生する。なお、再生部１３０は、通信部１１０により取得されたコンテンツを、ストリーミング再生してもよいし、コンテンツＤＢ１２０からコンテンツを読み出して再生してもよい。再生部１３０は、コンテンツに含まれる制御情報に応じて、当該コンテンツに含まれる音データを再生する。再生部１３０は、コンテンツに映像データが含まれる場合には、映像データと共に音データを再生してもよい。

　再生部１３０は、例えば、通信部１１０により取得されたコンテンツに含まれる制御情報が含む最大音量情報を用いて、コンテンツに含まれる音データの所定の音を予め設定されている設定音量を超えた音量で出力しない再生制御を行う。なお、予め設定されている設定音量は、第１のユーザにより設定されていてもよいし、工場出荷時などに初期状態として設定されていてもよい。

　再生部１３０は、具体的には、当該制御情報が含む最大音量情報で示される最大音量が設定音量を超えている場合、当該制御情報と関連付けられた音データを再生しない第１の再生制御を行ってもよい。また、再生部１３０は、当該制御情報が含む最大音量情報で示される最大音量が設定音量を超えている場合、当該制御情報と関連付けられた音データの所定の音の音量を設定音量以下に低下させた状態で、所定の音を出力させる第２の再生制御を行ってもよい。また、再生部１３０は、当該制御情報が含む最大音量情報で示される最大音量が設定音量を超えている場合、当該制御情報と関連付けられた音データの所定の音の音量において、当該制御情報が含む平均音量情報で示される平均音量を最大音量が設定音量以下となるまで低下させた状態で、所定の音を出力させる第３の再生制御を行ってもよい。また、再生部１３０は、当該制御情報が最大音量情報で示される最大音量が設定音量を超えている場合、当該制御情報と関連付けられた音データの所定の音における設定音量を超えている部分の音量を設定音量以下に低下させた状態で、所定の音を出力させる第４の再生制御を行ってもよい。

　また、再生部１３０は、当該制御情報が含む最大音量情報で示される最大音量が設定音量を超えている場合において、制御情報が音データの音量の調節を許可するか否かを示す属性情報を含む場合、属性情報に応じて第１の再生制御および第２の再生制御を選択的に行ってもよい。具体的には、再生部１３０は、当該制御情報が含む属性情報が音量の調節を許可することを示す場合、第２の再生制御を行い、当該制御情報が含む属性情報が音量の調節を許可しないことを示す場合、第１の再生制御を行ってもよい。

　また、再生部１３０は、当該制御情報が含む最大音量情報で示される最大音量が設定音量を超えている場合において、制御情報が（ｉ）音データの全体の音量の調節を許可する、（ｉｉ）音データの一部の音量の調節を許可する、および（ｉｉｉ）音データの音量の調節を許可しないのいずれかを示す属性情報を含む場合、属性情報に応じて、第１の再生制御、第３の再生制御および第４の再生制御を選択的に行ってもよい。具体的には、再生部１３０は、当該制御情報が含む属性情報が音データの全体の音量の調節を許可することを示す場合、第３の再生制御を行い、当該制御情報が含む属性情報が音データの一部の音量の調節を許可する場合、第４の再生制御を行い、当該制御情報が含む属性情報が音量の調節を許可しないことを示す場合、第１の再生制御を行う。

　ここで、第３の再生制御および第４の再生制御について、図８～図１１を用いて説明する。

　図８は、コンテンツの音量の再生時間における時間的変化を示す図である。図９は、コンテンツを再生装置で再生した場合に出力される再生音量の再生時間における時間的変化を示す図である。図１０は、第３の再生制御を行った場合に出力される再生音量の再生時間における時間的変化を示す図である。図１１は、第４の再生制御を行った場合に出力される再生音量の再生時間における時間的変化を示す図である。なお、図８～図１１で示されるコンテンツは一例であり、コンテンツの音量および再生音量は一例である。

　図８に示すように、コンテンツの音量は、時間ｔ１において最大音量Ｖｏｌ_ＭＡＸとなる。また、コンテンツの平均音量Ｖｏｌ_ＡＶＧは、図８の一点鎖線で示される。

　再生装置１００の再生部１３０は、図９に示すように、コンテンツの平均音量Ｖｏｌ_ＡＶＧが、第１のユーザによりリモコンなどを用いて調節されている音量である調整音量に一致させた音量でコンテンツに含まれる所定の音をスピーカ１０６から出力する再生制御を行う。この場合、再生部１３０は、コンテンツの音データにおいて音量の調節を行わないと、スピーカ１０６から出力される再生音量が設定音量よりも大きくなる場合がある。つまり、再生部１３０は、コンテンツの平均音量Ｖｏｌ_ＡＶＧが調節音量と一致するようにコンテンツを再生した場合、設定音量よりも大きい音量の音をスピーカ１０６から出力してしまう場合がある。

　このため、再生部１３０は、例えば、図１０に示すように、第３の再生制御として、コンテンツの平均音量Ｖｏｌ_ＡＶＧを調節音量よりも低下させることで、出力される再生音量の最大音量が設定音量以下となるまで低下させる再生制御を行ってもよい。

　また、再生部１３０は、例えば、図１１に示すように、第４の再生制御として、コンテンツの再生音量が設定音量を超えている部分の音量を設定音量以下に低下させた状態で、所定の音を出力させる再生制御を行ってもよい。

　再生部１３０は、例えば、ＣＰＵ１０１、メインメモリ１０２、ストレージ１０３、ディスプレイ１０５、およびスピーカ１０６により実現される。

　次に、サーバ２００の機能構成について説明する。

　サーバ２００は、データベース２１０と、比較部２２０と、生成部２３０と、通信部２４０とを備える。

　データベース２１０は、映像コンテンツＤＢ（Ｄａｔａｂａｓｅ）２１１と、音コンテンツＤＢ（Ｄａｔａｂａｓｅ）２１２とを有する。映像コンテンツＤＢ２１１は、それぞれが独立した複数の映像コンテンツを記憶している。映像コンテンツＤＢ２１１は、複数の映像コンテンツと共に、複数の映像コンテンツのそれぞれに対応している制御情報を記憶している。音コンテンツＤＢ２１２は、それぞれが独立した複数の音コンテンツを記憶している。音コンテンツＤＢ２１２は、複数の音コンテンツと共に、複数の音コンテンツのそれぞれに対応している制御情報を記憶している。映像コンテンツＤＢ２１１は、通信部２４０により通信ネットワーク３００を介して生成装置４００から取得された映像コンテンツを記憶している。同様に、音コンテンツＤＢ２１２は、通信部２４０により通信ネットワーク３００を介して生成装置４００から取得された音コンテンツを記憶している。映像コンテンツＤＢ２１１および音コンテンツＤＢ２１２のそれぞれは、例えば、ストレージ２０３により実現される。

　なお、サーバ２００は、データベース２１０記憶したコンテンツおよび制御情報の少なくとも一方を用いて、上記の方法を用いて、アンビエント度を算出してもよい。このようにアンビエント度が算出される場合、制御情報には、アンビエント度が含まれていなくてもよい。

　比較部２２０は、複数の映像コンテンツのそれぞれに含まれる映像属性情報と、複数の音コンテンツのそれぞれに含まれる音属性情報とを比較する。比較部２２０は、例えば、映像コンテンツのジャンルと、音コンテンツのジャンルとが一致する場合、互いに類似すると判定する。なお、ジャンルには、コンテンツの作者、コンテンツが作成された日（または、月、年）が含まれていてもよい。比較部２２０は、例えば、映像アンビエント度と、音アンビエント度とが、所定の方法を用いて比較し、類似しているか否かを判定する。比較部２２０は、アンビエント度の大きさに応じて分類された複数のランクにおいて、映像コンテンツの映像アンビエント度が属するランクと、音コンテンツの音アンビエント度が属するランクとが同じである場合に、当該映像コンテンツおよび当該音コンテンツが互いに類似すると判定する。なお、比較部２２０は、映像属性情報に含まれるメタデータから映像アンビエント度を上記の方法を利用して算出し、音属性情報に含まれるメタデータから音アンビエント度を上記の方法を利用して算出してもよい。比較部２２０は、例えば、ＣＰＵ２０１、メインメモリ２０２、およびストレージ２０３により実現される。

　生成部２３０は、比較部２２０による比較の結果に応じて、互いに類似する属性情報を有する映像コンテンツおよび音コンテンツで構成されるコンテンツを複数生成する。つまり、生成部２３０は、互いに類似する映像コンテンツおよび音コンテンツの組合せで構成されるコンテンツを複数生成する。生成部２３０は、例えば、ＣＰＵ２０１、メインメモリ２０２、およびストレージ２０３により実現される。

　通信部２４０は、生成部２３０により生成された複数のコンテンツのうちの２以上のコンテンツを、通信ネットワーク３００を介して再生装置１００に送信する。通信部２４０は、再生装置１００からコンテンツの取得要求を受信した場合に、当該取得要求に応じたコンテンツを再生装置１００に送信してもよい。通信部２４０は、例えば、通信ＩＦ２０４により実現される。

　なお、サーバ２００は、比較部２２０および生成部２３０を必ずしも有していなくてもよい。つまり、サーバ２００は、生成装置４００から通信ネットワーク３００を介して映像コンテンツまたは音コンテンツを取得して、データベース２１０に記憶し、記憶した映像コンテンツまたは音コンテンツを、通信ネットワーク３００を介して再生装置１００に送信できる構成であればよい。

　［１－２．動作］
　次に、再生システム１の動作について説明する。

　図１２は、実施の形態に係る生成装置による生成方法の一例を示すフローチャートである。

　取得部４２０が所定の音を示す音データを取得する（Ｓ１１）。

　入力受付部４３０が制御情報の入力を受け付ける（Ｓ１２）。入力受付部４３０が受け付ける制御情報の詳細は、上述したとおりである。

　生成部４４０が取得部４２０により取得された音データと、入力受付部４３０により受け付けられた制御情報とを関連付けることによりコンテンツを生成する（Ｓ１３）。

　通信部４５０が生成部４４０により生成されたコンテンツを、通信ネットワーク３００を介して、サーバ２００または再生装置１００に送信する（Ｓ１４）。

　図１３は、実施の形態に係る再生装置による再生方法の一例を示すフローチャートである。

　通信部１１０が通信ネットワーク３００を介してサーバ２００または生成装置４００からコンテンツを取得する（Ｓ２１）。

　再生部１３０が通信部１１０により取得されたコンテンツを当該コンテンツに含まれる制御情報に応じて再生する（Ｓ２２）。再生部１３０により行われる再生処理の詳細は後述する。

　図１４は、実施の形態に係る再生装置の再生部による再生処理の詳細の一例を示すフローチャートである。

　再生部１３０は、通信部１１０により取得されたコンテンツに含まれる制御情報が含む最大音量情報で示される最大音量が設定音量を超えているか否かを判定する（Ｓ３１）。

　再生部１３０は、最大音量が設定音量を超えていると判定した場合（Ｓ３１でＹｅｓ）、制御情報が含む属性情報が音データの音量の調節を許可することを示すか否かを判定する（Ｓ３２）。

　再生部１３０は、属性情報が音データの音量の調節を許可することを示す場合（Ｓ３２でＹｅｓ）、音データの最大音量を設定音量以下に低下させて再生する第２の再生制御を行う（Ｓ３３）。

　一方、再生部１３０は、属性情報が音データの音量の調節を許可しないことを示す場合（Ｓ３２でＮｏ）、当該コンテンツを再生しない第１の再生制御を行う（Ｓ３４）。

　再生部１３０は、最大音量が設定音量を超えていない場合（Ｓ３１でＮｏ）、コンテンツを音量の調節をせずにそのまま再生する（Ｓ３５）。

　なお、上記の再生処理において、ステップＳ３２およびＳ３４は行われなくてもよい。つまり、最大音量が設定音量を超えていると判定された場合、制御情報の属性情報の確認を行わずに、ステップＳ３３の第２の再生制御を行ってもよい。

　上記の再生処理では、属性情報は、音データの音量の調節を許可するか否かを示す情報であるとしたが、上述したように、属性情報は、（ｉ）音データの全体の音量の調節を許可する、（ｉｉ）音データの一部の音量の調節を許可する、および（ｉｉｉ）音データの音量の調節を許可しないのいずれかを示す情報であってもよい。この場合の再生処理は、例えば、図１５に示す処理となる。

　図１５は、実施の形態に係る再生装置の再生部による再生処理の詳細の他の一例を示すフローチャートである。

　なお、この再生処理では、図１４を用いて説明した再生処理においてステップＳ３３の代わりにステップＳ３６～Ｓ３８を行う点で異なる。このため、ステップＳ３６～Ｓ３８について説明する。

　再生部１３０は、属性情報が音データの音量の調節を許可することを示す場合（Ｓ３２でＹｅｓ）、さらに、属性情報が音データの一部の音量調節のみを許可することを示すか、音データの全体の音量調節を許可することを示すかを判定する（Ｓ３６）。

　再生部１３０は、属性情報が音データの一部の音量調節のみを許可することを示す場合（Ｓ３６でＹｅｓ）、最大音量が設定音量を超えている部分の音量を調節して再生する第４の再生制御を行う（Ｓ３７）。

　再生部１３０は、属性情報が音データの全体の音量調節を許可することを示す場合（Ｓ３６でＮｏ）、音データの平均音量を調節して音データの最大音量が設定音量以下となるまで低下して再生する第３の再生制御を行う（Ｓ３８）。

　［１－３．効果など］
　本実施の形態に係る生成方法によれば、コンテンツは、所定の音が、再生装置１００に設定されている設定音量を超えた音量で当該再生装置１００により出力されるのを禁止するために用いられる制御情報であって、所定の音の最大音量を示す最大音量情報を含む制御情報を含む。このため、再生装置１００が当該コンテンツを再生したときにコンテンツが設定音量を超えた音量で当該再生装置１００により出力されることを低減できる。よって、再生装置１００がコンテンツを再生したときに、再生装置１００がユーザに与える不快感を低減することができる。

　このように、例えば、生成方法では、アンビエント度が高いコンテンツを生成した場合であっても、上記のような制御情報を含んでいるため、再生装置１００により所定の音が出力される場合であっても、当該所定の音が設定音量を超えて出力されるのを低減できる。つまり、再生装置１００は、アンビエントなコンテンツとしてふさわしくない大きな音量でコンテンツの音が出力されるのを低減することができる。

　［１－４．変形例］
　［１－４－１．変形例１］
　上記実施の形態においてコンテンツは、制御情報に含まれる属性情報として、音データの音量の調節を許可するか否かを示す属性情報、または、（ｉ）音データの全体の音量の調節を許可する、（ｉｉ）音データの一部の音量の調節を許可する、および（ｉｉｉ）音データの音量の調節を許可しないのいずれかを示す属性情報を含むとしたが、これに限らない。上記の属性情報の代わりに、第１の再生制御を行わせることを示す属性情報、第２の再生制御を行わせることを示す属性情報、第３の再生制御を行わせることを示す属性情報、第４の再生制御を行わせることを示す属性情報のいずれか１つを含んでいてもよい。再生装置１００は、上記の属性情報を含むコンテンツを再生する場合、上記の属性情報が示す再生制御、つまり、第１の再生制御、第２の再生制御、第３の再生制御および第４の再生制御のいずれか１つを行う。

　［１－４－２．変形例２］
　上記実施の形態における再生装置１００は、コンテンツを再生する場合、コンテンツとともに、アンビエント度に関する画像を表示してもよい。画像は、コンテンツのアンビエント度を示す画像、及び、図示しないリモコンなどの受付部により受け付けたアンビエント度の範囲を示す画像の少なくとも一方を含んでいてもよい。

　コンテンツとともにアンビエント度に関する画像をディスプレイ１０５に表示されることで、ユーザは、再生されているコンテンツとともに当該画像を視認する。ユーザは、アンビエント度を示す画像を視認すれば、現在再生されているコンテンツのアンビエント度を認識することができる。また、ユーザは、アンビエント度の範囲を示す画像を視認すれば、自身が指定しているアンビエント度の範囲を認識することができる。これらを認識することで、ユーザは、例えば、指定しているアンビエント度を現在より高く又は低く変更することを受付部を通じて再生装置１００に指示することができる。

　なお、アンビエント度に関する画像を提示することに代えて、又は、ともに、アンビエント度に関する音声をスピーカ１０６により出力してもよく、上記と同様の効果が得られる。

　［１－５．その他の効果］
　また、本実施の形態及び本変形例に示される再生装置の制御方法によれば、再生装置は、コンテンツに紐付けられた指標を、その指標の範囲でもって指定することで、再生させるコンテンツを指定し得る。その際、ユーザは、検索キーを想起する必要はない。ユーザは、コンテンツに紐付けられた指標の大まかな値を、その範囲でもって指定するだけで、再生装置により再生させるコンテンツを指定し得る。このように、再生装置は、より柔軟なコンテンツの指定を可能とする。また、柔軟なコンテンツの指定を可能とするので、ユーザの意図を反映したコンテンツの決定に失敗した場合における再生装置の処理負荷及び消費電力の増大の問題を未然に回避し得る。

　また、再生装置は、再生されているコンテンツに対してユーザが向ける注意の度合いを示す推定指標を、具体的に指標として用いることによって、より柔軟なコンテンツの指定を可能とする。

　また、再生装置、サーバまたは生成装置は、コンテンツに含まれる映像と音とのそれぞれに対してユーザが向ける注意の度合いに基づいて、コンテンツに紐付けられる指標を算出する。これにより、コンテンツに含まれる映像と音とを考慮してコンテンツの指標を算出することができる。

　また、再生装置、サーバまたは生成装置は、映像指標と音指標とのうちの音指標の重みを重くした加重平均により、コンテンツに紐付けられる指標を算出する。一般に人が、再生装置が提示する映像に対して意図的に注意を向けないようにすることは比較的容易であるが、音に対して意図的に注意を向けないようにするのは容易ではない。つまり、再生装置が提示する音から意図的に注意を背けることは難しいという特徴がある。そこで、コンテンツに紐付けられる指標において、音に対して人が向ける注意の度合いの寄与を相対的に大きくすることで、コンテンツの指定に用いる指標を、ユーザが向ける注意の度合いについての感覚に即した指標にすることができる。

　また、再生装置、サーバまたは生成装置は、映像指標と音指標とのうちの映像指標の重みを重くした加重平均により、コンテンツに紐付けられる指標を算出する。一般に、コンテンツを表示する表示画面の寸法が大きいと、ユーザは、映像から注意を背けることが難しい。このような場合に、コンテンツに紐付けられる指標において、映像に対して人が向ける注意の度合いの寄与を相対的に大きくすることで、コンテンツの指定に用いる指標を、ユーザが向ける注意の度合いについての感覚に即した指標にすることができる。

　また、再生装置、サーバまたは生成装置は、コンテンツに含まれる映像の明度、彩度、色相、又は、シーンチェンジの態様を具体的に用いて、映像指標を算出し得る。

　また、再生装置、サーバまたは生成装置は、コンテンツに含まれる音量、周波数分布、又は、音量の変化の態様を具体的に用いて、音指標を算出し得る。

　また、再生装置、サーバまたは生成装置は、再生しているコンテンツとともに、当該コンテンツに紐付けられている指標をユーザに提示することで、コンテンツの指標をユーザに認識させることができる。そして、ユーザが再生装置に提示させることを希望するコンテンツと、ユーザが指定した指標の範囲とが適合しているか否かなどについての判断等をユーザにさせることができる。

　また、再生装置、サーバまたは生成装置は、映像コンテンツと音コンテンツとをともに再生する場合に、再生する映像コンテンツと音コンテンツとの指標がともに、ユーザが指定した範囲に含まれるものとすることができる。これにより、ユーザは、再生装置により、同じ程度の注意を向けると推定される映像コンテンツと音コンテンツとをともに再生させることができる。

　また、再生装置は、サーバに予めコンテンツを格納する際に指標を提示することで、コンテンツ提供者に対して、コンテンツに紐付けられた指標を認識させることができる。

　また、再生装置は、コンテンツの調整をしてから調整後のコンテンツの指標をコンテンツ提供者に認識させることができる。コンテンツ提供者は、調整後のコンテンツの指標を認識することで、自身が提供したコンテンツに対してなされた調整の結果を確認し、その結果に基づいてサーバに格納するかどうかの判断をするなどの行動を行うことができる。

　（他の実施の形態）
　なお、上記各実施の形態において、各構成要素は、各構成要素に適したソフトウェアプログラムを実行することによって実現されるとしたが、専用のハードウェアで構成されてもよい。また、各構成要素は、ＣＰＵまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。ここで、上記各実施の形態の再生方法などを実現するソフトウェアは、次のようなプログラムである。

　すなわち、このプログラムは、コンピュータに、コンピュータを用いてコンテンツを生成する生成方法であって、所定の音を示す音データを取得し、取得した前記音データにより示される前記所定の音が、再生装置に設定されている設定音量を超えた音量で当該再生装置により出力されるのを禁止するために用いられる制御情報であって、前記所定の音の最大音量を示す最大音量情報を含む制御情報の入力を受け付け、取得した前記音データと、前記入力を受け付けた前記制御情報とを関連付けることによりコンテンツを生成する生成方法を実行させる。

　また、このプログラムは、コンピュータに、コンテンツを生成する生成装置と、前記生成装置により生成された前記コンテンツを取得して、取得した前記コンテンツを再生する再生装置とを備える再生システムによる再生方法であって、前記生成装置では、所定の音を示す音データを取得し、取得した前記音データにより示される前記所定の音が、前記再生装置に設定されている設定音量を超えた音量で当該再生装置により出力されるのを禁止するために用いられる制御情報であって、前記所定の音の最大音量を示す最大音量情報を含む制御情報の入力を受け付け、取得した前記音データと、受け付けた前記制御情報とを関連付けることによりコンテンツを生成し、前記再生装置では、前記コンテンツを、通信ネットワークを介して取得し、取得した前記コンテンツに含まれる前記制御情報が含む前記最大音量情報を用いて、前記コンテンツに含まれる前記音データの前記所定の音を予め設定されている前記設定音量を超えた音量で出力しない再生方法を実行させる。

　以上、本発明の一つまたは複数の態様に係る生成方法、生成装置、再生方法および再生システムについて、実施の形態に基づいて説明したが、本発明は、この実施の形態に限定されるものではない。本発明の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態も、本発明の一つまたは複数の態様の範囲内に含まれてもよい。

　例えば、上記実施の形態では、音アンビエント度は、コンテンツの音の音量、音の周波数分布、又は、音量の変化の態様に基づいて算出する説明をした。しかし、これに限定されるものではなく、音の周波数特性の中でも、いわゆる『１／ｆゆらぎ』と呼ばれる特性との近似性や倍音成分の多寡、音色の波形の規則性（数Ｈｚ以下の周波数領域）などを考慮してもよい。

　なお、音アンビエント度は、映像アンビエント度に比べ、研究段階の指標であるが、２００Ｈｚ付近の中音域の音は、ボーカルや人の話し声などに相当し、人間にとって耳につきやすい音域であることが分かっている。したがって、ユーザが向ける注意の度合いが大きくなり、コンシャス度が上がる（アンビエント度が下がる）と考えられる。

　人間は自然界に存在する（人工的に加工されていない）広い帯域の音を聞きながら生活しているが、脳は、これらの広い帯域の音を常に無意識に処理している。人間の脳は、倍音構造の変化や微妙な遅れなどを手掛かりとして通常と異なる音を判別し、危険を察知するために注意の度合いが大きくなる。すなわち、コンシャス度が上がる（アンビエント度が下がる）と考えられる。

　また、人間の脳は、自然と異なるものを無意識に補完して理解しようとするため、自然界と異なる音を聞いたときには、脳のリソースを使ってしまうこととなり、コンシャス度が上がる（アンビエント度が下がる）と考えられる。したがって、ユーザの注意の度合いを大きくするために作曲された音楽が、コンシャス度が高い（アンビエント度が低い）だけではなく、川のせせらぎのような自然界に存在する音も、録音環境（マイクや記録装置の性能）によっては、アンビエント度が下がると考えられる。

　本開示は、再生装置がユーザに与える不快感を低減することができる生成方法等に適用可能である。

　　１　　再生システム
１００　　再生装置
１０１　　ＣＰＵ
１０２　　メインメモリ
１０３　　ストレージ
１０４　　通信ＩＦ
１０５　　ディスプレイ
１０６　　スピーカ
１１０　　通信部
１２０　　コンテンツＤＢ
１３０　　再生部
２００　　サーバ
２０１　　ＣＰＵ
２０２　　メインメモリ
２０３　　ストレージ
２０４　　通信ＩＦ
２１０　　データベース
２１１　　映像コンテンツＤＢ
２１２　　音コンテンツＤＢ
２２０　　比較部
２３０　　生成部
２４０　　通信部
３００　　通信ネットワーク
４００　　生成装置
４０１　　ＣＰＵ
４０２　　メインメモリ
４０３　　ストレージ
４０４　　通信ＩＦ
４０５　　入力ＩＦ
４０６　　ディスプレイ
４１０　　データベース
４２０　　取得部
４３０　　入力受付部
４３１～４３６　　ＵＩ
４４０　　生成部
４５０　　通信部
Ｃ１０　　コンテンツ
Ｃ１１　　音データ
Ｃ１２　　制御情報

Claims

　コンピュータを用いてコンテンツを生成する生成方法であって、
　所定の音を示す音データを取得し、
　取得した前記音データにより示される前記所定の音が、再生装置に設定されている設定音量を超えた音量で当該再生装置により出力されるのを禁止するために用いられる制御情報であって、前記所定の音の最大音量を示す最大音量情報を含む制御情報の入力を受け付け、
　取得した前記音データと、前記入力を受け付けた前記制御情報とを関連付けることによりコンテンツを生成する
　生成方法。
　前記入力の受け付けでは、前記音データの音量の調節を許可するか否かを示す属性情報をさらに含む制御情報の入力を受け付け、
　前記制御情報は、
　当該制御情報が含む前記最大音量情報で示される前記最大音量が前記設定音量を超えている場合であって、
　（ｉ）当該制御情報が含む前記属性情報が前記音量の調節を許可することを示す場合、当該制御情報と関連付けられた前記音データの前記所定の音の音量を前記設定音量以下に低下させた状態で、前記所定の音を出力させる再生制御を、前記再生装置に行わせ、
　（ｉｉ）当該制御情報が含む前記属性情報が前記音量の調節を許可しないことを示す場合、当該制御情報と関連付けられた前記音データが前記再生装置により再生されることを禁止する
　ための情報である
　請求項１に記載の生成方法。
　前記入力の受け付けでは、（ｉ）前記音データの全体の音量の調節を許可する、（ｉｉ）前記音データの一部の音量の調節を許可する、および（ｉｉｉ）前記音データの音量の調節を許可しないのいずれかを示す属性情報をさらに含む制御情報の入力と、前記音データの前記所定の音の平均音量を示す平均音量情報をさらに含む制御情報の入力とを受け付け、
　前記制御情報は、
　当該制御情報が含む前記最大音量情報で示される前記最大音量が前記設定音量を超えている場合であって、
　（ｉ）当該制御情報が含む前記属性情報が前記音データの全体の音量の調節を許可することを示す場合、当該制御情報と関連付けられた前記音データの前記所定の音の音量において、当該制御情報が含む前記平均音量情報で示される前記平均音量を、当該制御情報が含む前記最大音量情報で示される前記最大音量が前記設定音量以下となるまで低下させた状態で、前記所定の音を出力させる再生制御を、前記再生装置に行わせ、
　（ｉｉ）当該制御情報が含む前記属性情報が前記音データの一部の音量の調節を許可する場合、当該制御情報と関連付けられた前記音データの前記所定の音における前記設定音量を超えている部分の音量を前記設定音量以下に低下させた状態で、前記所定の音を出力させる再生制御を、前記再生装置に行わせ、
　（ｉｉｉ）当該制御情報が含む前記属性情報が前記音量の調節を許可しないことを示す場合、当該制御情報と関連付けられた前記音データが前記再生装置により再生されることを禁止する
　ための情報である
　請求項１に記載の生成方法。
　前記制御情報は、当該制御情報が含む前記最大音量情報で示される前記最大音量が前記設定音量を超えている場合、当該制御情報と関連付けられた前記音データが前記再生装置により再生されることを禁止するための情報である
　請求項１に記載の生成方法。
　前記制御情報は、当該制御情報が含む前記最大音量情報で示される前記最大音量が前記設定音量を超えている場合、当該制御情報と関連付けられた前記音データの前記所定の音の音量を前記設定音量以下に低下させた状態で、前記所定の音を出力させる再生制御を、前記再生装置に行わせるための情報である
　請求項１に記載の生成方法。
　前記入力の受け付けでは、前記音データの前記所定の音の平均音量を示す平均音量情報をさらに含む制御情報の入力を受け付け、
　前記制御情報は、当該制御情報が含む前記最大音量情報で示される前記最大音量が前記設定音量を超えている場合、当該制御情報と関連付けられた前記音データの前記所定の音の音量において、当該制御情報が含む前記平均音量情報で示される前記平均音量を、前記最大音量が前記設定音量以下となるまで低下させた状態で、前記所定の音を出力させる再生制御を、前記再生装置に行わせるための情報である
　請求項５に記載の生成方法。
　前記制御情報は、当該制御情報が含む前記最大音量情報で示される前記最大音量が前記設定音量を超えている場合、当該制御情報と関連付けられた前記音データの前記所定の音における前記設定音量を超えている部分の音量を前記設定音量以下に低下させた状態で、前記所定の音を出力させる再生制御を、前記再生装置に行わせるための情報である
　請求項５に記載の生成方法。
　コンテンツを生成する生成装置であって、
　所定の音を示す音データを取得する取得部と、
　取得部により取得された前記音データにより示される前記所定の音が、再生装置に設定されている設定音量を超えた音量で当該再生装置により出力されるのを禁止するために用いられる制御情報であって、前記所定の音の最大音量を示す最大音量情報を含む制御情報の入力を受け付ける入力受付部と、
　前記取得部により取得された前記音データと、前記入力受付部により受け付けられた前記制御情報とを関連付けることによりコンテンツを生成する生成部と、を備える
　生成装置。
　コンテンツを生成する生成装置と、前記生成装置により生成された前記コンテンツを取得して、取得した前記コンテンツを再生する再生装置とを備える再生システムによる再生方法であって、
　前記生成装置では、
　所定の音を示す音データを取得し、
　取得した前記音データにより示される前記所定の音が、前記再生装置に設定されている設定音量を超えた音量で当該再生装置により出力されるのを禁止するために用いられる制御情報であって、前記所定の音の最大音量を示す最大音量情報を含む制御情報の入力を受け付け、
　取得した前記音データと、受け付けた前記制御情報とを関連付けることによりコンテンツを生成し、
　前記再生装置では、
　前記コンテンツを、通信ネットワークを介して取得し、
　取得した前記コンテンツに含まれる前記制御情報が含む前記最大音量情報を用いて、前記コンテンツに含まれる前記音データの前記所定の音を予め設定されている前記設定音量を超えた音量で出力しない
　再生方法。
　コンテンツを生成する生成装置と、前記生成装置により生成された前記コンテンツを取得して、取得した前記コンテンツを再生する再生装置とを備える再生システムであって、
　前記生成装置は、
　所定の音を示す音データを取得する取得部と、
　前記取得部により取得された前記音データにより示される前記所定の音が、前記再生装置に設定されている設定音量を超えた音量で当該再生装置により出力されるのを禁止するために用いられる制御情報であって、前記所定の音の最大音量を示す最大音量情報を含む制御情報の入力を受け付ける入力受付部と、
　前記取得部により取得された前記音データと、前記入力受付部により受け付けられた前記制御情報とを関連付けることによりコンテンツを生成する生成部と、を備え、
　前記再生装置は、
　前記コンテンツを、通信ネットワークを介して取得する取得部と、
　前記取得部により取得された前記コンテンツに含まれる前記制御情報が含む前記最大音量情報を用いて、前記コンテンツに含まれる前記音データの前記所定の音を予め設定されている前記設定音量を超えた音量で出力しない再生部と、を備える
　再生システム。