CN100484222C - 视频音频记录播放装置、视频音频记录方法和视频音频播放方法 - Google Patents
视频音频记录播放装置、视频音频记录方法和视频音频播放方法 Download PDFInfo
- Publication number
- CN100484222C CN100484222C CNB2004800304181A CN200480030418A CN100484222C CN 100484222 C CN100484222 C CN 100484222C CN B2004800304181 A CNB2004800304181 A CN B2004800304181A CN 200480030418 A CN200480030418 A CN 200480030418A CN 100484222 C CN100484222 C CN 100484222C
- Authority
- CN
- China
- Prior art keywords
- audio
- video
- information
- audio frequency
- recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/91—Television signal processing therefor
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/19—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
- G11B27/28—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
- G11B27/32—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
- G11B27/322—Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier used signal is digitally coded
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Television Signal Processing For Recording (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
一种视频音频记录播放装置具备:输入视频、音频的主信息的视频与音频输入部(100);输入附加到主信息上的音频附加信息(音频备注)的音频附加信息输入部(110);进行视频、音频数据记录,播放的记录播放部(140);记录视频、音频数据的记录介质(150);控制各部分动作的控制部(120)。控制部(120)将音频附加信息与主信息中的特定的帧位置相关联地记录到记录介质(150)中。指定的帧位置由时间码或偏移量(距主信息开头的帧数)等指定。
Description
技术领域
本发明涉及存储记录摄像机等的视频音频的记录播放装置和方法,特别是,涉及在视频和音频的主信息中与音频附加信息相关联地进行记录播放的装置和方法。
背景技术
以由照相机一体型VTR拍摄录像的收集素材后的磁带为基础,制作节目时,自拍摄录像的多个剪辑(场面),通常只编辑需要的场面,进行制作一部节目的工作。
进行这样编辑工作的以往的非线性编辑装置,作为素材的记录在素材收集后的磁带中的视频和音频等信息,输入象硬盘那样可以随机访问的记录介质,一边随机访问输入到该硬盘的视频和音频,一边进行编辑。
为了有效地进行该编辑工作,编辑者需要确认各剪辑(cut)的拍摄内容是哪些内容。因此,以往,在各剪辑开头,将说明其剪辑内容的文字标题等静止画面,作为所谓字幕(credit)(用于辅助编辑的附加信息)进行拍摄插入,记录在硬盘中。在其后的编辑时,通过播放该记录的静止画面的字幕,显示在监视器上,能够容易把握各剪辑中拍摄了什么样的内容。
如上所述,在各剪辑开头,插入拍摄说明其内容的文字标题等字幕的工作很费事,希望得到能够更简单把握各剪辑内容的方法。
对此,在特开2001—136482号公报中提出,作为用于了解各剪辑的拍摄内容的方法,除了视频和音频的主信息之外,将由音频生成的附加信息(音频备注)与上述主信息相关联,记录播放的方法。
但是,在上述专利文献中,对附加信息(音频备注)与各剪辑素材相关联的概念进行叙述,对应用于存储记录摄像机等时的具体方法没有提及。另外,存在只在主信息的播放中记录音频备注的问题。
发明内容
本发明是为了解决上述课题产生的,提出在视频音频记录播放装置中,对各剪辑,附加附加信息时的具体方法。
在本发明的第1方式中,视频音频记录播放装置具备:视频音频输入部,其输入视频和音频主信息;音频附加信息输入部,其输入附加在主信息中的音频附加信息;视频音频输出部,其输出主信息和音频附加信息;记录播放部,其将主信息和音频附加信息,记录在记录介质或者从记录介质播放;以及控制部,其控制视频音频输入部、音频附加信息输入部、视频音频输出部和记录播放部的动作。控制部以与上述主信息的时间轴非同步地将音频附加信息与主信息中的特定帧位置相关联地记录到记录介质中的方式进行控制。
在本发明的第2方式中,视频音频记录方法,输入视频和音频的主信息,输入附加在主信息中的音频附加信息,与上述主信息的时间轴非同步地将音频附加信息与主信息中的特定帧位置相关联地记录到记录介质中。
在本发明的第3方式中,是通过上述视频音频记录方法记录主信息和音频附加信息的记录介质的播放方法,显示主信息的缩略图像,在同一主信息与一个以上的音频附加信息相关联的情况下,对一个以上的音频附加信息中的每一个,将位于上述各音频附加信息相关联的帧位置上的主信息缩略图像可选择地显示。
在本发明的第4方式中,是通过上述视频音频记录方法记录主信息和音频附加信息的记录介质的播放方法,播放上述音频附加信息时,与主信息时间轴不保持同步。
(技术效果)
通过本发明,能够将用于说明视频和音频的主信息的内容等的音频附加信息(音频备注)与主信息特定帧位置相关联地记录,能够在主信息内的时间轴上的一点记录多个音频备注。
另外,也可以由距主信息开头的帧数指定主信息中的特定帧位置,由此,即使素材数据的时间码不连续时,也能够使音频附加数据与素材数据的唯一位置相关联。
另外,也可以每个连续记录的素材数据(剪辑)与音频附加信息相关联,由此,能够将音频附加信息作为每个场景的备注使用。
另外,也可以记录关联到记录介质整体的音频附加数据,通过将其记录介质中记录哪样的镜头,作为音频附加数据相关联,与其他记录介质的区别变容易。
另外,跨多个记录介质记录的主信息(镜头)中,可以对每个记录介质建立关联的音频附加数据,由此,即使去掉一部分记录介质,能够充分记录对记录在剩余记录介质中与主信息关联的音频附加数据。
另外,在结束主信息的记录时,也可以结束音频附加信息的记录,由此,在记录结束由用户产生的素材数据时,省去结束音频附加数据的记录的工夫。
另外,也可以以与主信息音频数据不同的采样率或者比特率记录音频附加信息,例如,通过以更低速率记录音频附加信息,能够增加音频附加数据可记录时间。
另外,也可以用与主信息音频数据不同的文件格式记录音频附加信息,例如,通过用编辑机专用格式记录主信息,用通用PC用格式记录音频附加信息,在PC上也能够播放音频附加数据。
另外,也可以预先在记录介质上保留用于记录音频附加信息的区域,即使主信息的空余容量没有了,也能确保音频附加数据的记录。
另外,仅根据主信息的记录中,记录暂时停止中,记录停止中,播放中,播放暂时停止中,播放停止中任意一种状态,就能记录音频附加信息,由此,编辑工作变得容易。
另外,删除与音频附加信息关联的主信息时,与被删除的主信息关联的音频附加信息也同时删除,能够防止遗忘删除不需要的音频附加数据。
另外,在同一主信息中与一个以上的音频附加信息相关联时,选择一个以上的音频附加信息中的一个时,以可以显示其选择的位于关联音频附加信息的帧位置的主信息的缩略图像,由此,搜索需要的音频附加信息变得容易。
另外,在音频附加信息的播放时,也可以显示与音频附加信息关联的主信息的缩略图或者主信息中的视频信息,可以在音频附加信息的播放中确认主信息。
另外,选择一个音频附加信息时,可以从与选择的音频附加信息相关联的主信息的帧位置播放主信息,在将音频附加信息作为关键词检索后,能够马上确认关联的主信息,提高了编辑工作效率。
另外,在播放音频附加信息中,也可以从与播放中的音频附加信息相关联的主信息的帧位置播放主信息,在将音频附加信息作为关键词的检索后,能够马上确认关联的主信息,提高了编辑工作效率。
另外,也可以具有与包含显示音频附加信息记录开始时状态的信息的、与音频附加信息相关的管理信息,可以参照该管理信息,用各种方法播放音频附加信息。
另外,也可以与主信息时间轴非同步使音频附加信息与主信息关联记录,由此,音频附加信息的播放控制变得容易。
附图说明:
图1表示本发明的实施方式1中的视频音频记录播放装置的构成图。
图2是用于说明音频备注的、与剪辑内特定的位置相关联的图。
图3是显示音频备注文件与剪辑关系的管理信息的例子(音频备注管理表格)的图。
图4是显示剪辑与构成该剪辑的素材文件(视频、音频文件)的关系的管理信息的例子(剪辑管理表格)的图。
图5是音频备注播放中,播放与音频备注数据相关联的主要部分数据(剪辑)时的处理流程图。
图6是剪辑播放中,播放与剪辑相关联的音频备注时的处理流程图。
图7是表示本发明的实施方式2中的、具有多个记录介质的视频音频记录播放装置的构成图。
图8是说明与跨过多个记录介质记录的镜头内的特定的位置相关联的音频备注的图。
图9是表示记录播放装置中的操作部的例子的图。
图10是表示音频备注的记录动作的流程图。
图11是表示剪辑一览画面显示例子的图。
图12是表示音频备注剪辑一览画面显示例子的图。
图13是音频备注播放动作流程图。
图14是表示音频备注播放中视频的显示例的图。
图15是表示记录介质内内容的目录构成的图。
图16是说明管理剪辑信息的标记的图。
图17是表示剪辑文件的XML描述的例子的图。
具体实施方式
以下,使用附图,对本发明中的视频音频记录播放装置的最佳实施方式进行详细地说明。
实施方式1
图1是显示本发明中的存储记录摄像机的概略构成的框图。
视频与音频输入部100将音频信息和视频信息作为主信息输入。视频信息能够通过摄像元件和播放装置等输入,另外,音频信息通过麦克风和播放装置等输入,只要能够输入视频、音频信息,不论其何种机构。其中,所谓“主信息”是指成为能够附加音频附加信息的对象的视频、音频信息,也称“主要部分”。
压缩解压电路101将由视频与音频输入部100输入的视频、音频的主信息进行数据压缩,作为视频、音频数据的主数据,输出到记录播放部140,或者,对由记录播放部140播放的视频、音频的主数据和音频附加数据进行数据解压,作为视频、音频的主信息和音频附加信息,输出到视频与音频输出部102。
视频与音频输出部102向外部输出来自压缩解压电路101的视频、音频的主信息和音频附加信息。
音频备注麦克风110是音频附加信息输入机构,将音频备注作为音频附加信息输入。并且,作为音频附加信息输入机构,替代在摄像机中设置麦克风,也可以使用仅设置音频输入端子,在此处连接麦克风等输入机构。音频备注处理电路111对由音频备注麦克风110输入音频附加信息进行数据变换、数据压缩,作为音频附加数据输出到记录播放部140。
控制部120控制记录播放部140和显示部121等各部分的动作。显示部121显示由控制部120指定的音频备注号码和缩略图(代表视频)等。操作部130具有记录按钮,播放按钮,音频备注播放按钮等,从外部接受通过它们所进行的用户操作。记录播放部140将来自压缩解压电路101的视频、音频的主数据,以及来自音频备注处理电路111的音频附加数据记录在记录介质150中,另外,由记录介质150播放的视频、音频的主数据和音频附加数据输出到压缩解压电路101。
记录介质150是记录来自记录播放部140的视频、音频的主数据和音频附加数据等的可以随机访问的记录介质。记录介质150只要是可以随机访问的记录介质就可以,不局限于内置型,外置型,可装卸型等,也可以存在多个。例如考虑硬盘,光盘,光磁盘,半导体存储器等。在本实施例中,假设只存在唯一的记录介质的情况。
构成素材数据的视频和音频每个主数据在单一记录介质150中连续记录时,其记录的一系列数据单位称为“剪辑”(并且,1个素材数据跨多个记录介质记录的情况在后面进行描述。)。
视频的主数据和音频的主数据作为同一文件记录在记录介质150中时,剪辑由一个素材文件构成,视频的主数据和音频的主数据分别作为不同的文件记录在记录介质150中时,剪辑有时由多个素材文件构成。在本实施方式中,视频的主数据和音频的主数据分别作为文件记录在记录介质150中,一个剪辑中,视频的主数据由一个视频文件构成,音频的主数据由多声道音频文件构成。以下,将视频的主数据只称为“视频数据”,音频的主数据只称为“音频数据”。
由音频备注麦克风110输入的音频信息由音频备注处理电路111变换为音频附加数据输出。将该音频附加数据称为“音频备注数据”。
记录播放部140将数据记录到记录介质150中时,该音频备注数据与剪辑中的时间码相关联进行记录。相关联的时间码可以是与剪辑内最初帧相关的时间码,也可以是中间的任意帧相关的时间码。
通过将音频备注数据与剪辑的时间码相关联记录,可以对一个剪辑记录多个音频备注。另外,可以与素材数据帧单位的详细位置相关联。在编辑时,能够得到通过听取音频备注,能够容易发现所需要的素材数据的位置的效果。
另外,音频备注数据也可以不与剪辑的时间码相关联,而与剪辑的帧偏移量(距开头的帧数目)相关联。
参照图2,对音频备注数据与剪辑的帧偏移量的关联进行具体的说明。
在剪辑400内一个帧(帧偏移量=4)中相关联,记录音频备注#1(411)。另外,音频备注#2(412)关联在音频备注#1(411)关联的帧后面的帧(帧偏移量=8)中记录。音频备注#2(412)的关联的帧偏移量位置的时刻也可以比音频备注#1(411)的结束时刻早。另外,也可以在与关联音频备注#2(412)的帧(帧偏移量=8)完全相同的帧相关联,记录不同的音频备注#3(413)。
这样,音频备注的记录时间不会直接影响构成主要部分数据的素材剪辑的记录时间。也就是说,可以认为音频备注记录在关联的剪辑的帧偏移量上的一点上。因此,也可以记录比素材剪辑更长时间的音频备注。但是,对于音频备注的记录时间的上限,在后面进行描述,必须在其设定时间以内。
因此,可以将音频备注数据与剪辑的特定帧偏移量值相关联,例如剪辑的开头帧相关联,此时,此音频备注可以定义为与剪辑整体相关联。这样,通过剪辑整体相关联,能够得到这样的效果,以音频备注为关键词的剪辑单位中的检索变得容易。
另外,通过将音频备注数据与剪辑的帧偏移量相关联记录,能够得到这样的效果,即使在剪辑内时间码不连续的情况下,也能够唯一地相关联。
作为剪辑的帧偏移量和音频备注数据相关关联的方法,例如,考虑使用如图3所示的剪辑与显示音频备注文件关系的管理表格(以下称为“音频备注管理表格”)以及如图4所示的剪辑与显示其素材文件(视频、音频数据文件)关系的管理表格(以下称为“剪辑管理表格”。)。并且,图3和图4表示使音频备注数据与剪辑的帧偏移量相关联时的管理表格。
在如图3所示的音频备注管理表格20中,剪辑名200显示剪辑ID。并且,在同一记录介质内,全部剪辑具有唯一的ID。帧偏移量201是距剪辑开头的帧数目。备注ID202,是对于关联到相同的剪辑的多个音频备注附加的唯一的ID。音频备注文件名203是音频备注文件的文件名,在同一剪辑内,全部音频备注文件名具有唯一的文件名。
在如图4所示的剪辑管理表格30中,AV类型301是将构成主要部分数据的剪辑(素材文件)类型表示为视频数据或音频数据的信息。声道号码302,如果是音频数据就要指定其声道号码,如果是视频数据也可以不特别指定。素材文件名303是作为构成剪辑的素材文件的视频数据或者音频数据的唯一文件名。
以下,使用图5的流程图,对在音频备注的播放中,播放与其音频备注数据相关的主数据(剪辑)时的处理进行说明。并且,剪辑和音频备注通过图2和图3的管理信息关联。
播放中的音频备注的音频备注文件名在同一剪辑内是唯一的。因此,参照音频备注管理表格20,以音频备注文件名为关键词,获得与其相关的剪辑名,帧偏移量(S11)。并且,下面,参照剪辑管理表格30,构成获得的剪辑名的剪辑的全部素材文件的文件名(素材文件名303)(S12)。即,只获得构成剪辑的文件数目量的素材文件名。对其中得到的每个具有各素材文件名的数据文件,首先从求出的帧偏移量表示的位置,开始播放(S13)。通过参照这样管理信息20、30,能够识别音频备注和主要部分数据(剪辑)的对应,在音频备注的播放中,能够播放与其音频备注相关联的剪辑。
下面,使用图6的流程图,对播放剪辑中,播放与其剪辑相关联的音频备注时的处理进行说明。
参照剪辑管理表格30,获得现在播放中的剪辑的剪辑名(S21)。并且,参照音频备注管理表格20,获得与其获得的剪辑名相关联的备注ID,获得对应其备注ID的音频备注文件名(S22)。播放由获得的音频备注文件名表示的音频备注数据(S23)。播放的音频备注的具体的指定方法等在后面进行描述。
通过上述方法,能够使用管理信息20、30,使剪辑和音频备注数据相关联。另外,由于使音频备注与剪辑内的时间码和帧偏移量相关联,能够对一个剪辑附加多个音频备注数据。另外,也可以在特定剪辑相同帧偏移量上关联多个音频备注。
并且,在本实施方式中,通过压缩解压电路101,压缩视频、音频信息,还有,解压视频、音频数据,也可以原封不动处理作为不进行压缩,解压的非压缩数据的视频、音频信息。
另外,在本实施方式中,在将剪辑内的帧偏移量与音频备注数据关联的机构,使用图3和图4所示的管理表格,但是只要能够实现它们相关联,也可以使用其他机构。
另外,在本实施方式中,使音频备注与剪辑的帧偏移量和时间码相关联,只要能够将音频备注关联到剪辑内的特定时间轴上的位置,即,只要是能够指定剪辑内的帧位置的信息,关联音频备注的目的地也可以不是剪辑的帧偏移量或时间码。
因此,对本发明的音频备注与通过由现有的编辑装置产生的后期录音功能记录的音频信息的不同点进行说明。
在以往的编辑机等中,对预先拍摄的视频、音频数据,通过后期录音,追加记录音频数据,有时将其当作对于视频数据的音频数据进行播放。此时,通过后期录音追加记录的音频数据,以与最初拍摄时记录的视频数据保持同步进行播放为前提进行记录。因此,通过后期录音,追加记录音频数据时,通常是播放视频数据,一边保持同步,一边追加记录音频数据。
与此相对,本发明中的音频备注是用于显示剪辑(素材数据)是什么的备注信息,与视频、音频的主数据同步播放不是必须的。因此,不限制音频备注记录时的主数据的状态,主数据可以处于停止中,播放中,特殊播放中等(多倍搜索播放,逆播放等)各种状态,也能够记录音频备注。
也就是说,音频备注是与主数据的时间轴特定的一点相关联的,能够不与主数据保持同步进行记录。
另外,通过后期录音追加记录音频数据时,追加数受机器的音频输出声道数限制。例如,对于音频只能输出4声道的机器,音频最大只能记录4声道。与此相对,本发明的音频备注与音频的输出声道数无关系,能够在主数据的同一时间轴的位置记录关联多个音频备注。
实施方式2
在实施方式1中,假设存储记录摄像机只具备唯一的记录介质150情况,但在本实施方式中,对记录介质150,如图7所示,由可以装卸的多个记录介质(记录介质#1(501),记录介质#2(502),记录介质#3(503))构成的情况进行说明。
本实施方式中,跨多个记录介质,视频、音频的主数据连续记录时,将其记录数据单位称为“镜头”。例如,将一个镜头的素材记录到一个记录介质中时,此镜头成为一个剪辑。另一方面,如果将一个镜头的素材跨多个记录介质记录,对各记录介质,生成各自的剪辑。此时,音频备注数据与被分割的每个剪辑相关联。
使用图8,对针对跨多个记录介质记录的一个镜头600的音频备注的附加,进行详细的说明。
镜头600从记录介质#1(501)开始记录,跨过记录介质#2(502)到记录介质#3(503),记录结束。此时,镜头600被分割为记录介质#1(501)内的剪辑#1(611),记录介质#2(502)内的剪辑#2(612),记录介质#3(503)内的剪辑#3(613)进行记录。
在本实施方式中,关联镜头600内的某些特定的位置,记录音频备注数据时,音频备注数据记录在与记录其附加的实体数据的记录介质相同的记录介质中。例如,欲与音频备注相关联的位置是剪辑#1(611)内的数据时,其音频备注数据(音频备注#1(621))被记录在记录介质#1(501)上。同样,欲与音频备注关联的位置是剪辑#2(612)内的数据时,其音频备注数据被记录在记录介质#2(502)上(音频备注#2(622))。此时,音频备注#2(622)的结束时刻在剪辑#2(612)结束时刻后面。但是,此时,音频备注#2(622)不会从记录介质#2(502)跨过记录介质#3(503),而是记录在与记录了相关联位置的主要部分数据的记录介质(即这里是记录介质#2(502))相同的记录介质上。另外,同样,欲与音频备注相关联的位置是剪辑#3(613)内的数据时,此音频备注数据(音频备注#3(623))被记录在记录介质#3(503)上。此时,音频备注#3(623)的结束时刻也可以在镜头600结束时刻后面。
这样,音频备注数据记录在与其关联的、记录剪辑的帧偏移量的主要部分数据的记录介质上。另外,音频备注数据的记录时间与实施方式1一样,必须在音频备注的记录时间的上限以内。
通过使用上述方法,使音频备注数据与剪辑内的数据相关联,在各自记录介质中,能够以主要部分数据与音频备注关联的状态进行播放。得到这样的效果,例如,即使在取出记录介质#3(503)时,与剪辑#1(611)内数据相关联的音频备注#1(621)和与剪辑#2(612)内的数据相关联的音频备注#2(622)也能播放。
并且,在实施方式1中,将音频备注数据与包含视频或者音频数据的剪辑相关联,生成由无效视频和音频数据构成的剪辑(以下称为“虚拟剪辑”),该虚拟剪辑也可以与音频备注数据相关联。并且,在虚拟剪辑中的与音频备注数据相关联也可以作为与记录介质整体相关联的数据。
例如,能够得到这样的效果,通过记录某些视频、音频数据的记录介质整体与显示此记录介质中记录什么样的数据的音频备注数据相关联,使其记录介质容易与其他记录介质区分。
虚拟剪辑中,本来不需要视频、音频数据,但是如果使用蓝色背景(blueback)视频数据作为虚拟剪辑的无效的视频数据,可以与现有的剪辑一样进行管理。为了判断剪辑是否为虚拟剪辑,可以将例如,显示剪辑是否为虚拟剪辑的标记附加到图3的管理表格中。并且,生成虚拟剪辑时,设立该标记。
实施方式3
在本实施方式中,对音频备注的记录处理进行简单的说明。
图9表示记录、播放音频备注时,用户操作的操作部130的例子。在操作部130上设置音频备注记录按钮1101,选择按钮1102,确定按钮1103。
音频备注记录按钮1101用于开始音频备注的记录时,以及结束音频备注的记录时。如果在没有记录音频备注的状态下,按下音频备注记录按钮1101,开始音频备注的记录动作。另外,如果在记录音频备注的状态下按下音频备注记录按钮1101,结束音频备注的记录动作。并且,音频备注记录按钮1101也可以分别划分为记录开始用的按钮和记录结束用的按钮。
选择按钮1102是用于进行例如,剪辑的缩略图(代表视频)概要中的指针的移动和各种选项项目的指针移动等的按钮。
确定按钮1103是用于确定选择的按钮。例如,如果在选择某音频备注的常态下,按下确定按钮1103时,开始其音频备注的播放。并且,操作部130也可以存在没有图示的各种按钮。
使用图10,对记录音频备注,到与剪辑相关联之前的处理流程进行说明。
如果由用户在音频备注非记录状态下,按下音频备注记录按钮1101,开始音频备注的记录动作。此时,首先获得应该记录与音频备注相关联的剪辑的剪辑名和帧偏移量,预先记录这些信息(S31)。并且,与音频备注相关联的剪辑和帧偏移量的具体确定方法在后面进行描述(参照实施方式5)。另外,此时,参照管理表格20,30,确定备注ID和文件名进行记录,以使在同一剪辑中不重复(S32)。并且,文件名的确定方法等在后面进行描述(实施方式7参照)。并且,开始音频备注的记录(S33)。
然后,在音频备注记录动作中,判断由用户按下音频备注记录按钮1101产生的记录停止操作的有无(S34)。如果有记录停止操作,结束音频备注的记录(S35)。此时,将在音频备注记录开始时记录的与音频备注关联目的地的剪辑名,帧偏移量,备注ID,文件名等关联信息,记录在如图3所示的管理表格中(S36)。
实施方式4
在本实施方式中,对音频备注的具体记录方法进行叙述。
音频备注是用于表示素材数据是什么的备注信息,记录后几乎不会进行编辑。另外,认为音频备注与素材的音频数据不同,没有高音质的要求。因此,可以以音频备注的采样率和比特率比素材的音频数据低的速率进行记录。由此音频备注的文件大小减小,更有效。
例如,素材的音频数据的采样率为48kHz,音频备注的采样率为8kHz进行记录。另外,素材的音频数据的比特率为16bps(Bits Per Sample),音频备注的比特率为8bps进行记录。由此,由于音频备注能够以素材的音频数据的1/12的大小进行记录,在限定容量的记录介质等中,可以记录更多素材的视频、音频数据。
另外,音频备注的文件格式能够使用与素材音频数据的文件格式不同的格式。
例如,作为主要部分的音频数据的格式,使用作为素材交换用格式的MXF(Material Exchange Format),作为音频备注格式采用通用PC中使用的WAVE。
主要部分的音频数据,进行编辑是前提,如果使用象MXF那样的素材交换用格式,由编辑机等进行编辑变得容易,能提高编辑效率。另外,能够得到这样的效果,音频备注如果采用象WAVE那样的由通用PC能够处理的格式,通过采用在后面进行描述的缩略图(代表视频)等,即使不看实际的素材数据,在PC上可以进行标题插入等简易编辑。
以下,对将素材数据和音频备注记录到记录介质中的情况进行具体的说明。并且,假设将音频备注的音质设定为若干高度,各数据的参数如下。
帧速率:30fps(Frames Per Second),
主要部分视频数据的帧大小:120kB,
主要部分音频数据的采样率:48kHz,
音频备注的采样率:12kHz,
主要部分音频数据的比特率:16bps,
音频备注的比特率:16bps,
其中,剪辑由1ch视频数据,2ch音频数据构成。此时,剪辑的每1秒的数据大小为:
(120kB×30fps)+((48kHz)×16bps/8bit)×2ch=3.792MB(式1)
另外,音频备注每1秒的数据大小为:
12kHz×16bps/8bit=24kB(式2)
并且,其中为了简化说明,没有考虑素材数据文件和音频备注文件的数据部以外的部分(头和尾部等)的记录。
另外,也可以在记录介质中,预先保留音频备注记录专用区域。
例如,在记录介质中预先保留5分钟(300秒)的音频备注的记录用区域。记录5分钟(300秒)音频备注需要的记录容量由(式2)得:
24kB×300秒=7.2MB(式3)
也就是说,记录5分钟(300秒)音频备注需要的记录容量(7.2MB)与记录1.9秒(约57帧)剪辑的记录容量相当。
这里,如果计算1GB记录容量的记录介质只记录剪辑时,即,不保留音频备注记录区域时的可以记录时间,由(式1)得:
1GB/3.792MB=约264秒(式4)
在1GB记录容量的记录介质中预先保留5分钟(300秒)的音频备注的记录区域时,剪辑可以记录时间变为约262秒。即,即使保留5分钟(300秒)的音频备注的记录区域,可以记录时间与不保留时几乎不变。
因此,可以说即使在记录介质中预先保留音频备注的记录区域,几乎不会对素材数据可以记录时间产生影响。另外,假设即使在预先保留的记录区域没有记录音频备注,记录介质的使用效率也几乎没有浪费。
另外,能够得到这样的效果,如图8所示,将剪辑#2(612)和音频备注#2(622)记录在记录介质#2(502)上时,即使记录介质#2(502)上的主要部分数据用的空余区域用完,主要部分数据的后续部分作为剪辑#3(613)记录在记录介质#3(503)上,继续记录时,如果在记录介质#2(502)中,剩余预先保留的音频备注专用记录区域,音频备注#2(622)能够记录在记录介质#2(502)上。
并且,在上述例子中,音频备注的最大可以记录时间为5分钟进行说明,此值可以不是5分钟,可以用户能够任意设定。另外,音频备注记录专用区域的容量由音频备注记录时间设定,也可以设定相对于记录介质整个容量的音频备注记录区域的比例。另外,也可以用字节(Byte)单位等直接设定保留的容量。
实施方式5
在本实施方式中,对音频备注的记录处理的各种变化进行说明。
音频备注在视频、音频的主信息的记录中,记录暂时停止中,记录停止中,播放中,播放暂时停止中,播放停止中的任意一种状态均可以开始记录。能够得到这样的效果,由于能够从多个状态记录音频备注,能提高音频备注记录的便利性。以下,对各自状态中的音频备注的记录方法进行叙述。
首先,对主信息的记录(拍摄)中记录音频备注的方法进行叙述。
如果在记录(拍摄)主信息中,由用户按下设置在操作部130上的音频备注按钮,通过音频备注处理电路111对由音频备注麦克风110输入的音频信号进行数字变换,作为音频备注储存到记录介质150中。此时,该音频备注与按音频备注按钮的时刻记录的剪辑的帧偏移量相关联。该关联通过管理信息的登录,更新进行。通过该方法,能够同时记录主信息的拍摄与音频备注的记录,在主信息拍摄后不必重新记录音频备注。
另外,音频备注记录中,在剪辑变化时,即现在记录的记录介质的主信息记录用空余容量变为0,在其他记录介质上记录主信息的后续部分时,如实施方式2所示,音频备注依然继续记录到此音频备注的记录开始时的记录介质上。由此,即使去掉音频备注关联的剪辑记录的记录介质以外的记录介质,也可以播放此音频备注。.
下面,对主信息的记录暂时停止中记录音频备注的方法进行叙述。
在主信息的记录暂时停止中,如果按下音频备注按钮,对由音频备注麦克风110输入的音频信号进行数据变换,作为音频备注记录到记录介质上。与此同时,该音频备注与剪辑内的记录暂时停止中的位置的剪辑的帧偏移量相关联。通过该方法,能够得到这样的效果,与在上述记录中按音频备注按钮的情况一样,在主要部分拍摄后不需要记录音频备注。
下面对主信息的记录停止中记录音频备注的方法进行叙述。
在主信息的记录动作中停止记录动作,如果按下音频备注按钮,对由音频备注麦克风110输入的音频信号进行数据变换,作为音频备注进行记录。此时,该音频备注与最后记录的镜头整体相关联。镜头被分为多个剪辑记录时,音频备注与最后记录的剪辑整体相关联。由此,在主信息记录(视频拍摄)后能够记录音频备注,在记录中,能够集中于主信息的记录(视频拍摄)。
并且,在主信息的记录停止中按音频备注按钮时,音频备注也可以与接下来拍摄的镜头相关联地进行记录。此时,暂时生成虚拟剪辑,将音频备注与该虚拟剪辑整体相关联。然后,如果重新开始拍摄,修改记录的音频备注,与拍摄中的剪辑相关联,删除虚拟剪辑。如果不开始下次拍摄,删除记录的音频备注。由于通过该方法,能够在主信息的记录前,记录音频备注,在记录中,能够集中于视频的拍摄。
主信息记录后记录音频备注,或者在主信息记录前记录音频备注,配合用户的用途,更改设定。
接下来对主信息播放中记录音频备注的方法进行叙述。
主信息的播放中,如果按下音频备注按钮,对由音频备注麦克风110输入的音频进行数据变换,作为音频备注,记录到记录介质中。此时,该音频备注与按下音频备注按钮时刻处于播放中的剪辑的帧偏移量相关联。通过该方法,能够在主信息记录后,能够一边确认主信息的视频,一边音频备注相关联,能够与规定的场景的更正确的位置相关联。
下面对主信息的播放暂时停止中记录音频备注的方法进行叙述。
在主信息的播放暂时停止中如果按下音频备注按钮,对由音频备注麦克风110输入的音频进行数据变换,作为音频备注记录。此时,该音频备注,与剪辑内的播放暂时停止中的位置的剪辑的帧偏移量相关联。通过该方法,能够得到这样的效果,与播放中按音频备注按钮时一样,由于能够一边确认记录后主信息,一边与音频备注相关联,所以与规定场景的更正确的位置相关联。
下面对主信息的停止中储存音频备注的方法进行叙述。
在主信息的播放后停止中,按下音频备注按钮时,停止位置是镜头中间时,对由音频备注麦克风110输入的音频进行数据变换信号,作为音频备注记录。此时,该音频备注与此镜头整体相关联。另外,镜头被分为多个剪辑记录时,与包含停止位置的剪辑整体相关联。通过该方法,能够得到这样的效果,能够在编辑中与镜头或者剪辑整体相关联记录音频备注,以音频备注为关键词容易检索剪辑单位。
并且,删除与一个以上的音频备注相关联的剪辑时,也同时删除与剪辑相关联的音频备注。通过该操作,能够得到这样的效果,省去删除音频备注的麻烦的同时,也能够防止忘记删除不需要的音频备注。
另外,同时记录主信息和音频备注时,如果结束主信息的记录,音频备注的记录也结束。通过该方法,能够得到这样的效果,省去结束音频备注记录的麻烦的同时,也消除了由于不注意等忘记音频备注记录的结束处理。
并且,在本实施方式中,主信息的音频数据和音频备注的采样率分别为48kHz和12kHz,但是各自的值也可以是其他值。另外,主信息的音频数据和音频备注的比特率同时为16bps,但是各自的值也可以为其他值。另外,由于记录介质容量充裕时,要求音频备注的高音质时,以及简化控制等理由,主信息的音频数据和音频备注可以采用共同的采样率或者共同的比特率,不论其大小关系。
另外,作为主信息的音频数据和音频备注的格式,分别使用MXF和WAVE,也可以使用其他格式。另外,根据简化控制等理由,在主信息的音频数据和音频备注中采用共同的格式。
另外,在本实施方式中,剪辑是由ich视频数据,2ch音频数据构成的,其声道数也可以是任意的,也可以是例如只有1ch音频数据的剪辑。
实施方式6
在本实施方式中,对音频备注的播放方法进行具体的说明。
首先,对为了音频备注的播放指示,在显示部12上显示的画面进行说明。
图11表示在显示部121中显示的剪辑一览画面的例子。剪辑一览画面显示记录在记录介质150内的剪辑的一览。视频显示不下全部剪辑时,使用选择指针1102,滚动视频进行显示。
剪辑一览画面中,整列显示记录的各剪辑的缩略图(剪辑的代表视频)1402。缩略图1402可以是剪辑开头帧的视频数据,也可以是剪辑内的其他帧的视频数据。剪辑中不存在视频数据时,即只由音频数据构成的剪辑时,缩略图1402中填入蓝色背景等视频。并且,在缩略图1402中,用户也可以深度不是剪辑内的视频数据的其他视频。
其剪辑的剪辑号码1403也与缩略图1402同时显示。剪辑号码1403能够确定与剪辑名无关系,在记录介质内只要是唯一的,就可以自由设定。
此外,对音频备注关联的剪辑,显示音频备注标识1404。在图11的例中,音频备注与剪辑号码“02”,“03”和“05”的剪辑相关联。
通过选择按钮1102的操作选择的缩略图,对表示选择的显示1405附加外框。
图12是表示音频备注剪辑一览画面的例子。音频备注剪辑一览画面由剪辑一览画面引导。
音频备注剪辑一览画面,在记录介质记录的剪辑中,只概要显示音频备注相关联的剪辑。转移到音频备注剪辑一览画面,可以使用操作部130上的选项按钮等进行,不局限于其机构。在音频备注剪辑一览画面中设置音频备注显示区域1502和剪辑显示区域1504。
剪辑显示区域1504是显示与音频备注相关联的剪辑的缩略图(以下称为“剪辑、缩略图”)1402的区域。
在音频备注显示区域1502中显示与在现在选择的剪辑相关联的音频备注相关的缩略图(以下称为“音频备注之缩略图”。)1501的概要。音频备注之缩略图1501是与音频备注相关联的剪辑中的位置静止画面的缩小视频。在被关联的剪辑中不存在视频数据时,即只由音频数据构成剪辑时,在音频备注之缩略图1501中填入蓝色背景等视频。
在音频备注之缩略图1501中显示音频备注号码1503。音频备注号码1503,能够确定与后面所述的MemoID985无关系,只要在剪辑内是唯一的,就可以自由地设定音频备注号码1503。
音频备注显示区域1502中显示,表示现在选择的音频备注的信息的音频备注信息1505。例如,表示与现在选择的音频备注相关联的目的地的剪辑号码1403,现在选择的音频备注的音频备注号码1503。图12的例子表示,通过音频备注信息1505,选择剪辑号码“02”,音频备注号码“02”的音频备注。该例表示,在剪辑号码“02”的剪辑中共计相关联了3个音频备注。
并且,在音频备注信息1505中显示的信息,如果不是需要的,也可以不显示,另外,如果是需要的,也可以显示其他信息。
使用图13对音频备注的播放动作进行说明。
用户为了播放音频备注,进入到音频备注剪辑一览画面,选择、确定与想要播放的音频备注相关联的剪辑。想要播放的剪辑的选择用操作部130上的选择按钮1102进行,通过确定按钮1103确定其选择。
在音频备注剪辑一览画面上,由用户操作,判断是否选择、确定剪辑(S41)。如果选择、确定剪辑,将指针移动到音频备注显示区域1502,在音频备注显示区域1502中,判断是否由用户选择想要播放的音频备注之缩略图(S42)。以选择想要播放的音频备注的状态,按下确定按钮1103,确定此选择,播放选择的音频备注(S43)。此时,与音频备注播放开始同时,显示位于与播放的音频备注相关联的位置的主要部分的视频数据的静止画面(S44)。然后,音频备注数据被播放到其终端,音频备注的播放结束,与此同时,主要部分的视频数据的静止画面的显示也停止。
图14是表示音频备注播放中的画面的图。
与主要部分的视频数据的静止画面同时,显示表示音频备注播放中的显示1601。显示1601也可以闪动显示。
并且,也可以与音频备注的播放开始同时,此播放的音频备注关联的位置开始播放主要部分的视频数据的运动图像。此时,在音频备注播放结束之前,主要部分视频数据的动画的播放结束时,可以持续输出主要部分的视频数据的最终帧的静止画面,或者蓝色背景视频等。
如果音频备注的播放结束,自动地返回音频备注剪辑一览画面。由于可能在音频备注播放中途结束,可以在按下规定的按钮(例如,确定按钮1103,停止按钮(图中没有显示))时,中断音频备注的播放动作。另外,在音频备注播放中,如果按下主要部分播放按钮(图中没有显示)或者选择、确定按钮1103,中断音频备注的播放,也可以从播放的音频备注关联的位置,开始主要部分的视频、音频数据的播放。
实施方式7
在实施方式1中,作为将剪辑的帧偏移量和音频备注数据相关联的方法,使用如图2和图3所示的管理表格,在本实施方式中,描述音频备注与XML(eXtensible Markup Language:W3C推荐)文件相关联的信息。另外,除了剪辑和音频备注的关联信息以外,也可以将构成剪辑的视频数据和音频数据相关的信息等,各种与剪辑相关的信息在XML文件中描述。
(记录介质的目录构成)
图15表示记录在记录介质150的各内容的目录构成的例子。
Contents目录800配置在记录介质150的root目录下。构成剪辑的全部文件被配置在Contents目录800下。
Clip目录810配置在Contents目录800下。描述剪辑信息的XML文件记录在Clip目录810下。
Video目录820配置在Contents目录800下。视频数据文件记录在Video目录820下。
Audio目录830配置在Contents目录800下。音频数据文件记录在Audio目录830下。
Voice目录850配置在Contents目录800下。音频备注数据文件记录在Voice目录850下。
剪辑文件811和812分别是描述音频备注的附加信息等所有剪辑信息的XML文件。对1个剪辑生成1个剪辑文件。
视频文件821和822分别是构成剪辑的视频数据文件。
音频文件831~834分别是构成剪辑的音频数据文件。
音频备注文件851~853分别是与剪辑相关联的音频备注数据文件。
并且,上述例中,为了说明本实施方式,只使用需要的构成要素。根据需要,例如也可以将图中没用表示的Icon目录,和图中没用表示的Icon文件等纳入该构成。另外,记录介质150内的目录构成也可以是其他的构成。
(由XML形成的剪辑文件的定义)
以下,对使用XML的剪辑文件的具体的描述方法进行说明。
图16表示XML描述内具体描述的项目。图16中所述的项目是为了说明本实施方式的列举的一个例子,也可以存在图16中没有描述的项目,另外,也可以不存在图16中所示的项目中几个。另外,在各项目中,有空存在其属性。
ClipContent标记900将与以下所示的剪辑相关的信息作为要素保存。
ClipName标记901将剪辑名称作为要素保存。
Duration标记902将剪辑的帧数作为要素保存。
EssenceList标记910将视频、音频数据等的摘要目录作为要素保存。
Video标记920将以下所示的视频数据的信息作为要素保存。另外,作为Video标记920的属性,通过附加例如图中没有表示的ValidAudioFlag的属性,可以判断在视频数据中音频数据是否被多路复用。
VideoFormat标记921将视频数据的文件格式作为要素保存。例如MXF文件格式等被考虑了,也可以是其他格式。
Audio标记940将以下表示的音频数据的信息作为要素保存。
AudioFormat标记941将音频数据的文件格式作为要素保存。例如MXF文件格式等被考虑了,也可以是其他格式。
SamplingRate标记942将音频数据的采样率作为要素保存。例如48000Hz等被考虑了,采样率值是多少都可以。
BitsPerSample标记943将音频数据的比特率作为要素保存。例如16bps,24bps等被考虑了,比特率的值是多少都可以。
ClipMetadata标记960将音频备注等,与剪辑相关联的素材数据以外的中间数据的信息作为要素保存。
MemoList标记970将与剪辑相关联的备注的目录作为要素保存。并且,如果不存在备注,也可以没有MemoList标记970。
Memo标记980将以下表示的备注的各信息作为要素保存。并且,将MemoID985作为属性附加到Memo标记980中。MemoID985是每个剪辑中独立的2位值,各剪辑中能够关联达到最大100个备注。另外,MemoID985也可以不是2位值,每个剪辑关联的备注的最大数也可以不是100。
Offset标记981将与备注相关联的剪辑的帧偏移量作为要素保存。Offset标记981可以是必需的。如果没有Offset标记981,此备注可以与剪辑整体相关联。
Person标记982将生成备注的人的名字等作为要素保存。例如,在音频备注记录时,在Person标记982内描述由谁记录的。由此,明确音频备注的记录者,如果不了解记录音频备注时的状况等,可以询问此记录者,并且,尤其是不需要时,也可以不附加Person标记982。
Voice标记990将以下表示的音频备注的各信息作为要素保存。如果音频备注没有被关联,Voice标记990也可以没有。
VoiceFormat标记991将音频备注数据的文件格式作为要素保存。例如WAVE文件格式等被考虑了,也可以是其他格式。
VoiceSamplingRate标记992将音频备注数据的采样率作为要素保存。例如可以考虑12000Hz等,采样率的值是多少都可以。
VoiceBitsPerSample标记993将音频备注数据的比特率作为要素保存。例如可以考虑16bps等,比特率的值是多少都可以。
RecContidion标记994将记录音频备注时的状态作为要素保存。例如,播放状态,停止状态等被考虑了,也可以是除此以外的状态,另外,可以细化这些状态。并且,RecCondition标记994如果不需要也可以不是设置。
并且,在剪辑文件中描述的项目,如上述所举的例子,只要能与剪辑和音频备注相关联,不论其构造,项目,要素,属性。
(音频备注记录时的状态管理)
对管理音频备注记录时的状态的方法进行说明。
例如,在主要部分数据的记录中或者主要部分数据的播放中记录音频备注时,将RecCondition标记994设为“播放”。另外,在主要部分数据的记录暂时停止中,记录停止中,播放停止中以及播放暂时停止中记录音频备注时,即,不能与主要部分数据保持同步记录音频备注时,将RecCondition标记994设为“停止”。
播放音频备注时,参照RecCondition标记994,如果为“播放”,从关联此音频备注的位置同时播放主要部分视频数据。另一方面,RecCondition标记994如果为“停止”,一边持续输出关联此音频备注的位置的主要部分的视频数据的静止画面,一边播放音频备注。因此,RecCondition标记994的值为“播放”和“停止”,也可以额外定义除此以外的状态,例如,在搜索播放中记录音频备注时,也可以将表示此时的搜索播放速率的值在RecCondition标记994中描述。此时,参照RecCondition标记994,获得搜索播放速率,可以一边以获得的速率搜索播放主要部分数据,一边播放音频备注。
并且,不管RecCondition标记994的值,可以总是一边持续输出主要部分的视频数据的静止画面,一边播放音频备注。另外,RecCondition标记994和音频备注的播放方法的关系也可以由用户自由确定。另外,RecCondition标记994也可以不记录,此时,可以变为统一音频备注的播放方法。另外,也可以与RecCondition标记994的值没有关系,用用户设定的播放方法播放音频备注。
这样,通过管理记录音频备注时的状态,能够增加音频备注的播放方法。
并且,播放音频备注时,举只从关联的位置同时播放主要部分的视频数据的例子,也可以同时播放主要部分音频数据。
(音频备注数据的非同步记录,非同步播放)
通常,播放素材的视频、音频数据时,有必要使视频和音频保持同步。此时,通常视频和音频有1帧的偏差也是不允许的。视频数据和音频数据不能被多重化,视频数据文件,音频数据文件(也包含多声道时)分别是不同的文件时,尽管全部这些文件保持同步,但是播放的控制变为复杂的控制。另外,播放采样率不同的2个以上的音频数据文件时,进行这些保持同步,但是播放控制变为更复杂的控制。
另一方面,但是不需要一边视频和音频保持同步一边播放时,即,如果允许出现数帧的偏差时,视频数据文件,音频数据文件即使是不同的文件,如果分别独立播放,其控制变为更简单的简易控制。
如上所述,由于音频备注数据是用于表示素材数据是多少的备注数据,认为没有必要与素材数据保存严密的同步进行播放。因此,不必与主要部分数据保持同步,播放音频备注,控制变为更简单的控制。
另外,音频备注是与主要部分数据的时间轴的特定一点相关联的,通过不必与主要部分数据保持同步记录音频备注,能够记录比关联的剪辑的Duration更长时间音频备注。例如,对于数秒的剪辑,能够记录数十秒的音频备注。另外,能够在主要部分数据是停止中,播放中,特殊播放中等(多倍搜索播放,逆播放等),各种状态下,记录音频备注。
例如,在主要部分数据的停止中,暂时停止中等记录音频备注时,作为音频备注的管理信息,也可以将RecCondition标记994的值设为“停止”(此时的音频备注的播放方法在后面进行描述。)。此时,能够在素材的记录前,预先记录音频备注。例如,对于从现在拍摄的场景,实现记录此场景的说明等作为音频备注,然后拍摄成为对象的场景,能够在其剪辑上关联预先记录的音频备注。
另外,在主要部分数据的记录中以及播放中,记录音频备注时,也可以将RecCondition标记994的值设为“播放”。(此时的音频备注的播放方法在后面进行描述。)此时,记录的音频备注未必与主要部分数据保持同步。因此,如实施方式2所示,即使是主要部分数据跨多个记录介质记录或者被记录时,音频备注也能不必跨多个记录介质进行记录。另外,尤其是在主要部分数据播放中记录音频备注时,在音频备注记录中,即使超过主要部分数据的终端,也能继续音频备注的记录。
另外,在主要部分数据的特殊播放中等(多倍搜索播放,逆播放等)记录音频备注时,可以将RecCondition标记994的值设为表示各自状态的值。
如上所述,在播放记录的音频备注时,通过参照音频备注记录时附加的RecCondition标记994,可以选择其播放方法。
RecCondition标记994的值为“停止”时,即,记录音频备注时的主要部分的状态为停止或者暂时停止时,一边持续输出关联音频备注的位置的主要部分的视频数据的静止画面,一边播放音频备注。
另外,RecCondition标记994的值为“播放”时,即,记录音频备注时的主要部分的状态为记录中或者播放中时,同时播放关联音频备注的位置的主要部分的视频数据。此时,如上所述,由于主要部分数据和音频备注未必需要保持同步,能够用更简单的控制进行播放。其中,在经过长时间的音频备注等中,希望快点听到音频备注时,能够在等倍播放主要部分中,以1.5~2倍速只播放音频备注。相反,在音频备注中,剩余的音频信息过快,听不到时等,可以在等倍播放主要部分中,以0.5倍速只播放音频备注。
另外,RecCondition标记994是表示搜索播放等的值时,例如是表示搜索播放4倍速的值时,能够一边从与音频备注关联的位置以4倍速搜索播放主要部分数据,一边播放音频备注。另外,RecCondition标记994是表示逆播放的值时,也能够一边从关联音频备注的位置逆播放主要部分数据,一边播放音频备注。
(XML描述的具体例)
图17是表示对图15中的目录构造的一部分的XML描述的例子的图。即,在图15所示的例子中,包含剪辑名为“0001AB”的剪辑文件#1(811),剪辑名为“0001CD”的剪辑文件#2(812),图17表示与其中的剪辑文件#1(811)相关的XML描述。但是,图17表示在剪辑文件#1(811)中描述的内容的一部分,记载的项目只是为了说明本实施方式需要的项目。也可以存在图17中没有描述的项目,另外,也可以不存在图17中所示的几个项目。另外,在各项目中也可以存在其属性。
在图17的XML描述中定义以下的内容。
剪辑文件#1(811)的剪辑名(ClipName)是“0001AB”。剪辑文件#1(811)的长度(Duration)是1000帧。作为主要部分的视频数据和主要部分的音频数据的文件格式(Video Format,AudioFormat)采用MXF,作为音频备注的文件格式(VoiceFormat)采用WAVE。另外,主要部分的音频数据的采样率(SamplingRate)为48kHz,音频备注数据的采样率(VoiceSamplingRate)为12kHz。另外,音频数据和音频备注的比特率(BitsPerSample,VoiceBitsPerSample)同时为16bps。
剪辑文件#1(811)由视频文件#1(821),音频文件#1(831),音频文件#2(832),音频备注文件#1(851),以及音频备注文件#2(852)构成。
音频备注文件#1(851)由将“UserName1”保存在用户名(Person)中的用户生成。此音频备注,以素材的记录暂时停止中,记录停止中,播放暂时停止中,播放停止中的任意一种状态(RecCondition)进行记录,被关联到该剪辑的0帧目(Offset)上。
另外,音频备注文件#2(852)由将“UserName2”保存在用户名(Person)中的用户生成,此音频备注在素材的记录中或者播放中(RecCondition)时记录,被关联到该剪辑的100帧目(Offset)。
各数据文件命名如下。
剪辑文件#1(811)的文件名是在剪辑名“0001AB”上附加扩展名“.xml”的,变为“0001AB.xml”。
另外,视频文件#1(821)的文件名是在剪辑名“0001AB”上附加扩展名“.mxf”的,变为“0001AB.mxf”。
音频文件#1(831)和音频文件#2(832)的文件名是尽管在剪辑名“0001AB”上附加2位的声道号码“00”和“01”,还附加扩展名“.mxf”的,分别变为“0001AB00.mxf”和“0001AB01.mxf”。并且,音频数据的声道号码按被登记在EssenceList标记910中的Audio标记940的要素的目录顺序,来分配0声道,1声道,2声道,…。音频数据的声道号码,作为在图9中表示的Audio标记940的属性,附加声道号码,也可以由其值确定,另外,也可以从其他标记获得声道信息,不管其机构。
音频备注文件#1(851)和音频备注文件#2(852)的文件名是,在剪辑名“0001AB”上附加各自的MemoID985的2位值“00”和“01”的,并且附加扩展名“.wav”的,分别变为“0001AB00.wav”“0001AB01.wav”。
根据图16那样的目录构成记录上述各文件。通过该构成,只参照剪辑文件#1(811),就能够了解构成剪辑的素材数据和音频备注数据等的相关信息。
并且,各文件文件名的确定方法也可以是上述例子以外的方法。
在本实施方式中,为了说明关联剪辑和视频、音频数据以及音频备注数据的方法和其效果,只对需要的项目进行叙述,但是各素材数据的详细信息,与作为剪辑的代表视频的缩略文件相关信息,拍摄的场所信息,拍摄者的用户信息,拍摄机器的信息等各种信息,也可以在剪辑文件中描述。通过这样做,只参照剪辑文件,就能了解剪辑的所有信息。
在本实施方式中,采用XML作为剪辑文件的描述语言。由于XML是由W3C(World Wide Web Consortium)标准化(推荐)的语言,认为例如,只要使用能够处理XML的变换软件等,就能将管理信息转移到其他数据库中等的操作成为可能,进一步增加通用性。另外,由于通过定义新的标记,也能够容易追加管理信息,认为扩展性高。另外,由于XML是文本文件,使用通用的信息机器,用户能够直接且容易的参照剪辑文件,能够大概把握剪辑信息。另外,用户使用通用的信息机器,能够直接编辑剪辑文件,简易编辑成为可能。
本发明对用于以由存储记录摄像机等拍摄录像的采访后的媒体为基础,有效地进行非线性编辑等编辑工作的视频音频记录播放装置有用。
本发明只对特定实施方式进行了说明,对于熟练当業者而言,其他许多的变形例,修正,其他利用是显然的。因此,本发明,不局限于在此指定的公开,能够只由附加的权利要求范围来限定。并且,本申请与日本国专利申请,特愿2003—356079号(2003年10月16日提出)相关,通过参照这些内容,插入本文中。
Claims (25)
1、一种视频音频记录播放装置,具备:
视频音频输入部,其输入视频和音频的主信息;
音频附加信息输入部,其输入附加到上述主信息中的音频附加信息;
视频音频输出部,其输出上述主信息和上述音频附加信息;
记录播放部,其将上述主信息和上述音频附加信息,记录到记录介质或者从记录介质播放;及
控制部,其控制上述视频音频输入部、上述音频附加信息输入部、上述视频音频输出部、上述记录播放部的动作,
上述控制部,以与上述主信息的时间轴非同步地将上述音频附加信息与上述主信息中的特定的帧位置相关联地记录到上述记录介质中的方式进行控制。
2、根据权利要求1所述的视频音频记录播放装置,其特征在于,
用距上述主信息开头的帧数或上述主信息的时间码指定上述主信息中的特定的帧位置,使上述音频附加信息与距上述主信息开头的帧数或上述主信息的时间码相关联地记录到上述记录介质中。
3、根据权利要求1所述的视频音频记录播放装置,其特征在于,
上述记录介质由单一介质构成时,与该单一的记录介质中连续记录的主信息的剪辑内的特定的帧位置相关联的上述音频附加信息,包含与上述剪辑整体相关的信息。
4、根据权利要求3所述的视频音频记录播放装置,其特征在于,
上述特定帧是剪辑内的开头帧。
5、根据权利要求1所述的视频音频记录播放装置,其特征在于,
为了对上述记录介质整体附加音频附加信息,生成虚拟的主信息,将上述音频附加信息与该生成的虚拟的主信息相关联,将上述虚拟的主信息和上述音频附加信息记录在上述记录介质中。
6、根据权利要求1所述的视频音频记录播放装置,其特征在于,
上述记录介质由多个介质构成,由一系列动作拍摄的上述主信息经由多个介质被分割记录时,上述音频附加信息与每个被分割的上述主信息相关联,将上述主信息和与上述主信息相关联的上述音频附加信息记录在同一介质中。
7、根据权利要求1所述的视频音频记录播放装置,其特征在于,
在上述主信息和上述音频附加信息的记录动作中,在结束上述主信息的记录时,结束上述音频附加信息的记录。
8、根据权利要求1所述的视频音频记录播放装置,其特征在于,
以与上述主信息的音频数据不同的采样率或者比特率记录上述音频附加信息。
9、根据权利要求1所述的视频音频记录播放装置,其特征在于,
以与上述主信息的音频数据不同的文件格式记录上述音频附加信息。
10、根据权利要求1所述的视频音频记录播放装置,其特征在于,
具有与上述音频附加信息相关的管理信息,
该管理信息包括上述音频附加信息的记录开始时的、表示上述主信息状态的信息。
11、根据权利要求1所述的视频音频记录播放装置,其特征在于,
在管理文件内记录确定附加了上述音频附加信息的使用者的信息。
12、根据权利要求1所述的视频音频记录播放装置,其特征在于,
由XML文件记录上述音频附加信息的管理信息。
13、一种视频音频记录方法,
输入视频和音频的主信息,
输入附加到上述主信息中的音频附加信息,
与上述主信息的时间轴非同步地将上述音频附加信息与上述主信息中的特定的帧位置相关联地记录到记录介质中。
14、根据权利要求13所述的视频音频记录方法,其特征在于,
用距上述主信息开头的帧数或上述主信息的时间码指定上述主信息中的特定的帧位置,将上述音频附加信息与距上述主信息开头的帧数或上述主信息的时间码相关联地记录到上述记录介质中。
15、根据权利要求13所述的视频音频记录方法,其特征在于,
上述记录介质由单一介质构成时,与该单一的记录介质中连续记录的主信息的剪辑内的特定的帧位置相关联的上述音频附加信息,包含与上述剪辑整体相关的信息。
16、根据权利要求15所述的视频音频记录方法,其特征在于,
上述特定的帧是剪辑内的开头帧。
17、根据权利要求13所述的视频音频记录方法,其特征在于,
为了对上述记录介质整体附加音频附加信息,生成虚拟的主信息,将上述音频附加信息与该生成的虚拟的主信息相关联,将上述虚拟的主信息和上述音频附加信息记录在上述记录介质中。
18、根据权利要求13所述的视频音频记录方法,其特征在于,
上述记录介质由多个介质构成,由一系列动作拍摄的上述主信息经由多个介质被分割记录时,上述音频附加信息与每个被分割的上述主信息相关联,将上述主信息和与上述主信息相关联的上述音频附加信息记录在同一介质中。
19、根据权利要求13所述的视频音频记录方法,其特征在于,
在上述主信息和上述音频附加信息的记录动作中,在结束上述主信息的记录时,结束上述音频附加信息的记录。
20、根据权利要求13所述的视频音频记录方法,其特征在于,
以与上述主信息的音频数据不同的采样率或者比特率记录上述音频附加信息。
21、根据权利要求13所述的视频音频记录方法,其特征在于,
以与上述主信息的音频数据不同的文件格式记录上述音频附加信息。
22、一种视频音频播放方法,是根据权利要求13所述的视频音频记录方法记录了主信息和音频附加信息的记录介质的播放方法,
显示上述主信息的缩略图像,
在一个以上的音频附加信息与同一主信息相关联的情况下,对一个以上的音频附加信息的每一个,将位于与上述各音频附加信息相关联的帧位置的主信息的缩略图像可选择地显示。
23、根据权利要求22所述的视频音频播放方法,其特征在于,
在播放上述音频附加信息时,持续显示与该音频附加信息相关联的主信息的静止画面。
24、根据权利要求22所述的视频音频播放方法,其特征在于,
在播放上述音频附加信息中,能够从与播放中的音频附加信息相关联的上述主信息的特定的帧位置开始播放上述主信息。
25、一种视频音频播放方法,是根据权利要求13所述的视频音频记录方法记录了主信息和音频附加信息的记录介质的播放方法,
播放上述音频附加信息时,不与上述主信息的时间轴取得同步。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP356079/2003 | 2003-10-16 | ||
| JP2003356079 | 2003-10-16 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN1868209A CN1868209A (zh) | 2006-11-22 |
| CN100484222C true CN100484222C (zh) | 2009-04-29 |
Family
ID=34463188
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CNB2004800304181A Expired - Fee Related CN100484222C (zh) | 2003-10-16 | 2004-06-29 | 视频音频记录播放装置、视频音频记录方法和视频音频播放方法 |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US20070127888A1 (zh) |
| EP (1) | EP1677531A4 (zh) |
| JP (1) | JP4271195B2 (zh) |
| KR (1) | KR100801396B1 (zh) |
| CN (1) | CN100484222C (zh) |
| CA (1) | CA2542390A1 (zh) |
| WO (1) | WO2005039175A1 (zh) |
Families Citing this family (138)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
| CN100409681C (zh) * | 2005-08-19 | 2008-08-06 | 上海晨兴电子科技有限公司 | 影音同步录制及播放方法 |
| US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
| US8301995B2 (en) * | 2006-06-22 | 2012-10-30 | Csr Technology Inc. | Labeling and sorting items of digital data by use of attached annotations |
| KR100856407B1 (ko) | 2006-07-06 | 2008-09-04 | 삼성전자주식회사 | 메타 데이터를 생성하는 데이터 기록 및 재생 장치 및 방법 |
| US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
| KR101309284B1 (ko) | 2006-12-05 | 2013-09-16 | 삼성전자주식회사 | 오디오 사용자 인터페이스 처리 방법 및 장치 및 그를적용한 오디오 기기 |
| CN101202873B (zh) * | 2006-12-13 | 2012-07-25 | 株式会社日立制作所 | 信息记录再现装置和信息记录再现方法 |
| US8553856B2 (en) * | 2007-01-07 | 2013-10-08 | Apple Inc. | Voicemail systems and methods |
| US20080167009A1 (en) * | 2007-01-07 | 2008-07-10 | Gregory Novick | Voicemail Systems and Methods |
| JP5009650B2 (ja) * | 2007-03-02 | 2012-08-22 | 株式会社エクシング | 合成装置、合成システム、合成方法及びプログラム |
| KR101125286B1 (ko) * | 2007-03-27 | 2012-03-21 | 삼성전자주식회사 | 부가 데이터 업데이트 방법 및 재생 장치 |
| US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
| US20090062944A1 (en) * | 2007-09-04 | 2009-03-05 | Apple Inc. | Modifying media files |
| US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
| US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
| US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
| US8682848B2 (en) * | 2008-07-08 | 2014-03-25 | Broadcom Corporation | Method and system for automatic detection of multimedia settings |
| US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
| WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
| US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform |
| US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
| US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
| US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
| US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
| JP5540244B2 (ja) * | 2009-10-24 | 2014-07-02 | 株式会社コルグ | 多重録音装置 |
| KR101641240B1 (ko) * | 2009-12-17 | 2016-07-21 | 엘지전자 주식회사 | 영상 표시 방법 및 그 장치 |
| US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
| US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
| US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
| US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
| US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
| CN102013179A (zh) * | 2010-12-02 | 2011-04-13 | 无敌科技(西安)有限公司 | 同时同步录播方式的电子学习系统及方法 |
| US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
| US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
| US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
| US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
| JP2013055569A (ja) * | 2011-09-06 | 2013-03-21 | Sony Corp | 撮像装置、情報処理装置、それらの制御方法、および、プログラム |
| KR101356006B1 (ko) * | 2012-02-06 | 2014-02-12 | 한국과학기술원 | 구간설정이 가능한 음성기반 멀티미디어 컨텐츠 태깅 방법 및 장치 |
| US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
| US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
| KR102042265B1 (ko) * | 2012-03-30 | 2019-11-08 | 엘지전자 주식회사 | 이동 단말기 |
| CN102682820B (zh) * | 2012-05-03 | 2015-01-28 | 福建星网视易信息系统有限公司 | 嵌入式linux平台媒体播放方法和系统 |
| US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
| US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
| US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
| US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
| US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
| KR101943320B1 (ko) * | 2012-09-21 | 2019-04-17 | 엘지전자 주식회사 | 이동단말기 및 그 제어방법 |
| KR102746303B1 (ko) | 2013-02-07 | 2024-12-26 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
| US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
| WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
| WO2014144949A2 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | Training an at least partial voice command system |
| US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
| WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
| WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
| WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
| CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
| US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
| EP3008964B1 (en) | 2013-06-13 | 2019-09-25 | Apple Inc. | System and method for emergency calls initiated by voice command |
| WO2015020942A1 (en) | 2013-08-06 | 2015-02-12 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
| US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
| US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
| US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
| US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
| US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
| US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
| US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
| US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
| US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
| US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
| US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
| EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
| US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
| US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
| US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
| US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
| US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
| US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
| US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
| US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
| US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
| US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
| US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
| US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
| US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
| US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
| US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
| US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
| US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
| US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
| JP2016181767A (ja) * | 2015-03-23 | 2016-10-13 | パナソニックIpマネジメント株式会社 | ウェアラブルカメラ及びウェアラブルカメラシステム |
| US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
| US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
| US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
| US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
| US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
| US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
| US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
| US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
| US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
| US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
| US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
| US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
| US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
| US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
| US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
| US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
| US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
| US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
| US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
| US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
| US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
| US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
| DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
| US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
| US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
| US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
| US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
| US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
| DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
| DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
| DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
| DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
| US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
| US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
| US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
| DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
| DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
| DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
| DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
| DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
| DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
| DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
| DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
| CN110740275B (zh) * | 2019-10-30 | 2022-07-19 | 中央电视台 | 一种非线性编辑系统 |
| EP4172795A4 (en) * | 2020-06-30 | 2024-08-14 | Seff Technology Corporation | DIGITAL INFORMATION MANAGEMENT SYSTEM AND METHOD |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3528214B2 (ja) * | 1993-10-21 | 2004-05-17 | 株式会社日立製作所 | 画像表示方法及び装置 |
| US5600775A (en) * | 1994-08-26 | 1997-02-04 | Emotion, Inc. | Method and apparatus for annotating full motion video and other indexed data structures |
| US6006241A (en) * | 1997-03-14 | 1999-12-21 | Microsoft Corporation | Production of a video stream with synchronized annotations over a computer network |
| US6529920B1 (en) * | 1999-03-05 | 2003-03-04 | Audiovelocity, Inc. | Multimedia linking device and method |
| US6378132B1 (en) * | 1999-05-20 | 2002-04-23 | Avid Sports, Llc | Signal capture and distribution system |
| JP2001136482A (ja) * | 1999-11-09 | 2001-05-18 | Matsushita Electric Ind Co Ltd | 映像音声記録再生装置 |
| JP3942792B2 (ja) * | 2000-03-28 | 2007-07-11 | パイオニア株式会社 | 映像編集方法及び装置、並びにそのための記憶媒体 |
| GB2366926A (en) * | 2000-09-06 | 2002-03-20 | Sony Uk Ltd | Combining material and data |
| US20020089519A1 (en) * | 2001-01-05 | 2002-07-11 | Vm Labs, Inc. | Systems and methods for creating an annotated media presentation |
| JP2003158697A (ja) * | 2001-11-21 | 2003-05-30 | Fuji Photo Film Co Ltd | 撮像装置及びプログラム |
| US20040216173A1 (en) * | 2003-04-11 | 2004-10-28 | Peter Horoszowski | Video archiving and processing method and apparatus |
-
2004
- 2004-06-29 CN CNB2004800304181A patent/CN100484222C/zh not_active Expired - Fee Related
- 2004-06-29 KR KR1020067007101A patent/KR100801396B1/ko not_active Expired - Fee Related
- 2004-06-29 CA CA002542390A patent/CA2542390A1/en not_active Withdrawn
- 2004-06-29 WO PCT/JP2004/009489 patent/WO2005039175A1/ja not_active Ceased
- 2004-06-29 EP EP04746958A patent/EP1677531A4/en not_active Withdrawn
- 2004-06-29 JP JP2005514705A patent/JP4271195B2/ja not_active Expired - Fee Related
- 2004-06-29 US US10/575,715 patent/US20070127888A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| CA2542390A1 (en) | 2005-04-28 |
| WO2005039175A1 (ja) | 2005-04-28 |
| JPWO2005039175A1 (ja) | 2007-02-08 |
| EP1677531A4 (en) | 2009-03-04 |
| KR20060096026A (ko) | 2006-09-05 |
| JP4271195B2 (ja) | 2009-06-03 |
| KR100801396B1 (ko) | 2008-02-05 |
| US20070127888A1 (en) | 2007-06-07 |
| CN1868209A (zh) | 2006-11-22 |
| EP1677531A1 (en) | 2006-07-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN100484222C (zh) | 视频音频记录播放装置、视频音频记录方法和视频音频播放方法 | |
| JP4285512B2 (ja) | 記録装置、記録方法、再生装置、再生方法、記録再生装置、記録再生方法、撮像記録装置及び撮像記録方法 | |
| US20040208486A1 (en) | Recording apparatus, optical disk and computer-readable recording medium | |
| JP4045651B2 (ja) | 情報処理装置、情報処理方法及びプログラム記録媒体 | |
| JP4218029B2 (ja) | 映像記録装置 | |
| WO2004095451A1 (ja) | 入力データ記録装置及び入力データ記録方法 | |
| CN100562938C (zh) | 信息处理设备和方法 | |
| CN101211641B (zh) | 记录方法 | |
| US8059167B2 (en) | Shooting apparatus and shooting method, and program | |
| CN101198073B (zh) | 记录方法 | |
| JP4385943B2 (ja) | 編集方法、記録再生装置 | |
| JP4772742B2 (ja) | 画像再生装置、画像再生方法及びプログラム記録媒体 | |
| WO2004112032A1 (ja) | 情報処理装置および方法、記録媒体、並びにプログラム | |
| JP2008147727A (ja) | 記録方法 | |
| JP4615637B2 (ja) | 情報記録再生装置 | |
| JP2005236950A (ja) | 映像記録再生装置 | |
| JP4255796B2 (ja) | データ記録装置、データ記録方法、データ記録プログラム、および該プログラムを記録した記録媒体 | |
| JP2008147729A (ja) | 記録方法 | |
| JP2002057979A (ja) | データ記録装置、データ記録方法、データ再生装置およびデータ再生方法 | |
| JP2001136482A (ja) | 映像音声記録再生装置 | |
| JP4208022B2 (ja) | 情報編集装置、情報編集方法及びプログラム記録媒体 | |
| JP4479501B2 (ja) | 記録方法、記録再生装置及び再生装置 | |
| JP4719454B2 (ja) | 記録方法、記録装置 | |
| JP2006024239A (ja) | 入力データ記録装置及び入力データ記録方法 | |
| JP2007235997A (ja) | 情報記録装置、撮像装置、情報記録方法及び撮像方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant | ||
| CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090429 Termination date: 20140629 |
|
| EXPY | Termination of patent right or utility model |