KR101071043B1 - 고속 오디오 검색을 위한 방법 및 장치 - Google Patents
고속 오디오 검색을 위한 방법 및 장치 Download PDFInfo
- Publication number
- KR101071043B1 KR101071043B1 KR1020107029141A KR20107029141A KR101071043B1 KR 101071043 B1 KR101071043 B1 KR 101071043B1 KR 1020107029141 A KR1020107029141 A KR 1020107029141A KR 20107029141 A KR20107029141 A KR 20107029141A KR 101071043 B1 KR101071043 B1 KR 101071043B1
- Authority
- KR
- South Korea
- Prior art keywords
- segment
- target audio
- audio clip
- groups
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/632—Query formulation
- G06F16/634—Query by example, e.g. query by humming
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
도 1은 강건하고 병렬인 오디오 검색이 오디오 검색 모듈을 이용하여 수행될 수 있는 하나의 컴퓨팅 시스템 예를 도시하고 있다.
도 2는 강건하고 병렬인 오디오 검색이 오디오 검색 모듈을 이용하여 수행될 수 있는 또 하나의 컴퓨팅 시스템 예를 도시하고 있다.
도 3은 강건하고 병렬인 오디오 검색이 오디오 검색 모듈을 이용하여 수행될 수 있는 또 다른 컴퓨팅 시스템의 예를 예시하고 있다.
도 4는 강건한 오디오 검색을 수행하는 예시적인 오디오 검색 모듈의 블록도이다.
도 5는 도 4에 도시된 강건한 오디오 검색 모듈이 동작하는 방법을 예시하는 예이다.
도 6은 멀티프로세서 시스템에서 강건하고 병렬인 오디오 검색을 수행하는 예시적인 오디오 검색 모듈의 블록도이다.
도 7a, 7b 및 7c는 멀티프로세서 시스템에서 강건하고 병렬인 오디오 검색을 위해 큰 오디오 데이터베이스를 더 작은 그룹으로 파티셔닝하는 방법을 예시하고 있다.
도 8은 멀티프로세서 시스템에서 강건하고 병렬인 오디오 검색을 수행하기 위한 예시적인 프로세스를 예시하는 의사코드(pseudo code)이다.
110: 프로세서
120: 오디오 검색 모듈
125: 메모리 컨트롤러
135: 디바이스 인터페이스
145: PCI 브리지
150: 메인 메모리
160: 다른 컴포넌트
170: 오디오 디바이스
180: 디스크 드라이브
Claims (13)
- 멀티프로세서 시스템에서 타겟 오디오 클립에 대한 오디오 데이터베이스를 검색하기 위한 방법으로서,
상기 오디오 데이터베이스를 복수의 그룹으로 파티셔닝하는 단계;
상기 타겟 오디오 클립에 대한 모델을 확립하는 단계;
상기 복수의 그룹을 상기 멀티프로세서 시스템의 복수의 프로세서에 스케줄링하는 단계; 및
상기 타겟 오디오 클립을 검색하기 위해 상기 복수의 프로세서에 의해 상기 스케줄링된 그룹들을 병렬로 처리하는 단계
를 포함하고,
상기 스케줄링된 그룹들을 병렬로 처리하는 단계는 상기 스케줄링된 그룹들의 각각을 적어도 하나의 세그먼트로 파티셔닝하는 단계를 포함하고, 각각의 세그먼트에 대하여,
(a) 상기 세그먼트에 대한 모델을 확립하는 단계;
(b) 상기 세그먼트의 상기 모델과 상기 타겟 오디오 클립의 상기 모델 사이의 거리를 계산하는 단계;
(c) 상기 거리가 사전결정된 임계치를 만족시키는 경우, 상기 세그먼트가 상기 타겟 오디오 클립과 매칭하는 것으로 결정하는 단계; 및
(d) 상기 거리가 상기 사전결정된 임계치를 만족시키지 않는 경우, 다수의 세그먼트를 처리하는 것을 스킵하는 단계 - 상기 세그먼트들의 수는 상기 거리의 값에 의존함 -
를 포함하는 검색 방법. - 제1항에 있어서,
상기 오디오 데이터베이스를 파티셔닝하는 단계는 상기 복수의 그룹 각각에 대한 크기를 결정하는 단계를 포함하고,
상기 크기는 상기 복수의 그룹 간의 중첩된 계산량 및 상기 복수의 그룹의 병렬 처리에서의 부하 불균형을 감소시키도록 결정되는 검색 방법. - 제1항에 있어서,
상기 타겟 오디오 클립의 상기 모델을 확립하는 단계는 상기 타겟 오디오 클립으로부터 특징 벡터 시퀀스(feature vector sequence)(FVS)를 추출하는 단계 및 상기 FVS를 모델링하는 단계를 포함하는 검색 방법. - 제1항에 있어서,
상기 적어도 하나의 세그먼트 각각은 상기 타겟 오디오 클립과 시간상으로 동일한 길이를 갖는 검색 방법. - 멀티프로세서 시스템에서 타겟 오디오 클립에 대한 오디오 데이터베이스를 검색하기 위한 방법으로서,
상기 오디오 데이터베이스를 복수의 그룹으로 파티셔닝하는 단계;
상기 타겟 오디오 클립에 대한 모델을 확립하는 단계;
상기 복수의 그룹을 상기 멀티프로세서 시스템의 복수의 프로세서에 스케줄링하는 단계; 및
상기 스케줄링된 그룹들의 각각을 적어도 하나의 세그먼트로 파티셔닝하는 단계; 및
상기 타겟 오디오 클립을 검색하기 위해 상기 복수의 프로세서에 의해 상기 스케줄링된 그룹들을 병렬로 처리하는 단계
를 포함하고,
오디오 스트림에 다수의 세그먼트들이 있는 경우, 각각의 세그먼트는 그 세그먼트 바로 앞의 세그먼트와 부분적으로 중첩하는 검색 방법. - 제5항에 있어서,
각각의 세그먼트에 대하여,
(a) 상기 세그먼트에 대한 특징 벡터 시퀀스("FVS")를 추출하는 단계;
(b) 상기 세그먼트의 모델을 결정하기 위해 상기 세그먼트에 대한 상기 FVS를 모델링하는 단계;
(c) 상기 세그먼트의 상기 모델과 상기 타겟 오디오 클립의 상기 모델 사이의 거리를 계산하는 단계;
(d) 상기 거리가 사전결정된 임계치를 만족시키는 경우, 상기 세그먼트가 상기 타겟 오디오 클립과 매칭하는 것으로 결정하는 단계; 및
(e) 상기 거리가 상기 사전결정된 임계치를 만족시키지 않는 경우, 다수의 세그먼트를 처리하는 것을 스킵하는 단계 - 상기 세그먼트들의 수는 상기 거리의 값에 의존함 -
를 포함하는 검색 방법. - 멀티프로세서 플랫폼에 의해 실행될 때, 상기 멀티프로세서 플랫폼이 동작들을 수행하게 하는 명령어들을 포함하는 머신 판독가능한 매체를 포함하는 물품으로서,
상기 동작들은,
오디오 데이터베이스를 복수의 그룹으로 파티셔닝하는 단계;
타겟 오디오 클립에 대한 모델을 확립하는 단계;
상기 복수의 그룹을 상기 멀티프로세서 플랫폼의 복수의 프로세서에 스케줄링하는 단계;
상기 타겟 오디오 클립을 검색하기 위해 상기 복수의 프로세서에 의해 상기 스케줄링된 그룹들을 병렬로 처리하는 단계
를 포함하고,
상기 스케줄링된 그룹들을 병렬로 처리하는 단계는 상기 스케줄링된 그룹들의 각각을 적어도 하나의 세그먼트로 파티셔닝하는 단계를 포함하고, 각각의 세그먼트에 대하여,
(a) 상기 세그먼트에 대한 모델을 확립하는 단계;
(b) 상기 세그먼트의 상기 모델과 상기 타겟 오디오 클립의 상기 모델 사이의 거리를 계산하는 단계;
(c) 상기 거리가 사전결정된 임계치를 만족시키는 경우, 상기 세그먼트가 상기 타겟 오디오 클립과 매칭하는 것으로 결정하는 단계; 및
(d) 상기 거리가 상기 사전결정된 임계치를 만족시키지 않는 경우, 다수의 세그먼트를 처리하는 것을 스킵하는 단계 - 상기 세그먼트들의 수는 상기 거리의 값에 의존함 -
를 포함하는 물품. - 제7항에 있어서,
상기 오디오 데이터베이스를 파티셔닝하는 단계는 상기 복수의 그룹 각각에 대한 크기를 결정하는 단계를 포함하고,
상기 크기는 상기 복수의 그룹 간의 중첩된 계산량 및 상기 복수의 그룹의 병렬 처리에서의 부하 불균형을 감소시키도록 결정되는 물품. - 제7항에 있어서,
상기 타겟 오디오 클립에 대한 모델을 확립하는 단계는 상기 타겟 오디오 클립으로부터 특징 벡터 시퀀스(FVS)를 추출하는 단계 및 복수의 가우시안 컴포넌트에 기초하여 상기 타겟 오디오 클립으로부터 상기 FVS를 모델링하는 단계를 포함하는 물품. - 제9항에 있어서,
상기 타겟 오디오 클립으로부터 상기 FVS를 모델링하는 단계는 상기 복수의 가우시안 컴포넌트 각각에 대한 혼합 가중들(mixture weights)을 추정하는 단계를 포함하는 물품. - 제7항에 있어서,
상기 적어도 하나의 세그먼트의 각각은 상기 타겟 오디오 클립과 시간상으로 동일한 길이를 갖는 물품. - 멀티프로세서 플랫폼에 의해 실행될 때, 상기 멀티프로세서 플랫폼이 동작들을 수행하게 하는 명령어들을 포함하는 머신 판독가능한 매체를 포함하는 물품으로서,
상기 동작들은,
오디오 데이터베이스를 복수의 그룹으로 파티셔닝하는 단계;
타겟 오디오 클립에 대한 모델을 확립하는 단계;
상기 복수의 그룹을 상기 멀티프로세서 플랫폼의 복수의 프로세서에 스케줄링하는 단계;
상기 스케줄링된 그룹의 각각을 적어도 하나의 세그먼트에 파티셔닝하는 단계; 및
상기 타겟 오디오 클립을 검색하기 위해 상기 복수의 프로세서에 의해 상기 스케줄링된 그룹들을 병렬로 처리하는 단계
를 포함하고,
오디오 스트림에 다수의 세그먼트들이 있는 경우, 각각의 세그먼트는 그 세그먼트 바로 앞의 세그먼트와 부분적으로 중첩하는 물품. - 제12항에 있어서,
상기 멀티프로세서 플랫폼에 의해 실행될 때, 상기 멀티프로세서 플랫폼으로 하여금 각각의 세그먼트에 대해,
(a) 상기 세그먼트에 대한 특징 벡터 시퀀스("FVS")를 추출하는 단계;
(b) 상기 세그먼트의 모델을 결정하기 위해 상기 세그먼트에 대한 상기 FVS를 모델링하는 단계;
(c) 상기 세그먼트의 상기 모델과 상기 타겟 오디오 클립의 상기 모델 사이의 거리를 계산하는 단계;
(d) 상기 거리가 사전결정된 임계치를 만족시키는 경우, 상기 세그먼트가 상기 타겟 오디오 클립과 매칭하는 것으로 결정하는 단계; 및
(e) 상기 거리가 상기 사전결정된 임계치를 만족시키지 않는 경우, 다수의 세그먼트를 처리하는 것을 스킵하는 단계 - 상기 세그먼트들의 수는 상기 거리의 값에 의존함 -
를 포함하는 동작들을 수행하게 하는 명령어들을 포함하는 물품.
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| PCT/CN2006/001550 WO2008006241A1 (en) | 2006-07-03 | 2006-07-03 | Method and apparatus for fast audio search |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020097000034A Division KR101071017B1 (ko) | 2006-07-03 | 2006-07-03 | 고속 오디오 검색을 위한 방법 및 장치 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20110014664A KR20110014664A (ko) | 2011-02-11 |
| KR101071043B1 true KR101071043B1 (ko) | 2011-10-06 |
Family
ID=38922899
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020107029141A Expired - Fee Related KR101071043B1 (ko) | 2006-07-03 | 2006-07-03 | 고속 오디오 검색을 위한 방법 및 장치 |
Country Status (6)
| Country | Link |
|---|---|
| US (2) | US7908275B2 (ko) |
| EP (1) | EP2044524A4 (ko) |
| JP (1) | JP5006929B2 (ko) |
| KR (1) | KR101071043B1 (ko) |
| CN (1) | CN101553799B (ko) |
| WO (1) | WO2008006241A1 (ko) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5413779B2 (ja) * | 2010-06-24 | 2014-02-12 | 株式会社日立製作所 | 音響−独自性データベース生成システム、音響データ類似判定システム、音響−独自性データベース生成方法、及び、音響データ類似判定方法 |
| CN102314875B (zh) * | 2011-08-01 | 2016-04-27 | 北京音之邦文化科技有限公司 | 一种音频文件的识别方法和装置 |
| US20140108448A1 (en) * | 2012-03-30 | 2014-04-17 | Intel Corporation | Multi-sensor velocity dependent context aware voice recognition and summarization |
| US8990951B1 (en) | 2012-03-30 | 2015-03-24 | Google Inc. | Claiming delayed live reference streams |
| US8886635B2 (en) * | 2012-05-23 | 2014-11-11 | Enswers Co., Ltd. | Apparatus and method for recognizing content using audio signal |
| CN102841932A (zh) * | 2012-08-06 | 2012-12-26 | 河海大学 | 一种基于内容的音频语义特征相似度比较方法 |
| GB2504737B (en) * | 2012-08-08 | 2016-06-01 | Basis Tech Int Ltd | Load balancing in data processing system |
| US9529907B2 (en) * | 2012-12-31 | 2016-12-27 | Google Inc. | Hold back and real time ranking of results in a streaming matching system |
| CN104252480B (zh) * | 2013-06-27 | 2018-09-07 | 深圳市腾讯计算机系统有限公司 | 一种音频信息检索的方法和装置 |
| JP2017097188A (ja) * | 2015-11-25 | 2017-06-01 | 日本電信電話株式会社 | 話者らしさ評価装置、話者識別装置、話者照合装置、話者らしさ評価方法、プログラム |
| CN105657535B (zh) * | 2015-12-29 | 2018-10-30 | 北京搜狗科技发展有限公司 | 一种音频识别方法和装置 |
| CN107748750A (zh) * | 2017-08-30 | 2018-03-02 | 百度在线网络技术(北京)有限公司 | 相似视频查找方法、装置、设备及存储介质 |
| CN110019994A (zh) * | 2017-11-13 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 数据加密、解密及查询方法、数据加密解密及查询装置 |
| US11810435B2 (en) | 2018-02-28 | 2023-11-07 | Robert Bosch Gmbh | System and method for audio event detection in surveillance systems |
| US11240609B2 (en) * | 2018-06-22 | 2022-02-01 | Semiconductor Components Industries, Llc | Music classifier and related methods |
| CN109036382B (zh) * | 2018-08-15 | 2020-06-09 | 武汉大学 | 一种基于kl散度的音频特征提取方法 |
| US10923158B1 (en) * | 2019-11-25 | 2021-02-16 | International Business Machines Corporation | Dynamic sequential image processing |
| CN115881067A (zh) * | 2022-12-22 | 2023-03-31 | 中国海洋大学 | 基于Resnet101的音乐流派分类方法、系统、介质 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20020129038A1 (en) | 2000-12-18 | 2002-09-12 | Cunningham Scott Woodroofe | Gaussian mixture models in a data mining system |
| US20040002935A1 (en) | 2002-06-27 | 2004-01-01 | Hagai Attias | Searching multi-media databases using multi-media queries |
Family Cites Families (30)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR0172866B1 (ko) * | 1994-07-06 | 1999-04-15 | 구자홍 | 음성 또는 영상신호의 저장/재생장치 |
| US6181867B1 (en) * | 1995-06-07 | 2001-01-30 | Intervu, Inc. | Video storage and retrieval system |
| US5765166A (en) * | 1996-04-23 | 1998-06-09 | Raytheon Company | Use of symmetric multiprocessors for multiple hypothesis tracking |
| JP3155991B2 (ja) * | 1997-04-09 | 2001-04-16 | 日本アイ・ビー・エム株式会社 | 集約演算実行方法及びコンピュータ・システム |
| GB9800427D0 (en) * | 1998-01-10 | 1998-03-04 | Ibm | Probabilistic data clustering |
| JPH11282857A (ja) * | 1998-03-27 | 1999-10-15 | Animo:Kk | 音声検索装置および記録媒体 |
| US6260036B1 (en) * | 1998-05-07 | 2001-07-10 | Ibm | Scalable parallel algorithm for self-organizing maps with applications to sparse data mining problems |
| US6581058B1 (en) * | 1998-05-22 | 2003-06-17 | Microsoft Corporation | Scalable system for clustering of large databases having mixed data attributes |
| US6826350B1 (en) * | 1998-06-01 | 2004-11-30 | Nippon Telegraph And Telephone Corporation | High-speed signal search method device and recording medium for the same |
| US6269376B1 (en) * | 1998-10-26 | 2001-07-31 | International Business Machines Corporation | Method and system for clustering data in parallel in a distributed-memory multiprocessor system |
| JP2000187668A (ja) * | 1998-12-22 | 2000-07-04 | Hitachi Ltd | グループ化方法と重複排除方法 |
| US6774917B1 (en) * | 1999-03-11 | 2004-08-10 | Fuji Xerox Co., Ltd. | Methods and apparatuses for interactive similarity searching, retrieval, and browsing of video |
| US6345252B1 (en) * | 1999-04-09 | 2002-02-05 | International Business Machines Corporation | Methods and apparatus for retrieving audio information using content and speaker information |
| US9076448B2 (en) * | 1999-11-12 | 2015-07-07 | Nuance Communications, Inc. | Distributed real time speech recognition system |
| US6470331B1 (en) * | 1999-12-04 | 2002-10-22 | Ncr Corporation | Very large table reduction in parallel processing database systems |
| US6453252B1 (en) * | 2000-05-15 | 2002-09-17 | Creative Technology Ltd. | Process for identifying audio content |
| US20020046030A1 (en) * | 2000-05-18 | 2002-04-18 | Haritsa Jayant Ramaswamy | Method and apparatus for improved call handling and service based on caller's demographic information |
| US6990453B2 (en) | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
| US6496834B1 (en) * | 2000-12-22 | 2002-12-17 | Ncr Corporation | Method for performing clustering in very large databases |
| NO315887B1 (no) * | 2001-01-04 | 2003-11-03 | Fast Search & Transfer As | Fremgangsmater ved overforing og soking av videoinformasjon |
| US6968337B2 (en) * | 2001-07-10 | 2005-11-22 | Audible Magic Corporation | Method and apparatus for identifying an unknown work |
| JP2003186890A (ja) * | 2001-12-13 | 2003-07-04 | Mitsubishi Electric Corp | 連続メディアデータ格納方法および連続メディアデータ並列処理方法 |
| US6879954B2 (en) * | 2002-04-22 | 2005-04-12 | Matsushita Electric Industrial Co., Ltd. | Pattern matching for large vocabulary speech recognition systems |
| US7174343B2 (en) * | 2002-05-10 | 2007-02-06 | Oracle International Corporation | In-database clustering |
| US7177874B2 (en) * | 2003-01-16 | 2007-02-13 | Jardin Cary A | System and method for generating and processing results data in a distributed system |
| JPWO2004084095A1 (ja) * | 2003-03-18 | 2006-06-22 | 富士通株式会社 | 情報検索システム,情報検索方法,情報検索装置,情報検索プログラムおよび当該プログラムを記録したコンピュータ読取可能な記録媒体 |
| JP3848319B2 (ja) * | 2003-11-11 | 2006-11-22 | キヤノン株式会社 | 情報処理方法及び情報処理装置 |
| CN100592386C (zh) * | 2004-07-01 | 2010-02-24 | 日本电信电话株式会社 | 特定音响信号含有区间检测系统及其方法 |
| JP4595415B2 (ja) * | 2004-07-14 | 2010-12-08 | 日本電気株式会社 | 音声検索システムおよび方法ならびにプログラム |
| CN1755796A (zh) * | 2004-09-30 | 2006-04-05 | 国际商业机器公司 | 文本到语音转换中基于统计技术的距离定义方法和系统 |
-
2006
- 2006-07-03 KR KR1020107029141A patent/KR101071043B1/ko not_active Expired - Fee Related
- 2006-07-03 WO PCT/CN2006/001550 patent/WO2008006241A1/en active Application Filing
- 2006-07-03 CN CN2006800557292A patent/CN101553799B/zh not_active Expired - Fee Related
- 2006-07-03 JP JP2009516853A patent/JP5006929B2/ja not_active Expired - Fee Related
- 2006-07-03 EP EP06761349A patent/EP2044524A4/en not_active Withdrawn
- 2006-07-03 US US10/590,397 patent/US7908275B2/en not_active Expired - Fee Related
-
2011
- 2011-02-01 US US13/018,635 patent/US20110184952A1/en not_active Abandoned
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20020129038A1 (en) | 2000-12-18 | 2002-09-12 | Cunningham Scott Woodroofe | Gaussian mixture models in a data mining system |
| US20040002935A1 (en) | 2002-06-27 | 2004-01-01 | Hagai Attias | Searching multi-media databases using multi-media queries |
Also Published As
| Publication number | Publication date |
|---|---|
| US7908275B2 (en) | 2011-03-15 |
| JP2009541869A (ja) | 2009-11-26 |
| EP2044524A1 (en) | 2009-04-08 |
| US20090019025A1 (en) | 2009-01-15 |
| KR20110014664A (ko) | 2011-02-11 |
| EP2044524A4 (en) | 2010-10-27 |
| CN101553799B (zh) | 2012-03-21 |
| CN101553799A (zh) | 2009-10-07 |
| US20110184952A1 (en) | 2011-07-28 |
| WO2008006241A1 (en) | 2008-01-17 |
| JP5006929B2 (ja) | 2012-08-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101071043B1 (ko) | 고속 오디오 검색을 위한 방법 및 장치 | |
| CN109905772B (zh) | 视频片段查询方法、装置、计算机设备及存储介质 | |
| US10909442B1 (en) | Neural network-based artificial intelligence system for content-based recommendations using multi-perspective learned descriptors | |
| JP7023934B2 (ja) | 音声認識方法及び装置 | |
| US9148619B2 (en) | Music soundtrack recommendation engine for videos | |
| US20230316042A1 (en) | Mixture of experts models with sparsified weights | |
| CN112825249B (zh) | 语音处理方法和设备 | |
| US20070136274A1 (en) | System of effectively searching text for keyword, and method thereof | |
| US11854536B2 (en) | Keyword spotting apparatus, method, and computer-readable recording medium thereof | |
| WO2007067329A1 (en) | Improving ranking results using multiple nested ranking | |
| CN108121814B (zh) | 搜索结果排序模型生成方法和装置 | |
| Le et al. | NII-HITACHI-UIT at TRECVID 2016. | |
| Srikanthan et al. | Implementing the dynamic time warping algorithm in multithreaded environments for real time and unsupervised pattern discovery | |
| JP2023534068A (ja) | スパース性を使用して深層学習ネットワークを加速するためのシステム及び方法 | |
| US20250190469A1 (en) | Instance-level adaptive propulsion of external knowledge (iapek) | |
| Xu et al. | CHA: A caching framework for home-based voice assistant systems | |
| CN120322775A (zh) | 经由状态空间模型(ssm)增强的转换器的长序列建模 | |
| KR101071017B1 (ko) | 고속 오디오 검색을 위한 방법 및 장치 | |
| CN102456077B (zh) | 用于快速音频搜索的方法和设备 | |
| JP5210440B2 (ja) | 高速音声検索のための方法、プログラムおよび装置 | |
| JP5755603B2 (ja) | 言語モデル作成装置、言語モデル作成方法、プログラム | |
| Kim et al. | Multi-user real-time speech recognition with a GPU | |
| KR102828691B1 (ko) | 의미 유사도 기반 응답 획득 장치 및 방법 | |
| US20240273355A1 (en) | General-purpose neural audio fingerprinting | |
| Liu et al. | Speech recognition systems on the Cell Broadband Engine processor |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A107 | Divisional application of patent | ||
| PA0104 | Divisional application for international application |
St.27 status event code: A-0-1-A10-A16-div-PA0104 St.27 status event code: A-0-1-A10-A18-div-PA0104 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| A201 | Request for examination | ||
| P11-X000 | Amendment of application requested |
St.27 status event code: A-2-2-P10-P11-nap-X000 |
|
| P13-X000 | Application amended |
St.27 status event code: A-2-2-P10-P13-nap-X000 |
|
| PA0201 | Request for examination |
St.27 status event code: A-1-2-D10-D11-exm-PA0201 |
|
| E701 | Decision to grant or registration of patent right | ||
| PE0701 | Decision of registration |
St.27 status event code: A-1-2-D10-D22-exm-PE0701 |
|
| GRNT | Written decision to grant | ||
| PR0701 | Registration of establishment |
St.27 status event code: A-2-4-F10-F11-exm-PR0701 |
|
| PR1002 | Payment of registration fee |
Fee payment year number: 1 St.27 status event code: A-2-2-U10-U12-oth-PR1002 |
|
| PG1601 | Publication of registration |
St.27 status event code: A-4-4-Q10-Q13-nap-PG1601 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20140829 Year of fee payment: 4 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 4 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| R18-X000 | Changes to party contact information recorded |
St.27 status event code: A-5-5-R10-R18-oth-X000 |
|
| FPAY | Annual fee payment |
Payment date: 20150827 Year of fee payment: 5 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 5 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| FPAY | Annual fee payment |
Payment date: 20160831 Year of fee payment: 6 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 6 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 7 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| FPAY | Annual fee payment |
Payment date: 20180903 Year of fee payment: 8 |
|
| PR1001 | Payment of annual fee |
Fee payment year number: 8 St.27 status event code: A-4-4-U10-U11-oth-PR1001 |
|
| P22-X000 | Classification modified |
St.27 status event code: A-4-4-P10-P22-nap-X000 |
|
| PC1903 | Unpaid annual fee |
Not in force date: 20190930 Payment event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE St.27 status event code: A-4-4-U10-U13-oth-PC1903 |
|
| PC1903 | Unpaid annual fee |
Ip right cessation event data comment text: Termination Category : DEFAULT_OF_REGISTRATION_FEE Not in force date: 20190930 St.27 status event code: N-4-6-H10-H13-oth-PC1903 |