JP2008515107A - テキスト分割のために言語を選択する方法およびシステム - Google Patents
テキスト分割のために言語を選択する方法およびシステム Download PDFInfo
- Publication number
- JP2008515107A JP2008515107A JP2007534758A JP2007534758A JP2008515107A JP 2008515107 A JP2008515107 A JP 2008515107A JP 2007534758 A JP2007534758 A JP 2007534758A JP 2007534758 A JP2007534758 A JP 2007534758A JP 2008515107 A JP2008515107 A JP 2008515107A
- Authority
- JP
- Japan
- Prior art keywords
- language
- result
- appearance frequency
- determining
- program code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
- 
        - G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
 
- 
        - G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/263—Language identification
 
- 
        - G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
 
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
- Information Transfer Between Computers (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明の実施形態は、テキスト分割のために言語を選択する方法およびシステムを有する。本発明について複数の実施形態がある。序論および実施形態として、本発明の一例の実施形態は、複数のトークンまたは単語の中のドメインネームのような、文字列の正確な言語を選択することで、文字列の分割を改善する方法として提供される。文字列についての多くの可能(potential)または候補言語が、前記文字列に関連している言語、ユーザに関連しているIPアドレス、前記文字列で使用された文字セット、前記ユーザに関連づけられたブラウザ・アプリケーション・プログラムのブラウザ設定、および前記文字列に関連づけられた最上位のドメインのような、様々な信号に基づいて選択することができる。文字列は、各候補言語を使用して多くの分割結果に区分することができる。各分割結果は、単語または他のトークンの特定の組合せとなることができる。例えば、文字列「usedrugs」は、英語についての以下の分割結果に分割することができる。
「used rugs」、「use drugs」、「us ed rugs」など。
各候補言語の分割結果のこの数から、実施可能分割結果および実施可能言語が前記実施可能分割結果を含む前記実施可能言語の中の文書または検索クエリーの数に基づいて特定できる。
本発明に従った様々なシステムが構成できる。図1は、本発明として動作可能な実施形態の一例のシステムの図を示している。また、本発明は、他のシステムとして、動作可能であるとともに、実施可能である。参照している図面では、いくつかの図面を通して同様の要素には同様の番号が付いており、図1は、本発明の実施形態を実施するための環境の一例を示す図である。図1に示すシステム100は、ネットワーク106を渡ってサーバ装置104およびサーバ装置150と通信する複数のクライアント装置102a−nを有する。一実施形態として、示されたネットワーク106は、インターネットを有する。他の実施形態として、イントラネット、WANまたはLANのような、他のネットワークを使用することができる。さらに、本発明に係る方法は、1台のコンピュータで動作することもできる。
本発明の実施形態に係る様々な方法が実施できる。本発明に従った一例の方法は、文字列に関連する第1候補言語および第2候補言語を少なくとも特定するステップと、前記文字列から前記第1候補言語に関連する第1分割結果を少なくとも決定するとともに、前記文字列から前記第2候補言語に関連する第2分割結果を少なくとも決定するステップと、前記第1分割結果について第1出現頻度を決定するとともに、前記第2分割結果について第2出現頻度を決定するステップと、前記第1出現頻度および第2出現頻度の一部に少なくとも基づいて、前記第1候補言語および第2候補言語から実施可能言語を特定するステップと、を有する。2つ以上の候補言語が特定できるとともに、2つ以上の分割結果が決定できる。例えば、3つの候補言語が特定できるとともに、4つの分割結果が各候補言語について決定できる。
例えば、「.ch」は、スイスを示すことができるとともに、文字列がフランス語、ドイツ語またはイタリア語に関連し得ることを示すことができる。文字列についての候補言語を特定する他の適当な信号および方法が使用されることとしてもよい。
上述の説明は多くの特定の内容を有しているが、これらは本発明の範囲を限定するものと理解すべきではなく、単なる開示された実施形態として理解すべきである。当業者は、本発明の範囲内のあらゆる他の実施可能な変形をなすことができる。前記用語の第1および第2は、単に、1つの物を他の物から区別するものとして、本明細書では使用されている。前記用語の第1および第2は、明らかな注記がない場合、時間についての第1または第2、リストについての第1または第2、または他の順番、を示すためには使用されない。例えば、「第2」は、他の方法で明らかに示されていない限り、時間について、または「第1」の前のリストについて、のものとしてもよい。
102a−n クライアント装置
104 サーバ装置
106 ネットワーク
116 プロセッサ
118 メモリ
120 分割化エンジン
122 分割化プロセッサ
124 頻度プロセッサ
126 言語プロセッサ
126 トークン・データベース
150 サーバ装置
152 プロセッサ
154 メモリ
156 サーチエンジン
158 索引装置
160 インデックス
Claims (35)
-  文字列に関連づけられた第1候補言語および第2候補言語を少なくとも特定するステップと、
 前記文字列から前記第1候補言語に関連づけられた第1分割結果を少なくとも決定するとともに、前記文字列から前記第2候補言語に関連づけられた第2分割結果を少なくとも決定するステップと、
 前記第1分割結果について第1出現頻度を決定するとともに、前記第2分割結果について第2出現頻度を決定するステップと、
 少なくとも前記第1出現頻度および第2出現頻度の一部に基づいて、前記第1候補言語および第2候補言語から実施可能言語を特定するステップと、
 を有することを特徴とする方法。
-  前記実施可能言語を特定するステップは、少なくとも前記第1出現頻度および第2出現頻度の一部に基づいて、前記第1分割結果および第2分割結果から実施可能分割結果を特定するステップを有する請求項1に記載の方法。
-  前記第1候補言語および第2候補言語を特定するステップは、少なくとも1つの言語信号の一部に基づいて行われる請求項1に記載の方法。
-  前記少なくとも1つの言語信号は、前記文字列に関連づけられた1つの言語学と、前記文字列に関連づけられたユーザのIPアドレスと、前記文字列に関連づけられた文字セットと、前記文字列に関連づけられたユーザに関連づけられたブラウザ・アプリケーション・プログラムのブラウザ設定と、前記文字列に関連づけられた最上位のドメインとを少なくとも有する請求項3に記載の方法。
-  前記実施可能言語を特定するステップは、少なくとも1つの言語信号の少なくとも一部に基づいて行われる請求項1に記載の方法。
-  前記第1分割結果は、トークンの第1組合せを有し、
 前記第2分割結果は、トークンの第2組合せを有する請求項1に記載の方法。
-  前記第1分割結果について前記第1出現頻度を決定するステップは、前記第1分割結果を有している前記第1候補言語における記事の数を決定するステップと、前記第1候補言語における記事の総数に基づいて前記記事の数を標準化するステップとを有する請求項1に記載の方法。
-  前記第1分割結果を有している前記第1候補言語において前記記事の数を決定するステップは、前記第1分割結果を有している検索クエリーに対応して生成された検索結果セットを識別する記事の数を決定するステップを有する請求項7に記載の方法。
-  前記第1分割結果を有している前記記事の数を決定するステップは、記事のインデックスにアクセスするステップを有する請求項7に記載の方法。
-  前記第1分割結果について前記第1出現頻度を決定するステップは、前記第1候補言語の中で複数の検索クエリーにおける第1分割結果の出現数を決定するステップと、前記第1候補言語の中の検索クエリーの総数に基づいて前記出現数を標準化するステップとを有する請求項1に記載の方法。
-  前記文字列は、ドメインネームを有する請求項1に記載の方法。
-  実施可能言語の一部に少なくともに基づいて記事を選択するステップをさらに有する請求項1に記載の方法。
-  前記記事は、広告と、ウェブページと、状況メッセージとを少なくとも有する請求項12に記載の方法。
-  前記第1分割結果を決定するステップは、
 前記文字列から前記第1候補言語における複数の分割結果を決定するステップと、
 前記複数の分割結果から前記第1分割結果を特定するステップと
 を有する請求項1に記載の方法。
-  前記第1分割結果を特定するステップは、前記複数の分割結果それぞれについて確率値を計算するステップを有する請求項14に記載の方法。
-  前記第1分割結果に関連づけられた第1確率値が、第1分割結果における各トークンの頻度の一部に少なくとも基づいて計算される請求項15に記載の方法。
-  前記第1出現頻度および第2出現頻度の一部に少なくとも基づいて、前記第1候補言語および第2候補言語から実施可能言語を特定するステップは、前記第1出現頻度が前記第2出現頻度よりも大きい場合、前記第1候補言語を選択するステップを有する請求項1に記載の方法。
-  文字列に関連づけられている第1候補言語および第2候補言語を少なくとも特定するプログラムコードと、
 前記文字列から前記第1候補言語に関連づけられた第1分割結果を少なくとも決定するとともに、前記文字列から前記第2候補言語に関連づけられた第2分割結果を少なくとも決定するプログラムコードと、
 前記第1分割結果について第1出現頻度を決定するとともに、前記第2分割結果について第2出現頻度を決定するプログラムコードと、
 少なくとも前記第1出現頻度および第2出現頻度の一部に基づいて、前記第1候補言語および第2候補言語から実施可能言語を特定するプログラムコードと
 を有するプログラムコードを有するコンピュータ読み取り可能媒体。
-  前記実施可能言語を特定するプログラムコードは、少なくとも前記第1出現頻度および第2出現頻度の一部に基づいて、前記第1分割結果および第2分割結果から実施可能分割結果を特定するプログラムコードを有する請求項18に記載のコンピュータ読み取り可能媒体。
-  前記第1候補言語および第2候補言語を特定するプログラムコードは、少なくとも1つの言語信号の一部に基づいて構成されている請求項18に記載のコンピュータ読み取り可能媒体。
-  前記少なくとも1つの言語信号は、
 前記文字列に関連づけられた1つの言語学と、前記文字列に関連づけられたユーザのIPアドレスと、前記文字列に関連づけられた文字セットと、前記文字列に関連づけられたユーザに関連づけられたブラウザ・アプリケーション・プログラムのブラウザ設定と、前記文字列に関連づけられた最上位のドメインとを少なくとも有する請求項20に記載のコンピュータ読み取り可能媒体。
-  前記実施可能言語を特定するプログラムコードは、少なくとも1つの言語信号の少なくとも一部に基づいて構成されている請求項18に記載のコンピュータ読み取り可能媒体。
-  前記第1分割結果は、トークンの第1組合せを有し、
 前記第2分割結果は、トークンの第2組合せを有する請求項18に記載のコンピュータ読み取り可能媒体。
-  前記第1分割結果について前記第1出現頻度を決定するプログラムコードは、
 前記第1分割結果を有している前記第1候補言語における記事の数を決定するプログラムコードと、前記第1候補言語における記事の総数に基づいて前記記事の数を標準化するプログラムコードとを有する請求項18に記載のコンピュータ読み取り可能媒体。
-  前記第1分割結果を有している前記第1候補言語において前記記事の数を決定するプログラムコードは、
 前記第1分割結果を有している検索クエリーに対応して生成された検索結果セットを識別する記事の数を決定するプログラムコードを有する請求項24に記載のコンピュータ読み取り可能媒体。
-  前記第1分割結果を有している前記記事の数を決定するプログラムコードは、
 記事のインデックスにアクセスするプログラムコードを有する請求項25に記載のコンピュータ読み取り可能媒体。
-  前記第1分割結果について前記第1出現頻度を決定するプログラムコードは、
 前記第1候補言語の中で複数の検索クエリーにおける第1分割結果の出現数を決定するプログラムコードと、前記第1候補言語の中の検索クエリーの総数に基づいて出現頻度を標準化するプログラムコードとを有する請求項18に記載のコンピュータ読み取り可能媒体。
-  前記文字列は、ドメインネームを有する請求項18に記載のコンピュータ読み取り可能媒体。
-  実施可能言語の一部に少なくともに基づいて記事を選択するプログラムコードをさらに有する請求項18に記載のコンピュータ読み取り可能媒体。
-  前記記事は、広告と、ウェブページと、状況メッセージとを少なくとも有する請求項29に記載のコンピュータ読み取り可能媒体。
-  前記第1分割結果を決定するプログラムコードは、
 前記文字列から前記第1候補言語における複数の分割結果を決定するプログラムコードと、
 前記複数の分割結果から前記第1分割結果を特定するプログラムコードとを有する請求項18に記載のコンピュータ読み取り可能媒体。
-  前記第1分割結果を特定するプログラムコードは、前記複数の分割結果それぞれの確率値を計算するプログラムコードを有する請求項31に記載のコンピュータ読み取り可能媒体。
-  前記第1分割結果に関連づけられた第1確率値が、第1分割結果における各トークンの頻度の一部に少なくとも基づいて計算される請求項32に記載のコンピュータ読み取り可能媒体。
-  前記第1出現頻度および第2出現頻度の一部に少なくとも基づいて、前記第1候補言語および第2候補言語から実施可能言語を特定するプログラムコードは、
 前記第1出現頻度が前記第2出現頻度よりも大きい場合、前記第1候補言語を選択するプログラムコードを有する請求項18に記載のコンピュータ読み取り可能媒体。
-  ドメインネームから第1候補言語の中で第1分割結果を少なくとも決定するとともに、ドメインネームから第2候補言語の中で第2分割結果を少なくとも決定するステップと、
 少なくとも記事インデックスと、テキストインデックスと、検索結果セットとの一部に少なくとも基づいて、前記第1分割結果について第1出現頻度を少なくとも決定するステップと、
 前記第2分割結果について第2出現頻度決定するステップと、
 前記第1出現頻度が前記第2出現頻度よりも大きいとき、実施可能言語として前記第1候補言語を選択するステップと、
 前記第2出現頻度が前記第1出現頻度よりも大きいとき、実施可能言語として前記第2候補言語を選択するステップと、
 前記実施可能言語の一部に少なくとも基づいて広告を選択するステップと、
 前記ドメインネームに関連づけられたウェブページに関連づけて前記広告の表示をするステップと、を有し、
 前記広告は、前記実施可能言語のテキストを有していることを特徴とする方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| US10/955,660 US7996208B2 (en) | 2004-09-30 | 2004-09-30 | Methods and systems for selecting a language for text segmentation | 
| US10/955,660 | 2004-09-30 | ||
| PCT/US2005/035010 WO2006039398A2 (en) | 2004-09-30 | 2005-09-28 | Methods and systems for selecting a language for text segmentation | 
Publications (3)
| Publication Number | Publication Date | 
|---|---|
| JP2008515107A true JP2008515107A (ja) | 2008-05-08 | 
| JP2008515107A5 JP2008515107A5 (ja) | 2008-12-04 | 
| JP5148278B2 JP5148278B2 (ja) | 2013-02-20 | 
Family
ID=35985934
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| JP2007534758A Expired - Lifetime JP5148278B2 (ja) | 2004-09-30 | 2005-09-28 | テキスト分割のために言語を選択する方法およびシステム | 
Country Status (8)
| Country | Link | 
|---|---|
| US (4) | US7996208B2 (ja) | 
| EP (2) | EP2511832B1 (ja) | 
| JP (1) | JP5148278B2 (ja) | 
| CN (3) | CN102708095B (ja) | 
| CA (1) | CA2581902C (ja) | 
| DK (1) | DK1800224T3 (ja) | 
| ES (1) | ES2395168T3 (ja) | 
| WO (1) | WO2006039398A2 (ja) | 
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| JP2011023007A (ja) * | 2009-07-17 | 2011-02-03 | Nhn Corp | 統計データに基づくユーザクエリ校正システムおよび方法 | 
Families Citing this family (142)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice | 
| US7680648B2 (en) | 2004-09-30 | 2010-03-16 | Google Inc. | Methods and systems for improving text segmentation | 
| US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant | 
| US8255376B2 (en) | 2006-04-19 | 2012-08-28 | Google Inc. | Augmenting queries with synonyms from synonyms map | 
| US8762358B2 (en) * | 2006-04-19 | 2014-06-24 | Google Inc. | Query language determination using query terms and interface language | 
| US8380488B1 (en) | 2006-04-19 | 2013-02-19 | Google Inc. | Identifying a property of a document | 
| US8442965B2 (en) | 2006-04-19 | 2013-05-14 | Google Inc. | Query language identification | 
| US7689408B2 (en) * | 2006-09-01 | 2010-03-30 | Microsoft Corporation | Identifying language of origin for words using estimates of normalized appearance frequency | 
| CA2661559C (en) * | 2006-09-01 | 2013-07-16 | Research In Motion Limited | Method for identifying language of text in a handheld electronic device and a handheld electronic device incorporating the same | 
| US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant | 
| US8423908B2 (en) * | 2006-09-08 | 2013-04-16 | Research In Motion Limited | Method for identifying language of text in a handheld electronic device and a handheld electronic device incorporating the same | 
| ATE480090T1 (de) * | 2006-09-18 | 2010-09-15 | Lg Electronics Inc | Verfahren zur verwaltung von sprachinformation für texteingabe, verfahren für texteingabe und mobiles endgerät | 
| WO2008111052A2 (en) * | 2007-03-09 | 2008-09-18 | Ghost, Inc. | A virtual file system for the web | 
| US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation | 
| US9754022B2 (en) * | 2007-10-30 | 2017-09-05 | At&T Intellectual Property I, L.P. | System and method for language sensitive contextual searching | 
| US8165869B2 (en) * | 2007-12-10 | 2012-04-24 | International Business Machines Corporation | Learning word segmentation from non-white space languages corpora | 
| US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals | 
| US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion | 
| US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction | 
| US8464150B2 (en) * | 2008-06-07 | 2013-06-11 | Apple Inc. | Automatic language identification for dynamic text processing | 
| US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback | 
| US9356907B2 (en) | 2008-08-05 | 2016-05-31 | HeyWire, Inc. | Messaging system having multiple number, dual mode phone support | 
| US11172067B1 (en) | 2008-08-05 | 2021-11-09 | HeyWire, Inc. | Call center mobile messaging | 
| US12238246B2 (en) | 2008-08-05 | 2025-02-25 | Salesforce, Inc. | Call center mobile messaging | 
| US20120221962A1 (en) | 2008-08-05 | 2012-08-30 | Eugene Lee Lew | Social messaging hub system | 
| WO2010017164A1 (en) | 2008-08-05 | 2010-02-11 | Mediafriends, Inc. | Apparatus and methods for tv social applications | 
| US20120309363A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Triggering notifications associated with tasks items that represent tasks to perform | 
| US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant | 
| US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant | 
| US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries | 
| US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition | 
| US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant | 
| US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction | 
| US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries | 
| US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant | 
| US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information | 
| US8635205B1 (en) * | 2010-06-18 | 2014-01-21 | Google Inc. | Displaying local site name information with search results | 
| CN101882226B (zh) * | 2010-06-24 | 2013-07-24 | 汉王科技股份有限公司 | 提高字符间语言区分度的方法及装置 | 
| US20120004899A1 (en) * | 2010-07-04 | 2012-01-05 | Taymoor Arshi | Dynamic ad selection for ad delivery systems | 
| CN102455997A (zh) * | 2010-10-27 | 2012-05-16 | 鸿富锦精密工业(深圳)有限公司 | 元件名称提取系统及方法 | 
| US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication | 
| US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications | 
| US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing | 
| US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation | 
| US9483461B2 (en) * | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages | 
| US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests | 
| US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system | 
| US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document | 
| CN103631802B (zh) * | 2012-08-24 | 2015-05-20 | 腾讯科技(深圳)有限公司 | 歌曲信息检索方法、装置及相应的服务器 | 
| US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant | 
| US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching | 
| US9218335B2 (en) * | 2012-10-10 | 2015-12-22 | Verisign, Inc. | Automated language detection for domain names | 
| US8713433B1 (en) * | 2012-10-16 | 2014-04-29 | Google Inc. | Feature-based autocorrection | 
| US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions | 
| WO2014144949A2 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | Training an at least partial voice command system | 
| WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model | 
| WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant | 
| US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion | 
| WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition | 
| WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices | 
| US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs | 
| CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 | 
| EP3008964B1 (en) | 2013-06-13 | 2019-09-25 | Apple Inc. | System and method for emergency calls initiated by voice command | 
| US9213910B2 (en) | 2013-11-06 | 2015-12-15 | Xerox Corporation | Reinforcement learning approach to character level segmentation of license plate images | 
| EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method | 
| US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases | 
| US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation | 
| US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input | 
| US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models | 
| US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input | 
| US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models | 
| US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing | 
| US9740687B2 (en) | 2014-06-11 | 2017-08-22 | Facebook, Inc. | Classifying languages for objects and entities | 
| US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions | 
| US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates | 
| US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback | 
| US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests | 
| US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger | 
| US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders | 
| US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition | 
| US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations | 
| US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models | 
| US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques | 
| US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection | 
| US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis | 
| US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants | 
| US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity | 
| US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation | 
| US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers | 
| US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models | 
| US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing | 
| US10360309B2 (en) * | 2015-04-30 | 2019-07-23 | Salesforce.Com, Inc. | Call center SMS-MMS language router | 
| US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance | 
| US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings | 
| US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session | 
| US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction | 
| US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging | 
| US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models | 
| US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection | 
| US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant | 
| US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant | 
| US9734142B2 (en) | 2015-09-22 | 2017-08-15 | Facebook, Inc. | Universal translation | 
| US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks | 
| US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction | 
| US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models | 
| US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification | 
| CN105224682B (zh) * | 2015-10-27 | 2018-06-05 | 上海智臻智能网络科技股份有限公司 | 新词发现方法及装置 | 
| US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment | 
| US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition | 
| US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices | 
| US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials | 
| US10430485B2 (en) | 2016-05-10 | 2019-10-01 | Go Daddy Operating Company, LLC | Verifying character sets in domain name requests | 
| US10180930B2 (en) | 2016-05-10 | 2019-01-15 | Go Daddy Operating Company, Inc. | Auto completing domain names comprising multiple languages | 
| US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters | 
| US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems | 
| US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading | 
| US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration | 
| DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment | 
| US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report | 
| US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment | 
| US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction | 
| US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech | 
| US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input | 
| DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant | 
| DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control | 
| DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery | 
| DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification | 
| US10348671B2 (en) | 2016-07-11 | 2019-07-09 | Salesforce.Com, Inc. | System and method to use a mobile number in conjunction with a non-telephony internet connected device | 
| US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant | 
| US10380247B2 (en) | 2016-10-28 | 2019-08-13 | Microsoft Technology Licensing, Llc | Language-based acronym generation for strings | 
| US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition | 
| US10180935B2 (en) * | 2016-12-30 | 2019-01-15 | Facebook, Inc. | Identifying multiple languages in a content item | 
| DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant | 
| DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models | 
| DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT | 
| DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback | 
| DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants | 
| DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES | 
| CN109492225A (zh) * | 2018-11-08 | 2019-03-19 | 大连瀚闻资讯有限公司 | 一种小语种国家的舆情信息文本处理方法 | 
| CN111079408B (zh) * | 2019-12-26 | 2023-05-30 | 北京锐安科技有限公司 | 一种语种识别方法、装置、设备及存储介质 | 
| US11915167B2 (en) | 2020-08-12 | 2024-02-27 | State Farm Mutual Automobile Insurance Company | Claim analysis based on candidate functions | 
| US20250200080A1 (en) * | 2023-12-15 | 2025-06-19 | Amazon Technologies, Inc. | Dynamic text tokenization for index-based searching of annotated data assets using keyword-based text searching | 
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| JPH07262188A (ja) * | 1994-03-14 | 1995-10-13 | Internatl Business Mach Corp <Ibm> | 言語識別処理方法 | 
| JPH10124513A (ja) * | 1996-09-30 | 1998-05-15 | Internatl Business Mach Corp <Ibm> | 言語を特定する方法およびシステム | 
| JPH11511574A (ja) * | 1995-08-22 | 1999-10-05 | バックウェブ | 遠隔地のネットワークと局地のコンピュータとの間の情報を伝送し、表示する方法及び装置 | 
| JP2000194696A (ja) * | 1998-12-23 | 2000-07-14 | Xerox Corp | サンプルテキスト基調言語自動識別方法 | 
| JP2001101186A (ja) * | 1999-09-30 | 2001-04-13 | Oki Electric Ind Co Ltd | 機械翻訳装置 | 
| JP2002245470A (ja) * | 2001-02-16 | 2002-08-30 | Merukomu Service Kk | 言語特定装置及び翻訳装置及び言語特定方法 | 
| WO2002095614A1 (fr) * | 2001-05-24 | 2002-11-28 | Izumi Suzuki | Procede d'identification d'un systeme de code de type langage ou par caracteres | 
| JP2003186789A (ja) * | 2001-12-18 | 2003-07-04 | Logo Vista Corp | 電子メール翻訳システム | 
Family Cites Families (96)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US4839853A (en) | 1988-09-15 | 1989-06-13 | Bell Communications Research, Inc. | Computer information retrieval using latent semantic structure | 
| US5325298A (en) | 1990-11-07 | 1994-06-28 | Hnc, Inc. | Methods for generating or revising context vectors for a plurality of word stems | 
| US5423032A (en) | 1991-10-31 | 1995-06-06 | International Business Machines Corporation | Method for extracting multi-word technical terms from text | 
| DE69318559D1 (de) * | 1992-07-24 | 1998-06-18 | Us Health | Peptide brauchbar als microsequezierungsstandard und verfahren zu ihrer anwendung | 
| US5377280A (en) | 1993-04-19 | 1994-12-27 | Xerox Corporation | Method and apparatus for automatic language determination of European script documents | 
| US5454046A (en) | 1993-09-17 | 1995-09-26 | Penkey Corporation | Universal symbolic handwriting recognition system | 
| US5619709A (en) | 1993-09-20 | 1997-04-08 | Hnc, Inc. | System and method of context vector generation and retrieval | 
| US5499360A (en) | 1994-02-28 | 1996-03-12 | Panasonic Technolgies, Inc. | Method for proximity searching with range testing and range adjustment | 
| US5794177A (en) | 1995-07-19 | 1998-08-11 | Inso Corporation | Method and apparatus for morphological analysis and generation of natural language text | 
| US6067552A (en) | 1995-08-21 | 2000-05-23 | Cnet, Inc. | User interface system and method for browsing a hypertext database | 
| US5778364A (en) | 1996-01-02 | 1998-07-07 | Verity, Inc. | Evaluation of content of a data set using multiple and/or complex queries | 
| US5966686A (en) | 1996-06-28 | 1999-10-12 | Microsoft Corporation | Method and system for computing semantic logical forms from syntax trees | 
| EP0822502A1 (en) | 1996-07-31 | 1998-02-04 | BRITISH TELECOMMUNICATIONS public limited company | Data access system | 
| US6002998A (en) * | 1996-09-30 | 1999-12-14 | International Business Machines Corporation | Fast, efficient hardware mechanism for natural language determination | 
| US5778363A (en) | 1996-12-30 | 1998-07-07 | Intel Corporation | Method for measuring thresholded relevance of a document to a specified topic | 
| US6285999B1 (en) | 1997-01-10 | 2001-09-04 | The Board Of Trustees Of The Leland Stanford Junior University | Method for node ranking in a linked database | 
| US7437351B2 (en) | 1997-01-10 | 2008-10-14 | Google Inc. | Method for searching media | 
| US6076051A (en) | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text | 
| US6119164A (en) | 1997-04-15 | 2000-09-12 | Full Circle Software, Inc. | Method and apparatus for distributing over a network unsolicited information to a targeted audience | 
| US6006222A (en) | 1997-04-25 | 1999-12-21 | Culliss; Gary | Method for organizing information | 
| US6185559B1 (en) | 1997-05-09 | 2001-02-06 | Hitachi America, Ltd. | Method and apparatus for dynamically counting large itemsets | 
| US6233575B1 (en) | 1997-06-24 | 2001-05-15 | International Business Machines Corporation | Multilevel taxonomy based on features derived from training documents classification using fisher values as discrimination values | 
| US6505150B2 (en) | 1997-07-02 | 2003-01-07 | Xerox Corporation | Article and method of automatically filtering information retrieval results using test genre | 
| US5933822A (en) | 1997-07-22 | 1999-08-03 | Microsoft Corporation | Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision | 
| US6760746B1 (en) | 1999-09-01 | 2004-07-06 | Eric Schneider | Method, product, and apparatus for processing a data request | 
| US6182068B1 (en) | 1997-08-01 | 2001-01-30 | Ask Jeeves, Inc. | Personalized search methods | 
| US6078916A (en) | 1997-08-01 | 2000-06-20 | Culliss; Gary | Method for organizing information | 
| US6014665A (en) | 1997-08-01 | 2000-01-11 | Culliss; Gary | Method for organizing information | 
| US5845278A (en) | 1997-09-12 | 1998-12-01 | Inioseek Corporation | Method for automatically selecting collections to search in full text searches | 
| US5974412A (en) | 1997-09-24 | 1999-10-26 | Sapient Health Network | Intelligent query system for automatically indexing information in a database and automatically categorizing users | 
| US6134532A (en) | 1997-11-14 | 2000-10-17 | Aptex Software, Inc. | System and method for optimal adaptive matching of users to most relevant entity and information in real-time | 
| US6230168B1 (en) * | 1997-11-26 | 2001-05-08 | International Business Machines Corp. | Method for automatically constructing contexts in a hypertext collection | 
| US6289342B1 (en) | 1998-01-05 | 2001-09-11 | Nec Research Institute, Inc. | Autonomous citation indexing and literature browsing using citation context | 
| US6640006B2 (en) | 1998-02-13 | 2003-10-28 | Microsoft Corporation | Word segmentation in chinese text | 
| US6421675B1 (en) | 1998-03-16 | 2002-07-16 | S. L. I. Systems, Inc. | Search engine | 
| US6272456B1 (en) | 1998-03-19 | 2001-08-07 | Microsoft Corporation | System and method for identifying the language of written text having a plurality of different length n-gram profiles | 
| GB9806085D0 (en) * | 1998-03-23 | 1998-05-20 | Xerox Corp | Text summarisation using light syntactic parsing | 
| US6044375A (en) | 1998-04-30 | 2000-03-28 | Hewlett-Packard Company | Automatic extraction of metadata using a neural network | 
| US6334131B2 (en) | 1998-08-29 | 2001-12-25 | International Business Machines Corporation | Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures | 
| US6466901B1 (en) * | 1998-11-30 | 2002-10-15 | Apple Computer, Inc. | Multi-language document search and retrieval system | 
| US6298348B1 (en) | 1998-12-03 | 2001-10-02 | Expanse Networks, Inc. | Consumer profiling system | 
| US6324519B1 (en) | 1999-03-12 | 2001-11-27 | Expanse Networks, Inc. | Advertisement auction system | 
| US6269189B1 (en) | 1998-12-29 | 2001-07-31 | Xerox Corporation | Finding selected character strings in text and providing information relating to the selected character strings | 
| US6678681B1 (en) | 1999-03-10 | 2004-01-13 | Google Inc. | Information extraction from a database | 
| US6826559B1 (en) | 1999-03-31 | 2004-11-30 | Verizon Laboratories Inc. | Hybrid category mapping for on-line query tool | 
| US6493702B1 (en) | 1999-05-05 | 2002-12-10 | Xerox Corporation | System and method for searching and recommending documents in a collection using share bookmarks | 
| US6493703B1 (en) * | 1999-05-11 | 2002-12-10 | Prophet Financial Systems | System and method for implementing intelligent online community message board | 
| US7065500B2 (en) | 1999-05-28 | 2006-06-20 | Overture Services, Inc. | Automatic advertiser notification for a system for providing place and price protection in a search result list generated by a computer network search engine | 
| US6269361B1 (en) | 1999-05-28 | 2001-07-31 | Goto.Com | System and method for influencing a position on a search result list generated by a computer network search engine | 
| US6314419B1 (en) | 1999-06-04 | 2001-11-06 | Oracle Corporation | Methods and apparatus for generating query feedback based on co-occurrence patterns | 
| WO2000079436A2 (en) | 1999-06-24 | 2000-12-28 | Simpli.Com | Search engine interface | 
| US6601026B2 (en) | 1999-09-17 | 2003-07-29 | Discern Communications, Inc. | Information retrieval by natural language querying | 
| US6754873B1 (en) | 1999-09-20 | 2004-06-22 | Google Inc. | Techniques for finding related hyperlinked documents using link-based analysis | 
| US6816857B1 (en) | 1999-11-01 | 2004-11-09 | Applied Semantics, Inc. | Meaning-based advertising and document relevance determination | 
| US6453315B1 (en) | 1999-09-22 | 2002-09-17 | Applied Semantics, Inc. | Meaning-based information organization and retrieval | 
| WO2001031500A1 (en) | 1999-10-29 | 2001-05-03 | British Telecommunications Public Limited Company | Method and apparatus for processing queries | 
| US6968308B1 (en) | 1999-11-17 | 2005-11-22 | Microsoft Corporation | Method for segmenting non-segmented text using syntactic parse | 
| JP3803219B2 (ja) * | 1999-12-14 | 2006-08-02 | 三菱電機株式会社 | 全文検索装置及び全文検索方法 | 
| US6691108B2 (en) | 1999-12-14 | 2004-02-10 | Nec Corporation | Focused search engine and method | 
| US6678409B1 (en) | 2000-01-14 | 2004-01-13 | Microsoft Corporation | Parameterized word segmentation of unsegmented text | 
| US6615209B1 (en) | 2000-02-22 | 2003-09-02 | Google, Inc. | Detecting query-specific duplicate documents | 
| US20020002452A1 (en) * | 2000-03-28 | 2002-01-03 | Christy Samuel T. | Network-based text composition, translation, and document searching | 
| US6754872B2 (en) * | 2000-05-22 | 2004-06-22 | Sarnoff Corporation | Method and apparatus for reducing channel distortion in a wireless communications network | 
| GB2362971B (en) | 2000-05-30 | 2004-03-24 | Com Nation Ltd | A method of searching the internet and an internet search engine | 
| SE517005C2 (sv) | 2000-05-31 | 2002-04-02 | Hapax Information Systems Ab | Segmentering av text | 
| US7136854B2 (en) | 2000-07-06 | 2006-11-14 | Google, Inc. | Methods and apparatus for providing search results in response to an ambiguous search query | 
| US6529903B2 (en) | 2000-07-06 | 2003-03-04 | Google, Inc. | Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query | 
| US6654993B2 (en) * | 2000-07-28 | 2003-12-02 | The Penn State Research Foundation | Process for fabricating hollow electroactive devices | 
| US6766320B1 (en) | 2000-08-24 | 2004-07-20 | Microsoft Corporation | Search engine with natural language-based robust parsing for user query and relevance feedback learning | 
| CA2323883C (en) | 2000-10-19 | 2016-02-16 | Patrick Ryan Morin | Method and device for classifying internet objects and objects stored oncomputer-readable media | 
| US6917937B1 (en) | 2000-11-01 | 2005-07-12 | Sas Institute Inc. | Server-side object filtering | 
| US7054803B2 (en) * | 2000-12-19 | 2006-05-30 | Xerox Corporation | Extracting sentence translations from translated documents | 
| US6714939B2 (en) | 2001-01-08 | 2004-03-30 | Softface, Inc. | Creation of structured data from plain text | 
| US6658423B1 (en) | 2001-01-24 | 2003-12-02 | Google, Inc. | Detecting duplicate and near-duplicate files | 
| US6526440B1 (en) | 2001-01-30 | 2003-02-25 | Google, Inc. | Ranking search results by reranking the results based on local inter-connectivity | 
| JP3408525B2 (ja) | 2001-02-08 | 2003-05-19 | 松下電器産業株式会社 | Sram装置 | 
| US8001118B2 (en) | 2001-03-02 | 2011-08-16 | Google Inc. | Methods and apparatus for employing usage statistics in document retrieval | 
| US7860706B2 (en) * | 2001-03-16 | 2010-12-28 | Eli Abir | Knowledge system method and appparatus | 
| US6738764B2 (en) | 2001-05-08 | 2004-05-18 | Verity, Inc. | Apparatus and method for adaptively ranking search results | 
| US6978264B2 (en) | 2002-01-03 | 2005-12-20 | Microsoft Corporation | System and method for performing a search and a browse on a query | 
| US7716161B2 (en) | 2002-09-24 | 2010-05-11 | Google, Inc, | Methods and apparatus for serving relevant advertisements | 
| US8517795B2 (en) | 2002-11-06 | 2013-08-27 | Nomura Plating Co., Ltd. | Surface treatment method for vacuum member | 
| US7249012B2 (en) * | 2002-11-20 | 2007-07-24 | Microsoft Corporation | Statistical method and apparatus for learning translation relationships among phrases | 
| FR2848688A1 (fr) * | 2002-12-17 | 2004-06-18 | France Telecom | Identification de langue d'un texte | 
| US20040119740A1 (en) | 2002-12-24 | 2004-06-24 | Google, Inc., A Corporation Of The State Of California | Methods and apparatus for displaying and replying to electronic messages | 
| EP1627325B1 (en) | 2003-05-28 | 2011-07-27 | LOQUENDO SpA | Automatic segmentation of texts comprising chunks without separators | 
| US7370034B2 (en) | 2003-10-15 | 2008-05-06 | Xerox Corporation | System and method for performing electronic information retrieval using keywords | 
| US20050086065A1 (en) | 2003-10-16 | 2005-04-21 | Nokia Corporation | Automatic field completion in capacity-constrained media | 
| US20050131872A1 (en) | 2003-12-16 | 2005-06-16 | Microsoft Corporation | Query recognizer | 
| US8392249B2 (en) | 2003-12-31 | 2013-03-05 | Google Inc. | Suggesting and/or providing targeting criteria for advertisements | 
| US7359851B2 (en) * | 2004-01-14 | 2008-04-15 | Clairvoyance Corporation | Method of identifying the language of a textual passage using short word and/or n-gram comparisons | 
| US20050289473A1 (en) | 2004-03-17 | 2005-12-29 | Carl Gustafson | Method and system for providing search information via a communications network | 
| US7409334B1 (en) * | 2004-07-22 | 2008-08-05 | The United States Of America As Represented By The Director, National Security Agency | Method of text processing | 
| US7792814B2 (en) | 2005-09-30 | 2010-09-07 | Sap, Ag | Apparatus and method for parsing unstructured data | 
| US7761458B1 (en) | 2006-02-01 | 2010-07-20 | Hewlett-Packard Development Company, L.P. | Segmentation of a data sequence | 
| US7747633B2 (en) | 2007-07-23 | 2010-06-29 | Microsoft Corporation | Incremental parsing of hierarchical files | 
- 
        2004
        - 2004-09-30 US US10/955,660 patent/US7996208B2/en active Active
 
- 
        2005
        - 2005-09-28 CN CN201210063033.1A patent/CN102708095B/zh active Active
- 2005-09-28 CA CA2581902A patent/CA2581902C/en not_active Expired - Fee Related
- 2005-09-28 JP JP2007534758A patent/JP5148278B2/ja not_active Expired - Lifetime
- 2005-09-28 ES ES05802157T patent/ES2395168T3/es active Active
- 2005-09-28 DK DK05802157.7T patent/DK1800224T3/da active
- 2005-09-28 WO PCT/US2005/035010 patent/WO2006039398A2/en active Application Filing
- 2005-09-28 CN CN201210288916.2A patent/CN102831107B/zh active Active
- 2005-09-28 EP EP12175207.5A patent/EP2511832B1/en not_active Not-in-force
- 2005-09-28 EP EP05802157A patent/EP1800224B1/en not_active Not-in-force
- 2005-09-29 CN CN2005800411370A patent/CN101095138B/zh active Active
 
- 
        2011
        - 2011-08-08 US US13/205,087 patent/US8306808B2/en not_active Expired - Fee Related
 
- 
        2012
        - 2012-09-15 US US13/620,752 patent/US20130018648A1/en not_active Abandoned
- 2012-09-15 US US13/620,821 patent/US8489387B2/en not_active Expired - Fee Related
 
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| JPH07262188A (ja) * | 1994-03-14 | 1995-10-13 | Internatl Business Mach Corp <Ibm> | 言語識別処理方法 | 
| JPH11511574A (ja) * | 1995-08-22 | 1999-10-05 | バックウェブ | 遠隔地のネットワークと局地のコンピュータとの間の情報を伝送し、表示する方法及び装置 | 
| JPH10124513A (ja) * | 1996-09-30 | 1998-05-15 | Internatl Business Mach Corp <Ibm> | 言語を特定する方法およびシステム | 
| JP2000194696A (ja) * | 1998-12-23 | 2000-07-14 | Xerox Corp | サンプルテキスト基調言語自動識別方法 | 
| JP2001101186A (ja) * | 1999-09-30 | 2001-04-13 | Oki Electric Ind Co Ltd | 機械翻訳装置 | 
| JP2002245470A (ja) * | 2001-02-16 | 2002-08-30 | Merukomu Service Kk | 言語特定装置及び翻訳装置及び言語特定方法 | 
| WO2002095614A1 (fr) * | 2001-05-24 | 2002-11-28 | Izumi Suzuki | Procede d'identification d'un systeme de code de type langage ou par caracteres | 
| JP2003186789A (ja) * | 2001-12-18 | 2003-07-04 | Logo Vista Corp | 電子メール翻訳システム | 
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| JP2011023007A (ja) * | 2009-07-17 | 2011-02-03 | Nhn Corp | 統計データに基づくユーザクエリ校正システムおよび方法 | 
Also Published As
| Publication number | Publication date | 
|---|---|
| US8306808B2 (en) | 2012-11-06 | 
| DK1800224T3 (da) | 2012-11-19 | 
| US20110301939A1 (en) | 2011-12-08 | 
| CN102831107B (zh) | 2016-01-20 | 
| EP2511832B1 (en) | 2014-05-14 | 
| CN101095138A (zh) | 2007-12-26 | 
| EP1800224A2 (en) | 2007-06-27 | 
| EP2511832A3 (en) | 2013-03-20 | 
| CA2581902C (en) | 2013-05-07 | 
| WO2006039398A8 (en) | 2007-03-22 | 
| CA2581902A1 (en) | 2006-04-13 | 
| EP2511832A2 (en) | 2012-10-17 | 
| US7996208B2 (en) | 2011-08-09 | 
| US20130018648A1 (en) | 2013-01-17 | 
| ES2395168T3 (es) | 2013-02-08 | 
| WO2006039398A3 (en) | 2006-07-06 | 
| CN102708095B (zh) | 2015-09-30 | 
| CN101095138B (zh) | 2012-08-29 | 
| US8489387B2 (en) | 2013-07-16 | 
| WO2006039398A2 (en) | 2006-04-13 | 
| US20060074628A1 (en) | 2006-04-06 | 
| CN102708095A (zh) | 2012-10-03 | 
| US20130013288A1 (en) | 2013-01-10 | 
| EP1800224B1 (en) | 2012-08-29 | 
| CN102831107A (zh) | 2012-12-19 | 
| JP5148278B2 (ja) | 2013-02-20 | 
Similar Documents
| Publication | Publication Date | Title | 
|---|---|---|
| JP5148278B2 (ja) | テキスト分割のために言語を選択する方法およびシステム | |
| US8849852B2 (en) | Text segmentation | |
| US9104772B2 (en) | System and method for providing tag-based relevance recommendations of bookmarks in a bookmark and tag database | |
| JP5069285B2 (ja) | ウェブサイトのウェブページのような関連するウェブページの間での有用な情報の伝搬 | |
| US7516118B1 (en) | Methods and systems for assisted network browsing | |
| US8412517B2 (en) | Dictionary word and phrase determination | |
| US8417695B2 (en) | Identifying related concepts of URLs and domain names | |
| JP4857075B2 (ja) | ウェブドキュメントの集合において効率的に日付を検索する方法、コンピュータプログラム | |
| US8271486B2 (en) | System and method for searching a bookmark and tag database for relevant bookmarks | |
| US8745065B2 (en) | Query parsing for map search | |
| US8010344B2 (en) | Dictionary word and phrase determination | |
| US9652529B1 (en) | Methods and systems for augmenting a token lexicon | |
| KR100485321B1 (ko) | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 | |
| CN112380337A (zh) | 基于富文本的高亮方法及装置 | |
| US20100153365A1 (en) | Phrase identification using break points | |
| JP5544401B2 (ja) | 文書データ評価方法、文書データ評価装置、文書データ選択方法、文書データ選択装置、データベース生成方法、データベース生成装置、およびコンピュータプログラム | |
| US8676790B1 (en) | Methods and systems for improving search rankings using advertising data | |
| KR20040086732A (ko) | 검색 엔진에서 등록된 웹사이트를 관리하기 위한 방법 및그 시스템 | 
Legal Events
| Date | Code | Title | Description | 
|---|---|---|---|
| A521 | Request for written amendment filed | Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080926 | |
| A621 | Written request for application examination | Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080926 | |
| A521 | Request for written amendment filed | Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081017 | |
| A131 | Notification of reasons for refusal | Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110913 | |
| A601 | Written request for extension of time | Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111213 | |
| A602 | Written permission of extension of time | Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111220 | |
| A521 | Request for written amendment filed | Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120309 | |
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) | Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121030 | |
| A61 | First payment of annual fees (during grant procedure) | Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121128 | |
| R150 | Certificate of patent or registration of utility model | Ref document number: 5148278 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 | |
| FPAY | Renewal fee payment (event date is renewal date of database) | Free format text: PAYMENT UNTIL: 20151207 Year of fee payment: 3 | |
| R154 | Certificate of patent or utility model (reissue) | Free format text: JAPANESE INTERMEDIATE CODE: R154 | |
| R250 | Receipt of annual fees | Free format text: JAPANESE INTERMEDIATE CODE: R250 | |
| R250 | Receipt of annual fees | Free format text: JAPANESE INTERMEDIATE CODE: R250 | |
| R250 | Receipt of annual fees | Free format text: JAPANESE INTERMEDIATE CODE: R250 | |
| S533 | Written request for registration of change of name | Free format text: JAPANESE INTERMEDIATE CODE: R313533 | |
| R350 | Written notification of registration of transfer | Free format text: JAPANESE INTERMEDIATE CODE: R350 | |
| R250 | Receipt of annual fees | Free format text: JAPANESE INTERMEDIATE CODE: R250 | |
| R250 | Receipt of annual fees | Free format text: JAPANESE INTERMEDIATE CODE: R250 | |
| R250 | Receipt of annual fees | Free format text: JAPANESE INTERMEDIATE CODE: R250 | |
| R250 | Receipt of annual fees | Free format text: JAPANESE INTERMEDIATE CODE: R250 | |
| R250 | Receipt of annual fees | Free format text: JAPANESE INTERMEDIATE CODE: R250 | |
| R250 | Receipt of annual fees | Free format text: JAPANESE INTERMEDIATE CODE: R250 | |
| R250 | Receipt of annual fees | Free format text: JAPANESE INTERMEDIATE CODE: R250 |