KR20150116389A - 전자 장치와 서버를 활용한 음성 인식 - Google Patents
전자 장치와 서버를 활용한 음성 인식 Download PDFInfo
- Publication number
- KR20150116389A KR20150116389A KR1020150038857A KR20150038857A KR20150116389A KR 20150116389 A KR20150116389 A KR 20150116389A KR 1020150038857 A KR1020150038857 A KR 1020150038857A KR 20150038857 A KR20150038857 A KR 20150038857A KR 20150116389 A KR20150116389 A KR 20150116389A
- Authority
- KR
- South Korea
- Prior art keywords
- reliability
- server
- speech recognition
- voice
- asr
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Probability & Statistics with Applications (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
전자 장치가 개시된다. 상기 전자 장치는 메모리에 저장된 음성 인식 모델을 이용하여 음성 입력에 대한 ASR(automatic speech recognition)을 수행하는 프로세서, 상기 음성 입력을 서버로 제공하고 상기 서버로부터 상기 음성 입력에 대응하는 음성 명령을 수신하는 통신 모듈을 포함하고, ASR의 수행 결과에 대한 신뢰도에 따라 다른 동작을 수행할 수 있다. 이 외에도 명세서를 통해 파악되는 다양한 실시 예가 가능하다.
Description
도 2는 본 발명의 다른 실시 예에 따른 전자 장치 및 서버를 나타낸다.
도 3은 본 발명의 일 실시 예에 따른 음성 인식 수행 방법의 흐름도를 나타낸다.
도 4는 본 발명의 다른 실시 예에 따른 음성 인식 수행 방법의 흐름도를 나타낸다.
도 5는 본 발명의 일 실시 예에 따른 임계 값을 업데이트하는 방법의 흐름도를 나타낸다.
도 6은 본 발명의 일 실시 예에 따른 음성 인식 모델을 업데이트하는 방법의 흐름도를 나타낸다.
도 7은 본 발명의 일 실시 예에 따른 네트워크 환경 내의 전자 장치를 나타낸다.
도 8은 본 발명의 일 실시 예에 따른 전자 장치의 블록 도를 나타낸다.
Claims (20)
- 전자 장치에 있어서,
메모리에 저장된 음성 인식 모델을 이용하여 음성 입력에 대한 ASR(automatic speech recognition)을 수행하는 프로세서,
상기 음성 입력을 서버로 제공하고 상기 서버로부터 상기 음성 입력에 대응하는 음성 명령을 수신하는 통신 모듈을 포함하고,
상기 프로세서는 (1) 상기 ASR의 수행 결과의 신뢰도가 제1 임계값 이상인 경우 상기 ASR의 수행 결과에 대응하는 동작을 수행하고, (2) 상기 ASR의 수행 결과의 신뢰도가 제2 임계값 미만인 경우 상기 신뢰도에 대한 피드백을 제공하도록 설정되는, 전자 장치. - 청구항 1에 있어서,
상기 프로세서는, (3) 상기 신뢰도가 상기 제1 임계 값과 상기 제2 임계 값 사이인 경우 상기 서버로부터 수신되는 상기 음성 명령을 수행하도록 설정되는, 전자 장치. - 청구항 1에 있어서,
상기 신뢰도가 상기 제1 임계 값 이상인 경우, 상기 동작은 상기 음성 명령의 수신 여부와 관계없이 수행되도록 설정되는, 전자 장치. - 청구항 3에 있어서,
상기 동작은, 상기 프로세서에 의해 실행 가능한 적어도 하나의 기능, 적어도 하나의 어플리케이션, 또는 상기 ASR의 수행 결과에 기초한 입력 중 적어도 하나를 포함하도록 설정되는, 전자 장치. - 청구항 1에 있어서,
상기 피드백은 상기 음성 입력이 인식되지 않았거나 상기 수행 결과를 신뢰할 수 없음을 나타내는 메시지 또는 오디오 출력을 포함하도록 설정되는, 전자 장치. - 청구항 1에 있어서,
상기 서버로부터 수신되는 상기 음성 명령은, 상기 메모리에 저장된 상기 음성 인식 모델과 다른 음성 인식 모델에 기초하여, 상기 서버에서 상기 제공된 음성 입력에 대한 음성 인식의 수행 결과에 해당하는, 전자 장치. - 청구항 6에 있어서,
상기 서버에서 수행되는 음성 인식은 NLP (Natural Language Processing)을 포함하는, 전자 장치. - 청구항 1에 있어서,
상기 프로세서는, 상기 음성 입력에 대한 전처리(pre-processing)가 적용된 오디오 신호를 상기 ASR을 수행하는 ASR 엔진으로 제공하고, 상기 음성 입력 자체를 상기 통신 모듈을 통해 상기 서버로 제공하도록 설정되는, 전자 장치. - 청구항 1에 있어서,
상기 프로세서는 상기 신뢰도가 상기 제1 임계 값 이상인 경우, 상기 ASR의 수행 결과와 상기 서버로부터 수신되는 상기 음성 명령을 비교하고 비교 결과에 기초하여 상기 제1 임계 값을 변경하도록 설정되는, 전자 장치. - 청구항 9에 있어서,
상기 프로세서는 상기 ASR의 수행 결과와 상기 서버로부터 수신되는 상기 음성 명령이 대응되는 경우 상기 제1 임계 값을 감소시키고, 서로 대응되지 않는 경우 상기 제1 임계 값을 증가시키도록 설정되는, 전자 장치. - 청구항 1에 있어서,
상기 프로세서는 상기 신뢰도가 상기 제1 임계 값 미만인 경우, 상기 ASR의 수행 결과와 상기 서버로부터 수신되는 상기 음성 명령을 비교하고, 비교 결과에 기초하여 상기 음성 인식 모델을 업데이트 하도록 설정되는, 전자 장치. - 청구항 11에 있어서,
상기 통신 모듈은 상기 서버로부터 상기 음성 명령과 함께 상기 음성 명령에 대한 신뢰도를 수신하고,
상기 프로세서는 상기 음성 입력에 대하여 상기 음성 명령 및 상기 음성 명령에 대한 신뢰도를 상기 음성 인식 모델에 추가하도록 설정되는, 전자 장치. - 전자 장치의 음성 인식 수행 방법에 있어서,
사용자로부터 음성 입력을 획득하여 음성 신호를 생성하는 동작,
상기 음성 신호의 적어도 일부에 대한 제1 음성 인식을 수행하여 제1 동작 정보 및 제1 신뢰도(confidence score)를 획득하는 동작,
제2 음성 인식의 수행을 위해 상기 음성 신호의 적어도 일부를 서버로 전송하는 동작,
상기 서버로부터 상기 전송된 신호에 대한 제2 동작 정보를 수신하는 동작, 및
(1) 상기 제1 신뢰도가 제1 임계 값 이상인 경우 상기 제1 동작 정보에 대응하는 기능을 수행하고, (2) 상기 제1 신뢰도가 제2 임계 값 미만인 경우 상기 제1 신뢰도에 대한 피드백을 제공하고, (3) 상기 제1 신뢰도가 상기 제1 임계 값과 상기 제2 임계 값 사이에 있는 경우 상기 제2 동작 정보에 대응하는 기능을 수행하는 동작을 포함하는, 음성 인식 수행 방법. - 청구항 13에 있어서,
상기 제1 신뢰도가 제1 임계 값 이상인 경우 상기 제1 동작 정보에 대응하는 기능을 수행하는 동작은, 상기 제2 동작 정보를 수신하는 동작 이전에 수행되는, 음성 인식 수행 방법. - 청구항 13에 있어서,
상기 제1 동작 정보에 대응하는 기능과 상기 제2 동작 정보에 대응하는 기능이 일치하는 경우, 상기 제1 임계 값을 증가시키는 동작을 더 포함하는, 음성 인식 수행 방법. - 청구항 13에 있어서,
상기 제1 동작 정보에 대응하는 기능과 상기 제2 동작 정보에 대응하는 기능이 일치하지 않는 경우, 상기 제1 임계 값을 감소시키는 동작을 더 포함하는, 음성 인식 수행 방법. - 청구항 13에 있어서,
상기 제2 동작 정보를 수신하는 동작은, 상기 제2 동작 정보에 대한 제2 신뢰도를 함께 수신하는 동작을 더 포함하는, 음성 인식 수행 방법. - 청구항 17에 있어서,
상기 제1 신뢰도가 상기 제1 임계 값 미만인 경우, 상기 음성 입력에 대한 상기 제2 동작 정보와 상기 제2 신뢰도를 상기 제1 음성 인식에 이용되는 음성 인식 모델에 추가하는 동작을 더 포함하는, 음성 인식 수행 방법. - 청구항 17에 있어서,
상기 제1 동작 정보와 상기 제2 동작 정보가 대응되지 않는 경우, 상기 제1 신뢰도와 상기 제2 신뢰도에 기초하여 상기 제2 동작 정보 및 상기 제2 신뢰도를 상기 제1 음성 인식에 이용되는 음성 인식 모델에 추가하는 동작을 더 포함하는, 음성 인식 수행 방법. - 컴퓨터 판독 가능한 명령어를 저장하고 있는 저장 매체에 있어서, 전자 장치의 프로세서에 의해 실행될 때,
사용자로부터 음성 입력을 획득하여 음성 신호를 생성하는 동작,
상기 음성 신호의 적어도 일부에 대한 제1 음성 인식을 수행하여 제1 동작 정보 및 제1 신뢰도(confidence score)를 획득하는 동작,
제2 음성 인식의 수행을 위해 상기 음성 신호의 적어도 일부를 서버로 전송하는 동작,
상기 서버로부터 상기 전송된 신호에 대한 제2 동작 정보를 수신하는 동작, 및
(1) 상기 제1 신뢰도가 제1 임계 값 이상인 경우 상기 제1 동작 정보에 대응하는 기능을 수행하고, (2) 상기 제1 신뢰도가 제2 임계 값 미만인 경우 상기 제1 신뢰도에 대한 피드백을 제공하고, (3) 상기 제1 신뢰도가 상기 제1 임계 값과 상기 제2 임계 값 사이에 있는 경우 상기 제2 동작 정보에 대응하는 기능을 수행하도록 하는 명령어를 저장하고 있는 저장 매체.
Priority Applications (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US14/680,444 US9640183B2 (en) | 2014-04-07 | 2015-04-07 | Speech recognition using electronic device and server |
| CN201910261486.7A CN109949815B (zh) | 2014-04-07 | 2015-04-07 | 电子装置 |
| CN201510162292.3A CN104978965B (zh) | 2014-04-07 | 2015-04-07 | 电子装置及利用电子装置和服务器的语音识别执行方法 |
| EP15162637.1A EP2930716B1 (en) | 2014-04-07 | 2015-04-07 | Speech recognition using electronic device and server |
| US15/581,847 US10074372B2 (en) | 2014-04-07 | 2017-04-28 | Speech recognition using electronic device and server |
| US16/128,107 US10643621B2 (en) | 2014-04-07 | 2018-09-11 | Speech recognition using electronic device and server |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201461976142P | 2014-04-07 | 2014-04-07 | |
| US61/976,142 | 2014-04-07 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| KR20150116389A true KR20150116389A (ko) | 2015-10-15 |
| KR102414173B1 KR102414173B1 (ko) | 2022-06-29 |
Family
ID=54356973
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020150038857A Active KR102414173B1 (ko) | 2014-04-07 | 2015-03-20 | 전자 장치와 서버를 활용한 음성 인식 |
Country Status (1)
| Country | Link |
|---|---|
| KR (1) | KR102414173B1 (ko) |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20180062746A (ko) * | 2016-12-01 | 2018-06-11 | 삼성전자주식회사 | 음성 신호를 입력 또는 출력하는 램프 장치 및 상기 램프 장치의 구동 방법 |
| WO2018182311A1 (en) * | 2017-03-28 | 2018-10-04 | Samsung Electronics Co., Ltd. | Method for operating speech recognition service, electronic device and system supporting the same |
| KR20180109580A (ko) * | 2017-03-28 | 2018-10-08 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치 및 그 동작 방법 |
| KR20180110977A (ko) * | 2017-03-30 | 2018-10-11 | 엘지전자 주식회사 | 홈 어플라이언스 및 그 동작 방법 |
| KR20180121758A (ko) * | 2017-04-30 | 2018-11-08 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치 및 이 전자 장치의 제어 방법 |
| CN109427331A (zh) * | 2017-08-16 | 2019-03-05 | 三星电子株式会社 | 语音识别方法及装置 |
| KR20200053242A (ko) * | 2018-11-08 | 2020-05-18 | 현대자동차주식회사 | 차량용 음성 인식 시스템 및 그 제어 방법 |
| CN111862949A (zh) * | 2020-07-30 | 2020-10-30 | 北京小米松果电子有限公司 | 自然语言的处理方法及装置、电子设备及存储介质 |
| WO2020230933A1 (ko) * | 2019-05-16 | 2020-11-19 | 엘지전자 주식회사 | 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 |
| WO2021107390A1 (en) * | 2019-11-28 | 2021-06-03 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013140269A (ja) * | 2012-01-05 | 2013-07-18 | Denso Corp | 音声認識装置 |
-
2015
- 2015-03-20 KR KR1020150038857A patent/KR102414173B1/ko active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013140269A (ja) * | 2012-01-05 | 2013-07-18 | Denso Corp | 音声認識装置 |
Cited By (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR20180062746A (ko) * | 2016-12-01 | 2018-06-11 | 삼성전자주식회사 | 음성 신호를 입력 또는 출력하는 램프 장치 및 상기 램프 장치의 구동 방법 |
| US10847152B2 (en) | 2017-03-28 | 2020-11-24 | Samsung Electronics Co., Ltd. | Method for operating speech recognition service, electronic device and system supporting the same |
| WO2018182311A1 (en) * | 2017-03-28 | 2018-10-04 | Samsung Electronics Co., Ltd. | Method for operating speech recognition service, electronic device and system supporting the same |
| KR20180109580A (ko) * | 2017-03-28 | 2018-10-08 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치 및 그 동작 방법 |
| CN108665890A (zh) * | 2017-03-28 | 2018-10-16 | 三星电子株式会社 | 操作语音识别服务的方法、电子设备和支持该设备的系统 |
| US12354605B2 (en) | 2017-03-28 | 2025-07-08 | Samsung Electronics Co., Ltd. | Electronic device for processing user speech and operating method therefor |
| US11955124B2 (en) | 2017-03-28 | 2024-04-09 | Samsung Electronics Co., Ltd. | Electronic device for processing user speech and operating method therefor |
| CN108665890B (zh) * | 2017-03-28 | 2023-10-13 | 三星电子株式会社 | 操作语音识别服务的方法、电子设备和支持该设备的系统 |
| US11222635B2 (en) | 2017-03-28 | 2022-01-11 | Samsung Electronics Co., Ltd. | Electronic device for processing user speech and operating method therefor |
| KR20180110977A (ko) * | 2017-03-30 | 2018-10-11 | 엘지전자 주식회사 | 홈 어플라이언스 및 그 동작 방법 |
| KR20180121758A (ko) * | 2017-04-30 | 2018-11-08 | 삼성전자주식회사 | 사용자 발화를 처리하는 전자 장치 및 이 전자 장치의 제어 방법 |
| CN109427331B (zh) * | 2017-08-16 | 2024-02-27 | 三星电子株式会社 | 语音识别方法及装置 |
| CN109427331A (zh) * | 2017-08-16 | 2019-03-05 | 三星电子株式会社 | 语音识别方法及装置 |
| KR20200053242A (ko) * | 2018-11-08 | 2020-05-18 | 현대자동차주식회사 | 차량용 음성 인식 시스템 및 그 제어 방법 |
| WO2020230933A1 (ko) * | 2019-05-16 | 2020-11-19 | 엘지전자 주식회사 | 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법 |
| US11367438B2 (en) | 2019-05-16 | 2022-06-21 | Lg Electronics Inc. | Artificial intelligence apparatus for recognizing speech of user and method for the same |
| US11776544B2 (en) | 2019-05-16 | 2023-10-03 | Lg Electronics Inc. | Artificial intelligence apparatus for recognizing speech of user and method for the same |
| WO2021107390A1 (en) * | 2019-11-28 | 2021-06-03 | Samsung Electronics Co., Ltd. | Electronic device and method for controlling the electronic device |
| US11705110B2 (en) | 2019-11-28 | 2023-07-18 | Samsung Electronics Co., Ltd. | Electronic device and controlling the electronic device |
| CN111862949A (zh) * | 2020-07-30 | 2020-10-30 | 北京小米松果电子有限公司 | 自然语言的处理方法及装置、电子设备及存储介质 |
| CN111862949B (zh) * | 2020-07-30 | 2024-04-02 | 北京小米松果电子有限公司 | 自然语言的处理方法及装置、电子设备及存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR102414173B1 (ko) | 2022-06-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10643621B2 (en) | Speech recognition using electronic device and server | |
| KR102414173B1 (ko) | 전자 장치와 서버를 활용한 음성 인식 | |
| US10978048B2 (en) | Electronic apparatus for recognizing keyword included in your utterance to change to operating state and controlling method thereof | |
| US10354643B2 (en) | Method for recognizing voice signal and electronic device supporting the same | |
| US10217477B2 (en) | Electronic device and speech recognition method thereof | |
| US10706847B2 (en) | Method for operating speech recognition service and electronic device supporting the same | |
| EP3531416A1 (en) | System for processing user utterance and controlling method thereof | |
| US11449672B2 (en) | Method for operating speech recognition service and electronic device and server for supporting the same | |
| US11537360B2 (en) | System for processing user utterance and control method of same | |
| US20170243578A1 (en) | Voice processing method and device | |
| CN110199350A (zh) | 用于感测语音结束的方法和实现该方法的电子设备 | |
| KR102653450B1 (ko) | 전자 장치의 입력 음성에 대한 응답 방법 및 그 전자 장치 | |
| US20190019509A1 (en) | Voice data processing method and electronic device for supporting the same | |
| US11915700B2 (en) | Device for processing user voice input | |
| EP3610479B1 (en) | Electronic apparatus for processing user utterance | |
| US20200075008A1 (en) | Voice data processing method and electronic device for supporting same | |
| KR20190109916A (ko) | 전자 장치 및 상기 전자 장치로부터 수신된 데이터를 처리하는 서버 | |
| KR20180099423A (ko) | 잠금 상태에서의 음성 명령을 기반으로 하는 기능 실행 운용 방법 및 이를 지원하는 전자 장치 | |
| US10929009B2 (en) | Electronic device for outputting graphic indication | |
| CN109949815B (zh) | 电子装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20150320 |
|
| PG1501 | Laying open of application | ||
| PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20200320 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20150320 Comment text: Patent Application |
|
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20210820 Patent event code: PE09021S01D |
|
| AMND | Amendment | ||
| E601 | Decision to refuse application | ||
| PE0601 | Decision on rejection of patent |
Patent event date: 20220225 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20210820 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
| X091 | Application refused [patent] | ||
| AMND | Amendment | ||
| PX0901 | Re-examination |
Patent event code: PX09011S01I Patent event date: 20220225 Comment text: Decision to Refuse Application Patent event code: PX09012R01I Patent event date: 20211013 Comment text: Amendment to Specification, etc. |
|
| PX0701 | Decision of registration after re-examination |
Patent event date: 20220422 Comment text: Decision to Grant Registration Patent event code: PX07013S01D Patent event date: 20220322 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20220225 Comment text: Decision to Refuse Application Patent event code: PX07011S01I Patent event date: 20211013 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I |
|
| X701 | Decision to grant (after re-examination) | ||
| PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20220623 Patent event code: PR07011E01D |
|
| PR1002 | Payment of registration fee |
Payment date: 20220624 End annual number: 3 Start annual number: 1 |
|
| PG1601 | Publication of registration |