CN108521501B - 语音输入方法及移动终端、计算机可读存储介质 - Google Patents
语音输入方法及移动终端、计算机可读存储介质 Download PDFInfo
- Publication number
- CN108521501B CN108521501B CN201810209073.XA CN201810209073A CN108521501B CN 108521501 B CN108521501 B CN 108521501B CN 201810209073 A CN201810209073 A CN 201810209073A CN 108521501 B CN108521501 B CN 108521501B
- Authority
- CN
- China
- Prior art keywords
- voice
- mobile terminal
- input
- preset
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000008859 change Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000001960 triggered effect Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72433—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/3827—Portable transceivers
- H04B1/385—Transceivers carried on the body, e.g. in helmets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/3827—Portable transceivers
- H04B1/385—Transceivers carried on the body, e.g. in helmets
- H04B2001/3872—Transceivers carried on the body, e.g. in helmets with extendable microphones or earphones
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Telephone Function (AREA)
Abstract
本发明公开了一种语音输入方法及移动终端,该方法包括:在移动终端处于与带麦克风的耳机连接及语音输入状态下,通过移动终端的麦克风接收用户输入的语音得到第一语音;通过耳机的麦克风接收用户输入的语音得到第二语音;获取第一语音的语音质量和第二语音的语音质量;当第一语音的语音质量高于第二语音的语音质量时,将第一语音作为语音输入。本发明中,可以启动移动终端麦克风和耳机麦克风来检测用户输入的语音,通过比较两个麦克风检测到的语音的语音质量,来决定最终是以第一语音还是第二语音作为语音输入,当移动终端的麦克风所检测到的语音的语音质量较高时,以移动终端的麦克风所检测到的语音作为语音输入,从而提高输入的语音的可识别度。
Description
技术领域
本发明实施例涉及移动终端技术领域,尤其涉及一种语音输入方法及移动终端。
背景技术
目前,移动终端与耳机之间可以通过有线、蓝牙或wifi等多种方式进行连接,在移动终端与耳机连接的情况下,移动终端会默认将耳机的麦克风所检测到的声音作为语音输入。当移动终端处于与耳机连接的状态时,虽然用户可以通过耳机的麦克风进行语音输入,但是由于日常的使用习惯,用户的第一反应通常是通过移动终端的麦克风进行语音输入,此时,耳机的麦克风检测到的声音音量非常小,导致输入的语音的可识别度较差。
发明内容
本发明实施例提供一种语音输入方法及移动终端,以解决现有技术中存在的耳机与移动终端连接时,用户可能仍通过移动终端的麦克风进行语音输入导致耳机的麦克风输入的语音可识别度较差的技术问题。
为解决上述技术问题,本发明实施例是这样实现的:
第一方面,本发明实施例还提供了一种语音输入方法,应用于移动终端,所述方法包括:
在所述移动终端处于与带麦克风的耳机连接及语音输入状态下,通过所述移动终端的麦克风接收用户输入的语音,得到第一语音;以及通过所述耳机的麦克风接收所述用户输入的语音,得到第二语音;
获取所述第一语音的语音质量和所述第二语音的语音质量;
当所述第一语音的语音质量高于所述第二语音的语音质量时,将所述第一语音作为语音输入。
第二方面,本发明实施例还提供了一种移动终端,所述移动终端包括:
第一语音接收单元,用于在所述移动终端处于与带麦克风的耳机连接及语音输入状态下,通过所述移动终端的麦克风接收用户输入的语音,得到第一语音;
第二语音接收单元,用于通过所述耳机的麦克风接收所述用户输入的语音,得到第二语音;
获取单元,用于获取所述第一语音的语音质量和所述第二语音的语音质量;
输入单元,用于在所述第一语音的语音质量高于所述第二语音的语音质量的情况下,将所述第一语音作为语音输入。
第三方面,本发明实施例还提供了一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的语音输入程序,所述语音输入程序被所述处理器执行时实现上述语音输入方法的步骤。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储语音输入程序,所述语音输入程序被处理器执行时实现上述语音输入方法的步骤。
本发明实施例中,在移动终端与耳机连接及语音输入状态下,移动终端可以同时启动移动终端的麦克风和耳机的麦克风来检测用户输入的语音,通过比较移动终端的麦克风与耳机的麦克风所检测到的语音的语音质量,来决定最终是以第一语音还是第二语音作为语音输入,当移动终端的麦克风所检测到的语音的语音质量较高时,最终以移动终端的麦克风所检测到的语音作为语音输入,从而提高移动终端与耳机连接时输入的语音的可识别度。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明的一个实施例的语音输入方法的流程图;
图2是本发明的一个实施例的语音输入系统的架构图;
图3是本发明的另一个实施例的语音输入方法的流程图;
图4是本发明的一个实施例的移动终端的结构示意图;
图5是实现本发明各个实施例的一种移动终端的硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
当移动终端处于与耳机连接的状态时,虽然用户可以通过耳机的麦克风进行语音输入,但是由于日常的使用习惯,用户的第一反应通常是通过移动终端的麦克风进行语音输入。例如,用户在平时使用移动终端过程中,经常将移动终端麦克风移到嘴边进行语音输入,当移动终端处于耳机模式时,该用户仍然将移动终端麦克风移到嘴边进行语音输入,此时,耳机的麦克风检测到的声音音量非常小,导致输入的语音的可识别度较差。为了解决现有技术中存在的耳机与移动终端连接时,用户可能仍通过移动终端的麦克风进行语音输入导致耳机的麦克风输入的语音可识别度较差的技术问题,本发明实施例提供了一种语音输入方法及移动终端。
下面首先对本发明实施例提供的语音输入方法进行介绍。
需要说明的是,本发明实施例提供的方法适用于移动终端,在实际应用中,该移动终端可以包括:智能手机、平板电脑、个人数字助理等等,本发明实施例对此不作限定。
图1是本发明的一个实施例的语音输入方法的流程图,如图1所示,该方法可以包括以下步骤:步骤101、步骤102和步骤103,其中,
在步骤101中,在移动终端处于与带麦克风的耳机连接及语音输入状态下,通过移动终端的麦克风接收用户输入的语音,得到第一语音;以及通过耳机的麦克风接收用户输入的语音,得到第二语音。
本发明实施例中,移动终端与带麦克风的耳机可以通过以下方式中的至少一种进行连接:有线、蓝牙、ZigBee或wifi。在实际应用中,可以采用现有技术中任意一种检测手段,来检测移动终端是否连接有带麦克风的耳机。
本发明实施例中,可以通过检测是否接收到语音输入指令,来确定移动终端是否处于语音输入状态;当检测接收到语音输入指令,确定移动终端处于语音输入状态;其中,该语音输入指令用于触发移动终端进入语音输入状态。
本发明实施例中,语音输入指令可以为用户针对移动终端中安装的第三方应用触发的,例如,当用户“长按”聊天应用中的语音按钮时,可以认为触发语音输入指令。语音输入指令也可以为用户针对移动终端中的系统应用触发的,例如,当用户点击录音工具中的录音按钮时,可以认为触发语音输入指令;或者,当用户“长按”移动终端的home键时,可以认为触发语音输入指令,本发明实施例对此不作限定。
本发明实施例中,当接收到语音输入指令时,移动终端可以同时开启移动终端的麦克风和耳机的麦克风,同时分别通过移动终端的麦克风和耳机的麦克风接收用户输入的语音。
本发明实施例中,可以通过软件的控制方式,控制移动终端的麦克风在该移动终端处于耳机模式下仍然能够接收语音,具体的,在该移动终端处于耳机模式下,可以为移动终端的麦克风供电,或者不屏蔽移动终端的麦克风接收到语音信号,以保证移动终端的麦克风在该移动终端处于耳机模式下仍然能够接收语音。其中,耳机模式指的是移动终端与带麦克风的耳机处理连接状态。
在步骤102中,获取第一语音的语音质量和第二语音的语音质量。
本发明实施例中,语音质量可以为用于表征音量大小的声音强度,也可以为信噪比或预设第二时长内声音强度的波动程度。此外,语音质量也可以为声音强度、信噪比和预设第二时长内声音强度的波动程度的加权求和值。
本发明实施例中,当语音质量为声音强度时,获取第一语音的声音强度和第二语音的声音强度;当语音质量为信噪比时,获取第一语音的信噪比和第二语音的信噪比;当语音质量为预设第二时长内声音强度的波动程度时,获取第一语音的预设第二时长内声音强度的波动程度和第二语音的预设第二时长内声音强度的波动程度。
本发明实施例中,在获取第一语音的预设第二时长内声音强度的波动程度和第二语音的预设第二时长内声音强度的波动程度的过程中,可以将第一语音和第二语音均进行下述处理:
将语音拆分为帧,获取每一帧的声音强度,如果在预设第二时长内,每一帧的声音强度波动较小,则认为该语音的有用声音与底噪的强度差别不大,即该语音不是用户有意输入的声音,也就说是,预设第二时长内声音强度的波动程度较小;如果在预设第二时长内,每一帧的声音强度波动较大,则认为该语音的有用声音与底噪的强度差别较大,该有用声音明显,即该语音是用户有意输入的声音,也就说是,预设第二时长内声音强度的波动程度较大。
本发明实施例中,在计算声音强度的波动时,可以采用方差的计算方法,对一段时间内的每一帧判断其声音强度,并对所有声音强度进行方差运算,如果方差较大,则可以认为声音强度的波动较大,如果方差较小,则可以认为声音强度的波动较小。此外,也可以采用现有技术中的其他计算方法,计算声音强度的波动,本发明实施例对此不作限定。
在步骤103中,当第一语音的语音质量高于第二语音的语音质量时,将第一语音作为语音输入。
本发明实施例中,当第一语音的语音质量高于第二语音的语音质量时,最终会被使用的语音是第一语音,而第二语音不会被使用,第二语音作丢弃处理。
本发明实施例中,当语音质量为声音强度时,若第一语音的声音强度高于第二语音的声音强度,则将第一语音作为语音输入,即将移动终端的麦克风所检测到的声音作为最终输入的语音。
本发明实施例中,当语音质量为信噪比时,若第一语音的信噪比高于第二语音的信噪比,则将第一语音作为语音输入。
本发明实施例中,当语音质量为预设第二时长内声音强度的波动程度时,若第一语音的预设第二时长内声音强度的波动程度高于第二语音的预设第二时长内声音强度的波动程度,则将第一语音作为语音输入。
本发明实施例中,为了保证最终输入的语音能够被移动终端识别,上述步骤103具体可以包括以下步骤:当第一语音的语音质量高于第二语音的语音质量、且第一语音的语音质量与第二语音的语音质量之间的差值大于预设语音质量阈值时,将第一语音作为语音输入。
在此情况下,当语音质量为声音强度时,若第一语音的声音强度高于第二语音的声音强度、且第一语音的声音强度与第二语音的声音强度之间的差值大于预设声音强度阈值,可以认为用户这时候并没有留意到耳机已经连接到移动终端,仍采用原来的移动终端麦克风输入方式,则将第一语音作为语音输入,即将移动终端的麦克风所检测到的声音作为最终输入的语音。例如,检测手机的麦克风接收到的声音强度与耳机的麦克风接收到的声音强度的强度差值是否大于30dB,若大于30dB,则将手机的麦克风接收的语音作为最终输入的语音。
本发明实施例中,当语音质量为信噪比时,若第一语音的信噪比高于第二语音的信噪比、且第一语音的信噪比与第二语音的信噪比之间的差值大于预设信噪比阈值,可以认为用户这时候并没有留意到耳机已经连接到移动终端,仍采用原来的移动终端麦克风输入方式,则将第一语音作为语音输入。
本发明实施例中,当语音质量为预设第二时长内声音强度的波动程度时,若第一语音的预设第二时长内声音强度的波动程度高于第二语音的预设第二时长内声音强度的波动程度、且第一语音的声音强度的波动程度与第二语音的声音强度的波动程度之间的差值大于预设声音强度的波动程度阈值,可以认为用户这时候并没有留意到耳机已经连接到移动终端,仍采用原来的移动终端麦克风输入方式,则将第一语音作为语音输入。
本发明实施例中,当第一语音的语音质量低于第二语音的语音质量时,将第二语音作为语音输入,即将耳机的麦克风所检测到声音作为最终输入的语音。
为了便于理解,结合图2所示的架构图对本发明技术方案进行介绍,图2 示出了移动终端与带麦克风的耳机连接情况下语音输入系统的架构,语音输入系统包括:耳机的麦克风、移动终端的麦克风、音频处理模块和中央处理器,当中央处理器接收到语音输入指令后,启动耳机的麦克风和移动终端的麦克风,耳机的麦克风和移动终端的麦克风几乎同时接收用户输入的语音,之后将各自接收到的语音传输至音频处理模块,中央处理器控制音频处理模块从接收到的语音中选择作为最终输入的语音。
由上述实施例可见,该实施例中,在移动终端与耳机连接及语音输入状态下,移动终端可以同时启动移动终端的麦克风和耳机的麦克风来检测用户输入的语音,通过比较移动终端的麦克风与耳机的麦克风所检测到的语音的语音质量,来决定最终是以第一语音还是第二语音作为语音输入,当移动终端的麦克风所检测到的语音的语音质量较高时,最终以移动终端的麦克风所检测到的语音作为语音输入,从而提高移动终端与耳机连接时输入的语音的识别度。
图3是本发明的另一个实施例的语音输入方法的流程图,本发明实施例中,可以通过判断用户在触发语音输入指令前后一定时间内是否有移动移动终端的动作,来推断用户是否有将移动终端的麦克风靠近嘴边的可能性,如图3所示,该方法可以包括以下步骤:步骤301、步骤302、步骤303、步骤304和步骤305,其中,
在步骤301中,在移动终端处于与带麦克风的耳机连接的状态下,接收语音输入指令。其中,该语音输入指令用于触发移动终端进入语音输入状态。
本发明实施例中的步骤301与图1所示实施例中的步骤101类似,在此不再赘述,详情请见图1所示实施例中的内容。
在步骤302中,判断在接收到语音输入指令之前和/或之后的预设第一时长内,移动终端是否发生移动。
本发明实施例中,可以判断在接收到语音输入指令之前的预设第一时长内,移动终端是否发生移动;或者,可以判断在接收到语音输入指令之后的预设第一时长内,移动终端是否发生移动;或者,可以判断在接收到语音输入指令之前和之后的预设第一时长内,移动终端是否发生移动,本发明实施例对此不作限定。
考虑到陀螺仪的灵敏度较高,因此为了提高检测灵敏度,本发明实施例中,可以通过根据移动终端中陀螺仪的数据变化,来判断移动终端是否发生移动,即,通过陀螺仪数据变化判断用户是否有突然移动手机的动作,可以推断用户使用移动终端的麦克风或者耳机的麦克风进行语音输入。如果有突然移动移动终端的动作,推断用户使用移动终端的麦克风进行语音输入。如果没有突然移动移动终端的麦克风的动作,推断用户使用耳机的麦克风输入。
在此情况下,上述步骤302具体可以包括以下步骤:判断在接收到语音输入指令之前和/或之后的预设第一时长内,移动终端的陀螺仪数据变化是否大于预设变化阈值,若大于预设变化阈值,则移动终端发生移动。
本发明实施例中,也可以通过移动终端中的其他传感器,例如红外传感器来检测移动终端是否发生移动,本发明实施例对此不作限定。
在步骤303中,通过移动终端的麦克风接收用户输入的语音,得到第一语音;以及通过耳机的麦克风接收用户输入的语音,得到第二语音。
本发明实施例中的步骤303与图1所示实施例中的步骤101类似,在此不再赘述,详情请见图1所示实施例中的内容。
在步骤304中,获取第一语音的语音质量和第二语音的语音质量。
本发明实施例中的步骤304与图1所示实施例中的步骤102类似,在此不再赘述,详情请见图1所示实施例中的内容。
在步骤305中,当第一语音的语音质量高于第二语音的语音质量、且移动终端发生移动时,将第一语音作为语音输入。
优选的,本发明实施例中,当第一语音的语音质量高于第二语音的语音质量、且第一语音的语音质量与第二语音的语音质量之间的差值大于预设语音质量阈值、且在接收到语音输入指令之前和/或之后的预设第一时长内移动终端发生移动时,将第一语音作为语音输入。
由上述实施例可见,该实施例中,在移动终端与耳机连接的情况下,移动终端可以同时启动移动终端的麦克风和耳机的麦克风来检测用户输入的声音,通过比较移动终端的麦克风与耳机的麦克风所检测到的声音的语音质量,来决定作为最终输入的语音;此外,用户在触发语音输入指令前后时间段内突然移动移动终端,可以从很大程度上反映出该用户有使用移动终端的麦克风输入语音的意图,因此当移动终端的麦克风所检测到的声音的语音质量较高、且有移动移动终端的动作时,将移动终端的麦克风所检测到的声音作为语音输入,从而进一步提高移动终端与耳机连接时输入的语音的可识别度。
图4是本发明的一个实施例的移动终端的结构示意图,如图4所示,移动终端400可以包括:第一语音接收单元401、第二语音接收单元402、获取单元403和输入单元404,其中,
第一语音接收单元401,用于在所述移动终端处于与带麦克风的耳机连接及语音输入状态下,通过所述移动终端的麦克风接收用户输入的语音,得到第一语音;
第二语音接收单元402,用于通过所述耳机的麦克风接收所述用户输入的语音,得到第二语音;
获取单元403,用于获取所述第一语音的语音质量和所述第二语音的语音质量;
输入单元404,用于在所述第一语音的语音质量高于所述第二语音的语音质量的情况下,将所述第一语音作为语音输入。
由上述实施例可见,该实施例中,在移动终端与耳机连接及语音输入状态下,移动终端可以同时启动移动终端的麦克风和耳机的麦克风来检测用户输入的语音,通过比较移动终端的麦克风与耳机的麦克风所检测到的语音的语音质量,来决定最终是以第一语音还是第二语音作为语音输入,当移动终端的麦克风所检测到的语音的语音质量较高时,最终以移动终端的麦克风所检测到的语音作为语音输入,从而提高移动终端与耳机连接时输入的语音的可识别度。
本发明提供的另一个实施例中,所述输入单元404,可以包括:
第一语音输入子单元,用于在所述第一语音的语音质量与所述第二语音的语音质量之间的差值大于预设语音质量阈值的情况下,将所述第一语音作为语音输入。
本发明提供的另一个实施例中,所述移动终端400还可以包括:
判断单元,用于判断在接收到语音输入指令之前和/或之后的预设第一时长内,所述移动终端是否发生移动,其中,所述语音输入指令用于触发所述移动终端进入所述语音输入状态;
所述输入单元404,可以包括:
第二语音输入子单元,用于在所述第一语音的语音质量高于所述第二语音的语音质量、且所述移动终端发生移动的情况下,将所述第一语音作为语音输入。
本发明提供的另一个实施例中,所述判断单元,可以包括:
判断子单元,用于判断在接收到语音输入指令之前和/或之后的预设第一时长内,所述移动终端的陀螺仪数据变化是否大于预设变化阈值,若大于所述预设变化阈值,则所述移动终端发生移动。
本发明提供的另一个实施例中,所述语音质量可以包括下述至少一种:
声音强度、信噪比和预设第二时长内声音强度的波动程度。
图5是实现本发明各个实施例的一种移动终端的硬件结构示意图,如图5 所示,该移动终端500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解,图5中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器510,用于在所述移动终端处于与带麦克风的耳机连接及语音输入状态下,通过所述移动终端的麦克风接收用户输入的语音,得到第一语音;以及通过所述耳机的麦克风接收所述用户输入的语音,得到第二语音;获取所述第一语音的语音质量和所述第二语音的语音质量;当所述第一语音的语音质量高于所述第二语音的语音质量时,将所述第一语音作为语音输入。
本发明实施例中,在移动终端与耳机连接及语音输入状态下,移动终端可以同时启动移动终端的麦克风和耳机的麦克风来检测用户输入的语音,通过比较移动终端的麦克风与耳机的麦克风所检测到的语音的语音质量,来决定最终是以第一语音还是第二语音作为语音输入,当移动终端的麦克风所检测到的语音的语音质量较高时,最终以移动终端的麦克风所检测到的语音作为语音输入,从而提高移动终端与耳机连接时输入的语音的可识别度。
可选的,作为一个实施例,所述当所述第一语音的语音质量高于所述第二语音的语音质量时,将所述第一语音作为语音输入,包括:
当所述第一语音的语音质量与所述第二语音的语音质量之间的差值大于预设语音质量阈值时,将所述第一语音作为语音输入。
可选的,作为一个实施例,所述方法还包括:
判断在接收到语音输入指令之前和/或之后的预设第一时长内,所述移动终端是否发生移动,其中,所述语音输入指令用于触发所述移动终端进入所述语音输入状态;
所述当所述第一语音的语音质量高于所述第二语音的语音质量时,将所述第一语音作为语音输入,包括:
当所述第一语音的语音质量高于所述第二语音的语音质量、且所述移动终端发生移动时,将所述第一语音作为语音输入。
可选的,作为一个实施例,所述判断在接收到语音输入指令之前和/或之后的预设第一时长内,所述移动终端是否发生移动,包括:
判断在接收到语音输入指令之前和/或之后的预设第一时长内,所述移动终端的陀螺仪数据变化是否大于预设变化阈值,若大于所述预设变化阈值,则所述移动终端发生移动。
可选的,作为一个实施例,所述语音质量包括下述至少一种:
声音强度、信噪比和预设第二时长内声音强度的波动程度。
应理解的是,本发明实施例中,射频单元501可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510 处理;另外,将上行的数据发送给基站。通常,射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元501还可以通过无线通信系统与网络和其他设备通信。
移动终端通过网络模块502为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元503还可以提供与移动终端500执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。
输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041 对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元506上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质) 中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。
移动终端500还包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度,接近传感器可在移动终端500移动到耳边时,关闭显示面板5061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击) 等;传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元 506可包括显示面板5061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。
用户输入单元507可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071 可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器 510,接收处理器510发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071,用户输入单元507还可以包括其他输入设备5072。具体地,其他输入设备5072 可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板5071可覆盖在显示面板5061上,当触控面板5071 检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中,触控面板5071与显示面板5061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板5071与显示面板5061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元508为外部装置与移动终端500连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/ 输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端500内的一个或多个元件或者可以用于在移动终端500和外部装置之间传输数据。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器 509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
移动终端500还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,移动终端500包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种移动终端,包括处理器510,存储器509,存储在存储器509上并可在所述处理器510上运行的语音输入程序,该语音输入程序被处理器510执行时实现上述语音输入方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有语音输入程序,该语音输入程序被处理器执行时实现上述语音输入方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称 ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。
Claims (10)
1.一种语音输入方法,应用于移动终端,其特征在于,所述方法包括:
在所述移动终端处于与带麦克风的耳机连接及语音输入状态下,通过所述移动终端的麦克风接收用户输入的语音,得到第一语音;以及通过所述耳机的麦克风接收所述用户输入的语音,得到第二语音;
获取所述第一语音的语音质量和所述第二语音的语音质量;
当所述第一语音的语音质量高于所述第二语音的语音质量时,将所述第一语音作为语音输入;
所述方法还包括:
判断在接收到语音输入指令之前和/或之后的预设第一时长内,所述移动终端是否发生移动,其中,所述语音输入指令用于触发所述移动终端进入所述语音输入状态;
所述当所述第一语音的语音质量高于所述第二语音的语音质量时,将所述第一语音作为语音输入,包括:
当所述第一语音的语音质量高于所述第二语音的语音质量、且所述移动终端发生移动时,将所述第一语音作为语音输入;
其中,当所述语音质量为预设第二时长内声音强度的波动程度时,获取所述第一语音的预设第二时长内声音强度的波动程度和所述第二语音的预设第二时长内声音强度的波动程度,对所述第一语音和所述第二语音的处理包括:
将语音拆分为帧,获取每一帧的声音强度,如果在预设第二时长内,每一帧的声音强度波动较小,则所述语音的预设第二时长内声音强度的波动程度较小;如果在预设第二时长内,每一帧的声音强度波动较大,则所述语音的预设第二时长内声音强度的波动程度较大。
2.根据权利要求1所述的方法,其特征在于,所述当所述第一语音的语音质量高于所述第二语音的语音质量时,将所述第一语音作为语音输入,包括:
当所述第一语音的语音质量与所述第二语音的语音质量之间的差值大于预设语音质量阈值时,将所述第一语音作为语音输入。
3.根据权利要求1所述的方法,其特征在于,所述判断在接收到语音输入指令之前和/或之后的预设第一时长内,所述移动终端是否发生移动,包括:
判断在接收到语音输入指令之前和/或之后的预设第一时长内,所述移动终端的陀螺仪数据变化是否大于预设变化阈值,若大于所述预设变化阈值,则所述移动终端发生移动。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述语音质量包括下述至少一种:
声音强度、信噪比和预设第二时长内声音强度的波动程度。
5.一种移动终端,其特征在于,所述移动终端包括:
第一语音接收单元,用于在所述移动终端处于与带麦克风的耳机连接及语音输入状态下,通过所述移动终端的麦克风接收用户输入的语音,得到第一语音;
第二语音接收单元,用于通过所述耳机的麦克风接收所述用户输入的语音,得到第二语音;
获取单元,用于获取所述第一语音的语音质量和所述第二语音的语音质量;
输入单元,用于在所述第一语音的语音质量高于所述第二语音的语音质量的情况下,将所述第一语音作为语音输入;
所述移动终端还包括:
判断单元,用于判断在接收到语音输入指令之前和/或之后的预设第一时长内,所述移动终端是否发生移动,其中,所述语音输入指令用于触发所述移动终端进入所述语音输入状态;
所述输入单元,包括:
第二语音输入子单元,用于在所述第一语音的语音质量高于所述第二语音的语音质量、且所述移动终端发生移动的情况下,将所述第一语音作为语音输入;
所述获取单元,还用于:当所述语音质量为预设第二时长内声音强度的波动程度时,获取所述第一语音的预设第二时长内声音强度的波动程度和所述第二语音的预设第二时长内声音强度的波动程度,对所述第一语音和所述第二语音的处理包括:
将语音拆分为帧,获取每一帧的声音强度,如果在预设第二时长内,每一帧的声音强度波动较小,则所述语音的预设第二时长内声音强度的波动程度较小;如果在预设第二时长内,每一帧的声音强度波动较大,则所述语音的预设第二时长内声音强度的波动程度较大。
6.根据权利要求5所述的移动终端,其特征在于,所述输入单元,包括:
第一语音输入子单元,用于在所述第一语音的语音质量与所述第二语音的语音质量之间的差值大于预设语音质量阈值的情况下,将所述第一语音作为语音输入。
7.根据权利要求5所述的移动终端,其特征在于,所述判断单元,包括:
判断子单元,用于判断在接收到语音输入指令之前和/或之后的预设第一时长内,所述移动终端的陀螺仪数据变化是否大于预设变化阈值,若大于所述预设变化阈值,则所述移动终端发生移动。
8.根据权利要求5至7任一项所述的移动终端,其特征在于,所述语音质量包括下述至少一种:
声音强度、信噪比和预设第二时长内声音强度的波动程度。
9.一种移动终端,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的语音输入程序,所述语音输入程序被所述处理器执行时实现如权利要求1至4中任一项所述的语音输入方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储语音输入程序,所述语音输入程序被处理器执行时实现如权利要求1至4中任一项所述的语音输入方法的步骤。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201810209073.XA CN108521501B (zh) | 2018-03-14 | 2018-03-14 | 语音输入方法及移动终端、计算机可读存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201810209073.XA CN108521501B (zh) | 2018-03-14 | 2018-03-14 | 语音输入方法及移动终端、计算机可读存储介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN108521501A CN108521501A (zh) | 2018-09-11 |
| CN108521501B true CN108521501B (zh) | 2021-01-08 |
Family
ID=63433704
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201810209073.XA Active CN108521501B (zh) | 2018-03-14 | 2018-03-14 | 语音输入方法及移动终端、计算机可读存储介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN108521501B (zh) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109743454A (zh) * | 2018-12-29 | 2019-05-10 | 维沃移动通信有限公司 | 一种通话处理方法及移动终端 |
| CN109961802B (zh) * | 2019-03-26 | 2021-05-18 | 北京达佳互联信息技术有限公司 | 音质比较方法、装置、电子设备及存储介质 |
| CN110751949A (zh) * | 2019-10-18 | 2020-02-04 | 北京声智科技有限公司 | 一种语音识别方法、装置及计算机可读存储介质 |
| CN111107225B (zh) * | 2019-12-26 | 2022-08-02 | 维沃移动通信有限公司 | 一种交互通信方法及电子设备 |
| CN114979359B (zh) * | 2021-02-20 | 2024-05-03 | 深圳市万普拉斯科技有限公司 | 一种麦克风切换方法、移动终端以及存储介质 |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105812585A (zh) * | 2016-06-01 | 2016-07-27 | 珠海市魅族科技有限公司 | 一种通话方式切换方法以及移动终端 |
| CN106255000A (zh) * | 2016-07-29 | 2016-12-21 | 维沃移动通信有限公司 | 一种音频信号采集方法及移动终端 |
| CN106412259A (zh) * | 2016-09-14 | 2017-02-15 | 广东欧珀移动通信有限公司 | 移动终端通话控制方法、装置及移动终端 |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20090023479A1 (en) * | 2007-07-17 | 2009-01-22 | Broadcom Corporation | Method and system for routing phone call audio through handset or headset |
-
2018
- 2018-03-14 CN CN201810209073.XA patent/CN108521501B/zh active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105812585A (zh) * | 2016-06-01 | 2016-07-27 | 珠海市魅族科技有限公司 | 一种通话方式切换方法以及移动终端 |
| CN106255000A (zh) * | 2016-07-29 | 2016-12-21 | 维沃移动通信有限公司 | 一种音频信号采集方法及移动终端 |
| CN106412259A (zh) * | 2016-09-14 | 2017-02-15 | 广东欧珀移动通信有限公司 | 移动终端通话控制方法、装置及移动终端 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN108521501A (zh) | 2018-09-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| WO2019196707A1 (zh) | 一种移动终端控制方法及移动终端 | |
| CN108521501B (zh) | 语音输入方法及移动终端、计算机可读存储介质 | |
| CN107799125A (zh) | 一种语音识别方法、移动终端及计算机可读存储介质 | |
| CN109215683B (zh) | 一种提示方法及终端 | |
| CN109600468B (zh) | 可折叠终端的控制方法及可折叠终端 | |
| CN109639863B (zh) | 一种语音处理方法及装置 | |
| CN109343788B (zh) | 一种移动终端的操作控制方法及移动终端 | |
| CN111093137B (zh) | 一种音量控制方法、设备及计算机可读存储介质 | |
| CN110012151B (zh) | 一种信息显示方法及终端设备 | |
| CN109451158B (zh) | 一种提醒方法和装置 | |
| CN107835495A (zh) | 一种消息提示方法、装置及移动终端 | |
| CN108270928B (zh) | 一种语音识别的方法及移动终端 | |
| CN108196663B (zh) | 一种人脸识别方法、移动终端 | |
| CN110427149B (zh) | 终端的操作方法及终端 | |
| CN109982273B (zh) | 一种信息回复方法及移动终端 | |
| CN109660657B (zh) | 一种应用程序控制方法及装置 | |
| CN108307075B (zh) | 一种来电处理方法及移动终端 | |
| CN108235084B (zh) | 一种视频播放方法及移动终端 | |
| CN108008808B (zh) | 运行参数的调整方法和移动终端 | |
| CN108093119B (zh) | 一种陌生来电号码的标记方法及移动终端 | |
| CN108089935B (zh) | 一种应用程序的管理方法及移动终端 | |
| CN110213439B (zh) | 一种消息处理方法和终端 | |
| CN110210197B (zh) | 屏幕灵敏度调整方法及移动终端 | |
| CN108650392A (zh) | 一种通话录音方法及移动终端 | |
| CN110471068B (zh) | 接近检测方法及移动终端 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |