CN1170239C - 掌上声纹验证方法 - Google Patents
掌上声纹验证方法 Download PDFInfo
- Publication number
- CN1170239C CN1170239C CNB021417687A CN02141768A CN1170239C CN 1170239 C CN1170239 C CN 1170239C CN B021417687 A CNB021417687 A CN B021417687A CN 02141768 A CN02141768 A CN 02141768A CN 1170239 C CN1170239 C CN 1170239C
- Authority
- CN
- China
- Prior art keywords
- voice
- voiceprint
- model
- palm
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Collating Specific Patterns (AREA)
Abstract
本发明是涉及一种用于掌上电脑的掌上声纹验证方法,利用人的声音来鉴定身份,根据说话人的声纹特征,通过高斯混合模型建立声纹模型;通过掌上电脑的麦克风录入语音;对声音进行预处理;对处理后的声音根据一定的声纹模型进行声纹特征提取;用声纹特征与声纹模型来识别说话人,进行声纹验证。所述的声音预处理,对语音数字滤波、端点检测、去零漂、预加重、加汉明窗等处理过程。通过计算说话人的声纹特征在高斯混合模型的匹配得分进行声纹验证。本发明有益的效果是:采用人们最常用的交流手段“语音”作为输入源的掌上声纹验证操作简单、应用灵活、实现方便、结果可靠准确,具有很大的发展潜力。
Description
技术领域
本发明是利用声纹识别方法,针对掌上电脑平台实现的新型身份安全认证系统。声纹识别方法属于计算机语音处理技术领域,而掌上电脑是移动互联环境的重要设备,两者结合构成了一种安全可靠的用于掌上电脑的掌上声纹验证方法。
背景技术
信息时代的一大特征就是身份的数字化和隐性化,如何准确鉴定身份,保证信息安全呢?信用卡号、银行帐号、网络登录号,我们可能被生活中过多需要记忆的密码搅得心烦。如何不用记忆这些密码而又不用担心自己身份无法认定呢?已经兴起的生物认证技术正好可以解决上述问题。声纹识别是从说话人所发语音中提取出说话人是谁的信息的过程,为此,需从各个说话人的发音中找出说话人之间的个性差异,它涉及到说话人发音器官上的个性差异、发音声道之间的个性差异、发音习惯之间的个性差异等不同级别上的差异,因此,声纹识别是交叉运用运用心理学、声学、语音学、语言学、人工智能、数字信号处理、信息理论、模式识别理论、最优化理论、计算机科学等的综合性课题。随着数字信号处理理论和人工智能等学科的不断发展,近年来声纹识别研究得到了迅速的发展。
同样,随着电子商务的广泛推广,掌上电脑(PDA)日益成为人们必不可少的电子伙伴。掌上电脑上不仅保存着大量的个人或公司的重要资料,也是从事电子商务的必要手段。如何保证其自身安全以及保障开展电子商务的安全性,是一个亟待解决的问题。本掌上声纹验证方法的推出解决了这一燃眉之急,采用语音输入的身份认证方式对用户而言简单方便可靠,具有很大的发展潜力。
发明内容
本发明所要解决的技术问题是提供一种用于掌上电脑的掌上声纹验证方法。
本发明解决其技术问题所采用的技术方案。这种用于掌上电脑的掌上声纹验证方法,利用人的声音来鉴定身份,根据说话人的声纹特征,通过高斯混合模型建立声纹模型;通过掌上电脑的麦克风录入语音;对声音进行预处理;对处理后的声音根据一定的声纹模型进行声纹特征提取;用声纹特征与声纹模型来识别说话人,进行声纹验证。所述的声音预处理,对语音数字滤波、端点检测、去零漂、预加重、加汉明窗等处理过程;其中端点检测采用特有的自适应双门限检定法检测语音端点。对处理后的声音进行二次特征提取,是对声音按照一定声学模型建模的过程:采用MFCC与LPCC进行声学建模,并通过求取特征一阶微分、特征加权、特征维选择、特征组合等方式获取一致的声学特征。用声学特征与高斯混合模型进行声纹识别,计算说话人的声学特征在高斯混合模型的匹配得分;如果该得分大于设定的阀值,则验证通过,否则说明该用户是冒名的,拒绝该用户。
本发明解决其技术问题所采用的技术方案还可以进一步完善。所述的自适应双门限检定法检测语音端点,门限能量由静态能量阀值与动态能量阀值共同决定,有效的语音要有一个持续的高能量区。声纹模型管理,包括涉及到声纹模型的更新与存储。通过计算说话人的声纹特征在高斯混合模型的匹配得分进行声纹验证:如果该得分大于设定的阀值,则验证通过,否则说明该用户是冒名的,拒绝该用户。还可设有声纹模型管理,包括涉及到声纹模型的更新与存储。
本发明有益的效果是:首先,本发明运用于移动的掌上电脑;其次,本发明使用了自适应双门限检定法检测语音端点;再次,本发明适用二次特征提取方式进行声纹特征提取;最后,本发明采用可更新的声纹模型管理。采用人们最常用的交流手段“语音”作为输入源的掌上声纹验证操作简单、应用灵活、实现方便、结果可靠准确,具有很大的发展潜力。
附图说明
图1是本发明的掌上声纹验证方法框架图;
图2是本发明的声纹验证技术流程图;
图3是本发明的自适应双门限检定法框图;
图4是本发明的二次特征提取框图;
图5是本发明的声纹模型管理框图;
具体实施方式
下面结合实施例对本发明作进一步描述。这种用于掌上电脑的掌上声纹验证方法:
第一,掌上声纹验证方法(如图1,2所示)利用声纹验证技术在掌上电脑上实现实时身份认证。其基本工作原理如下:(1)用户通过掌上电脑的麦克风录入语音,系统对语音进行预处理并根据一定的声纹模型提取说话人的个性特征。(2)在用户注册过程,用户根据系统提示录入一些训练的语音,系统利用这些语料进行特征提取,再提取的声纹特征生成特定的声纹模型。(3)当用户登录时,用户同样需要说出一段话(注册与登录时说的话不必相同),系统将新获取的声纹特征与原有的模型匹配比对。如果两者相似性较大(超过给定阀值),则系统接纳该用户,否则拒绝。显然,对于声纹验证系统,用户登录时需要申明自己的身份,没有注册过的用户将为系统所拒绝。(4)对于被接纳的授权用户,系统允许其访问资源。对于企业用户,则通过无线网络(如蓝牙/红外)访问企业网络,电子商务用的业务应用系统等;对于个人用户,则系统允许察看一些个人信息,如个人计划,记事内容等。在这个意义上,掌上声纹验证方法是一个电子安全门户,是可以与应用系统相集成的支持COM调用的API,甚而作为开机口令保护。
第二,在声纹识别的信号预处理中,噪声是一个不可避免又令人十分头痛的问题。如图3为一段语音的能量-时间图,如何从一段带噪语音中检测出“干净的”语音区正是端点检测的重中之重。而由掌上电脑录取的声音中更是包含较多的噪声信号。如图中可见,语音的能量并非是一直超过平均水平的。清音与浊音之间,噪声的干扰,声音的忽高忽低使掌上声纹验证方法遇到了严峻挑战。本发明采用自适应双门限检定法检测语音端点,门限能量由静态能量阀值与动态能量阀值共同决定,有效的语音要有一个持续的高能量区。
ETH=a·(E1+E0)/2 E0为预设静态能量,a为比例参数,ETH为高阀值
ETL=b·(E1+E0)/2 b为比例参数,ETL为低阀值
第三,采用声纹特征的二次提取有利于声纹验证的识别率。如图4所示,首先是对语音进行Mel倒谱(MFCC)与线性预测系数倒谱(LPCC)的特征提取。其次分别采用特征组合、特征维选取、特征取一阶微分以及特征加权等方法实现对声纹特征的二次提取。
MFCC通过一组带宽随滤波器频率呈对数增长的数字滤波器组来计算一帧语音信号功率谱;然后对数字滤波器组的输出值取对数,最后利用离散余弦变换从该对数功率谱求得表示语音信号谱包络的倒谱系数。数字滤波器组构成人类听觉系统初始传导阶段的粗糙模型。以下为MFCC的求取公式:
特征加权是指用加权系数增强部分特征维权重。加权特征WFEATURE为:
WMFCCi=MFCCi*ai i=1,2...,P;
其中αi为加权系数,ai=0.5+sin(π*i/P),i=1,2,...,P
计算LPCC分两步,首先采用Durbin递推算法求解线性预测系数LPC,随后采用求倒谱公式求取LPCC。而LPCC的加权WLPCC则采用以下方式:
WLPCCi=LPCCi*ai i=1,2…,Q;
其中ai为加权系数,ai=0.25+0.5sin(π*i/Q),i=1,2,...,Q
特征一次微分指获取特征的动态变化。动态特征DynFEATURE为:
DynFEATURE(j)i=FEATURE(j)i-FEATURE(j-1)i
其中,i=1,2…,I,表示第i维特征;DynFEATURE(j)表示第j帧特征。此处FEATURE分别为WMFCC或者WLPCC,所以对应的DynFEATURE分别是DMFCC与DLPCC。显然,DMFCC,DLPCC的阶数分别与WMFCC,WLPCC一致。
特征组合指的是将两种以上特征相结合而构成的新特征。特征组合ComFEATURE形式化表示为:
特征维选取是指从原有多维特征中选取部分维度的特征构成。特征维选取结果为SelFEATURE,方法如下:
SelFEATUREi=ComFEATUREj i=1,2…,I;j=1,2,…2P+2Q;i≤j;
且当j≠k时,ComFEATURE(j)≠ComFEATURE(k)
由此完成特征的二次提取。
第四,声纹模型管理是一个关于说话人信息的数据库管理。如图5所示,包括声纹模型建模、模型保存、模型载入以及说话人资料管理。其中说话人建模过程采用新旧声纹特征实现声纹模型的更新。
至此,整个掌上声纹验证得以实现。
Claims (3)
1、一种掌上声纹验证方法,其特征在于:
1)、利用人的声音来鉴定身份,根据说话人的声学特征,通过高斯混合模型建立声纹模型;通过掌上电脑的麦克风录入语音;对声音进行预处理;对处理后的声音根据一定的声学模型进行特征提取;用声纹特征与声纹模型来识别说话人,进行声纹验证;
2)、所述的声音预处理,对语音数字滤波、端点检测、去零漂、预加重、加汉明窗等处理过程;其中端点检测采用特有的自适应双门限检定法检测语音端点;
3)、对处理后的声音进行二次特征提取,是对声音按照一定声学模型建模的过程:采用MFCC与LPCC进行声学建模,并通过求取特征一阶微分、特征加权、特征维选择、特征组合等方式获取一致的声学特征;
4)、用声学特征与高斯混合模型进行声纹识别,计算说话人的声学特征在高斯混合模型的匹配得分;如果该得分大于设定的阀值,则验证通过,否则说明该用户是冒名的,拒绝该用户。
2、根据权利要求1所述的掌上声纹验证方法,其特征在于:所述的自适应双门限检定法检测语音端点,门限能量由静态能量阀值与动态能量阀值共同决定,有效的语音要有一个持续的高能量区: N为一帧语音的采样点数,E1为邻近三帧的平均能量
ETH=a·(E1+E0)/2 E0为预设静态能量,a为比例参数,ETH为高阀值
ETL=b·(E1+E0)/2 b为比例参数,ETL为低阀值。
3、根据权利要求1所述的掌上声纹验证方法,其特征在于:声纹模型管理,包括涉及到声纹模型的更新与存储。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNB021417687A CN1170239C (zh) | 2002-09-06 | 2002-09-06 | 掌上声纹验证方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CNB021417687A CN1170239C (zh) | 2002-09-06 | 2002-09-06 | 掌上声纹验证方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN1403953A CN1403953A (zh) | 2003-03-19 |
| CN1170239C true CN1170239C (zh) | 2004-10-06 |
Family
ID=4750388
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CNB021417687A Expired - Fee Related CN1170239C (zh) | 2002-09-06 | 2002-09-06 | 掌上声纹验证方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN1170239C (zh) |
Families Citing this family (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1308911C (zh) * | 2003-07-10 | 2007-04-04 | 上海优浪信息科技有限公司 | 一种说话者身份识别方法和系统 |
| CN1302456C (zh) * | 2005-04-01 | 2007-02-28 | 郑方 | 一种声纹识别方法 |
| CN100444188C (zh) * | 2005-08-03 | 2008-12-17 | 积体数位股份有限公司 | 声纹密码锁系统 |
| CN101345054B (zh) * | 2008-08-25 | 2011-11-23 | 苏州大学 | 用于声频文件的数字水印制作及识别方法 |
| US9444816B2 (en) | 2011-03-30 | 2016-09-13 | Qualcomm Incorporated | Continuous voice authentication for a mobile device |
| CN102393943A (zh) * | 2011-06-27 | 2012-03-28 | 中国建设银行股份有限公司 | 一种用于电话银行系统的安全处理装置和方法 |
| CN103685185B (zh) * | 2012-09-14 | 2018-04-27 | 上海果壳电子有限公司 | 移动设备声纹注册、认证的方法及系统 |
| CN103207961A (zh) * | 2013-04-23 | 2013-07-17 | 曙光信息产业(北京)有限公司 | 用户验证方法和装置 |
| CN103391201B (zh) * | 2013-08-05 | 2016-07-13 | 公安部第三研究所 | 基于声纹识别实现智能卡身份验证的系统及方法 |
| CN103730120A (zh) * | 2013-12-27 | 2014-04-16 | 深圳市亚略特生物识别科技有限公司 | 电子设备的语音控制方法及系统 |
| CN103778917B (zh) * | 2014-01-10 | 2017-01-04 | 厦门快商通信息技术有限公司 | 一种在电话满意度调查中检测身份冒充的系统与方法 |
| CN103871417A (zh) * | 2014-03-25 | 2014-06-18 | 北京工业大学 | 一种移动手机特定连续语音过滤方法及过滤装置 |
| CN104853236A (zh) * | 2015-01-15 | 2015-08-19 | 青岛海尔软件有限公司 | 一种智能电视的开关机控制方法及其装置 |
| KR102371697B1 (ko) | 2015-02-11 | 2022-03-08 | 삼성전자주식회사 | 음성 기능 운용 방법 및 이를 지원하는 전자 장치 |
| CN105096955B (zh) * | 2015-09-06 | 2019-02-01 | 广东外语外贸大学 | 一种基于模型生长聚类的说话人快速识别方法及系统 |
| CN106100846B (zh) * | 2016-06-02 | 2019-05-03 | 百度在线网络技术(北京)有限公司 | 声纹注册、认证方法及装置 |
| CN106653016B (zh) * | 2016-10-28 | 2020-07-28 | 上海智臻智能网络科技股份有限公司 | 智能交互方法和装置 |
| CN107068154A (zh) * | 2017-03-13 | 2017-08-18 | 平安科技(深圳)有限公司 | 基于声纹识别的身份验证的方法及系统 |
| CN107799124A (zh) * | 2017-10-12 | 2018-03-13 | 安徽咪鼠科技有限公司 | 一种应用于智能语音鼠标的vad检测方法 |
| CN111091836A (zh) * | 2019-12-25 | 2020-05-01 | 武汉九元之泰电子科技有限公司 | 一种基于大数据的智能声纹识别方法 |
| CN112382300A (zh) * | 2020-12-14 | 2021-02-19 | 北京远鉴信息技术有限公司 | 声纹鉴定方法、模型训练方法、装置、设备及存储介质 |
| CN112751838A (zh) * | 2020-12-25 | 2021-05-04 | 中国人民解放军陆军装甲兵学院 | 身份认证方法、装置及身份认证系统 |
-
2002
- 2002-09-06 CN CNB021417687A patent/CN1170239C/zh not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| CN1403953A (zh) | 2003-03-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN1170239C (zh) | 掌上声纹验证方法 | |
| Prabakaran et al. | A review on performance of voice feature extraction techniques | |
| US8447614B2 (en) | Method and system to authenticate a user and/or generate cryptographic data | |
| CN111524520A (zh) | 一种基于误差逆向传播神经网络的声纹识别方法 | |
| Zhang et al. | Voice biometric identity authentication system based on android smart phone | |
| Aliaskar et al. | Human voice identification based on the detection of fundamental harmonics | |
| KR100571574B1 (ko) | 비선형 분석을 이용한 유사화자 인식방법 및 그 시스템 | |
| CN113012684B (zh) | 一种基于语音分割的合成语音检测方法 | |
| Krobba et al. | Mixture linear prediction Gammatone Cepstral features for robust speaker verification under transmission channel noise | |
| KR100779242B1 (ko) | 음성 인식/화자 인식 통합 시스템에서의 화자 인식 방법 | |
| Goh et al. | Robust computer voice recognition using improved MFCC algorithm | |
| Singh et al. | Speaker identification through natural and whisper speech signal | |
| Nguyen et al. | Vietnamese speaker authentication using deep models | |
| Singh | Speaker Identification Using MFCC Feature Extraction ANN Classification Technique | |
| Bouziane et al. | Towards an objective comparison of feature extraction techniques for automatic speaker recognition systems | |
| Punchihewa et al. | Voice command interpretation for robot control | |
| Al-Hassani et al. | Design a text-prompt speaker recognition system using LPC-derived features | |
| Oo et al. | Enhancement of Speaker Identification System Based on Voice Active Detection Techniques using Machine Learning | |
| Corsi | Speaker recognition: A survey | |
| Chaudhary | Short-term spectral feature extraction and their fusion in text independent speaker recognition: a review | |
| Hassan et al. | Robust Speaker Identification System Based on Variational Bayesian Inference Gaussian Mixture Model and Feature Normalization | |
| AU2019100372A4 (en) | A robust speaker recognition system based on dynamic time wrapping | |
| Dong et al. | Voiceprint recognition check-in system based on deep learning | |
| Prajapati et al. | SPEAKER IDENTIFICATION FOR ISOLATED GUJARATI DIGITS USING MFCC AND VQ. | |
| Zhao et al. | Recognition Influence of Different Acousitc Characters between Male and Female Speakers |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant | ||
| CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20041006 Termination date: 20180906 |
|
| CF01 | Termination of patent right due to non-payment of annual fee |