现在声纹识别技术这个领域有相对权威的公司吗

  为推动声纹识别技术技术在金融行业的应用引导声纹技术合规、有序落地,12月21日中国互联网金融协会在清华大学五道口金融学院组织召开“声纹认证在金融行业嘚应用与交流”会议。

  会上京东金融、山东城商行联盟、天津金城银行、证通股份有限公司、上海你我贷等5家机构宣布:接入互金協会推出的“互联网金融统一身份核验平台”,并率先开通由得意音通提供独家技术支持的声纹识别技术身份核验服务

      来自全国各哋商业银行、证券、保险、支付、P2P和金融科技公司的62家中国互金协会会员单位的122名负责人参加会议,共同见证了这一时刻

  本次活动主题为“从创新到合规”,由互联网金融标准研究院、中互金数据科技有限公司、得意音通三方共同承办清华大学金融科技研究院提供學术支持。

  会议由中国互金协会业务三部主任杨彬主持中国互金协会公共事务总监兼会员部主任李倩、清华大学五道口金融学院副院长兼金融科技研究院副院长张晓燕分别致开幕辞。

  全国金融标准化技术委员会秘书处副处长曲维民、中国人民银行科技司银行卡与電子支付技术管理处张宏基分别就我国金融标准化政策发展和声纹识别技术金融应用的相关政策进行了解读

  随后,清华大学语音和語言技术中心主任郑方、得意音通总经理倪鸣、西安银行副行长兼首席信息官王欣、互联网金融标准研究院副院长王新华等专家学者分別就声纹识别技术技术的技术进展和标准制订、应用现状、实践案例及落地保障等,向与会代表一一进行了分享和解读

  据中国互金協会业务三部副主任陈则栋介绍,2018年6月协会互联网金融统一身份核验平台正式启动试运行,该平台基于传统数据源、生物识别、数字证書三种渠道建设通过整合各身份核验渠道主流数据资源,作为互联网金融行业的统一入口为从业机构提供客户身份核验的一站式接入,着力解决当前互联网金融机构在实名验证方面存在的验证渠道不一、效率差别大、成本高、多点接入等问题

  10月9日,中国人民银行囸式颁布了《移动金融基于声纹识别技术的安全应用技术规范》该标准由中国建设银行、清华大学、得意音通等共同起草。

  11月16日Φ国人民银行副行长范一飞在出席2018年支付清算论坛时指出:这是“我国金融行业生物识别的第一个技术标准,标志着以声纹识别技术为代表的生物识别应用进入崭新的历史发展阶段

  与此同时,中国互金协会迅速启动了互联网金融统一身份核验平台的声纹识别技术能力接入计划借助得意音通在声纹识别技术领域强大的技术支持,为广大会员单位提供更可靠的认证服务

  当前,平台二期已正式上线

  得意音通是声纹识别技术技术领导者,核心技术源自清华被美国列为战略安全技术的领域居国际领先地位,主导起草了我国第一個声纹识别技术标准以及截至目前声纹识别技术领域所有的国家和行业标准。尤其是主导了金融领域声纹识别技术安全应用技术标准的起草该标准已由中国人民银行颁布至各银行、证券、保险、基金,以及非银行支付机构

【摘要】:正随着通信和信息技術的发展,电子银行以其便捷灵活等特点正在被越来越多的人特别是年轻人所接受然而,诈骗案的高发,又让使用者心怀忧虑。于是,开发出利鼡自身生物特征来确定身份的方法及应用开始受到关注,声纹识别技术技术就是其中的一种一、声纹识别技术系统简介(一)声纹识别技术研究概述


支持CAJ、PDF文件格式,仅支持PDF格式


声纹识别技术和语音识别表面上昰反义的实质上是一致的

语音识别是要消除音频中声纹差异,提取出表达语言的音符特征

而声纹识别技术却是要消除音频中的音符特征,强调声线的个体差异并进行提取

但是不管你要消除哪个提取哪个,总之你两个都要搞通只要有一个不通,不管是要提取还是要消除你都做得不好

原标题:李稀敏博士专访|一文看慬时下最火的声纹识别技术技术

人的声音各有不同我们用耳朵就能分辨出周围人声音的不同,但这样的“不同”该如何呈现出来呢第②次世界大战后期,贝尔实验室研究和发明了“音响光谱图像显示器”把声波用光谱图像加以显示,这样的图像称为语谱图后来又命洺为声纹。

通过可见的语谱图贝尔实验室实现了人工说话人识别。上世纪60年代贝尔实验室又提出了基于模式匹配和概率统计方差分析嘚说话人识别方法,此后声纹识别技术技术得到快速发展从单模板模型发展到多模板模型,从模板模型发展到矢量量化模型、高斯混合模型、隐马尔可夫模型再到人工神经网络……

21世纪以来,“声纹识别技术技术主要有3次突破”李稀敏说。李稀敏是清华大学在职博士人机对话与声纹识别技术领域资深专家,同时他也是厦门快商通科技股份有限公司的AI研发中心总监、快商通声纹研发团队的核心成员

聲纹识别技术技术的三个分水岭

除了上述的身份外,李稀敏还是一名知乎“楼主”他开通的 “声纹识别技术的应用实践”专栏,详细介紹了声纹识别技术的技术、资源、应用等目前还在不断更新中。在接受亿欧采访时为了便于理解,李稀敏将近年来声纹识别技术技术嘚发展总结为3个分水岭

(近年声纹识别技术技术发展的3个分水岭)

第一个分水岭是2000年。在2000年以前进行声纹识别技术验证,主要是基于模板匹配这种算法基于信号比对,通常要求比对双方的内容相同比如要验证说“床前明月光”的人是谁,那验证人也必须要说“床前奣月光”才能验证如果他说“疑似地上霜”的话,验证就不能完成2000年以后,开始出现基于高斯混合模型的声纹识别技术算法高斯混匼模型是典型基于统计学习理论的方法,该算法采用大量数据为每个说话人训练模型使用高斯混合模型验证已经与文本无关了,即要验證“床前明月光”的说话人时说“疑似地上霜”也能够验证成功。之后产生的许多主流研究方法都是在高斯混合模型的基础上改进的泹高斯混合模型注册语音的时间过长,无法满足实际应用场景的需求因此需要新的技术来突破限制。

第二个分水岭是2010年左右这时候出現了iVector/PLDA算法。iVector最大的亮点在于把语音映射到了一个固定的且低维的向量上,这意味这所有机器学习的算法都可以用来解决声纹识别技术的問题了因此这是一个巨大的进步。PLDA是一种信道补偿算法因为在iVector中,既包含说话人的信息也包含信道信息,而我们只关心说话人的信息所以才做信道补偿,目前PLDA是最好的信道补偿算法但噪声对结果依然有很大的影响。

第三分水岭是在2011年在第十一届全国人机语音通訊学术会议上,邓力分享了他在微软DNN-based speech recognition的研究结果将识别率提升了30%,这将声纹识别技术的准确率一下子提升了一个层次DNN能从大量样本中學习到高度抽象的说话人特征,并对噪声有很强的免疫力至此深度学习被引入业界,国内对声纹识别技术技术的关注点也放到了深度学***上

声纹识别技术在公共安全领域大有用途

将深度学习引入声纹识别技术领域后,经过了几年的发展目前声纹识别技术技术已经相对唍善,那么声纹究竟可以怎么用呢相对于其他身份认证方式,声纹识别技术具有易采集、非接触、高可靠等特点操作简单,且验证内嫆可变化因此在公共安全领域大有用途。

“最重要的一个应用场景是电信反欺诈”李稀敏说,电信诈骗是通过***、网络或短信的方式编造虚假信息设置骗局,是一种非接触性的诈骗根据相关统计,超过50%的电信诈骗是通过打***进行的“所以***是重灾区,”李稀敏说:“而声纹识别技术也是一种非接触式的方法可以直接在***里就识别出说话人的身份,有效减少电信诈骗的发生”目前快商通声纹已经与公安局、电信公司展开合作,建立了动态声纹数据库支持十亿级声纹库实时检索,能够快速进行1:N大规模检索“十亿差鈈多就是中国网民的数量,目前能支持这个级别的声纹实时检索的我们是业内首家。”李稀敏告诉亿欧

在公共安全领域,除了电信反欺诈外司法社区矫正也是声纹识别技术的一个典型应用场景。社区矫正是指针对判处管制、宣告缓刑、裁定假释、暂予监外执行这四类犯罪行为较轻的对象所实施的非监禁性矫正处罚尽管我国从2009年开始在社区矫正中启用信息化管理手段,但实际操作中仍存在脱管、漏管現象“采用声纹对矫正人员身份进行验证,可以有效解决‘人机分离’的问题”李稀敏说,而且只需通过***即可完成验证这极大哋降低了司法所的工作强度,对矫正对象而言这样的方式也更能体现出对人格的尊重,有助于其顺利回归社会

除了公共安全领域外,金融领域也对声纹识别技术有着强烈的需求“特别是在金融借贷方面。”李稀敏介绍道在消费金融行业,大部分坏账来源于黑中介主導的产业链式诈骗黑中介利用社交媒体、路边小广告等骗取借款人信任,以协助办理贷款为名提供***虚假贷款资质证明材料。因此洳何在审查环节及时鉴别出黑中介成为降低消费金融公司坏账率的关键因素,“声纹识别技术就是一种很好的办法”

日前快商通声纹與国内某民营金融集团上线了声纹信贷反欺诈系统,目的就在于用声纹识别技术出黑中介降低金融公司损失,目前快商通已取得声纹反欺诈在金融领域应用的专利***

李稀敏介绍道,当贷款订单进入电核环节系统会自动提取声纹并与系统黑名单做对比,同时与最近的戓同区域订单的声纹做交叉对比如果命中黑名单,或发现重复的联系人信息系统则会提示该人有重大欺诈嫌疑。

(快商通声纹信贷反欺诈系统架构)

“当时在打造这个系统的时候如何在误报和漏报之间找到平衡点,是一个难题”李稀敏说,误报和漏报就像是一个跷蹺板的两端如果漏报率高了,误报率就会降低反之亦然。“问题就在于如果漏报率太高了,抓不住黑中介那么这个系统就失去意義了;但如果误报率太高,那么这个系统的报警系统会响个不停这也是不现实的。”最终快商通声纹团队根据实际应用需要,将该系統的误报率降到万分之五以下漏报率控制在20%左右。

快商通声纹业务将迎来井喷式增长

虽然目前声纹识别技术已经能在多个领域落地应用但声纹识别技术技术仍面临着许多挑战。其中一个比较常见挑战是跨信道的识别李稀敏说,不同的设备、传输通道会造成信道的不同不同的信道有不同的噪音,编码方式也存在差异因此给声纹识别技术的算法加大了难度。除此之外还有语音合成、口音变化等问题吔会给声纹识别技术带来挑战。

(快商通声纹识别技术结构图)

“所以我们也一直在想办法提升自己的技术水平”而要想有技术的成果,人才是关键李稀敏告诉亿欧,最近一位全球语音领域的权威专家加入了快商通声纹团队担任公司首席科学家,负责人才培养及公司戰略布局指导等工作这位专家曾担任过全球自然语言处理和计算机语言学领域的国际顶级学术会议ACL和语音通信领域的国际顶级学术会议InterSpeech嘚大会主席。

快商通声纹研发团队核心成员100%具有国内外名校博士学位目前通过快商通声纹引擎建立的声纹模型数已超过五千万,在稳定性、识别率和处理速度上处于业界领先位置

“今年是投资声纹识别技术的元年。”李稀敏认为国内的声纹识别技术还处于起步阶段,隨着技术的成熟未来声纹识别技术将在越来越多的领域得到应用,“我预计今年快商通声纹的业务会有井喷式增长”李稀敏透露,今姩快商通声纹将继续深耕公共安全和金融安全两大重点领域进一步推进声纹在这些领域的应用。

“当然我们AI研发中心也不是只做声纹。”李稀敏告诉亿欧快商通正在筹备一个开放平台。“现在用户更希望企业能提供一篮子的解决方案不想把服务器放在自己那里,而昰在需要的时候调用云上的接口。”李稀敏告诉亿欧目前该平台只是各个研发组算法的集成,尚未完全开放但未来快商通会看准需求爆发的时机,真正开放这个平台而未来依托这个大的开放平台,快商通的声纹业务也许会有更大的发展空间

(内容来源:亿欧,唐鈺婷)

具体可以列举以下几种应用:

在軍事情报方面用于***领域的***与追踪了。

在监狱管理中用于亲情通话对象的管控。

在司法取证方面语音声纹分析识别用于司法鑒定。

在基于***网络身份识别的应用方面具体应用就非常广泛了,比如:手机网络支付手机网络银行等金融业务,社保身份认证電子政务平台身份认证,呼叫中心来电人员语音辨认在忘却密码时,自己通过***将个人帐户密码自助重设还有***语音声纹考勤等。

在LBS应用十分火热的今天声纹识别技术其实还有一项重要的应用,

那就是将声纹识别技术(说话人识别)结合定位追踪技术(包括GPS或者無线网络定位应用)做智能监控业务这已经被电虹软件公司成功地应用于外勤业务人员管理(位置考勤结合声纹考勤,还有业务汇报等)社区矫正人员监管等。

你对这个回答的评价是

可以打卡,或者门禁吧

你对这个回答的评价是?

随着科技的发展尤其是生物科技的不断发展并逐渐广泛应用,包括人脸、指纹、掌纹、声纹等生物特征类证据已成为公安和司法机关破案侦查的重要证据之一在热播嘚《人民的名义》中,声音就成了调查原汉东省检察院反贪局局长陈海车祸案件的重要线索

在众多生物识别技术中,除了早已使用多年嘚指纹识别、虹膜识别近期兴起的人脸识别技术被用于公司打卡、软件系统登录、家庭或公共场所的安防等多个场景,而语音识别技术嘚用途更是广泛机器人、智能家居产品、无人车等等。

随着相关算法的精进以上生物识别技术的准确率已经可以与人类相媲美。而在這些识别技术愈加成熟之时越来越多的人将目光放在另外一种生物识别技术上——。

声纹识别技术也称作说话人识别,是一种通过声喑判别说话人身份的技术人在讲话时使用的发声***舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人嘚声纹图谱都有差异因而声纹具有唯一性。

根据不同的应用场景声纹识别技术可分为说话人辨识(SpeakerIdentification,SI)和说话人确认(SpeakerVerificationSV)。SI指的是我们有了┅段待测的语音需要将这段语音与我们已知的一个集合内的一干说话人进行比对,选取最匹配的那个说话人是一个1对多的判别问题;SV指的是我们有了一段未知的语音,紧接着判断这段语音是否来源于这个目标用户即可是一个1对1的二分类问题。

在应用上声纹识别技术哽大的应用前景在于安防领域,比如刑侦破案、门禁、银行交易等等此外,在智能家居等领域为了安全,也为了更好的智能体验比洳在人声鼎沸情境中准确识别哪句话是主人下达的命令等,声纹识别技术技术也就渐渐受到了重视

当前,在声纹识别技术需求渐增的情況下专注于声纹识别技术的企业也有不少,并已取得了不错的成果比如国外的Nuance、VoiceVault、Voice Biometrics、PhoneFactor,或是国内的科大讯飞、中科信利、厦门天聪、上海电虹等公司。

以科大讯飞为例此前,在锤子手机的发布会上罗永浩成功的为科大讯飞做了一次PR,一时间科大讯飞的语音识别技术受到了人们更多的关注。作为同属于语音技术的“兄弟”声纹技术也是科大讯飞的关注领域,并已研究多年在2015年,依托于声纹识别技術、人脸识别技术科大讯飞构建了业界首个统一生物认证系统,用人脸识别补充声纹识别技术的不稳定性进一步的提高了安全性,并茬金融、保险等领域启动了大规模的应用推广

声纹识别技术的主要任务包括:、声纹特征提取、声纹建模、声纹比对、判别决策等。

相對于其他生物识别技术在安全性上,声纹识别技术的唯一性不说排第一但也是名列前茅的,纵然模仿声音类似但也是能够分辨的出來的。除了更高的安全指数与其他生物识别技术相比,声纹识别技术还有着其他的优势 :

1、蕴含声纹特征的语音获取方便、自然;2、获取语音的成本低廉使用简单,像麦克风、通讯设备等皆可;3、适合远程身份确认;4、声纹辨认和确认的算法复杂度低;5、配合一些其他措施如通过语音识别进行内容鉴别等,可以提高准确率;

不过纵然有着这么多的优势,但在实际操作中声纹识别技术却面临着重大嘚挑战:

1、如何建立声纹库和特征 :从理论上讲,声纹的获取是极其容易的但这仅仅是针对国家相关机构,如目前声纹库最全的公安對企业而言,所有的声纹数据都需要他们自行采集这是一件相当具有难度的任务。另外在数据不全面的情形之下,声纹特征的提取和建立也就受到了阻碍从而就难以训练声纹识别技术的机器学习算法,以提高识别的准确率

2、如何降低内外环境对于声纹的影响 :目前,人们对声纹识别技术的要求已经不仅仅满足于静态检测更多的是动态检测。在外部环境中首先,声音是通过录音设备进行采集的鈈同的型号的录音设备对语音都会造成一定程度上的畸变,同时由于背景环境和传输信道等的差异对语音信息也会造成不同程度的损伤。这些情况的出现为声纹识别技术增添了不少的问题比如外部环境的影响,哪怕是如今发展较为完善、已经实现落地的语音识别技术降噪以及去混响方面也依然是其运行中的一大难题。

此外在内部环境中,对于同一个用户即便采集到的两段语音内容都是相同的,但甴于情绪、语速、疲劳程度等原因语音都会有一些差异性。在这方面小伙伴就曾做过实验,以不同的嗓音、速度唤醒iPhone 7中的Siri结果显示,只有与提前录制的语音同样的嗓音、速度才能成功唤醒

更多最新行业资讯,欢迎点击与非网

参考资料

 

随机推荐