老大哥听声就能识你

来源:

澎湃新闻

近期,澎湃新闻发布了一则《听声就能“识”骗子 它让安徽冒充公检法电话诈骗骤降八成》新闻称,安徽省公安厅、公安部物证鉴定中心、科大讯飞3家单位联合建立了公安部重点实验室——“智能语音技术公安部重点实验室”,该实验室能为公安机关提供语音检验鉴定技术服务,从报道内容看该技术具备强大的声纹识别与监控能力,并且接入了电信系统,具备不限于“电话诈骗”的防范能力。

安徽淮南的一位女士曾接到一个诈骗电话。电话那头自称掌握了这位女士的所有个人信息,手上还握有和这位女士相关的法院传票。她若想解决这事就必须给特定的银行卡转账。

当时,淮南的这位女士完全相信了骗子的话,把钱存在了指定的卡上,密码也已经设好。而电话那头的骗子正一步步指挥她如何进行转账。就在转账的最后关头,当地公安机关后台的声纹识别系统根据骗子的声纹给出了预警,接到预警后,公安干警直接掐断了这位女士的电话,及时阻止了十几万的损失。

这是一起真实的案件。其中用的技术便是声纹识别:能辨别骗子的声音,并即时发出警告。安徽公安部门使用的这项技术由科大讯飞信息科技股份有限公司(002230,一下简称“科大讯飞”)研发,并得到了安徽省公安厅、公安部物证鉴定中心的合作。2012年7月9日,安徽省公安厅、公安部物证鉴定中心、科大讯飞3家单位联合建立了公安部重点实验室——“智能语音技术公安部重点实验室”。根据当时的部署,该实验室能为全国公安机关提供语音检验鉴定技术服务,逐步增加语音技术检验鉴定人员和相关设备,拓宽语音检验鉴定范围,服务侦查破案。目前,该实验室已经推出了电话诈骗防范拦截平台。

声纹识别(Voiceprint Recognize),是一项根据语音波形反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。声纹与人体的其他生物特征,例如DNA、指纹、人脸图像等一样,具有人体所固有的不可复制的唯一性。

如何“听”音“识”人

现实生活中常有“未见其人,先闻其声”的说法,意思是人类能通过声音去识别对方,即使还未获得视觉信息。对于相互熟悉的人来说,有些人甚至可以通过你电话里的一个“喂”字就知道是你。虽然目前计算机还做不到通过一个字就判断出人的身份,但是利用大量的训练语音数据,可以学出一个“智商”还不错的“声纹”大脑。那么这个“声纹”大脑是如何做到的,工作模式是什么?

声纹识别流程图

对于一个生物识别系统而言,一般有两个工作模式。一是需要你提供自己的身份(账号)以及生物特征,然后跟之前保存好的个人生物特征进行比对,确认两者是否一致,这是一个1比1的识别系统,也可以称为说话人确认(Speaker Verification)。另一种模式是如果它只需要你提供生物特征,然后从后台多条生物特征记录中搜寻出哪个是你,那么它是一个1比N的识别系统,也可以叫辨认(Speaker Identification)。

从上述生物识别系统的工作模式来看,要想让系统“听”音“识”人,就需要建立丰富的声纹资料库,并利用人工智能的一些算法进行分析。

据科大讯飞大数据研究院副院长谭昶介绍,从2010 年左右,讯飞开始做语音云平台,从那时开始真正拥有互联网用户的大数据。与安徽公安厅、公安部成立联合实验室后,接入了公安部门重点监控人员的声纹特征和数据。有了丰富的语音资料库后,该实验室就能对声音进行数字化声谱分析、真实性检验、降噪与增益。

通过声纹比对,真实性检验,科大讯飞的电话诈骗防范拦截平台还与当地的电信系统合作,建立了监控系统。这样一来,一旦有可疑声音接入平台,系统能第一时间给出警告,公安部门便能第一时间做出反应。

据科大讯飞介绍,基于这一系列技术,公司还成立了智能声纹鉴定工作站(FIAS,Forensic Intelligent Audio Studio)。

“去年统计结果表明,全国冒充公检法诈骗量上升将近70%,而安徽因为使用了讯飞的技术,比例下降了80%。” 科大讯飞董事长刘庆峰在2016年年会发言中提到。

能否做到“万无一失”

根据科大讯飞官网信息,它的声纹识别率超过95%。除了用在防范电话诈骗上,还可以用在门禁系统、为信用卡、远程炒股、社保等实现双保险。

但声纹识别在各个场景下的应用是否能做到万无一失?用户的声纹数据安全又如何保证?

“基于生物特征的这些识别技术,可能都是跟原来我们基于字码和文本字串的不同之处,在于它有一定的模糊性和不确定性。所以,从现在技术成熟的程度来讲,肯定还有一定的误识率。一般的应用,有点误识率关系还不大,但是,支付大宗交易的,如果误识的话,损失就真的造成了。”易宝支付联合创始人、总裁余晨在《MIT科技评论》2017年十大突破性技术发布大会上说。

余晨认为,跟生物特征相关的东西,它最大的特点就是没法改变。你的密码万一被人家截获了或者是丢了,你改就可以了。但万一别人获取了你的生物特征,你没办法换一张脸,除非你去做整形手术。所以从这个角度来讲,你的声纹特征一旦丢失,或被复制,给你带来的担忧会更多。

另外,与人脸、DNA、虹膜等生物特征不同,声纹更容易受外界因素影响。人的语音不是“一成不变”的。在声纹鉴定中由于背景噪音干扰、传输信道变化、疾病、醉酒、心理紧张、情绪变化、伪装等内外在因素的存在,使得同一人的语音在不同情况下存在差异。还有人担心,声纹识别防诈骗平台会对个人的电话进行监听,电话信息安全就无法保障。

“我们的这个监控系统,对有诈骗性行为的通话进行自动提醒。整个提醒工作都由智能系统自动完成,不增加额外的人力。当然,只有把语意理解和推理能力做得足够好,才能把这件事做好。我们的落脚点是人工智能技术。”科大讯飞执行总裁胡郁曾在接受澎湃新闻采访时说。

No comments