刑偵新裝備聲呐識別偵(zhēn)查係統(tǒng)
金(jīn)輝警(jǐng)用器材專賣店分享消息: 一個新的平台旨在將語音錄音與存儲在海量數(shù)據庫中的語音樣本進行匹(pǐ)配來識別(bié)犯(fàn)罪分子,但這也引發了隱私方麵的問題(tí)。

正(zhèng)如開發(fā)人員所述,該平台將采用幾種(zhǒng)語音分析(xī)算法,按性別、年齡、語言和口音來過濾語音樣本。它將由國際(jì)刑(xíng)警組織在(zài)法國裏昂的總部加以(yǐ)管理,目的是提高語音數據的準確性,並提高語音數據(jù)的可(kě)靠(kào)性和司法上的可(kě)采信(xìn)性。
開發(fā)團隊已在2017年3月和11月成功完成了係(xì)統的現場測試。接下來會於今(jīn)年(nián)6月在布魯塞(sāi)爾進行項目評估。
雖然該係統可以處理任何“合法截獲”的聲音(yīn),包(bāo)括(kuò)背景對話,但(dàn)預期用途是將從電話通話和社交媒體收集的聲(shēng)音與“黑名單”數據庫相匹配。樣本可能來(lái)自移動電話、固定電話或VoIP網絡電話的錄音,或者來自從發布到社交媒體上的招聘或宣傳視頻捕獲的音頻片段。
這些錄製的數據實際上成(chéng)了生產線上的小部件(jiàn)。該文件(即捕獲的語音(yīn)片段)可能(néng)已經包(bāo)含由最初獲取語音片段(duàn)的執法官員添加的一(yī)些描述性元數據。比如說,軟(ruǎn)件隨後會嚐試添加關於說話人的年齡或口音的新信息(xī)。
為了(le)幫助完成這項任務,SIIP平台將創建(jiàn)一個模板(含有電話通話的警方錄音),標記代表該(gāi)片段上聲音的聲學特征。然後使用那些特征或身(shēn)份向量,試圖在數據庫(kù)中找到匹配的對象。
為了開(kāi)發該軟件,開發人員采用了(le)多種算法或(huò)模塊,通過一條基於開源架構的處理鏈對剛(gāng)錄製的語音樣本進行排序。2016年6月、2017年5月和2018年2月發布的臨時報告聲稱,構建這種係統所麵臨的挑戰包括安裝諸多工具,以便過濾背景噪音,提高(gāo)語(yǔ)音清(qīng)晰度,隔離聲音,以及為警察總部(bù)和外勤的(de)應用輕鬆共享、收集和分類數據。
其(qí)目(mù)的是能(néng)夠(gòu)將新的語(yǔ)音錄(lù)音與可能存儲100多(duō)萬條記錄的數據庫中存儲的超大(dà)聲音樣本數據庫進行匹配。該數據庫將由國際(jì)刑警組織來管理;語音錄音將(jiāng)由這家機構所轄(xiá)的各(gè)執法機構來輸入。來(lái)自(zì)192個(gè)國家的(de)這(zhè)些執法機構可(kě)以訪問該係統。
自各大社交媒體平台的語音樣本,包括Twitter、Google+、LinkedIn、YouTube和Facebook。通過(guò)基於語言相關性和地(dì)理位(wèi)置等搜索標準對(duì)多媒體內容進行梳理,該係統(tǒng)將標記和處理這(zhè)些材料,並在數(shù)據庫中找到類似的片段。該軟件的視頻處理引擎可(kě)以從在線視頻中提取音(yīn)頻,將其分割(gē)成單聲道錄音,將(jiāng)格式處理(lǐ)成未經(jīng)壓縮的16千赫(hè)茲WAV文件。純音頻內容也可以用這種方式來加以搜索和(hé)標記。
負責協調該項目的是總部位於紐約和以(yǐ)色列(liè)的Verint這家“可行動情報”公司。Verint以商業通話(huà)錄音起家(jiā),不妨想想“出於質量控(kòng)製和培訓的原因,本次通話可能被錄(lù)音。”該公司與空中(zhōng)客車、SingularLogic和Nuance共同開發了該係統,關(guān)鍵字識別組件來自維也納Sail Labs和瑞士非(fēi)營利研究組織IDIAP。荷蘭和英國的(de)安全(quán)小組研究了(le)這個項目的倫理道(dào)德(dé)方麵。征集(jí)了(le)多個執法(fǎ)機構的意見,包括國際刑警組織(zhī)、意大利警察局(jú)、英國大都會警察局、德(dé)國聯(lián)邦刑事調查局和(hé)葡萄牙刑(xíng)事警察局。
與更廣泛的自動語音監視領域一樣,該項目引起了複雜的反響。柏林的活動家馬修斯?蒙洛伊(Matthias Monroy)是一家公民權利雜誌(zhì)的編輯,他說:“我認為,警察和秘密情報機構手裏的語音識別相當危險。我持有(yǒu)異議。”自SIIP係統(tǒng)在2014年啟動以(yǐ)來,蒙洛伊就一直在密切關注該係統。
保羅?約翰尼(ní)斯(sī)(Paul Johannes)是(shì)德(dé)國卡塞爾大學商法係的研究助理,還是柏林數字隱私組織Forum Privatheit的成員。他表示,執法機構一直在尋找工具,對(duì)付由犯罪或(huò)恐怖活動開發(fā)的新(xīn)技術。
Human Rights Watch的高級研究員兼中國問題專家瑪雅?王(Maya Wang)最近幫助撰寫了一份報告,批評北京政府借助AI構建(jiàn)語音樣本數據庫的工(gōng)作。不過她表示,政治環境很重要。她看到了一個三極環境:一方(fāng)是中(zhōng)國及“處於蠻荒(huāng)期”的監視,缺少任何有(yǒu)意義的保護措施;一方是歐洲(zhōu),實施了較嚴(yán)格的規定;另(lìng)一方是美國,采用較鬆散的框架,該框架仍與充滿活力的公民社會和法治相關聯。王認為(wéi),自動語音識別帶來的後果取決(jué)於該技術(shù)用於哪裏。
讓事情(qíng)更複(fù)雜的是,歐盟即將頒布《數據保護通用(yòng)條例》(GDPR),這是(shì)一係列全麵的消費者數據隱私(sī)法規。關於該法規會不會影響SIIP之類的語音識別工具,外界意見不一。約翰尼斯表示,GDPR有一(yī)條“被遺忘的孿生”指令(lìng),該指令對警方或情報(bào)部門處理個人數據作了規定,並為個人數據(jù)的(de)自由移動製定了規則。
許多執法機構已(yǐ)經使用語音識別軟件包。國際刑警(jǐng)組織曾對69個國家的91個警察部(bù)門作了一項調(diào)查,結果顯示(shì),一半以上的警察(chá)部門已經在使用某種類型的自動語音識別係統。
比如說,STC Group提供一套名為VoiceGrid的語音識別套件,該套件於2011年部署在墨西哥,於2015年部署在厄瓜多爾。STCGroup是(shì)總部(bù)位於俄羅(luó)斯的Speech Technology Center的歐洲(zhōu)子公司。STC很注重將所謂的(de)“聲紋”(voiceprint)與底層的原始語音數據相分離――萬一(yī)含有聲紋的(de)數據庫遭到黑(hēi)客攻擊,識別個人身份的數據已被清除。
外界(jiè)一再要(yào)求置評,Verint和國際刑警組織並未予以回複。該係統的目標之一是改善在法庭案子中使用語音識別的前景。消息靈通人士表示,但是如果國際刑警組織繼續推(tuī)行SIIP平台,顯著特征很可能是數據庫。
傑弗裏?斯圖爾特?莫裏森(Geoffrey Stewart Morrison)是英國伯明翰阿斯頓大學司法語言中心的副教授,他表示,在法庭上使用語音數據和使用語音識(shí)別(bié)作為一種調查工具有很大(dà)的區別。通過已發表的作品,他(tā)和同事已為法庭(tíng)上的(de)語音比較(jiào)證詞指出了明確的限(xiàn)製。
國際刑警組織的這個(gè)平台可能證(zhèng)明它不僅有助於縮小(xiǎo)潛(qián)在嫌疑人的範圍,還有助於起(qǐ)訴犯罪分子。莫裏森表示,個別(bié)執(zhí)法機構可能已經在購買現有係(xì)統以滿足各(gè)自的用途,但它們可能不會(huì)共享數據,哪怕是在本國內部。然而,國際刑警組織的作用就是促進執法機構之間共享信息。
鑒於最近(jìn)有公司從Facebook之類的社交(jiāo)媒體平台獲取數據這一做法頗讓人擔(dān)憂,還可以將這(zhè)種分析視為一種(zhǒng)警告。正如活動家蒙洛伊(yī)指出的那樣,普通大眾最近才意識(shí)到他們的書麵交流內容可能大範圍受到監視、過(guò)濾(lǜ)查找關(guān)鍵字。他說:“普通(tōng)大眾應該知道,這還適用於語音(yīn)內容。”
糖心VLOG警用器材專(zhuān)賣店業務經理提示,本公(gōng)司是一家專業從事單警裝備銷售和研發的一體化企業,主要麵向國內(nèi)公安派出所(suǒ)交警隊(duì)伍及各類需要安保場所器材提供,按采購手續專(zhuān)業提供正規製式服裝,其中可大(dà)批量按企業招標合同生產市場(chǎng)監督(dū)服裝,交(jiāo)通路政服裝,衛生監督服裝(zhuāng),文化執法服裝,農林監(jiān)管執法服裝,行政執法服裝,一線品牌專業執法類服裝配(pèi)飾等,本公示同時還擁有目前國內先進的電腦織嘜流水線和專業製作團隊,警用裝備取得國家相(xiàng)關檢測證書和專利,各類警察日(rì)常用品齊全,價格公道。 如需了解更多警用品類產品可以聯係我們客服了解。
- 上一篇:浙江麗水交警(jǐng)抓了一個無證(zhèng)駕駛的戲精(jīng) 2018/6/19
- 下一篇(piān):穿上警服不是能壯膽 職責所在隻為正義 2018/6/13


