• 免費試用

                    聲紋識別最權威評測 NIST SRE18結果公布:快商通排名全球前三!

                    2018-12-24 09:33  未知    閱讀:

                    在由美國國家標准技術署(NIST)主辦的說話人識別技術評測(Speaker Recognition Evaluation, SRE)公布的最新評測結果中,由快商通首席科學家李海洲教授及快商通聲紋研究院領銜的I4U團隊獲得綜合成績第三名的好成績,在大中華區參賽團隊中排名第一。

                     

                    NIST SRE:國際最權威、標准最嚴、影響力最大的聲紋識別技術評測
                     

                    SRE 2018 是由NIST(National Institute of Standards and Technology,美國國家標准與技術研究院,直屬美國商務部)承辦的國際上規模最大、標准最嚴、最權威的聲紋識別技術評測,爲全球參賽研究機構提供了一個公平的統一測試平台,旨在關注聲紋識別領域的核心技術問題。從1996年開始舉辦至今,參加 NIST SRE 評測的隊伍逐年增加,今年有包括麻省理工、清華大學、聲揚科技等在內的25個國家、78支隊伍參賽。

                     

                    近年來,NIST SRE 的重點任務是對于現階段實用領域中,口語對話電話語音(CTS)的說話人檢測。

                     

                    今年,除了在各種手機上錄制的CTS 之外,SRE18中的開發和測試材料還加入了IP語音(VOIP)數據,以及視頻音頻(AfV)數據。數據庫環境的複雜程度更高、幹擾因素更多,已遠遠超過一般的實際應用場景,意味著對參評機構的算法性能和系統魯棒性等提出更高的要求。

                     

                    另外,由于現實應用中,系統往往要根據不同的需求來決定阈值的選取。今年,爲綜合考核參評系統的靈活度、實用度以及綜合實力,NIST 將C_primary(或稱爲actDCF)作爲首要核心指標,用于描述說話人識別系統的整體辨別能力,評判標准不再僅看在某個阈值點的FAR/FRR或DCF,進一步提升了競賽的難度。

                     

                    因此,NIST SRE 測評結果不僅爲當前說話人識別的最新技術進步水平,也代表著該技術在目前實戰場景應用中能夠具備的最佳表現。

                     

                    聲紋識別技術排名全球前三,快商通憑什麽?
                     

                    在衆多多場景測評中,快商通聲紋識別系統在十萬分之一的誤報率下識別准確率超過99%。是國內聲紋識別領域企業中在該指標下的最好水平,也體現了我國說話人識別技術已達到世界領先水平。

                     

                    “NIST SRE 評測挑戰最大的是單信道多說話人識別。”快商通AI事業部研究員葉志堅表示,“測試數據中,每段語音使用麥克風陣列錄制用來混合測試,比如電話信道涵蓋了移動電話,固定電話等。麥克風類型也幾乎覆蓋實際應用中所有類型。其次,環境噪聲也更‘廣義化’,包括環境噪聲、人聲非語言、彩鈴炫鈴等各種背景噪聲情況。我們的系統采用了經典的DNN-ivector系統和基于端到端深度神經網絡(DNN)的說話人特征提取系統,在不同語種中使用的結果都不錯。”

                     

                    今年,快商通聲紋研究院在單信道多說話人識別方面取得了重大的進展,提出“單耳語音分離技術”,實現單音頻定向人聲分離,開創性解決聲紋識別中“雞尾酒會問題”難題。經實測、在嘈雜的環境中能夠准確分辨多說話人聲音。

                     

                    這套強大聲紋識別系統出色的完成了 NIST SRE 的說話人檢測任務,特別是在降低環境“噪聲”幹擾,以及同一段語音中多聲紋特征提取方面表現優異,系統將語音樣本分割聚類成獨立的片段,准確標注出“誰”從“什麽時候”到“什麽時候”在說話。

                     

                     

                    美國“最嚴技術封鎖”,國産AI能力崛起
                     

                    美國商務部工業安全署(BIS)根據出口行政規定(ExportAdministration Regulations, EAR)對軍民兩用和較爲不敏感的軍品出口進行監管,主要甄別涉及國家安全和高技術範疇的出口。根據美國商務部文件(15 CFR Part 744 [DocketNo. 180712626–8840–01] RIN 0694–AH61 Review of Controls for Certain Emerging Technologies),從美國公布的清單中甄別篩選出的代表性産業類別來看,可謂條條針對中國最新計劃發展的高科技産業。

                     

                    近年來,中國人工智能高速發展。無人超市,無人物流,無人加油站,無人駕駛,無人酒店……再加上各種功能健全的機器人!在我們毫無察覺中,人工智能正在日夜不息地自我叠代進化,沖擊著我們生活的方方面面。

                     

                    在人臉識別技術的研發和應用上,中國在其上投入巨大,在各項國際人臉領域的評測中中國的企業穩拿第一,如依圖科技,曠世科技,商湯科技(SenseTime)、雲從科技、百度等企業。

                     

                    在聲紋領域,快商通已將自主研發的聲紋識別技術落地應用在金融、安防、社保、智能家居、物聯網等領域,推出“金融信貸身份反欺詐”、“社保異地生存驗證”等行業解決方案。 在豐富項目經驗積累下,快商通在國內銀行、保險等領域商業測試中均取得聲紋技術排名第一,目前,快商通已爲平安集團、上海華瑞銀行,國家電網、常州司法局等用戶落地聲紋行業解決方案。

                     

                    在推動人工智能落地應用的同時,快商通也在持續加大對前沿技術投入。在成立快商通新加坡研究院之後,還與福建本土高校廈門大學、華僑大學建立聯合建立人工智能研究院,推進産學研用結合,爲廈門市乃至福建省的人工智能産業規模化發展增光添彩,爲提升我國科技創新實力、爲我國高科技産業的核心技術發展做積極貢獻。

                     

                    2018年,快商通首席科學家李海洲教授帶領的新加坡國立大學團隊榮獲2018年第二屆國際大學生類腦計算大賽一等獎;

                     

                    2017年,快商通聲紋團隊在Interspeech2017的ASVspoof2017自動說話人驗證欺騙和對策挑戰賽(AutomaticSpeaker Verification Spoofing and Countermeasures Challenge)中,獲得全球第一。

                    • 掃碼關注微信公衆平台
                      權威認證
                    • ISO27001信息安全管理
                    • 高新技術企業
                    • CMMI 3
                    服務熱線:400-900-1323
                    地址:廈門市集美區軟件園三期B20棟11-13層
                    權威認證
                    • 信息安全管理
                    • 高新技術企業
                    • CMMI 3
                    聯系我們
                    服務熱線:400-900-1323
                    地址:廈門市集美區軟件園三期B20棟13樓
                    銀行轉賬
                    ×
                    ×