3月24日消息,中科院聯合阿里安全團隊通過訓練AI模型,研究表情和聲音的關系,完成了給定一段聲音和僅有一張正確人臉的若干張圖片,AI為該聲音找到“主人”的實驗研究。
經驗證,相較于人類67%的正確率,AI的準確率接近90%。在“1對N”的匹配實驗中,AI還能對聲音歸屬人臉的“可能性”進行排序。這種技術是一種自適應的學習框架,用來挖掘和學習人臉與聲音的潛在聯系,該論文研究成果隨即被CVPR 2021接收。
據阿里安全圖靈實驗室資深算法專家華棠介紹,該技術后續將在內容安全和賬戶安全領域探索應用,對抗偽造類視頻攻擊,保護用戶財產和信息安全。“有些人利用偽造視頻試圖騙過認證系統,AI的這項技能將進一步驗證聲音與相應真人是否匹配,防范欺詐,守護安全。”華棠說,這也是讓AI在提升安全水位上有更多用武之地。