頭條資訊 - 為您提供最新最全的新聞資訊,每日實時更新

給AI系統做“安全體檢” 阿裡發佈自動化AI對抗平臺

科技數碼 鞭牛士

鞭牛士BiaNews消息:安全人員曾為某著名車企自動駕駛系統做過一次安全測試,用物理對抗攻擊欺騙Autopilot車道檢測系統,導致汽車在Autopilot不發出警告的情況下駛入錯誤車道。假如這是一場真實的攻擊,後果不堪設想。事實上,AI系統如果沒有足夠的“免疫力”,甚至會被一張圖片欺騙,如將停車標誌識別為通行,在醫療應用中將有問題的醫療影像識別為正常圖像等。

為幫助AI應用從源頭構建安全性,阿裡安全圖靈實驗室整理歸納了學界針對AI模型提出的32種攻擊方法,以此為基礎搭建了一個自動化AI對抗攻擊平臺CAA,幫助檢測AI系統存在的安全漏洞。

經CAA“體檢”後,AI安全專家可針對被檢測AI的薄弱地帶提出安全建議,助力AI魯棒性(穩定性)檢測,以此增強AI系統的安全性,近日,該研究成果被人工智能頂會AAAI2021接收。

相比業界此前提出的其他攻擊工具箱,阿裡圖靈實驗室研發的自動化對抗攻擊平臺CAA首度實現了對抗攻擊的“工具化”。它讓AI應用的使用者即使不具備任何專業領域知識的情況下,也可以進行AI模型的對抗攻擊和魯棒性測試。

此外,CAA還可預先評估待檢測AI的特性,通過自動化搜索技術來合成多個攻擊算法的組合,提升了現有模型攻擊方法的性能和效率。阿裡安全專家通過實驗表明,CAA超越了最新提出的攻擊方法,是可有效評估當前AI系統安全性的最強“攻擊”。

給AI系統做“安全體檢” 阿裡發佈自動化AI對抗平臺

圖示:阿裡安全提出的自動化對抗攻擊平臺CAA運行示意圖

以事前“攻擊演練”檢測AI系統的安全性,是當前提升安全AI的有效方法,也是阿裡提出新一代安全架構,從源頭構建安全的核心理念。但如果不知道目標模型的防禦細節,研究者通常很難根據經驗選擇到對當前模型最優的攻擊算法,從而難以驗證“體檢”的真實效果。

阿裡安全圖靈實驗室算法專家簫瘋表示,阿裡安全首次提出將智能技術引入到對抗攻擊中,使得所有攻擊細節和參數作為一個黑箱,而攻擊者只需要提供目標模型和數據,算法就會自動選擇最優的攻擊組合和參數。

以AI體檢AI,以AI訓練AI。蕭瘋認為,對識別黃、賭、毒等不良內容的安全檢測AI而言,模型可靠性和魯棒性顯得尤為重要。目前,在鑑黃算法上,圖靈實驗室正在藉此技術方法提升曝光、模糊、低畫質等極端分類場景下的模型識別能力,並且逐漸提升模型在極端場景下的魯棒性,為業界提供更安全可靠的AI算法能力。

轉載請超鏈接註明:頭條資訊 » 給AI系統做“安全體檢” 阿裡發佈自動化AI對抗平臺
免責聲明
    :非本網註明原創的信息,皆為程序自動獲取互聯網,目的在於傳遞更多信息,並不代表本網贊同其觀點和對其真實性負責;如此頁面有侵犯到您的權益,請給站長發送郵件,並提供相關證明(版權證明、身份證正反面、侵權鏈接),站長將在收到郵件24小時內刪除。
加載中...