光華講壇——社會名流與企業家論壇第6661期
主題:基于黑箱攻擊的信用卡欺詐檢測模型安全性評估框架
主講人:四川大學教授 肖進
主持人:西南財經大學 管理科學與工程學院副院長 肖輝
時間:11月7日10:00
地點:通博樓D301會議室(溫江柳臺大道555號)
主辦單位:管理科學與工程學院
主講人簡介:
肖進,研究領域智能金融,四川大學商學院教授,博導,2018年作為首席專家主持國家社科重大項目并入選四川省突出貢獻專家和四川省天府萬人計劃天府社科精英,2020年獲得四川省杰出青年基金,2023年入選四川省學術和技術帶頭人,2024年入選國家萬人計劃哲社領軍人才。共獲得3項四川省科技進步獎二等獎,和1項四川省優秀哲社成果二等獎1項。
內容提要:
機器學習模型已經被廣泛應用于信用卡欺詐檢測(credit card fraud detection,CCFD)領域,然而,已有的研究主要關注模型的檢測性能,很少關注其安全性。近年來,其它領域的研究表明機器學習模型很容易受到對抗攻擊。目前,黑箱攻擊算法最為常用。已有的黑箱攻擊算法在生成對抗樣本時需要向目標模型查詢大量樣本的標簽,在現實的信用卡欺詐中很難滿足這一條件。因此,本研究提出了一個基于黑箱攻擊的CCFD模型安全性評估框架;在該框架下,進一步提出了一種半監督遷移黑箱攻擊(semi-supervised transfer black-box attack,STBA)算法來評估已有的CCFD機器學習模型的安全性。該算法不需要向目標模型進行大量查詢,而是利用半監督學習技術從無類別標簽樣本集中選擇性標記一部分樣本的類別來輔助訓練替代模型,進而提高替代模型與目標模型判別函數的相似性。在兩個真實CCFD數據集上進行實驗,使用構建的2種不同版本的STBA算法來攻擊包括深度神經網絡在內的6種目標模型。結果發現,和傳統的黑箱攻擊算法相比,STBA算法能夠進一步降低CCFD機器學習模型在生成的對抗樣本集上的分類準確率;面對STBA算法生成的對抗樣本,六種CCFD模型都基本喪失了識別欺詐交易的能力。這證明了本研究提出的安全性評估框架的可行性和有效性,為銀行評估和提升CCFD模型的安全性提供了重要參考。