亞馬遜云科技客戶案例-Bayer圖像欺詐檢測

痛點與挑戰

為了提高聲譽,提高銷售業績,維護客戶關系,拜耳每年都會撥出大量的預算用于銷售,開展營銷活動,如學術會議等。
目前存在很多銷售人員未參與活動,為了報銷制造虛假數據(即餐費、參會人數、演講費)和圖片(即會議照片、集體照片),制造欺詐事件騙取營銷補貼。
為了識別這種欺詐行為,Bayer需要借助一定的手段來識別銷售提交上來的圖片是真實拍攝的還是從另外一張照片上重新拍攝得到的,傳統審核的方法存在以下挑戰:
1) 樣本量較大,公司抽樣檢查,覆蓋面不全。
2) 每月公司會花費大量的人力資源進行檢查照片的真實性,造成人力資源浪費。
目標:實現Bayer銷售活動圖片自動化檢測,高效率識別欺詐行為。

 

解決方案

Bayer數據存儲在AWS S3存儲桶內,使用模型構建組件SageMaker讀取存儲桶內的銷售真實拍攝的照片和翻拍的照片,結合業務對數據進行處理獲取建模需要的數據格式,在SageMaker中嘗試構建分類模型識別圖片的類別,并將模型部署到AWS Endpoint,實現持續自動化識別欺詐行為。
解決方案具體步驟如下:
1. 數據讀?。鹤x取AWS S3存儲桶中的Bayer的圖片數據到AWS SageMaker Studio中已經建立的Notebook腳本中。
2. 特征工程:提取像素矩陣、設定圓形半徑和像素點的個數、計算LBP碼、分塊統計直方圖形成特征向量。
3. 數據集劃分:將處理好的數據按8:2的比例劃分訓練集和驗證集,選定合適的評估指標。
4. 模型訓練和模型選擇:設置合適的參數訓練模型,或設置超參數優化作業進行參數自動調優,得到模型評估結果最好的超參組合作為最終的模型。
5. 模型部署:將最優模型部署到AWS Endpoint上。
6. 模型預測:調用Endpoint里的模型,對新的圖片識別是原始圖片還是翻拍圖片,以實現快速識別欺詐行為。

成果與收益

實現了自動化預測:部署在AWS Endpoint上的模型在任何時候都可以被調用,進行自動化預測,大大降低了Bayer手工識別的成本,預測結果直接存儲到AWS S3中,Bayer相關業務人員可直接下載查看相關預測報告。
模型識別準確率:模型預測準確率達到95%,召回率達到90%。
模型的自動化實現和效率的提升給Bayer帶來了極大的工作效率。

 

解決方案架構圖

關于<bayer>

 


拜耳作為一家跨國公司,在醫藥保健和農業領域具有核心競爭力。公司致力于通過產品和服務,幫助人們克服全球人口不斷增長和老齡化帶來的重大挑戰,造福人類。同時,集團還通過科技創新和業務增長來提升盈收能力并創造價值。拜耳致力于可持續發展。在全球,拜耳品牌代表著可信、可靠及優質