雲端防偽推薦系統開發
- 系統藉由消費者掃描QRCode的機制,搜集使用者資訊和其他相關資料,來確認並回傳購買商品的真偽。
- 負責在現有已上線的框架中,改善Data Pipeline,並且透過資料清洗、資料分析和訪問使用者,找出真實的標籤資料、探索新的特徵值及建立更好的預測模型。
- 藉由機器學習在現有框架的限制下,以決策樹演算法建立新模型,成功地將預測準確度(Precision,Recall)由70%提升至90%↑,以F1-Score和AUC曲線為判斷標準。
- 提出新的Feature搜集方法,用於使用者行為分析和模型建立,如IP地理位置判定、裝置GPS蒐集、UserAgent、使用者裝置、商業know-how...等。
- 經由改善現有Web框架,新增以Pmml檔作為模型資料傳遞方法,在開發者後台可使用各類Python機器學習的演算法,進行資料分析及建模。
- 以AWS雲端服務管理5億筆以上資料(使用InnoDB的Partition Table提升查詢效率),也運行網站服務。可達到3秒內,讓95%的消費者從查詢到模型產出得到真偽判定結果,其中使用服務包含AURORA、EC2、S3 Bucket、WAF...等。