CakeResume 找人才

进阶搜寻
On
4 到 6 年
6 到 10 年
10 到 15 年
15 年以上
Avatar of 金爾康.
Avatar of 金爾康.
Engineering Manager @Viscovery 創意引晴股份有限公司
2018 ~ 现在
一個月內
Weir, ..., Broad-DREAM Community , Gustavo Stolovitzky, William C Hahn, Adam A Margolin "A community-based challenge for building predictive models of gene essentialities over a large-scale functional screen of cancer cell lines", Cell Systems 3. Erh-Kan King , Chung-Yen Hung, Winston Hsu, "Visual-Textual Convolutional Neural Network: Rening Image Representation With Click-Through Data", to appear in going to submmit in arXiv. Research Experience Research Assistant, Seppresent Communication and Multimedia Lab (CMLab), NTU Proposed a Convolutional Neural Network (CNN) accurately performing fine-grained classification for surveillance car. The model recovered lost details
Deep Learning
Computer Vision
FastAPI
就职中
目前会考虑了解新的机会
全职 / 对远端工作有兴趣
4 到 6 年
國立台灣大學
Electrical Engineering
Avatar of the user.
Avatar of the user.
Senior software engineer @Compal Electronic, Inc.
2019 ~ 现在
AI工程師、後端工程師
一個月內
Deep Learning
AOI
c#
就职中
全职 / 对远端工作有兴趣
4 到 6 年
National Kaohsiung University of Applied Sciences
Computer science and information engineering
Avatar of the user.
Avatar of the user.
AI 工程師 @台灣塑膠工業股份有限公司
2020 ~ 现在
AI工程師、機器學習工程師、深度學習工程師、資料科學家、Machine Learning Engineer、Deep Learning Engineer、Data Scientist
半年內
Simulink
OpenCV
Azure
就职中
全职 / 对远端工作有兴趣
4 到 6 年
Chung Yuan Christian University
Master in Chemical Engineering
Avatar of the user.
Avatar of the user.
資深JAVA工程師 @智誠科技
2020 ~ 2021
軟體工程師
一年內
C++
C
JAVA
就职中
全职 / 对远端工作有兴趣
4 到 6 年
國立嘉義大學
資訊工程系
Avatar of Wonjoong Cheon.
Post Doc position or Research professor
一年內
of Korea Winter internship, Dept. Research and Development (R&D) - CT Reconstruction Algorithm using Matlab Awards  2021, Asia-oceania Federation of Organization Medical physics Best Ph.D Award Winnner : [link] 2021, Body morphometry AI segmetation challenge (보건복지부) Top prize : Kidney and kidney tumor segmetation network by using nnUnet and STAPLE algorithm 2021, 9th Japan-Korea Joint meeting on Medical physics (한-일 의학물리학회) Young Investigation Award : Beam Angle Optimization for Double-Scattering Proton Delivery Technique Using an Eclipse Application Programming Interface and Convolutional Neural Network 2021, 9th Japan-Korea
JavaScript
全职 / 对远端工作有兴趣
4 到 6 年
Yonsei University
Dept. Computer engineering
Avatar of 孫郁喬.
Avatar of 孫郁喬.
Data Scientist/Machine Learning Engineer @CloudMile_萬里雲
2019 ~ 现在
Data analyst, Machine Learning engineer.
半年內
智慧家電Chatbot後端平台之開發,使用者可透過LINE直接操作家中的電器,省去使用智慧家電APP操控. (Golang, Heroku, PostgreSQL, Line Chatbot, Azure Cognitive Services) • 實作Convolutional Neural Network與遷移學習在自駕車專案中的物件偵測. (Python, Pandas, Scikit-learn, Tensorflow, Keras) • 建立OTA系統後端開發,讓使用者可以隨時更新韌體.(PHP
Deep Learning
Data Analytics
Python
就职中
全职 / 对远端工作有兴趣
4 到 6 年
National Taiwan University of Science and Technology
Computer Science
Avatar of Lindsay Yuling Chuang.
Avatar of Lindsay Yuling Chuang.
Teaching Assistant @Georgia Institute of Technology | The University of British Columbia
2014 ~ 2019
PHD Student
超過一年
earthquakes beneath southern Vancouver Island publication date MG Bostock, AM Thomas, G Savard, L Chuang, AM Rubin Journal of Geophysical Research: Solid Earth,Ambient tremors in a collisional orogenic belt. publication date LY Chuang, KH Chen, A Wech, T Byrne, W Peng Geophysical Research Letters,Conference presentation A Deep Convolutional Neural Network Model for Earthquake Phase Picking in Taiwan publication date Dec 12, 2019 publication description 2019 AGU meeting Tremor or train? An attempt to discern tremor and noise using a deep convolutional neural network publication date Sep 8, 2019 publication description 2019 SCEC meeting A Machine Learning Approach
Machine Learning
Python
Deep learning with TensorFlow
Intern / 对远端工作有兴趣
6 到 10 年
The University of British Columbia
M.S. in Geophysics
Avatar of ChenKuan Sun (CK Sun).
Avatar of ChenKuan Sun (CK Sun).
Senior Software engineer @Cisco Systems
2022 ~ 现在
DeepLearning Engineer
一個月內
on the cutting-edge of robotics, machine learning, software engineering, and mechanical engineering. Learn more Robotics SoftwareND Master advanced robotics software engineering skills, and gain hands-on experience developing solutions that solve challenging robotics and AI problems. Learn more Certificates Continue to pursue online courses to solve a variety of different issues. Fundamentals of Deep Learning for Computer Vision Links Neural Networks and Deep Learning Links Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization Links Structuring Machine Learning Projects Links Convolutional Neural Networks Links Python3 for Data Science Links HTML, CSS, Javascript, jQuery,php, mySQL Links
Python
C
Web Development
就职中
全职 / 对远端工作有兴趣
4 到 6 年
R.O.C. Naval Academy
Electrical Engineering

最轻量、快速的招募方案,数百家企业的选择

搜寻简历,主动联系求职者,提升招募效率。

  • 浏览所有搜寻结果
  • 每日可无限次数开启陌生对话
  • 搜尋僅開放付費企業檢視的简历
  • 检视使用者信箱 & 电话
搜寻技巧
1
Search a precise keyword combination
senior backend php
If the number of the search result is not enough, you can remove the less important keywords
2
Use quotes to search for an exact phrase
"business development"
3
Use the minus sign to eliminate results containing certain words
UI designer -UX
免费方案仅能搜寻公开简历。
升级至进阶方案,即可浏览所有搜寻结果(包含数万笔览仅在 CakeResume 平台上公开的简历)。

职场能力评价定义

专业技能
该领域中具备哪些专业能力(例如熟悉 SEO 操作,且会使用相关工具)。
问题解决能力
能洞察、分析问题,并拟定方案有效解决问题。
变通能力
遇到突发事件能冷静应对,并随时调整专案、客户、技术的相对优先序。
沟通能力
有效传达个人想法,且愿意倾听他人意见并给予反馈。
时间管理能力
了解工作项目的优先顺序,有效运用时间,准时完成工作内容。
团队合作能力
具有向心力与团队责任感,愿意倾听他人意见并主动沟通协调。
领导力
专注于团队发展,有效引领团队采取行动,达成共同目标。
一個月內
AI工程師 @ 鉅芯科技
鉅芯科技
2021 ~ 现在
台灣新竹市
专业背景
目前状态
就职中
求职阶段
专业
机器学习工程师
产业
半导体, 人工智能 / 机器学习
工作年资
4 到 6 年工作经验(2 到 4 年相关工作经验)
管理经历
我有管理 1~5 人的经验
技能
python programming
machine learning
Deep Learning
tensorflow
Tensorflow (Keras)
PyTorch
Convolutional Neural Network
语言能力
Chinese
母语或双语
English
中阶
求职偏好
希望获得的职位
機器學習/資料科學工程師
预期工作模式
全职
期望的工作地点
台灣新竹市, 台灣新竹縣
远端工作意愿
暂不考虑远端工作
接案服务
学历
学校
國立交通大學
主修科系
電機與控制
列印
Profile 00 00@2x

李東宏 Dong-Hong Lee

 喜愛思考、熱愛挑戰、永不放棄

我是一名喜歡思考、用程式解決問題的工程師。

先後曾在台積電擔任過設備工程師與製程工程師、以及在中科院擔任過PLC程式設計工程師、目前則在鉅芯科技擔任AI工程師。


在台積電工作的經歷,讓我學到最多的是如何將每一件看似小事的事做到最好,如何細心以及專注於每一塊可能忽略的細節,唯有將每個細節用心做到最好,才是一名工程師該有的素養。我在擔任設備工程師及製程工程師的時候,最重要的就是如何盡己所能的將設備機台維護到完美,連一顆螺絲釘要鎖到多緊、磅數需要多少都是我們所關心的,唯有如此才能確保晶圓經過自家設備機台時的良率能夠維持一定的水準。


在中科院工作的經歷,讓我學到最多的是如何規劃及設計出國家級的潛艦,我從零開始學習如何應用PLC程式設計,設計與規劃潛艦上電機電子設備的控制。由於從小到大學習新事物的速度一直都還算快速,尤其在台積電時還曾受到主管稱讚學習能力優秀且新事物的適應力快速,因此應用在學期間所學到的電子學、自動控制等理論知識並搭配PLC程式設計,讓我很快就能自己負責規劃與設計潛艦中四大系統中的其中一個,在新聞上看到的IPMS系統中,四大系統的其中之一就是我所負責設計的。


目前在鉅芯科技擔任AI工程師負責晶圓瑕疵分類(ADC)系統,主要提供Deep learning在影像辨識上,幫助半導體廠能夠用最少的人力達到最高的效率在提升半導體良率上,目前我個人所負責完成的專案如下:

  1. 應用OCR引擎於辨識wafer ID的系統,主要將圖片透過傳統影像辨識的處理,將特徵強化再透過OCR引擎訓練模型並預測,負責完成的部分包含傳統影像處理、data label、model training、predict and test。
  2. 於公司現有的晶圓瑕疵分類系統上,提出將預測結果的分數經由投票機制搭配加權級距的方式處理,可以有效提升系統實際於產品線上應用的準確度約5%。
  3. 於公司現有的晶圓瑕疵分類系統上,分析資料平衡的機制,改善部分平衡的方式,可以在不影響準確度的前提下加速系統運行的速度。
  4. 應用SOLOv2模型在半導體的測試上,檢測探針於晶圓上的測試狀態,我所設計的系統由於只需要精準預測出晶圓上pad物件的目標,就能夠搭配傳統影像辨識的後處理達到高準確度,目前我所測試得到的準確度約有80%,而這是在訓練資料量只有19張的條件下,而測試的資料量約132張所達到的準確度。
  5. 應用XGBoost模型在半導體良率預測上,根據機台Recipe作為資料集,並預測晶圓良率,在75筆資料中所建立的model,其誤差平均在15左右。


我在Coursera上修習吳恩達教授的Deep learning,學習類神經網路,在自學的這段期間所完成的Python專案有:

  1. 手刻Perceptron Learning Algorithm(PLA).
  2. 手刻Optimizers function配合GIF圖觀察求解最佳解的軌跡.
  3. 手刻2 layer NN model辨識貓咪圖片.
  4. 使用Random forest在Kaggle上的競賽.
  5. IMBD2020 全國智慧製造大數據競賽, 使用Random forest預測填補缺值並用類神經網絡預測結果。


秉持著永不放棄的精神、強烈的自我要求及良好的團隊合作與溝通能力,讓我能快速適應新環境,也能在高壓與快節奏的工作環境中完成任務。

我喜歡思考、熱愛挑戰的工作並樂於分享使自己與團隊更進步。


1990, Hsinchu,TW 0931-790-923
[email protected]





工作經歷

鉅芯科技, AI工程師, Apr 2021 ~ 現在

  • 晶圓瑕疵分類(ADC)系統架構
  • 應用OCR引擎辨識wafer ID. 
  • 於InceptionV3模型輸出後採用投票機制,並提升模型分類wafer defect的準確度. 
  • 分析並改善資料平衡上data augmentation的方法,優化系統架構. 
  • 應用SOLOv2於wafer探針狀態,根據物件偵測的實例分割判斷探針位置及狀態.

中山科學研究院-資通所, PLC工程師, Apr 2019 ~ 現在

  • 參與計畫的研擬,包含選用PLC軟體程式、硬體RTU等模組設備
  • 使用PLC進行電機電子等元件設備的系統程式開發
  • 測試並確認能與其他子系統進行邏輯控制
  • 執行設備的採購案
  • 利用Python強大的資料處理能力將PLC所需的訊號點位進行編碼,總共針對25個子系統,近3000個訊號點位進行編碼,同時減輕其他同事的工作量,將電腦就能完成的事情交由程式解決,讓工程師可以專注於其他更重要的工作上。

台積電, 設備工程師與製程工程師, Feb 2017 ~ Jul 2018

  • 提高產線製程的良率,解決產線製程不良品發生的問題。
  • 解決因不良品導致停止運作的機檯。
  • 提出機台保養的手法,提升機台效率,降低機台保養次數。
  • 掌控機檯製造狀況,避免不良品的發生,在同期新進人員中,以最快的學習速度以及最少的犯錯率,快速掌握與認識將所負責的製程機台。
  • 利用Excel以及公司各種圖表繪製工具繪圖並觀察產品各種量測的結果,追蹤預防或即時發現與解決Defect的產生。

專長

• Tensorflow及Pytorch 

• Convolution Neural Network(CNN)

• Neural Network 

• SOLOv2使用經驗 

 • OCR使用經驗

專案

• 手刻Perceptron Learning Algorithm(PLA)

• 手刻Optimizers function配合GIF圖觀察求解最佳解的軌跡

• 手刻2 layer NN model辨識貓咪圖片 

• IMBD2020 全國智慧製造大數據競賽, 使用Random forest預測填補缺值並用類神經網絡預測 結果












學歷

國立交通大學, 碩士學位, 聲音科技學程, 電機與控制, 2014 ~ 2017

畢業論文 基於語音命令之家用機器人任務學習設計

 C++, Android, Hidden Markov ModelVoice recognition

  • 透過使用者一個簡單的語音命令即可以使機器人執行一連串的動作以完成任務。機器人將不再需要使用者逐一下達語音命令,而是可以由使用者的一個語音命令就能夠透過任務學習系統的運算串聯起整個任務的流程並且逐步完成任務。
  • 利用Matlab建立兩個序列,並透過HMM演算法的方式,給定隱含狀態值與可觀察值之間的權重,可以根據先前的狀態決定當下的命令任務為何。
  • 利用Google助理進行使用者的語音辨識,並透過Socket的方式將辨識結果傳至機器人端進行任務選擇。
  • 搭配機器人身上的Kinect進行物體的辨識並透過手臂進行物體抓取。
  • 搭配機器人身上的雷射建立環境地圖並且辨識與避開障礙物。

擅長的科目

  • 電子學、電路學、工程數學、自動控制。

競賽

IRHOCS 2014 國際機器人實作競賽 第二名

機器人必須持球並且辨識籃框位置與射籃,以及將籃球傳給隊員,讓隊員能夠上籃得分,機器人在移動的過程中必須避開障礙物,才能完成比賽。

  • 參與LabVIEW程式開發,個人負責的是辨識好籃框後決定與籃框的距離,以及避開障礙物之後決定好要傳球給隊員的距離。
  • 籃球機器人在整個比賽中,透過雷射測距能夠避開障礙物,同時利用Kinect辨識籃框位置,最後在機械手臂的部分利用槓桿原理的方式將籃球投出。

IMBD 2020 全國智慧製造大數據競賽

針對鑽孔機機台各項參數進行結果的預測。

  • 利用Random forest進行缺值的預測並填補。
  • 利用類神經網絡進行結果的預測。
  • 預測指標Loss:0.02, R2_score 0.55, Accuracy score:0.80

Kaggle競賽

Enron Fraud Dataset 安隆公司詐欺案

安隆公司曾是一間能源公司,2001 年破產前是世界上最大的電力、天然氣及電信公司之一。擁有上千億資產的公司於 2002 年竟然在短短幾周內宣告破產,才揭露其財報在多年以來均是造假的醜聞。在本資料集中你將會扮演偵探的角色,透過高層經理人內部的 mail 來往的情報以及薪資、股票等財務特徵,訓練出一個機器學習模型來幫忙你找到可疑的詐欺犯罪者是誰!

  • 我的Kaggle競賽ID是GaprsGG,在此次的Kaggle競賽中得到最佳的預測分數為0.821。
  • 我使用的演算法為Random Forest,選擇建立150顆決策樹,每顆決策樹最大的深度設定為7,這是我在實驗過程中找到最佳的參數。
  • 在特徵工程中,除了基本的補缺值外,我將所有參數均視覺化,分別是直方圖、箱型圖以及散佈圖等等,另外還特別將訓練集中的犯罪者以及無罪者個別繪製散佈圖,原因是我想利用視覺化的方式快速找到每一個特徵資料的關係為何,可以方便我決定如何利用這些特徵值。
  • 利用feature_importances_的方式列出各個特徵值的重要性,最後我將重要性最薄弱的三個特徵值刪除,這樣的方式成功讓我的預測準確性上升約0.02。

简历
个人档案
Profile 00 00@2x

李東宏 Dong-Hong Lee

 喜愛思考、熱愛挑戰、永不放棄

我是一名喜歡思考、用程式解決問題的工程師。

先後曾在台積電擔任過設備工程師與製程工程師、以及在中科院擔任過PLC程式設計工程師、目前則在鉅芯科技擔任AI工程師。


在台積電工作的經歷,讓我學到最多的是如何將每一件看似小事的事做到最好,如何細心以及專注於每一塊可能忽略的細節,唯有將每個細節用心做到最好,才是一名工程師該有的素養。我在擔任設備工程師及製程工程師的時候,最重要的就是如何盡己所能的將設備機台維護到完美,連一顆螺絲釘要鎖到多緊、磅數需要多少都是我們所關心的,唯有如此才能確保晶圓經過自家設備機台時的良率能夠維持一定的水準。


在中科院工作的經歷,讓我學到最多的是如何規劃及設計出國家級的潛艦,我從零開始學習如何應用PLC程式設計,設計與規劃潛艦上電機電子設備的控制。由於從小到大學習新事物的速度一直都還算快速,尤其在台積電時還曾受到主管稱讚學習能力優秀且新事物的適應力快速,因此應用在學期間所學到的電子學、自動控制等理論知識並搭配PLC程式設計,讓我很快就能自己負責規劃與設計潛艦中四大系統中的其中一個,在新聞上看到的IPMS系統中,四大系統的其中之一就是我所負責設計的。


目前在鉅芯科技擔任AI工程師負責晶圓瑕疵分類(ADC)系統,主要提供Deep learning在影像辨識上,幫助半導體廠能夠用最少的人力達到最高的效率在提升半導體良率上,目前我個人所負責完成的專案如下:

  1. 應用OCR引擎於辨識wafer ID的系統,主要將圖片透過傳統影像辨識的處理,將特徵強化再透過OCR引擎訓練模型並預測,負責完成的部分包含傳統影像處理、data label、model training、predict and test。
  2. 於公司現有的晶圓瑕疵分類系統上,提出將預測結果的分數經由投票機制搭配加權級距的方式處理,可以有效提升系統實際於產品線上應用的準確度約5%。
  3. 於公司現有的晶圓瑕疵分類系統上,分析資料平衡的機制,改善部分平衡的方式,可以在不影響準確度的前提下加速系統運行的速度。
  4. 應用SOLOv2模型在半導體的測試上,檢測探針於晶圓上的測試狀態,我所設計的系統由於只需要精準預測出晶圓上pad物件的目標,就能夠搭配傳統影像辨識的後處理達到高準確度,目前我所測試得到的準確度約有80%,而這是在訓練資料量只有19張的條件下,而測試的資料量約132張所達到的準確度。
  5. 應用XGBoost模型在半導體良率預測上,根據機台Recipe作為資料集,並預測晶圓良率,在75筆資料中所建立的model,其誤差平均在15左右。


我在Coursera上修習吳恩達教授的Deep learning,學習類神經網路,在自學的這段期間所完成的Python專案有:

  1. 手刻Perceptron Learning Algorithm(PLA).
  2. 手刻Optimizers function配合GIF圖觀察求解最佳解的軌跡.
  3. 手刻2 layer NN model辨識貓咪圖片.
  4. 使用Random forest在Kaggle上的競賽.
  5. IMBD2020 全國智慧製造大數據競賽, 使用Random forest預測填補缺值並用類神經網絡預測結果。


秉持著永不放棄的精神、強烈的自我要求及良好的團隊合作與溝通能力,讓我能快速適應新環境,也能在高壓與快節奏的工作環境中完成任務。

我喜歡思考、熱愛挑戰的工作並樂於分享使自己與團隊更進步。


1990, Hsinchu,TW 0931-790-923
[email protected]





工作經歷

鉅芯科技, AI工程師, Apr 2021 ~ 現在

  • 晶圓瑕疵分類(ADC)系統架構
  • 應用OCR引擎辨識wafer ID. 
  • 於InceptionV3模型輸出後採用投票機制,並提升模型分類wafer defect的準確度. 
  • 分析並改善資料平衡上data augmentation的方法,優化系統架構. 
  • 應用SOLOv2於wafer探針狀態,根據物件偵測的實例分割判斷探針位置及狀態.

中山科學研究院-資通所, PLC工程師, Apr 2019 ~ 現在

  • 參與計畫的研擬,包含選用PLC軟體程式、硬體RTU等模組設備
  • 使用PLC進行電機電子等元件設備的系統程式開發
  • 測試並確認能與其他子系統進行邏輯控制
  • 執行設備的採購案
  • 利用Python強大的資料處理能力將PLC所需的訊號點位進行編碼,總共針對25個子系統,近3000個訊號點位進行編碼,同時減輕其他同事的工作量,將電腦就能完成的事情交由程式解決,讓工程師可以專注於其他更重要的工作上。

台積電, 設備工程師與製程工程師, Feb 2017 ~ Jul 2018

  • 提高產線製程的良率,解決產線製程不良品發生的問題。
  • 解決因不良品導致停止運作的機檯。
  • 提出機台保養的手法,提升機台效率,降低機台保養次數。
  • 掌控機檯製造狀況,避免不良品的發生,在同期新進人員中,以最快的學習速度以及最少的犯錯率,快速掌握與認識將所負責的製程機台。
  • 利用Excel以及公司各種圖表繪製工具繪圖並觀察產品各種量測的結果,追蹤預防或即時發現與解決Defect的產生。

專長

• Tensorflow及Pytorch 

• Convolution Neural Network(CNN)

• Neural Network 

• SOLOv2使用經驗 

 • OCR使用經驗

專案

• 手刻Perceptron Learning Algorithm(PLA)

• 手刻Optimizers function配合GIF圖觀察求解最佳解的軌跡

• 手刻2 layer NN model辨識貓咪圖片 

• IMBD2020 全國智慧製造大數據競賽, 使用Random forest預測填補缺值並用類神經網絡預測 結果












學歷

國立交通大學, 碩士學位, 聲音科技學程, 電機與控制, 2014 ~ 2017

畢業論文 基於語音命令之家用機器人任務學習設計

 C++, Android, Hidden Markov ModelVoice recognition

  • 透過使用者一個簡單的語音命令即可以使機器人執行一連串的動作以完成任務。機器人將不再需要使用者逐一下達語音命令,而是可以由使用者的一個語音命令就能夠透過任務學習系統的運算串聯起整個任務的流程並且逐步完成任務。
  • 利用Matlab建立兩個序列,並透過HMM演算法的方式,給定隱含狀態值與可觀察值之間的權重,可以根據先前的狀態決定當下的命令任務為何。
  • 利用Google助理進行使用者的語音辨識,並透過Socket的方式將辨識結果傳至機器人端進行任務選擇。
  • 搭配機器人身上的Kinect進行物體的辨識並透過手臂進行物體抓取。
  • 搭配機器人身上的雷射建立環境地圖並且辨識與避開障礙物。

擅長的科目

  • 電子學、電路學、工程數學、自動控制。

競賽

IRHOCS 2014 國際機器人實作競賽 第二名

機器人必須持球並且辨識籃框位置與射籃,以及將籃球傳給隊員,讓隊員能夠上籃得分,機器人在移動的過程中必須避開障礙物,才能完成比賽。

  • 參與LabVIEW程式開發,個人負責的是辨識好籃框後決定與籃框的距離,以及避開障礙物之後決定好要傳球給隊員的距離。
  • 籃球機器人在整個比賽中,透過雷射測距能夠避開障礙物,同時利用Kinect辨識籃框位置,最後在機械手臂的部分利用槓桿原理的方式將籃球投出。

IMBD 2020 全國智慧製造大數據競賽

針對鑽孔機機台各項參數進行結果的預測。

  • 利用Random forest進行缺值的預測並填補。
  • 利用類神經網絡進行結果的預測。
  • 預測指標Loss:0.02, R2_score 0.55, Accuracy score:0.80

Kaggle競賽

Enron Fraud Dataset 安隆公司詐欺案

安隆公司曾是一間能源公司,2001 年破產前是世界上最大的電力、天然氣及電信公司之一。擁有上千億資產的公司於 2002 年竟然在短短幾周內宣告破產,才揭露其財報在多年以來均是造假的醜聞。在本資料集中你將會扮演偵探的角色,透過高層經理人內部的 mail 來往的情報以及薪資、股票等財務特徵,訓練出一個機器學習模型來幫忙你找到可疑的詐欺犯罪者是誰!

  • 我的Kaggle競賽ID是GaprsGG,在此次的Kaggle競賽中得到最佳的預測分數為0.821。
  • 我使用的演算法為Random Forest,選擇建立150顆決策樹,每顆決策樹最大的深度設定為7,這是我在實驗過程中找到最佳的參數。
  • 在特徵工程中,除了基本的補缺值外,我將所有參數均視覺化,分別是直方圖、箱型圖以及散佈圖等等,另外還特別將訓練集中的犯罪者以及無罪者個別繪製散佈圖,原因是我想利用視覺化的方式快速找到每一個特徵資料的關係為何,可以方便我決定如何利用這些特徵值。
  • 利用feature_importances_的方式列出各個特徵值的重要性,最後我將重要性最薄弱的三個特徵值刪除,這樣的方式成功讓我的預測準確性上升約0.02。