CakeResume Talent Search

Advanced filters
On
4-6 years
6-10 years
10-15 years
More than 15 years
Avatar of 金爾康.
Avatar of 金爾康.
Engineering Manager @Viscovery 創意引晴股份有限公司
2018 ~ Present
Within one month
Weir, ..., Broad-DREAM Community , Gustavo Stolovitzky, William C Hahn, Adam A Margolin "A community-based challenge for building predictive models of gene essentialities over a large-scale functional screen of cancer cell lines", Cell Systems 3. Erh-Kan King , Chung-Yen Hung, Winston Hsu, "Visual-Textual Convolutional Neural Network: Rening Image Representation With Click-Through Data", to appear in going to submmit in arXiv. Research Experience Research Assistant, Seppresent Communication and Multimedia Lab (CMLab), NTU Proposed a Convolutional Neural Network (CNN) accurately performing fine-grained classification for surveillance car. The model recovered lost details
Deep Learning
Computer Vision
FastAPI
Employed
Open to opportunities
Full-time / Interested in working remotely
4-6 years
國立台灣大學
Electrical Engineering
Avatar of the user.
Avatar of the user.
Senior software engineer @Compal Electronic, Inc.
2019 ~ Present
AI工程師、後端工程師
Within one month
Deep Learning
AOI
c#
Employed
Full-time / Interested in working remotely
4-6 years
National Kaohsiung University of Applied Sciences
Computer science and information engineering
Avatar of the user.
Avatar of the user.
AI 工程師 @台灣塑膠工業股份有限公司
2020 ~ Present
AI工程師、機器學習工程師、深度學習工程師、資料科學家、Machine Learning Engineer、Deep Learning Engineer、Data Scientist
Within six months
Simulink
OpenCV
Azure
Employed
Full-time / Interested in working remotely
4-6 years
Chung Yuan Christian University
Master in Chemical Engineering
Avatar of the user.
Avatar of the user.
資深JAVA工程師 @智誠科技
2020 ~ 2021
軟體工程師
Within one year
C++
C
JAVA
Employed
Full-time / Interested in working remotely
4-6 years
國立嘉義大學
資訊工程系
Avatar of Wonjoong Cheon.
Post Doc position or Research professor
Within one year
of Korea Winter internship, Dept. Research and Development (R&D) - CT Reconstruction Algorithm using Matlab Awards  2021, Asia-oceania Federation of Organization Medical physics Best Ph.D Award Winnner : [link] 2021, Body morphometry AI segmetation challenge (보건복지부) Top prize : Kidney and kidney tumor segmetation network by using nnUnet and STAPLE algorithm 2021, 9th Japan-Korea Joint meeting on Medical physics (한-일 의학물리학회) Young Investigation Award : Beam Angle Optimization for Double-Scattering Proton Delivery Technique Using an Eclipse Application Programming Interface and Convolutional Neural Network 2021, 9th Japan-Korea
JavaScript
Full-time / Interested in working remotely
4-6 years
Yonsei University
Dept. Computer engineering
Avatar of 孫郁喬.
Avatar of 孫郁喬.
Data Scientist/Machine Learning Engineer @CloudMile_萬里雲
2019 ~ Present
Data analyst, Machine Learning engineer.
Within six months
智慧家電Chatbot後端平台之開發,使用者可透過LINE直接操作家中的電器,省去使用智慧家電APP操控. (Golang, Heroku, PostgreSQL, Line Chatbot, Azure Cognitive Services) • 實作Convolutional Neural Network與遷移學習在自駕車專案中的物件偵測. (Python, Pandas, Scikit-learn, Tensorflow, Keras) • 建立OTA系統後端開發,讓使用者可以隨時更新韌體.(PHP
Deep Learning
Data Analytics
Python
Employed
Full-time / Interested in working remotely
4-6 years
National Taiwan University of Science and Technology
Computer Science
Avatar of Lindsay Yuling Chuang.
Avatar of Lindsay Yuling Chuang.
Teaching Assistant @Georgia Institute of Technology | The University of British Columbia
2014 ~ 2019
PHD Student
More than one year
earthquakes beneath southern Vancouver Island publication date MG Bostock, AM Thomas, G Savard, L Chuang, AM Rubin Journal of Geophysical Research: Solid Earth,Ambient tremors in a collisional orogenic belt. publication date LY Chuang, KH Chen, A Wech, T Byrne, W Peng Geophysical Research Letters,Conference presentation A Deep Convolutional Neural Network Model for Earthquake Phase Picking in Taiwan publication date Dec 12, 2019 publication description 2019 AGU meeting Tremor or train? An attempt to discern tremor and noise using a deep convolutional neural network publication date Sep 8, 2019 publication description 2019 SCEC meeting A Machine Learning Approach
Machine Learning
Python
Deep learning with TensorFlow
Intern / Interested in working remotely
6-10 years
The University of British Columbia
M.S. in Geophysics
Avatar of ChenKuan Sun (CK Sun).
Avatar of ChenKuan Sun (CK Sun).
Senior Software engineer @Cisco Systems
2022 ~ Present
DeepLearning Engineer
Within one month
on the cutting-edge of robotics, machine learning, software engineering, and mechanical engineering. Learn more Robotics SoftwareND Master advanced robotics software engineering skills, and gain hands-on experience developing solutions that solve challenging robotics and AI problems. Learn more Certificates Continue to pursue online courses to solve a variety of different issues. Fundamentals of Deep Learning for Computer Vision Links Neural Networks and Deep Learning Links Improving Deep Neural Networks: Hyperparameter tuning, Regularization and Optimization Links Structuring Machine Learning Projects Links Convolutional Neural Networks Links Python3 for Data Science Links HTML, CSS, Javascript, jQuery,php, mySQL Links
Python
C
Web Development
Employed
Full-time / Interested in working remotely
4-6 years
R.O.C. Naval Academy
Electrical Engineering

The Most Lightweight and Effective Recruiting Plan

Search resumes and take the initiative to contact job applicants for higher recruiting efficiency. The Choice of Hundreds of Companies.

  • Browse all search results
  • Unlimited access to start new conversations
  • Resumes accessible for only paid companies
  • View users’ email address & phone numbers
Search Tips
1
Search a precise keyword combination
senior backend php
If the number of the search result is not enough, you can remove the less important keywords
2
Use quotes to search for an exact phrase
"business development"
3
Use the minus sign to eliminate results containing certain words
UI designer -UX
Only public resumes are available with the free plan.
Upgrade to an advanced plan to view all search results including tens of thousands of resumes exclusive on CakeResume.

Definition of Reputation Credits

Technical Skills
Specialized knowledge and expertise within the profession (e.g. familiar with SEO and use of related tools).
Problem-Solving
Ability to identify, analyze, and prepare solutions to problems.
Adaptability
Ability to navigate unexpected situations; and keep up with shifting priorities, projects, clients, and technology.
Communication
Ability to convey information effectively and is willing to give and receive feedback.
Time Management
Ability to prioritize tasks based on importance; and have them completed within the assigned timeline.
Teamwork
Ability to work cooperatively, communicate effectively, and anticipate each other's demands, resulting in coordinated collective action.
Leadership
Ability to coach, guide, and inspire a team to achieve a shared goal or outcome effectively.
Within six months
AI工程師 @ 鉅芯科技
鉅芯科技
2021 ~ Present
台灣新竹市
Professional Background
Current status
Employed
Job Search Progress
Professions
Machine Learning Engineer
Fields of Employment
Semiconductor, Artificial Intelligence / Machine Learning
Work experience
4-6 years work experience (2-4 years relevant)
Management
I've had experience in managing 1-5 people
Skills
python programming
machine learning
Deep Learning
tensorflow
Tensorflow (Keras)
PyTorch
Convolutional Neural Network
Languages
Chinese
Native or Bilingual
English
Intermediate
Job search preferences
Positions
機器學習/資料科學工程師
Job types
Full-time
Locations
台灣新竹市, 台灣新竹縣
Remote
Not interested in working remotely
Freelance
Educations
School
國立交通大學
Major
電機與控制
Print
Profile 00 00@2x

李東宏 Dong-Hong Lee

 喜愛思考、熱愛挑戰、永不放棄

我是一名喜歡思考、用程式解決問題的工程師。

先後曾在台積電擔任過設備工程師與製程工程師、以及在中科院擔任過PLC程式設計工程師、目前則在鉅芯科技擔任AI工程師。


在台積電工作的經歷,讓我學到最多的是如何將每一件看似小事的事做到最好,如何細心以及專注於每一塊可能忽略的細節,唯有將每個細節用心做到最好,才是一名工程師該有的素養。我在擔任設備工程師及製程工程師的時候,最重要的就是如何盡己所能的將設備機台維護到完美,連一顆螺絲釘要鎖到多緊、磅數需要多少都是我們所關心的,唯有如此才能確保晶圓經過自家設備機台時的良率能夠維持一定的水準。


在中科院工作的經歷,讓我學到最多的是如何規劃及設計出國家級的潛艦,我從零開始學習如何應用PLC程式設計,設計與規劃潛艦上電機電子設備的控制。由於從小到大學習新事物的速度一直都還算快速,尤其在台積電時還曾受到主管稱讚學習能力優秀且新事物的適應力快速,因此應用在學期間所學到的電子學、自動控制等理論知識並搭配PLC程式設計,讓我很快就能自己負責規劃與設計潛艦中四大系統中的其中一個,在新聞上看到的IPMS系統中,四大系統的其中之一就是我所負責設計的。


目前在鉅芯科技擔任AI工程師負責晶圓瑕疵分類(ADC)系統,主要提供Deep learning在影像辨識上,幫助半導體廠能夠用最少的人力達到最高的效率在提升半導體良率上,目前我個人所負責完成的專案如下:

  1. 應用OCR引擎於辨識wafer ID的系統,主要將圖片透過傳統影像辨識的處理,將特徵強化再透過OCR引擎訓練模型並預測,負責完成的部分包含傳統影像處理、data label、model training、predict and test。
  2. 於公司現有的晶圓瑕疵分類系統上,提出將預測結果的分數經由投票機制搭配加權級距的方式處理,可以有效提升系統實際於產品線上應用的準確度約5%。
  3. 於公司現有的晶圓瑕疵分類系統上,分析資料平衡的機制,改善部分平衡的方式,可以在不影響準確度的前提下加速系統運行的速度。
  4. 應用SOLOv2模型在半導體的測試上,檢測探針於晶圓上的測試狀態,我所設計的系統由於只需要精準預測出晶圓上pad物件的目標,就能夠搭配傳統影像辨識的後處理達到高準確度,目前我所測試得到的準確度約有80%,而這是在訓練資料量只有19張的條件下,而測試的資料量約132張所達到的準確度。
  5. 應用XGBoost模型在半導體良率預測上,根據機台Recipe作為資料集,並預測晶圓良率,在75筆資料中所建立的model,其誤差平均在15左右。


我在Coursera上修習吳恩達教授的Deep learning,學習類神經網路,在自學的這段期間所完成的Python專案有:

  1. 手刻Perceptron Learning Algorithm(PLA).
  2. 手刻Optimizers function配合GIF圖觀察求解最佳解的軌跡.
  3. 手刻2 layer NN model辨識貓咪圖片.
  4. 使用Random forest在Kaggle上的競賽.
  5. IMBD2020 全國智慧製造大數據競賽, 使用Random forest預測填補缺值並用類神經網絡預測結果。


秉持著永不放棄的精神、強烈的自我要求及良好的團隊合作與溝通能力,讓我能快速適應新環境,也能在高壓與快節奏的工作環境中完成任務。

我喜歡思考、熱愛挑戰的工作並樂於分享使自己與團隊更進步。


1990, Hsinchu,TW 0931-790-923
[email protected]





工作經歷

鉅芯科技, AI工程師, Apr 2021 ~ 現在

  • 晶圓瑕疵分類(ADC)系統架構
  • 應用OCR引擎辨識wafer ID. 
  • 於InceptionV3模型輸出後採用投票機制,並提升模型分類wafer defect的準確度. 
  • 分析並改善資料平衡上data augmentation的方法,優化系統架構. 
  • 應用SOLOv2於wafer探針狀態,根據物件偵測的實例分割判斷探針位置及狀態.

中山科學研究院-資通所, PLC工程師, Apr 2019 ~ 現在

  • 參與計畫的研擬,包含選用PLC軟體程式、硬體RTU等模組設備
  • 使用PLC進行電機電子等元件設備的系統程式開發
  • 測試並確認能與其他子系統進行邏輯控制
  • 執行設備的採購案
  • 利用Python強大的資料處理能力將PLC所需的訊號點位進行編碼,總共針對25個子系統,近3000個訊號點位進行編碼,同時減輕其他同事的工作量,將電腦就能完成的事情交由程式解決,讓工程師可以專注於其他更重要的工作上。

台積電, 設備工程師與製程工程師, Feb 2017 ~ Jul 2018

  • 提高產線製程的良率,解決產線製程不良品發生的問題。
  • 解決因不良品導致停止運作的機檯。
  • 提出機台保養的手法,提升機台效率,降低機台保養次數。
  • 掌控機檯製造狀況,避免不良品的發生,在同期新進人員中,以最快的學習速度以及最少的犯錯率,快速掌握與認識將所負責的製程機台。
  • 利用Excel以及公司各種圖表繪製工具繪圖並觀察產品各種量測的結果,追蹤預防或即時發現與解決Defect的產生。

專長

• Tensorflow及Pytorch 

• Convolution Neural Network(CNN)

• Neural Network 

• SOLOv2使用經驗 

 • OCR使用經驗

專案

• 手刻Perceptron Learning Algorithm(PLA)

• 手刻Optimizers function配合GIF圖觀察求解最佳解的軌跡

• 手刻2 layer NN model辨識貓咪圖片 

• IMBD2020 全國智慧製造大數據競賽, 使用Random forest預測填補缺值並用類神經網絡預測 結果












學歷

國立交通大學, 碩士學位, 聲音科技學程, 電機與控制, 2014 ~ 2017

畢業論文 基於語音命令之家用機器人任務學習設計

 C++, Android, Hidden Markov ModelVoice recognition

  • 透過使用者一個簡單的語音命令即可以使機器人執行一連串的動作以完成任務。機器人將不再需要使用者逐一下達語音命令,而是可以由使用者的一個語音命令就能夠透過任務學習系統的運算串聯起整個任務的流程並且逐步完成任務。
  • 利用Matlab建立兩個序列,並透過HMM演算法的方式,給定隱含狀態值與可觀察值之間的權重,可以根據先前的狀態決定當下的命令任務為何。
  • 利用Google助理進行使用者的語音辨識,並透過Socket的方式將辨識結果傳至機器人端進行任務選擇。
  • 搭配機器人身上的Kinect進行物體的辨識並透過手臂進行物體抓取。
  • 搭配機器人身上的雷射建立環境地圖並且辨識與避開障礙物。

擅長的科目

  • 電子學、電路學、工程數學、自動控制。

競賽

IRHOCS 2014 國際機器人實作競賽 第二名

機器人必須持球並且辨識籃框位置與射籃,以及將籃球傳給隊員,讓隊員能夠上籃得分,機器人在移動的過程中必須避開障礙物,才能完成比賽。

  • 參與LabVIEW程式開發,個人負責的是辨識好籃框後決定與籃框的距離,以及避開障礙物之後決定好要傳球給隊員的距離。
  • 籃球機器人在整個比賽中,透過雷射測距能夠避開障礙物,同時利用Kinect辨識籃框位置,最後在機械手臂的部分利用槓桿原理的方式將籃球投出。

IMBD 2020 全國智慧製造大數據競賽

針對鑽孔機機台各項參數進行結果的預測。

  • 利用Random forest進行缺值的預測並填補。
  • 利用類神經網絡進行結果的預測。
  • 預測指標Loss:0.02, R2_score 0.55, Accuracy score:0.80

Kaggle競賽

Enron Fraud Dataset 安隆公司詐欺案

安隆公司曾是一間能源公司,2001 年破產前是世界上最大的電力、天然氣及電信公司之一。擁有上千億資產的公司於 2002 年竟然在短短幾周內宣告破產,才揭露其財報在多年以來均是造假的醜聞。在本資料集中你將會扮演偵探的角色,透過高層經理人內部的 mail 來往的情報以及薪資、股票等財務特徵,訓練出一個機器學習模型來幫忙你找到可疑的詐欺犯罪者是誰!

  • 我的Kaggle競賽ID是GaprsGG,在此次的Kaggle競賽中得到最佳的預測分數為0.821。
  • 我使用的演算法為Random Forest,選擇建立150顆決策樹,每顆決策樹最大的深度設定為7,這是我在實驗過程中找到最佳的參數。
  • 在特徵工程中,除了基本的補缺值外,我將所有參數均視覺化,分別是直方圖、箱型圖以及散佈圖等等,另外還特別將訓練集中的犯罪者以及無罪者個別繪製散佈圖,原因是我想利用視覺化的方式快速找到每一個特徵資料的關係為何,可以方便我決定如何利用這些特徵值。
  • 利用feature_importances_的方式列出各個特徵值的重要性,最後我將重要性最薄弱的三個特徵值刪除,這樣的方式成功讓我的預測準確性上升約0.02。

Resume
Profile
Profile 00 00@2x

李東宏 Dong-Hong Lee

 喜愛思考、熱愛挑戰、永不放棄

我是一名喜歡思考、用程式解決問題的工程師。

先後曾在台積電擔任過設備工程師與製程工程師、以及在中科院擔任過PLC程式設計工程師、目前則在鉅芯科技擔任AI工程師。


在台積電工作的經歷,讓我學到最多的是如何將每一件看似小事的事做到最好,如何細心以及專注於每一塊可能忽略的細節,唯有將每個細節用心做到最好,才是一名工程師該有的素養。我在擔任設備工程師及製程工程師的時候,最重要的就是如何盡己所能的將設備機台維護到完美,連一顆螺絲釘要鎖到多緊、磅數需要多少都是我們所關心的,唯有如此才能確保晶圓經過自家設備機台時的良率能夠維持一定的水準。


在中科院工作的經歷,讓我學到最多的是如何規劃及設計出國家級的潛艦,我從零開始學習如何應用PLC程式設計,設計與規劃潛艦上電機電子設備的控制。由於從小到大學習新事物的速度一直都還算快速,尤其在台積電時還曾受到主管稱讚學習能力優秀且新事物的適應力快速,因此應用在學期間所學到的電子學、自動控制等理論知識並搭配PLC程式設計,讓我很快就能自己負責規劃與設計潛艦中四大系統中的其中一個,在新聞上看到的IPMS系統中,四大系統的其中之一就是我所負責設計的。


目前在鉅芯科技擔任AI工程師負責晶圓瑕疵分類(ADC)系統,主要提供Deep learning在影像辨識上,幫助半導體廠能夠用最少的人力達到最高的效率在提升半導體良率上,目前我個人所負責完成的專案如下:

  1. 應用OCR引擎於辨識wafer ID的系統,主要將圖片透過傳統影像辨識的處理,將特徵強化再透過OCR引擎訓練模型並預測,負責完成的部分包含傳統影像處理、data label、model training、predict and test。
  2. 於公司現有的晶圓瑕疵分類系統上,提出將預測結果的分數經由投票機制搭配加權級距的方式處理,可以有效提升系統實際於產品線上應用的準確度約5%。
  3. 於公司現有的晶圓瑕疵分類系統上,分析資料平衡的機制,改善部分平衡的方式,可以在不影響準確度的前提下加速系統運行的速度。
  4. 應用SOLOv2模型在半導體的測試上,檢測探針於晶圓上的測試狀態,我所設計的系統由於只需要精準預測出晶圓上pad物件的目標,就能夠搭配傳統影像辨識的後處理達到高準確度,目前我所測試得到的準確度約有80%,而這是在訓練資料量只有19張的條件下,而測試的資料量約132張所達到的準確度。
  5. 應用XGBoost模型在半導體良率預測上,根據機台Recipe作為資料集,並預測晶圓良率,在75筆資料中所建立的model,其誤差平均在15左右。


我在Coursera上修習吳恩達教授的Deep learning,學習類神經網路,在自學的這段期間所完成的Python專案有:

  1. 手刻Perceptron Learning Algorithm(PLA).
  2. 手刻Optimizers function配合GIF圖觀察求解最佳解的軌跡.
  3. 手刻2 layer NN model辨識貓咪圖片.
  4. 使用Random forest在Kaggle上的競賽.
  5. IMBD2020 全國智慧製造大數據競賽, 使用Random forest預測填補缺值並用類神經網絡預測結果。


秉持著永不放棄的精神、強烈的自我要求及良好的團隊合作與溝通能力,讓我能快速適應新環境,也能在高壓與快節奏的工作環境中完成任務。

我喜歡思考、熱愛挑戰的工作並樂於分享使自己與團隊更進步。


1990, Hsinchu,TW 0931-790-923
[email protected]





工作經歷

鉅芯科技, AI工程師, Apr 2021 ~ 現在

  • 晶圓瑕疵分類(ADC)系統架構
  • 應用OCR引擎辨識wafer ID. 
  • 於InceptionV3模型輸出後採用投票機制,並提升模型分類wafer defect的準確度. 
  • 分析並改善資料平衡上data augmentation的方法,優化系統架構. 
  • 應用SOLOv2於wafer探針狀態,根據物件偵測的實例分割判斷探針位置及狀態.

中山科學研究院-資通所, PLC工程師, Apr 2019 ~ 現在

  • 參與計畫的研擬,包含選用PLC軟體程式、硬體RTU等模組設備
  • 使用PLC進行電機電子等元件設備的系統程式開發
  • 測試並確認能與其他子系統進行邏輯控制
  • 執行設備的採購案
  • 利用Python強大的資料處理能力將PLC所需的訊號點位進行編碼,總共針對25個子系統,近3000個訊號點位進行編碼,同時減輕其他同事的工作量,將電腦就能完成的事情交由程式解決,讓工程師可以專注於其他更重要的工作上。

台積電, 設備工程師與製程工程師, Feb 2017 ~ Jul 2018

  • 提高產線製程的良率,解決產線製程不良品發生的問題。
  • 解決因不良品導致停止運作的機檯。
  • 提出機台保養的手法,提升機台效率,降低機台保養次數。
  • 掌控機檯製造狀況,避免不良品的發生,在同期新進人員中,以最快的學習速度以及最少的犯錯率,快速掌握與認識將所負責的製程機台。
  • 利用Excel以及公司各種圖表繪製工具繪圖並觀察產品各種量測的結果,追蹤預防或即時發現與解決Defect的產生。

專長

• Tensorflow及Pytorch 

• Convolution Neural Network(CNN)

• Neural Network 

• SOLOv2使用經驗 

 • OCR使用經驗

專案

• 手刻Perceptron Learning Algorithm(PLA)

• 手刻Optimizers function配合GIF圖觀察求解最佳解的軌跡

• 手刻2 layer NN model辨識貓咪圖片 

• IMBD2020 全國智慧製造大數據競賽, 使用Random forest預測填補缺值並用類神經網絡預測 結果












學歷

國立交通大學, 碩士學位, 聲音科技學程, 電機與控制, 2014 ~ 2017

畢業論文 基於語音命令之家用機器人任務學習設計

 C++, Android, Hidden Markov ModelVoice recognition

  • 透過使用者一個簡單的語音命令即可以使機器人執行一連串的動作以完成任務。機器人將不再需要使用者逐一下達語音命令,而是可以由使用者的一個語音命令就能夠透過任務學習系統的運算串聯起整個任務的流程並且逐步完成任務。
  • 利用Matlab建立兩個序列,並透過HMM演算法的方式,給定隱含狀態值與可觀察值之間的權重,可以根據先前的狀態決定當下的命令任務為何。
  • 利用Google助理進行使用者的語音辨識,並透過Socket的方式將辨識結果傳至機器人端進行任務選擇。
  • 搭配機器人身上的Kinect進行物體的辨識並透過手臂進行物體抓取。
  • 搭配機器人身上的雷射建立環境地圖並且辨識與避開障礙物。

擅長的科目

  • 電子學、電路學、工程數學、自動控制。

競賽

IRHOCS 2014 國際機器人實作競賽 第二名

機器人必須持球並且辨識籃框位置與射籃,以及將籃球傳給隊員,讓隊員能夠上籃得分,機器人在移動的過程中必須避開障礙物,才能完成比賽。

  • 參與LabVIEW程式開發,個人負責的是辨識好籃框後決定與籃框的距離,以及避開障礙物之後決定好要傳球給隊員的距離。
  • 籃球機器人在整個比賽中,透過雷射測距能夠避開障礙物,同時利用Kinect辨識籃框位置,最後在機械手臂的部分利用槓桿原理的方式將籃球投出。

IMBD 2020 全國智慧製造大數據競賽

針對鑽孔機機台各項參數進行結果的預測。

  • 利用Random forest進行缺值的預測並填補。
  • 利用類神經網絡進行結果的預測。
  • 預測指標Loss:0.02, R2_score 0.55, Accuracy score:0.80

Kaggle競賽

Enron Fraud Dataset 安隆公司詐欺案

安隆公司曾是一間能源公司,2001 年破產前是世界上最大的電力、天然氣及電信公司之一。擁有上千億資產的公司於 2002 年竟然在短短幾周內宣告破產,才揭露其財報在多年以來均是造假的醜聞。在本資料集中你將會扮演偵探的角色,透過高層經理人內部的 mail 來往的情報以及薪資、股票等財務特徵,訓練出一個機器學習模型來幫忙你找到可疑的詐欺犯罪者是誰!

  • 我的Kaggle競賽ID是GaprsGG,在此次的Kaggle競賽中得到最佳的預測分數為0.821。
  • 我使用的演算法為Random Forest,選擇建立150顆決策樹,每顆決策樹最大的深度設定為7,這是我在實驗過程中找到最佳的參數。
  • 在特徵工程中,除了基本的補缺值外,我將所有參數均視覺化,分別是直方圖、箱型圖以及散佈圖等等,另外還特別將訓練集中的犯罪者以及無罪者個別繪製散佈圖,原因是我想利用視覺化的方式快速找到每一個特徵資料的關係為何,可以方便我決定如何利用這些特徵值。
  • 利用feature_importances_的方式列出各個特徵值的重要性,最後我將重要性最薄弱的三個特徵值刪除,這樣的方式成功讓我的預測準確性上升約0.02。