張浚誠

[email protected] 0931-504298

擁有3年以上資料處理及模型開發經驗,於在學時期就曾利用個人電腦處理TB級交易資料,成功縮短研究所需時間。堅持作品交付後回顧缺陷,喜歡與人分享技術與討論。在閒暇之餘學習有關資料工程方面知識,例如:Apache Hadoop、AirFlow、Kafka等資料處理和流程監控工具。曾多次擔任現職工程師技術及統計顧問,提供技術選擇及統計諮詢,時常與不同職位的工程師開讀書會,分享技術及經驗,期望自己能持續成長。

資訊技能 & 專案技能

Cloud & Local Architecture

  • GCP
  • AWS
  • Local Server

Language & Environment

  • Python
  • R
  • Golang
  • SQL
  • SAS
  • Linux

Database, Microservice &
BI Software

  • PostgreSQL/MySQL
  • Elasticsearch
  • Docker
  • Tableau

Project Skills

  • 需求評估
  • 需求規劃
  • 系統架構規劃
  • 業務邏輯規劃
  • 系統設計技術決策

工作經歷 - 資料工程師、後端工程師

AI模型產品化與資料系統架構設計開發 - AI演算法工程師、資料工程師

興創知能股份有限公司 • 月 2022 - 現在

  1. 地理資訊系統相關AI災害模型產品化,提供災害防治系統服務:

    負責內容為:a. AI模型產品化、b. 利用Python、SQL、RabbitMQ、Airflow、Postgres等工具,整合多種外部時間、空間資料、c. 整合團隊開發技術及專案架構
    a. 山坡地崩塌預測模型服務建立
    b. 自動化資料搜集系統
    c. AI產品研發團隊專案架構及開發模式導入

Python講師

臺灣科技大學• 月 2022 - 十一月 2022

資料處理與分析專案:

臺灣科技大學推廣教育中心開立課程,Python基礎與資料視覺化講師。
加入面對新資料的開發過程,課程中呈現如何尋找問題與解決問題。

客製化案件開發 - 資料工程師、後端工程師

個人與團隊合作  •  月 2021 - 七月2022

  1. 資料處理與分析專案:

    負責內容為:a.原始資料轉換流,利用Python、R、SQL等工具建立資料處理流程、資料報表等、b.使用機器學習模型進行資料分析並判讀、c. 研究報表產出及結果重現
    a. 醫療診斷紀錄整理及模型開發,與心臟內科醫師合作,利用院內診斷紀錄及病理檢查紀錄進行機器學習相關研究,判斷病人在未來數年內患病機率。
    b. 環保署空氣污染資料與空間統計分析,整合環保署近10年的空汙的污染物指數,配合ArcGIS Python API進行10年內醫療個案資料分析。將人力2個月的工時透過2週的自動化開發完成,並可重複使用。
  2. 客製化專案開發:

    負責內容為:a. 客戶需求可行性評估,提出業務邏輯設計、需求變更處理方式、b. 系統可行性方案建立,考量多方現有系統整合,提供開發及維運成本評估、c. 系統運行環境開發,使用GCP、AWS部署微服務 (Docker、CloudRun、CloudSQL、Cloud Storage)、d. 後端架構及開發,利用go (gin、gorm) 開發。在評估及開發之虞,協助前端環境部署及驗證技術可行性。
    a. 金屬回收公司收發案及報表系統開發。
    b. 股市報表客製化開發案,建立股市、證券交易及外匯資料即時互動視覺化圖表
    c. 類部落格系統開發Fabula
    d. 網購系統開發,整合現有的DB設計,建立下單時間限制及下單等功能。
    e. 說書APP後端開發

研究助理 - 資料工程師

  1. 衛生福利部雙和醫院(委託臺北醫學大學興建經營)  •  四月 2019 - 四月 2020
    碩士論文:
    分析研究運算需求,評估與建置運算系統環境 (Ubuntu、Nvidia GPU、CUDA、cuDNN、Jupyter-Notebook、TensorFlow),利用Python TensorFlow對ECG (心電圖) ,進行影像處理 (OpenCV、Numpy) 及深度學習 (Keras) 模型建立,並進行模型評估 (Scikit-Learn)
  2. 中國醫藥大學中醫部  •  八月 2019 - 七月 2020
    中醫藥物手冊處理與資料庫建立
    a. 開發藥物手冊資料處理流程,將手冊資料轉為結構化資料
    b. 利用微服務技術 (Docker) 部署Postgres資料庫,並建立自動化重建流程,使資料庫重建僅需1-2分鐘
  3. 其他在校研究
    a. 攝護腺癌細胞轉移骨科檢驗報告處理,透過自然語言技術 (Natural Language Process, NLP) 處理報告關鍵字分割,並透過關鍵字定位抓取癌細胞轉移路徑。
    b. 利用爬蟲技術 (Crawler) 及第三方API (OpenAPI) ,協助他學校校務研究資料收集,自Facebook粉絲專頁及Dcard文章資料

外聘統計顧問及報表製作 - SAS資料工程師及報表製作

Henlix 瀚霖生技  •  三月 2017 - 六月 2019

臨床實驗報表製作
1. 利用SAS進行CRO (Clinical Research Associate) 公司提供的臨床研究資料庫資料 (53張表) 進行資料整合
2.利用SAS製作臨床實驗報表 (Clinical Trial Listing)
3.臨床實驗報表初步審核及異常資料回報
透過針對性報表製作流程設計,原需七天製作的報表,僅需一天即可交付。

研究助理 - SAS資料工程師

中原大學 財務金融學系  •  七月 2018 - 三月 2019

台灣經濟新報 (TEJ) 資料庫,提供台灣證券「即時交易價量資料」( 1.5TB, 2006-2019 ),利用SAS建立高效資料處理流,透過軟體特性搭配硬體,每年資料所需計算時間從150分鐘改為25分鐘。

專案展示

金融數據戰情室

資產管理公司委託,設計及客製化其產品報表,前後端分離開發網頁及資料檢索。

工廠ERP客製化

根據貴金屬回收工廠提供的流程,開發電子化系統,並根據其網頁操作流程及APP報表,建立WebAPI。

部落格網站開發

根據客戶需求,設計網站樣式及操作後,利用模板系統整合為前後端合一服務。

網購商店客製化

根據客戶的特別需求,開發符合其銷售流程的系統,並媒合其原有的資料庫設計,建立網購API。

其他相關經歷

競賽 - ETU Hadoop Competition (2016)

參與ETU舉辦的電商競賽,利用分散式框架Hadoop進行消費者行為記錄資料進行分析,預測未來消費者消費產品類型。本次競賽取得冠軍奠定了自學之路的開始。

自我成長 - 基礎架構架設

為了理解伺服器基礎架設,自行架設了雙路由網路架構,並設定連線管理,達到基本商用環境架構。甚至自行架設了NAS及伺服器,便於專案開發與協助他人開發使用。

競賽 - SAS與玉山銀行FinTech預測未來挑戰賽

帶領超過40位來自不同科系的同學使用SAS,並一同參與競賽。最後有一半的同學通過考試,並在競賽中大展身手。

自我成長 - 技術學習

自主進修學習過Apache Airflow、Apache Kafka、Elasticsearch、React,並在自己電腦架設建立模擬系統。網路通訊則有RestfulAPI、gRPC、MQTT學習使用經驗。


學歷

臺北醫學大學 - 碩士

大數據科技及管理學研究所

畢業論文:機器學習應用於急性冠心症之鑑別診斷研究 Machine Learning Application for Differential Diagnosing Acute Coronary Syndrome

2018 - 2020

中原大學 - 學士

應用數學系-統計學程、大數據學士學位學程

2014 - 2018


自我學習及成長

Self-Learning and Future - 

在經歷過去一年的開發期間,依然不忘持續學習有關資料工程方面的之後,不管是ETL優化、第三方系統的搭配應用,都在我的學習清單中,包含:Apache Kafka、Apache Airflow、Elasticsearch、Redis等。在學習Apache Kafka時,甚至自己利用go goroutine建立一個基於RestfulAPI的pub/sub訂閱機制系統,以利我更快速了解Kafka的應用場景。另外,與大學同學開發一套「梗圖查詢系統」,利用使用者上傳的圖片及文字描述,透過Elasticsearch儲存並利用其全文搜尋功能進行關鍵字搜尋,讓使用者僅需要透過Line即可查詢有關梗圖,並在此開發後理解到Elasticsearch的實際應用成本問題,開始利用jieba、CKIP、monpa等NLP工具配合Postgres的text-search功能取代Elasticsearch關鍵字搜尋功能,簡化架構及成本。而在後端的基礎上,除了開發資料流外,也需要將自己的成果讓他人使用,進而需要不同的通訊方式。利用gRPC開發輔具評估系統 (Assitive-Technology-System),透過gRPC-gateway工具使前端能過快速接上功能,並不需要學習新的工具,除了給前端使用外,gRPC的proto schema訂製及code generator也能讓其他系統能夠快速銜接,簡化開發溝通時間成本。另外學習了前端React + Bootstrap開發使自己能夠將成果展示給他人。期望自己在未來能夠將技術應用在產品環境中,並持續學習更多知識。

2021-05 - Present

因認清自己而離開學術單位之後,學長找我開發「水質檢測視覺化系統」,以響應團隊在中華電信IoT競賽獲獎後的成果。當時利用中華的電信IoT大平台建立系統,透過MQTT技術搜集資料、利用ResufulAPI索取歷史紀錄,並且在GCP GAE (App Engine) 上建立視覺化服務,供團隊領袖與合作業主訪談時呈現。在因緣際會下,取得了金屬回收廠ERP開發案,也讓我們想學習並嘗試更多的可能,技術方面學習了go語言及雲端的應用完成專案。在這期間,接收到資產管理公司委託,設立一家公司進行股市、期貨及外匯資料整合視覺化系統,並擁有後台使用者權限管理。到後來,更有其他的小型專案評估及委託,也讓我持續學習許多開發上的知識。

2020-08 - 2021-04

碩士畢業後,曾在北醫攻讀博士學位,並擔任多個研究計畫的開發負責人。當時認知到「視覺化」是何等重要的技術,為了將自己的研究成果展現給他人,於是學習了前後端開發、前端資料視覺化及後端專案架構等技術,將當時的影像研究模型透過Python FastAPI作為RestfulAPI,並呈現於網頁中,以利於會議呈現討論使用。在此,也奠定下了有關前後端開發分工及後端業務邏輯層的基礎。

2018-08 - 2020-07

過去幾年奠定下的自學基礎,使我在碩一開學時就身兼多職,包含藥廠臨床實驗報表製作、股市交易資料整合及實驗室中所有「技術」問題都由我一個人負責。但在這樣的狀況下,仍不忘記每天學習。除了論文的閱讀外,在專案交付上也不斷提醒自己「這個流程效率高嗎?」、「這程式交給他人,人家會用嗎?」、「這程式哪裡可以改進?」等問題,促使自己不斷學習。在碩士兩年畢業前,有足夠能力將交付給他人的專案能快速復用,例如:中醫藥物配方手冊資料庫建立等專案,都透過Docker、Linux指令、Python專案管理工具等達成。

2014-08 - 2018-06

從大學時遇到好老師及學長姊,願意利用課餘時間開讀書會,帶領我與同學們一起學習課外事務。當時學習了有關C語言使用及Linux作業系統操作,並同時在數學集合論及分析理論內學習非常多基礎知識,打下的基礎是無可替代的。在學習之餘,也參加許多社團活動,包含音樂競賽、演出及外校協演等。甚至於寒假、暑假期間到校聽跨年級暑期課程,奠定日後主動學習的動力。而這些基礎培養出的學習能力,使我和同學在大二那年參與的ETU Hadoop競賽中奪冠。有了第一次的成果,使我更有動力持續精進自己。