陳昭儒(Chao-Ju Chen) Github [email protected] Education National Taiwan University Bachelor’s Degree, Electrical Engineering 2012 ~ 2017 Project Highlights Aggregating Files in one ETL, output 60B row to Data Warehouse Input :gzipped files(200GB in total) Task : Loading columns with values parsed from each gzipped file name. Wrote to BigQuery existing table(specific schema) in parallel. Tool: GCP Dataflow(Hosted Serverless Apache Beam) Result : The job took 40min to finish. Machine Type: n1-standard-1(1 vcpu, 3.75GB memory) Autoscaled up to 122 workers at peak. The data
Python
ETL
Web Scraping
Desempleado
・
Listo para la entrevista
A tiempo completo / Interesado en trabajar a distancia
A tiempo completo / Interesado en trabajar a distancia
6-10 años
逢甲大學
・
資訊電機學院 - 資訊工程學系 學士學位
El plan de reclutamiento más ligero y eficaz
Busque currículums y tome la iniciativa de ponerse en contacto con los solicitantes de empleo para lograr una mayor eficacia en la contratación. La elección de cientos de empresas.
Examinar todos los resultados de la búsqueda
Acceso ilimitado para iniciar nuevas conversaciones
currículos accesibles sólo para empresas de pago
Ver dirección de correo electrónico y números de teléfono de los usuarios