Zong-Ci Lu (Serge) [email protected] Experience AMD,2022/05 - present Develop GEMM kernel for AMD GPU in GCN assembly Study on different stratedies on GPU kernel fusion such as GEMM + GEMM and GEMM + Softmax + GEMM Appier,2022//05 Developed API for AIQUA service Skymizer,2020//03 TensorFlow integration with DLA (Deep Learning Accelerator) Sped up float to int8 quantization by using x86 SIMD instructions(10%~50% improvement depends on batch size) Developed customized neural network visualization tool to help developers to debug graph partitioning result Amended forward shape
C++
Python
Employé
Temps plein / Intéressé par le travail à distance
6 à 10 ans
National Tsing Hua University
・
Mathematics
Le Plan de Recrutement le Plus Efficace et Facile
Recherchez 800.000 CV et prenez l'initiative de contacter les candidats pour améliorer votre taux de recrutement. Le Choix de Centaines d'Entreprises
Consulter tous les résultats
Démarrer des nouvelles conversations sans limites
Seules les entreprises avec un abonnement peuvent consulter les CV
Consulter les adresses email et les numéros de téléphone des utilisateurs