【Power BI】COVID-19與肥胖率之關係

Avatar of 林尚毅.
Avatar of 林尚毅.

【Power BI】COVID-19與肥胖率之關係

衛生福利部疾病管制署 Data Analyst
Taipei City, Taiwan

這個作品集是以我在國立臺北大學碩士期間,課程「迴歸分析」的期末報告作為延伸,並以Power BI展示視覺化效果,資料集取自kaggle的COVID-19 Healthy Diet Dataset,在該堂課中,我身為組長,帶領組員關注食物脂肪攝入和COVID-19確診率如何影響肥胖率。


我們分析了2019年173個國家的數據,包括食物脂肪攝入百分比、肥胖率和COVID-19病例百分比。通過線性回歸模型,嘗試找出不同類型食物脂肪攝入和COVID-19病例百分比如何影響肥胖率。其中透過課程所學,我們考慮了變數共線性問題,使用變數處理和逐步回歸的方法優化了模型。


最終模型發現,酒精和糖類作物脂肪攝入量上升反而會降低肥胖率,而五穀雜糧脂肪攝入量上升會增加肥胖率。此外,COVID-19確診率上升也輕微增加了肥胖率。


而本作品集希望透過Power BI便利且多樣的呈現方式,延伸針對各國家「COVID-19與肥胖率」、「攝入食物分析」以及「迴歸分析」這三個面向來進行探討分析,透過視覺化的角度,在同一份資料集中嘗試找出不同的見解!

 

首先,在「COVID-19與肥胖率」這部分,我使用地圖功能呈現各個國家的確診率,並且以泡泡大小表示確診率的高低,並且可以使用右方的交叉篩選器查詢特定國家的資訊。而下方的互動式面板呈現了各國家的肥胖率以及確診率的關係,以散佈圖的方式呈現,並且泡泡大小意涵著確診死亡率的高低,在該互動式報表中,可以發現,高COVID-19確診率的國家,普遍也有較高肥胖率的趨勢,另外發現,高COVID-19確診率且高肥胖率的國家,如美國,在確診死亡率方面也明顯較高,呈現出了傳統描述性統計報表較不易看出的見解。

接著,我想要探究各個國家在攝入食物脂肪的占比與COVID-19的關係,左上角圖示了各個國家平均的攝入脂肪的食物組成,以圓環圖呈現比例,而右上則列出了,TOP10高與低的COVID-19確診率國家,食物組成占比的排名,可以發現,在前三名的食物組成差異不大,而在右表中,TOP4是starchy root(根莖菜類),在左表則掉到了TOP11,而在後面的排序也可以發現,最高確診率前十名的國家在攝入脂肪的比例上,不健康的食物(如Sugar或是Alcoholic Beverage)占比較大。

最後,我想以互動圖示的方式,呈現簡單線性迴歸的模擬準確度,在上表,我的橫軸放的是確診率由高到低的國家,鼠標在圖表上滑動也可以知道確診率rank代表的是哪一個國家,從實際以及預測的Obesity肥胖率可以發現,確診率高的國家,對於肥胖率的預測較易不準確,探究原因可能是高確診率的國家在肥胖率的波動本身就比較大,因此不容易做出準確的預測。


而下表是各個國家詳細的模型變數以及預測值,因dataset與迴歸分析的報告所用資料有些許不同,因此我有重新跑過迴歸模型,也把模型的檢測跟係數放在下方供各位參考。我想,雖然同樣是非常簡易的迴歸分析模型,搭配上互動式報表以及視覺化之後,整體能夠讓讀者對於資料更有感覺,也可以觀察到不同的見解,對後續發展深度的分析有莫大的幫助。


如果對於這份Power BI報告有興趣的朋友,歡迎與我聯繫,我會提供連結給你,謝謝!


本作品集延伸我在臺北大學統研所的「迴歸分析」課程期末報告,希望透過Power BI便利且多樣的呈現方式,延伸針對各國家「COVID-19與肥胖率」、「攝入食物分析」以及「迴歸分析」這三個面向來進行探討分析,透過視覺化的角度,在同一份資料集中嘗試找出不同的見解!
Avatar of the user.
Please login to comment.

Published: Mar 20th 2024
93
9
0

Tools

python
Python

迴歸分析
Regression
Power BI

Share