2015年5月22日

2015年5月10日

前往資料科學之道 - Developing Data Products

參與Coursera的課程:Developing Data Products些許心得

資料分析的最後一個步驟就是將結果呈現。

呈現的方式很多,包括文字報告、圖像、簡報、互動式網頁、或是R package。由於不同的呈現方式需要不同的技術,例如互動式網頁,會用到java script和html5等語法,R提供了很多套件,讓只會用R的人也可以很快速地做出成果。但是如果本身就會相關的技術,則不需用到這些懶人包。

2015年3月30日

前往資料科學之道 - Practical Machine Learning

參與Coursera的課程:Practical Machine Learning些許心得:

課程內容

此課程和其他Data Science課程相比,絕大部份都是介紹幾個常見的模型建立法,和相對應的R程式碼為主,幾乎沒有提到數學運算的部份。

Machine Learning 領域廣大,不同的學者提出不同的技術,就有不同的R package。這些package預設使用的方式有時並不一致,所以產生了caret 這個套件。讓我們有一個統一的介面使用這些不同的演算法。本課程主要使用caret建立各種模型。

2015年3月2日

前往資料科學之道 - Regression Models

參與Coursera的課程:Regression Models些許心得:

課程所涵蓋的概念:
  • simple linear regression
    • residual variation
  • multi variable regression
    • variance inflation
  • logistic regression 
必需預備的知識:
建議預備的知識:Exploratory Data Analysis

2015年2月2日

前往資料科學之道 - 統計推論

參與Coursera的課程:Statistical Inference些許心得:
  • 統計學基礎,像是:
    • Probability and Conditional Probability
    • Mean and Variance
    • Central Limit Theorem
    • Normal Distribution, Poisson Distribution
    • Confidence Intervals
    • Power
  • 使用Swirl對於沒接觸過統計的人是一大幫助。