2015年8月22日

前往資料科學之道 - The Analytics Edge

參與edX的課程:The Analytics Edge 些許心得

Practical Machine Learning一樣,本課程以機器學習為主。

內容

課程包含:
  • Linear Regression
  • Logistic Regression
  • Tree and Random Forest
  • Clustering: Hierarchical Clustering, K-Means Clustering
  • Visualization (ggplot2, ggmap, igraph)
  • Text Analysis
  • Linear and Integer Optimization (Libre Office Calc or R)

2015年6月1日

前往資料科學之道 - 資料分析與R

參與Udacity的課程:Data Analysis with R 些許心得

課程以Exploratory Data Analysis (EDA) 為主,我們可以透過這種方式觀察變數之間的關係,提供後續分析時一個大概的方向。例如將原本的非線性關係轉為 (transform) 線性關係,這樣在下一步的建立預測模型時,只要使用線性模型即可。DEA 大部份觀察的方式以視覺為主。

2015年5月22日

2015年5月10日

前往資料科學之道 - Developing Data Products

參與Coursera的課程:Developing Data Products些許心得

資料分析的最後一個步驟就是將結果呈現。

呈現的方式很多,包括文字報告、圖像、簡報、互動式網頁、或是R package。由於不同的呈現方式需要不同的技術,例如互動式網頁,會用到java script和html5等語法,R提供了很多套件,讓只會用R的人也可以很快速地做出成果。但是如果本身就會相關的技術,則不需用到這些懶人包。

2015年3月30日

前往資料科學之道 - Practical Machine Learning

參與Coursera的課程:Practical Machine Learning些許心得:

課程內容

此課程和其他Data Science課程相比,絕大部份都是介紹幾個常見的模型建立法,和相對應的R程式碼為主,幾乎沒有提到數學運算的部份。

Machine Learning 領域廣大,不同的學者提出不同的技術,就有不同的R package。這些package預設使用的方式有時並不一致,所以產生了caret 這個套件。讓我們有一個統一的介面使用這些不同的演算法。本課程主要使用caret建立各種模型。