2015年3月30日 星期一

前往資料科學之道 - Practical Machine Learning

參與Coursera的課程:Practical Machine Learning些許心得:

課程內容

此課程和其他Data Science課程相比,絕大部份都是介紹幾個常見的模型建立法,和相對應的R程式碼為主,幾乎沒有提到數學運算的部份。

Machine Learning 領域廣大,不同的學者提出不同的技術,就有不同的R package。這些package預設使用的方式有時並不一致,所以產生了caret 這個套件。讓我們有一個統一的介面使用這些不同的演算法。本課程主要使用caret建立各種模型。

2015年3月2日 星期一

前往資料科學之道 - Regression Models

參與Coursera的課程:Regression Models些許心得:

課程所涵蓋的概念:
  • simple linear regression
    • residual variation
  • multi variable regression
    • variance inflation
  • logistic regression 
必需預備的知識:
建議預備的知識:Exploratory Data Analysis

2015年2月2日 星期一

前往資料科學之道 - 統計推論

參與Coursera的課程:Statistical Inference些許心得:
  • 統計學基礎,像是:
    • Probability and Conditional Probability
    • Mean and Variance
    • Central Limit Theorem
    • Normal Distribution, Poisson Distribution
    • Confidence Intervals
    • Power
  • 使用Swirl對於沒接觸過統計的人是一大幫助。

前往資料科學之道 - 可重製之研究

參與Coursera的課程:Reproducible Research 些許心得:
  • 所有對資料進行的步驟都應該紀錄。
    • 是紀錄我們對資料的動作,而不是我們認為應該做的動作。
    • 一般圖形介面軟體很難達到這種要求,R等以文字描述執行動作的軟體則相對適合。
  • 如果文章內容不龐雜,將內容、資料處理步驟、結果放在同一個文件不失為一個好辦法。
    • R提供許多套件可以達成,knitr為其中之一。
    • 一個例子放在Rpubs.
  •  必須預備的知識(沒有的話無法完成作業):
  • 建議預備的知識(課堂中極少部份會要求此類知識)

2015年1月1日 星期四

政府宣傳政績管道逐漸增加

紙本時代(~1960):印一堆宣傳單、手冊、年日曆等,告訴公民做了什麼事或是即將要做什麼事。

電視媒體時代(約1960~1990):一堆電視廣告,告訴公民做了什麼事或是即將要做什麼事。

網路宣傳時代(約1990~?):透過政府網站、臉書等社群渠道告訴公民做了什麼事或是即將要做什麼事。

開放政府(資料)時代(?~??):政府把自己相關活動的所有資料透過實體或虛擬方式讓公民自由取用與研究,由公民決定資料呈現的方式,了解政府的成果,並可以在政府執行新政策前即給予回饋。

?是否有可能成為2015?