2015年3月2日 星期一

前往資料科學之道 - Regression Models

參與Coursera的課程:Regression Models些許心得:

課程所涵蓋的概念:
  • simple linear regression
    • residual variation
  • multi variable regression
    • variance inflation
  • logistic regression 
必需預備的知識:
建議預備的知識:Exploratory Data Analysis

2015年2月2日 星期一

前往資料科學之道 - 統計推論

參與Coursera的課程:Statistical Inference些許心得:
  • 統計學基礎,像是:
    • Probability and Conditional Probability
    • Mean and Variance
    • Central Limit Theorem
    • Normal Distribution, Poisson Distribution
    • Confidence Intervals
    • Power
  • 使用Swirl對於沒接觸過統計的人是一大幫助。

前往資料科學之道 - 可重製之研究

參與Coursera的課程:Reproducible Research 些許心得:
  • 所有對資料進行的步驟都應該紀錄。
    • 是紀錄我們對資料的動作,而不是我們認為應該做的動作。
    • 一般圖形介面軟體很難達到這種要求,R等以文字描述執行動作的軟體則相對適合。
  • 如果文章內容不龐雜,將內容、資料處理步驟、結果放在同一個文件不失為一個好辦法。
    • R提供許多套件可以達成,knitr為其中之一。
    • 一個例子放在Rpubs.
  •  必須預備的知識(沒有的話無法完成作業):
  • 建議預備的知識(課堂中極少部份會要求此類知識)

2015年1月1日 星期四

政府宣傳政績管道逐漸增加

紙本時代(~1960):印一堆宣傳單、手冊、年日曆等,告訴公民做了什麼事或是即將要做什麼事。

電視媒體時代(約1960~1990):一堆電視廣告,告訴公民做了什麼事或是即將要做什麼事。

網路宣傳時代(約1990~?):透過政府網站、臉書等社群渠道告訴公民做了什麼事或是即將要做什麼事。

開放政府(資料)時代(?~??):政府把自己相關活動的所有資料透過實體或虛擬方式讓公民自由取用與研究,由公民決定資料呈現的方式,了解政府的成果,並可以在政府執行新政策前即給予回饋。

?是否有可能成為2015?

2014年12月12日 星期五

前往資料科學之道 - 探索性資料分析

參與Coursera的課程:Exploratory Data Analysis些許心得:
  • 快速、簡單地用圖形顯示資料,用圖像方式看看有沒有什麼有趣的現象,如果發現有,再進一步處理。
  • 要和什麼比較?因為只有比較才能看出差異存在。
  • 別讓分析圖形的視角,侷限我們分析事物的視角。
  • 資料的屬性(數字、文字、還是日期)會影響R顯示圖形的預設方式
  • R至少有3種圖形系統(就以本課涵蓋範圍來說)
    • Base
    • lattice
    • ggplot2
  • 在這個環節中,以最快能讓我們看出數據中趨勢的圖形系統為先