2015年1月1日 星期四

政府宣傳政績管道逐漸增加

紙本時代(~1960):印一堆宣傳單、手冊、年日曆等,告訴公民做了什麼事或是即將要做什麼事。

電視媒體時代(約1960~1990):一堆電視廣告,告訴公民做了什麼事或是即將要做什麼事。

網路宣傳時代(約1990~?):透過政府網站、臉書等社群渠道告訴公民做了什麼事或是即將要做什麼事。

開放政府(資料)時代(?~??):政府把自己相關活動的所有資料透過實體或虛擬方式讓公民自由取用與研究,由公民決定資料呈現的方式,了解政府的成果,並可以在政府執行新政策前即給予回饋。

?是否有可能成為2015?

2014年12月12日 星期五

前往資料科學之道 - 探索性資料分析

參與Coursera的課程:Exploratory Data Analysis些許心得:
  • 快速、簡單地用圖形顯示資料,用圖像方式看看有沒有什麼有趣的現象,如果發現有,再進一步處理。
  • 要和什麼比較?因為只有比較才能看出差異存在。
  • 別讓分析圖形的視角,侷限我們分析事物的視角。
  • 資料的屬性(數字、文字、還是日期)會影響R顯示圖形的預設方式
  •  R至少有3種圖形系統(就以本課涵蓋範圍來說)
    • Base
    • lattice
    • ggplot2
  • 在這個環節中,以最快能讓我們看出數據中趨勢的圖形系統為先

2014年12月11日 星期四

前往資料科學之道 - 取得與清理資料

參與Coursera的課程: Getting and Cleaning Data些許心得。
  • 一般來說,我們在處理資料的時會經過下列流程:原始的資料 -> 整齊的資料 -> 溝通的資料
    • 原始的資料 -> 整齊的資料:由於原始的資料種類繁多,上自MariaDB, JSON, XML等等,下達csv、txt等。必須要先整理格式,才能使用進行分析。
    • 整齊的資料 -> 溝通的資料:資料進行分析後,依據使用環境,成為文字、表格、圖像、互動程式等等,將成果散布出去。
  • 這應該會是花最多時間的環節。
  • dplyr package 在這環節的實用性非常高。在執行這堂課的練習專案時可以明顯地感受到其效果。

2014年12月10日 星期三

前往資料科學之道 - R語言設計

參與Coursera的課程:R Programming些許心得
  • stackoverflow是找答案,問問題的好地方。
  • 使用swirl學習是一個有趣的經驗,在R中直接學習部份課程, 並且回傳學習結果到Coursera網站。建議先使用這個功能,從中學習到的技巧可以應用於該課程的練習專案。
  • 這個課程其實可以和資料科學家的工具盒一起服用,因為後者只是安裝軟體。

2014年12月7日 星期日

大的數據(Big Data)與正確的數據(Right Data)

「總經理的鼻子有多長?」

小全推開門時突然這樣問我。

看了他一眼,我才剛從背後那令人昏昏欲睡的在職講座爬出來,但顯然小全非常興奮今天講座的內容── Big Data,整個人躍躍欲試想要找些問題,用大數據這個新玩意兒來解決看看。