2014年12月12日 星期五

前往資料科學之道 - 第四課:探索性資料分析

註:這是草稿,為參與線上課程之筆記,其資訊會持續變動。

第四課:Exploratory Data Analysis
  • 快速、簡單地用圖形顯示資料,用圖像方式看看有沒有什麼有趣的現象,如果發現有,再進一步處理。
  • 要和什麼比較?因為只有比較才能看出差異存在。
  • 別讓分析圖形的視角,侷限我們分析事物的角度。

2014年12月11日 星期四

前往資料科學之道 - 第三課:取得與清理資料

註:這是草稿,為參與線上課程之筆記,其資訊會持續變動。

第三課: Getting and Cleaning Data

一般來說,我們在處理資料的時會經過下列流程:
原始的資料 -> 整齊的資料 -> 溝通的資料

原始的資料 -> 整齊的資料:由於原始的資料種類繁多,上自MariaDB, JSON, XML等等,下達csv、txt等。必須要先整理格式,才能使用進行分析。


整齊的資料 -> 溝通的資料:資料進行分析後,依據使用環境,成為文字、表格、圖像、互動程式等等,將成果散布出去。

2014年12月10日 星期三

前往資料科學之道 - 第二課:R語言設計

註:這是草稿,為參與線上課程之筆記,其資訊會持續變動。

  第二課:R Programming

2014年12月7日 星期日

大的數據(Big Data)與正確的數據(Right Data)

「總經理的鼻子有多長?」

小全推開門時突然這樣問我。

看了他一眼,我才剛從背後那令人昏昏欲睡的在職講座爬出來,但顯然小全非常興奮今天講座的內容── Big Data,整個人躍躍欲試想要找些問題,用大數據這個新玩意兒來解決看看。

2014年11月13日 星期四

前往資料科學之道 - 第1.5課

註:這是草稿,為參與線上課程之筆記,其資訊會持續變動。(2014-11-30 update)

接續第一堂課

在還沒有進入第二堂課之前,想先了解R的人可以參考R Studio提供的連結

如果還沒有裝R,想直接線上了解R語言:
已經裝了R(和R Studio),可以試試: