2015年10月16日

前往資料科學之道 - Introduction to Big Data

參與Coursera的課程:Introduction to Big Data 些許心得

內容 

  • Big data = Old + New Tech
  • Hadoop的由來、特色、組成
  • Apache Hadoop Ecosystem
  • MapReduce概念
  • 安裝虛擬機

軟體

虛擬環境使用cloudera已建立好的64位元虛擬機(以CentOS 6.4為基礎),所以建議主作業系統也是64位元。如果熟悉虛擬機(VMware、Virtualbox或KVM)基本操作的話就不會有什麼大問題。

硬體

因為要使用虛擬機模擬分散處理環境,對於硬體要求比較高,虛擬機需要的記憶體至少要4GB,建議6GB才有可能比較順,加上2GB留給實體作業系統,所以建議電腦最好有8GB以上記憶體。

沒有留言:

張貼留言

為避免垃圾訊息,留言需檢視後會才會顯示,請見諒。