腦袋有問題之o1o1o

#胡思亂想#流量#旁門左道#快樂夥伴們#網站#APP#轉換率#失敗#唬爛#人生#數據

當資料科學家不需花80%時間在蒐集/清洗數據

分享一下R Taiwan研討會的簡報,團隊最右邊的我,是當時想說塞進去比較好看而硬塞的,我其實是來亂的。

Kyper相信好的數據只要更有效率地被交易,將會有更多驚人的數據應用改善我們的生活。換個角度想,數據應用在發展的數年之後,如果不能專業分工,成本跟ROI的衝突將扼殺許多可能的數據應用。2015RTAIWAN

投影片嵌入在最文章最後喔

其實打造一個數據應用,通常需要經過幾個模組。(1) Data collection, (2) Visualization/Demo, (3) Analysis, (4) Application。通常老闆或客戶想到的就是數據應用,好一點的有目的,慘的就是就是想跟潮流。但其實光從數據的蒐集跟整理,就要花上高達80%的時間,這種高昂的成本常扼殺許多數據應用。

另一個角度從團隊來看,一個夢幻的數據團隊包含程式開發人員,數據工程師,數據科學家,分析師,產業專家。但若是從一個大公司切出來的,通常只有一群功能相似的人。如果老闆認為數據部門是IT,那可能派很多工程師。如果老闆認為數據部門是分析,就找很多分析師。因此團隊功能的缺乏上也是目前數據應用的問題之一。

其實所有產業的開始都是從頭做到尾的,但隨著競爭強化,都會被迫每段專業分工。例如IC產業也會分出無晶圓廠設計、製造、封測、組裝等,來挑戰IDM公司。數據產業也一樣,當專業的數據收集清洗公司,把數據拿出來賣,讓成本降到最低,就會促成更多的應用。我們也相信這一天就在來到。

廢話不多說,請看簡報檔,有任何問題請向我提出喔!

未來也會分享一些數據應用的例子,想要一起討論這部分的主題的朋友請訂閱我的網誌,我會調整分享的比例喔。

輸入電子郵件地址以關注此網誌,並透過電子郵件接收新文章通知。

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 / 變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 / 變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 / 變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 / 變更 )

連結到 %s

Information

This entry was posted on 十二月 24, 2015 by and tagged , , .

Enter your email address to follow this blog and receive notifications of new posts by email.

Follow 腦袋有問題之o1o1o on WordPress.com