大資料日報 2015-02-14
市民眼中的綠地為何沒那麼多?用大資料講述城市意象@市政廳官微
HIVE的CTAS用法探究@IT技術部落格大學習
Docker為何會火?@灣區日報BayArea
@好東西傳送門出品,過往目錄見http://bd.memect.com
訂閱:給[email protected]發封空信, 標題: 訂閱大資料日報 或點選點我訂閱
本期話題有:(點選橢圓標籤可只看這一主題)
全部23分析9虛擬化6應用3資料庫
今日焦點 (5)
計算框架Spark
【Spark SQL 資料來源 API:Spark平臺的統一資料接入】自從Spark 1.0版本的Spark SQL問世以來,它最常見的用途之一就是作為從Spark平臺上面獲取資料的一個渠道。到了Spark 1.2 版本,我們已經邁出了下一步,讓Spark的原生資源和更多的輸入源進行整合整合。http://t.cn/Rwq4If2
應用規劃
我們可以從大資料中找到市民心中的城市意象。從城市建設用地指標上看,上海並不比東京的綠地率少多少,但在居民感受中,東京實在是比上海綠得太多太多了。【@澎湃新聞
虛擬化Docker程式碼容器
Fig:Fast, isolated development environments using Docker.http://t.cn/Rhcsp1y@luofei614這個工具看起來不錯…
IT技術部落格大學習原微博2015-02-14 09:14
資料庫
【HIVE的CTAS用法探究】 最近在使用ADM系統的時候遇到一個問題,ADM在自動將HIVE QL包裝成CTAS之後,由於HIVE內部預設使用’\\N’來儲存NULL,這樣就會產生一個問題,因為我們處理的很多結果資料是需要匯出附... 詳見:
灣區日報BayArea原微博2015-02-14 07:51
虛擬化Docker容器
Docker為何會火?http://t.cn/Rw5u72q寫得很好的文章。裡面的一個觀點很有意思:“The Docker product came from a non-threatening source, a small startup (DotCloud) that was able to broadly partner across the whole industry. ” #灣區日報#
最新動態
2015-02-14 (7)
應用新聞
#每週資料新聞精選# 本期亮點:Vox網站的資料新聞理念、《紐約時報》的新嘗試“The Upshot”,《愛爾蘭時報》資料團隊,還有《柏林晨報》最新互動設計。@資料新聞@財新資料視覺化實驗室http://t.cn/Rwci7yG
分析
[文章]《Career Spotlight: What I Do as a Data Scientist》http://t.cn/Rwt680s"Spend as much time learning analytics communication as learning models"。職業生涯亮點:聚焦資料科學家。
分析機器學習
機器學習日報 2015-02-13http://t.cn/RwtJ0l61) 世紀佳緣使用者推薦系統的發展歷史 2) 通過資料分析解讀GDP系列文章 3) OpenCV進階之路:神經網路識別車牌字元 4) New Directions in Recommender Systems 5) Andrej Karpathy的反擊 可點選加長版16條http://t.cn/RwtJjwp
v2ex版http://t.cn/RwtoTZr
分析虛擬化Docker視覺化容器
大資料日報 2015-02-13http://t.cn/RwtVqGE1) 去矽谷當個大資料工程師,你要這麼做 2) 視覺化儲存智慧解決方案 3) CrowdFlower的2015年資料科學領域報告 4) 大資料中的百年社會學 5) awesome docker 可點選加長版32條http://t.cn/RwtVfTu
分析書籍
每日新書:《R資料分析——方法與案例詳解(雙色)》本書是一本R 語言和資料分析的入門教材,每個知識點儘量從實際的應用案例出發,以問題為導向,在解決問題中學習統計方法、R 語言的基本使用以及程式設計技巧。內容涵蓋R 資料結構、抽樣模擬、統計分析、假設檢驗、迴歸分析、統計繪圖和R 包製作等內容。
Linuxeden開源社群原微博2015-02-14 08:24
【Node.js基金會成立,Joyent交出領導權】 Node.js 是一個基於Chrome JavaScript執行時建立、流行、開源、跨平臺的執行時環境。近日,雲端計算服務商Joyent終於 宣佈 成立Node.js的開源基金…http://t.cn/Rw5dr58
HackerNewsDaily原微博2015-02-14 05:30
虛擬化Docker容器
《App Container and Docker》原文:http://t.cn/Rw5Qx1uHN評論:http://t.cn/Rw5QQGS
溫故知新 (11)
更早的微博,有新精彩評論或被再次推薦
2015-02-13 (6)
分析丁士正
【怎麼評價產品經理拿資料說話這回事?如何做資料分析?】丁士正 : 這幾個月在一家為客戶在Facebook上做廣告的加拿大公司工作。簡單說說他們對於資料的態度吧。這是一家小型Startup公司,總共不到20個人。其中4個人(包括我)是技術,剩下…http://t.cn/anzXrS(分享自@知乎)
【TT大資料】一年一度的情(shi)人(shen)節就要來了,你的TT買好了嗎?想知道什麼品牌更受歡迎嗎?超薄體貼、凸點螺紋和果味刺激哪個更受大家歡迎呢?下面由星圖資料的小編帶你探索TT中稀(mei)奇(you)古(xia)怪(xian)的大資料!
如果線上線下三七開的話,節前大概能賣出1億多的安全套。我在想,今天晚上全國一共能消耗多少個TT呢?
分析
[文章]通過資料分析解讀GDP系列文章,該系列包含三篇文章,第一篇GDP助推因素分析http://t.cn/Rwq1xnh和第二篇各國經濟資料的蒙特卡洛k-means聚類分析http://t.cn/Rwq1OfA已經放出,第三篇關於未來GDP增長趨勢預測的文章還沒放,基於資料分析的現代經濟學典範,推薦閱讀 雲:http://t.cn/RwqBOdx
【空氣質量分散式監測成功案例,雲創儲存已在全國部署了大量的空氣感測器,今年之內將超過全國的總和】在江蘇,為江蘇省環保廳1831平臺建設提供了技術支撐,實現了大資料技術與環保的高度結合。http://t.cn/Rwba1Yy@專注雲端計算@何春銀微想
分析會議活動活動教育網站課程
上海科技大學資訊學院將於六月舉辦第一屆ShanghaiTech Symposium on Data Science:http://t.cn/Rwql0MN屆時國際國內關於資料處理的理論、計算、學習、與應用的頂尖學者(主要是中青年)將作20多場學術報告與多個關於Sparse、DNN、和Cloud等的短訓課程。這將是一場真正的關於資料科學的豪門盛宴!
虛擬化Docker容器
【Java開發人員:如何穿過Docker現象這片“叢林”】今天我們來談談Java開發人員如何能夠穿過Docker現象這片叢林,更容易瞭解使用這種熱門新技術來簡化開發流程的種種好處。我們在本文中將探討你可以用Docker來完成什麼以及如何認識Docker這項新興技術。http://t.cn/Rwqf3KY@專注雲端計算
2015-02-11 (3)
科學通報的一期大資料研究與應用http://t.cn/RwU4d5N我們撰文《面向大社交資料的深度分析與挖掘》http://t.cn/RwU4d5p
裴智勇
【中國首個網路騙子地圖上線】中國首個用大資料追蹤網路詐騙的“中國網路騙子地圖”9日正式上線,網民可以通過該地圖實時發現所在地區的釣魚網站等網路詐騙方式,從而提高警惕,避免上當受騙。http://t.cn/RwyvJxz
自動化網官方微博原微博轉發於2015-02-14 10:59
<裴智勇:360將陸續對公眾開放系列安全大資料視覺化產品>360安全大資料平臺負責人裴智勇表示,2015年,繼“中國網路騙子地圖”上線後,還將陸續對公眾開放系列安全大資料視覺化產品,讓公眾提高網路安全意識,同努力,以真正實現“網上無賊”,提升中國網民網際網路上的安全感。#每週熱博#
ArnetMiner原微博2015-02-11 00:28
分析應用
[Call for Paper & Scholar data challenge] IEEE成立了大資料Transaction(IEEE Transaction on Big Data), 這期專刊是大科學資料探勘競賽,http://t.cn/RwyRDaI歡迎投稿!專刊使用AMiner資料,專家發現、Profile抽取、學術預測、推薦。盡情發揮您的想象。@劉知遠THU@西瓜大丸子湯@李航博士
2015-02-08 (1)
虛擬化Docker容器
唱衰Docker:http://t.cn/Rwwb1CJ
reddit上的討論:http://t.cn/RwtLWnn
2014-06-16 (1)
分析
推薦這篇文章,分析了推薦系統中使用演算法的誤區,確實規則帶來的好處簡單有效。 當一個做推薦系統的部門開始重視【資料清理,資料標柱,效果評測,資料統計,資料分析】這些所謂的髒活累活,這樣的推薦系統才會有救。http://t.cn/RvxC543
轉載於:https://my.oschina.net/airship/blog/378750