百度、阿里、美團、頭條…論劍AI,這裡有開發者想知道的未來
昨天是技術的盛宴,今天是技術+應用的狂歡。
11 月 9 日,中國專業 IT 社群 CSDN 與矽谷 AI 社群 AICamp 聯合出品的 2018 中國 AI 開發者大會(AI NEXTCon) 迎來了機器學習、知識圖譜和語音技術 3 大技術專題,以及智慧金融、智慧駕駛和智慧醫療 3 大行業峰會。
只講技術,拒絕空談,下面我們就來一起回顧下技術大牛們在今天做的精彩分享。
機器學習技術專題
第四正規化聯合創始人、首席架構師 胡時偉(出品人)
胡時偉的演講主題為《“零”門檻開發高維機器學習應用》,除了技術分享,他還表示,希望讓業務部門的負責人和所有決策者知道,AI 到底是什麼,不要一講 AI 就說知識圖譜是 AI,深度學習是 AI。在他看來,AI 要讓機器對資料進行學習,從而讓機器能夠對某一個具體的目標具有判斷能力,這樣的人工智慧才真正可以幫助企業。
位元組跳動人工智慧實驗室總監 李磊
李磊的分享主題是 Learning to Generate Better News, Translation, and Advertisement。位元組跳動一直在研究如何利用演算法做更好的內容創作,包括用演算法讓機器自動寫新聞,用演算法幫助作者寫好文章,用演算法自動生成標題或者摘要,以及讓演算法設計更好的廣告文案或者生成使用者的評論。在演講中,李磊介紹了位元組跳動研發的自動寫作機器人——小明機器人,並詳細介紹了背後的文字表示和生成方面的技術。
普元移動產品線總經理 郝振明
郝振明的演講主題是《機器學習在 RPA 中的實踐與探索》。在演講中,郝振明介紹了普元如何把機器學習與 RPA(Robotics Process Automation)結合,解決公司財務都會遇到的代理申報問題。
松鼠AI智適應教育首席科學家 崔煒
崔煒的分享主題是《松鼠 AI 智適應技術的實踐與落地》。崔煒表示,松鼠 AI 的目標是要打造智慧個性化學習平臺。基於目標特徵,他們為這個學習系統開發了四套模型:學生模型、內容模型、教學模型、預測模型,這四個模型相互結合,才能打造更加個性化的學習產品。
OneClick.ai CEO 沈淵
沈淵的演講主題是《自動化深度學習開創人工智慧的未來》。沈淵提到,現在業界學術界處理 AutoML 的問題一般用的都是神經網路搜尋,但是 OneClick.ai 的全自動化深度學習平臺不太一樣,他們會把傳統的機器學習和深度學習放在一起優化,特徵工程和模型可以同步優化,避免像以前一樣每個節奏都是相對獨立的,因此訓練速度很快。
微博機器學習研發部基礎演算法負責人、高階架構師 劉博
劉博的演講主題是《機器學習在微博資訊流推薦的應用實踐》。在演講中,劉博提到大規模推薦系統作為新浪微博資訊流推薦的核心,在排序環節中主要基於使用者特徵、內容特徵、環境特徵、上下文特徵等進行 CTR 使用者排序,構建模型時將博文列表作為樣本資料,通過預估每條微博 CTR 概率的大小來判斷。
阿里巴巴資深技術專家 楊旭
楊旭的分享主題是《Alink 流式演算法平臺架構與實現》。楊旭介紹,基於 Flink 框架構建流式演算法平臺,可直接從演算法級元件入手。Alink 的核心是豐富的資料分析演算法庫,包括機器學習、推薦等,尤其是推薦訓練,如今將批式訓練和流式預測放在同一平臺上,使用者可以輕鬆完成端到端的系統建立。
知乎首頁業務總監、首頁推薦技術負責人 張瑞
張瑞的演講主題是《知乎首頁資訊流系統的框架及機器學習技術在推薦策略中的應用》。在演講中,張瑞提出一個問題:內容推薦的精確度能否代表所有需求?為此,知乎引入各種框架進行業務導向調權、打散、隔離和禁閉。如果用行為表現預估排序推薦,最後會形成“資訊繭房”,針對不同使用者探測,應儘量使用內容間的關聯資訊增強探測效果。
小米閒聊演算法負責人 崔志
崔志的分享主題是《機器學習技術在 “小愛同學”閒聊演算法中的應用》。崔志表示,要想讓機器人更像人類的朋友,需要做到的非常重要的一點就是情感計算。使用分類模型對情感進行識別,再通過 MLP 得到 Happy、Sad、Anger 等回覆,其中自動情感生成需套用 Encoder 和 Decoder,這樣就可以生成一個有情緒的回覆。
百度核心搜尋部資深研發工程師 曹皓
曹皓的演講主題是《機器學習在搜尋領域的實踐》。在演講中,曹皓介紹了百度搜索未來要探索的三個方向:第一是智慧標註,通過機器學習的手段提升標註的效率和準確率;第二是內容檢索,從網頁圖文檢索轉化成視訊等內容檢索;第三是 GPU 和目前比較火的 IPLV 等技術。
智慧金融行業峰會
天雲大資料資料科學家 呂慧
呂慧做了題為《AutoFE 和 AutoML 從免程式設計建模到 AI 零知識啟動》的主題分享,她介紹瞭如何快速構建傳統領域的金融機器學習平臺,並表示 AI 生態需要“Android”,在不遠的未來,AI 應用將不再是少數大公司和精英科學家的專利,AI 將逐漸應用到各行各業,AI 行業需要自己的“Android”實現這一轉變!
億喆 ECB 創始人 & CEO 金龍
金龍分享的主題為《AI+Blockchain 助力普惠金融》,普惠金融市場空間大約在 20 萬億,個人信用記錄不完善,缺少相關金融經驗,單筆貸款資金需求量偏小、群體基數大,這些都是普惠金融客戶的主要特徵。普惠金融如何平衡“商業回報”與“社會價值”,實現“普”與“惠”的雙重目標都是最大的難點。而通過區塊鏈的資料完整性、系統可用性、資料安全性,構建可程式設計金融基礎設施,可助力普惠金融。
小花豬分期 CEO、網信前 CTO 周欣
小花豬分期 CEO、網信前 CTO 周欣發表《金融大資料平臺的實踐及創新應用》主題演講,周欣從智慧 BI 報表系統、智慧風控、不需要開發的後臺和業務及全鏈路實時資料監控四個實踐來介紹金融大資料的平臺搭建。最後對大資料實踐下的金融科技進行展望:AI 機器人可替代理財經紀人;物聯網金融大資料增強風控措施;深度學習助力智慧股票交易策略;基於大資料的生物識別增強風控;合作培養人才打造高效能實時計算引擎和叢集;基於 AI 大資料的股權投資模型。
宜信大資料創新中心首席量化科學家 楊博理
宜信大資料創新中心首席量化科學家楊博理分享了《AI 在財富管理上的應用趨勢與實踐》的演講。他表示,用機器學習演算法預測資產的未來價格和收益的有效方法是存在的,但在基金層面的實踐經驗上,投入產出比不高。對於財富管理,尤其是大類資產配置業務而言,存在與收益同等重要的其他特徵,也需要加以預測,這些特徵也許更值得嘗試用機器學習的方法進行預測。AI 在財富管理流程中的預測和理解層面上都可以發揮作用,目前金融邏輯仍然在整個流程中占主導地位,實踐中需要對哪些方面適合使用 AI 技術有清楚認識。
智慧駕駛行業峰會
馭勢科技視覺感知技術負責人 潘爭
盤整的演講主題為《智慧駕駛視覺感知的挑戰與應對》自動駕駛在視覺感知領域的挑戰主要包括三點:高精準、多功能性以及實時性。也就是說,這需要對每個可行駛區域進行高精準且多功能性感知,如果感知演算法足夠快,才能保證識別實時性,這需要通過資料、模型、演算法、安全等方面解決。
Neurala 高階研究員 Jeff Rondy
Jeff Rondy 的分享主題為 Data Collection and Annotation Using Neurala Brain Builder。Brain Builder 是 Neurala 開發的一站式 AI 平臺。藉助 Brain Builder,企業和開發人員能夠輕鬆完成從標記訓練資料集到使用資料開發人工智慧應用的各項工作。
地平線智慧駕駛研發總監 餘軼南
餘軼南的演講主題是《基於自由計算平臺的自動駕駛研發實踐》。餘軼南表示,地平線比較關注前端邊緣計算的 AI 平臺,這種平臺對晶片的要求集中在高效能、低功耗、低成本、行動式等方面。針對目前火熱的自動駕駛領域,晶片的算力與演算法的使用更多是為了讓車輛在行使過程中更安全、高效。
DeepMap 工程技術總監 鄒亮
鄒亮的分享主題是《深度學習在無人駕駛高精地圖生產中的挑戰與應用》。在演講中,鄒亮介紹了目前 3D 點雲檢測存在的兩方面的挑戰:首先是高質量的訓練集比較難獲取,往往需要內部訓練集,而且時間久價格高;另一方面精準率不如 2D 影象深度學習的結果準確。
智慧醫療行業峰會
大數醫達創始人 & CEO、復星集團人工智慧首席科學家 鄧侃
大數醫達創始人 CEO、復星集團人工智慧首席科學家鄧侃分享的主題是《小樣本學習在醫療領域的技術實踐》。 人工智慧所面臨的一大問題就是資料,深度學習極高的資料標註需求更是每遭詬病,小樣本問題愈加突出。他們將小樣本學習引入醫療領域,開創臨床決策深度學習,其中包含醫療私有云、病歷結構化、醫學知識圖譜以及臨床決策導航四項技術基礎。
中科院計算所副研究員 趙地
趙地的演講主題為《深度學習與醫學影像分析》。電子病歷是醫院資料中最基礎的部分,而論及資料量,又以醫學影像規模最大,於是他們將深度學習引入醫療領域,其應用涵蓋疾病預測、基因分析、行為分析,及影像分析等,未來還將向深度學習與醫學影像分析的醫療裝置和機器人的研究方向繼續探索。
Airdoc 創始人 & CEO 張大磊
張大磊的分享主題為《人工智慧與臨床決策》。張大磊表示,從現階段的實際情況來看,談“人工智慧取代醫生論”還為時尚早,目前還停留在協助醫生決策的初級發展階段,完全替代還有很長的路要走。長期以來,中國在醫療領域的漏診和誤診普遍存在,而演算法的引入能夠在一定程度上緩解這一問題。
丁香園副總裁 張偉
丁香園副總裁張偉本次分享的主題是《面板病人工智慧發展實踐分享》。他表示,對於醫療,應該常懷敬畏,深刻理解每一種疾病的臨床與診療特性,明確人工智慧的引入方向。面板病便因其病種繁多、診斷困難及患者疾病認知程度侷限等問題,急需人工智慧助手的協助,以達到輔助醫生、輔助患者以及輔助基層的目的。
知識圖譜技術專題
東南大學教授、博士生導師 漆桂林(出品人)
漆桂林的分享主題是《知識圖譜的表示與推理》。在演講中,他介紹了知識圖譜的表示方法,以及兩類基本的推理方法:記憶邏輯和記憶途徑。漆桂林表示,知識圖譜要有一定的邏輯基礎,並且有一個網路結構,以及知識變形,否則無法做到高效和實用化。
百度知識圖譜演算法團隊負責人 張揚
張揚的演講主題是《大規模通用知識圖譜構建及應用》,他首先介紹了知識圖譜在百度的應用,並從構建和應用的角度介紹了百度近期在知識圖譜領域的一些工作。此外,張揚還詳細介紹了構建知識圖譜的四大技術:事實獲取、Ontology構建、實體歸一、主動收錄。
阿里業務平臺商品知識圖譜負責人 張偉
張偉的演講主題是《電商領域知識圖譜的構建與應用》。圍繞知識生命週期,張偉結合阿里自身業務提出了四大挑戰:如何快速搭建各個領域的知識圖譜;如何把各個領域的知識圖譜快速聯通;如何管理海量的知識(事實類知識和形式化知識);如何更新這龐大的知識圖譜;如何面向搜尋推薦、智慧互動、商業能力智慧化等多種應用做統一的知識表示。此外,張偉也介紹了阿里的知識引擎架構與藏經閣計劃。
雲知聲資深技術專家、AI Labs 技術總監 劉昇平
劉昇平的分享主題是《醫學知識圖譜的敏捷構建與實踐》。劉昇平指出,在構建知識圖譜時,一定要看行業歷史上的知識表現方法,通過借鑑這些方法來降低成本。另外一定要應用驅動,而且一定要選好知識圖譜的評測方法。
美團點評 NLP 中心知識圖譜演算法負責人 張富崢
張富崢的演講主題是《餐飲娛樂領域知識圖譜的構建與應用》。張富崢介紹了美團大腦在美團搜尋推薦場景的應用,他們把搜尋推薦的場景拆分成不同層次:索引層、資料層、召回層、排序、策略融合、使用者感知優化層,而且在各個不同層次都會進行輔助,把它整合成一個知識,作為資料儲存進來。在召回層通過實體連結技術,找到使用者的興趣點和意圖,對 query 進行查詢糾錯、語義理解,讓機器瞭解使用者的真實需求。
語音技術專題
聲智科技創始人 & CEO 陳孝良
陳孝良的演講主題是《遠場語音互動技術與實踐》。他認為,新的感測是新的機會,新的互動是新的革命,新的互聯是新的時代。遠場語音互動就是從“學習機器”到“機器學習”的技術革命。
清華大學語音和語言技術中心主任、得意音通董事長 鄭方
鄭方的分享主題是《聲紋識別技術及其應用現狀》。鄭方表示,語音技術發展到現在有很多突破,但卻沒有在真正在應用上得到使用,原因在於很多場景沒有選好。聲紋確認核心需要解決的是身份認證的問題,這在技術上有五項要求分別是:人證合一、不易偽造、意圖真實、證據可溯、認證便宜。
雲知聲董事長、CTO 樑家恩
樑家恩的分享主題是《AIoT 智慧互動技術與應用》。他表示,智慧 AI 行業應用的高效定製、調優和資料閉環,需要合理的 AI 架構支撐,提高擴充套件性和演進效率。超算平臺和 AI 晶片,是智慧互動迭代演進和產品落地的關鍵支撐。
標貝科技聯合創始人、CTO 李秀林
李秀林的演講主題是《語音超市實踐--助力智慧產品人性化》。在演講中,李秀林指出了語音合成技術的實踐現狀:一是端到端很美,控制很難;二是語音資料少,文字很多;三是 GPU 很貴,CPU 為主。語音合成仍是一個方興未艾的狀態。
出門問問 CTO 雷欣
雷欣的分享主題是《語音互動的軟硬結合》。雷欣表示,想要做好軟硬結合的智慧語音互動產品,絕對不是隻專注於某一項技術,而是講求端到端,即時間延遲的速度是否夠快,結果又是否足夠令人滿意。
高能預告
雖然 2018 年開發者大會已經落下帷幕,但是我們還是為意猶未盡的觀眾準備了一份大禮:《2018 中國人工智慧產業路線圖 V2.0》正式版。
在昨天的大會上,CSDN 創始人&董事長、極客幫創投創始合夥人蔣濤已經預先披露了這本報告的精彩內容,很多觀眾都對這份報告有著濃厚的興趣。
實際上,相比去年的 V1.0 版釋出以來,此次 V2.0 版路線圖將進行新一輪大升級,內容包括 3 大 AI 前沿產業趨勢分析,10 多位 AI 特邀專家的深度技術分析,10 多家一線網際網路企業的 AI 實力大巡展,以及多個 AI 優秀應用案例,力求為讀者呈現更全面的中國人工智慧產業發展概況和趨勢判斷。
目前,這份報告已經送予 AI 開發者大會的與會專家,在根據專家的點評校訂之後,我們將會推出正式版。大家可以關注我們公眾號,我們會在一週左右時間內釋出完整報告。
精彩現場
最後,在此感謝支援本次大會的所有專家與觀眾,以及我們的合作伙伴和工作人員。
#號外# 2018 中國大資料技術大會將於 12 月 6 -8 日在京舉行,第一批“早鳥票”報名通道已開啟(點選閱讀原文),期待與您一起,共論大資料創新應用!更多資訊請關注官網:http://bdtc2018.hadooper.cn/