“泡沫”之後，強化學習已應用到這些領域

阿新 • • 發佈：2019-01-20

監督學習 (Supervised Learning)、無監督學習 (Unsupervised learning) 和強化學習 (Reinforcement Learning) 是機器學習的三類演算法。隨著 Alpha Go 的成功，強化學習已成為當下機器學習中最熱門的研究領域之一，逐漸在遊戲、機器人控制、計算機視覺、自然語言處理和推薦系統等領域得到應用。

640

與常見的監督學習和非監督學習不同，強化學習主要強調智慧體（Agent）與環境（Environment）的互動，其目標就是從智慧體與環境的互動過程中獲取資訊，學出狀態與動作之間的對映，指導智慧體根據狀態做出最佳決策，最大化獲得的獎勵。

640

強化學習的發展不僅停留在理論層面，各大遊戲、機器人、無人駕駛、金融、電商等企業在高薪招募強化學習演算法工程師/研究員，爭取在技術研究及產品研發上能夠搶佔先機。阿里巴巴推出的《強化學習在阿里的技術演進與業務創新》電子書籍中，全面介紹了強化學習在集團諸多業務中的成功應用。

640

雖然強化學習已經引起國內外足夠的關注，但中文資料少之又少，國內鮮有高校開設系統性的課程，並且缺乏相互交流的圈子。深藍學院聯合中科院自動化所、清華大學的研究人員，打磨推出『強化學習：理論與實踐』升級版I線上課程。課程通過理論與程式碼實踐，讓大家掌握演算法的核心思想，並安排Project大作業，體驗強化學習的實際應用；同時，建立課程答疑群，便於相互交流學習。

【講師介紹】

640

陳達貴，深藍學院講師，清華大學自動化系碩士，主要研究方向是深度強化學習的理論和計算圖形學，開拓了其課題組強化學習的研究方向，帶隊在FPS遊戲Visual Doom人工智慧競賽取得前三名。曾在阿里巴巴從事將強化學習具體落地的探索和實踐專案，具有豐富的深度強化學習實踐經驗。其主講的『強化學習理論與實踐』第一期課程，受到大家的普遍歡迎。

【課程目錄】

640

【報名諮詢】

1，2018年12月7日-2019年2月15日，每週五晚上7點-9點進行授課；

2，課程限報200人，報滿即止；

3，前100位，可領取100元優惠券，報名時直接抵現；

4，微信新增課程助教—書哲（shenlanflying），領券報名。

現在新增助教微信，備註“RL”，立刻免費領取RL電子資料。

640

“泡沫”之後，強化學習已應用到這些領域

“泡沫”之後，強化學習已應用到這些領域

ICLR 2019論文投稿近1600篇，強化學習最熱門

什麼是監督學習非監督學習，強化學習

比特幣泡沫之後，加密貨幣投資者學到的教訓

在網易和百度實習之後，我才明白了這些事

微軟鄧力：深度強化學習在聊天機器人領域的應用

博應用這些高質的幼兒教育APP，讓寶寶玩著能在學習

Hinton Neural Networks課程筆記1e: 監督學習、強化學習、無監督學習，及其應用

用別人的錢和時間進行學習（可以學到很多東西，創業成功多了把握，而且緩解財務壓力），善於利用已有資源，別著急，只要不斷工作、不斷學習然後保持耐心即可

場景化效應，裂變式發展，3D打印應用時代已來！

這麼多機器學習的應用場景，金融領域到底有何不同？

Android應用被kill掉之後，接受其他應用的廣播

畢業之後，這些年薪50萬+的90後程序員經歷了什麼？

強化學習及其在NLP上的應用

「模仿學習」很強大，但和「強化學習」有什麼關係

會java之後，應該如何學習大資料？

學習了Python大資料之後，將來主要做什麼

五個案例，三大心得，深度學習的實踐應用之路

一種強化學習在NLP文字分類上的應用模型

Java學習路線建議，Java熱門的應用領域

“泡沫”之後，強化學習已應用到這些領域

相關推薦