探索新零售時代背後的技術變革
隨著線下場景佈局的不斷髮展,以及線上技術的持續推進,一個真正屬於新零售的時代已經來臨。
走完了廣州、成都、北京、深圳等四大城市後,個推技術沙龍TechDay於上海完美收官。來自京東到家、個推、億咖通、Pinlan的技術大咖們,在上海站的現場,為大家解析並展示了新零售時代下的新技術。
《大資料時代,使用者畫像實踐與應用》
葉政君 個推大資料分析師
使用者畫像,即使用者資訊的標籤化,本質上來說,使用者畫像是資料的標籤化。常見的使用者畫像體系有三種:結構化體系、非結構化體系和半結構化體系。非結構化體系沒有明顯的層級,較為獨立。半結構化層次有一定的層級概念,但是沒有過於嚴格的依賴關係。在電商行業中,較多的企業會選擇半結構化的使用者畫像體系進行應用。以一個簡單的三級結構化標籤為例,一級標籤有基本屬性和興趣偏好,並且由此可以延伸至二級標籤和三級標籤,具體到哪些屬性、興趣。
在畫像建設方面,開發者們可以參考一些通用的做法,如標籤體系設計、基礎資料收集和多資料來源資料融合、實現使用者統一標識、構建使用者畫像特徵層、畫像標籤規則+演算法建模、對所有使用者進行演算法打標籤和畫像質量監控等。
個推使用者畫像構建的整體流程,可以分為三個部分,第一,基礎資料處理。基礎資料包括裝置資訊、線上APP偏好資料和線下場景資料。第二,畫像中間資料處理。處理結果包括線上APP偏好特徵和線下場景特徵等。第三,畫像資訊表。表中應有四種資訊:裝置基礎屬性、使用者基礎畫像、使用者興趣畫像和使用者其它畫像。同時,使用者畫像的構建需要技術和業務人員的共同參與,避免形式化的使用者畫像。
在進行使用者畫像構建的過程中,個推主要運用到的技術有資料儲存、實時計算、機器學習和深度學習。
而使用者畫像的應用則包括:精準營銷、使用者分析、資料探勘、服務產品、行業報告以及使用者研究。
針對新零售時代下,APP的運營者對於使用者畫像的需求,個推依託多年推送服務的積累和強大的大資料能力,推出了使用者畫像產品“個像”,為APP開發者提供豐富的使用者畫像資料以及實時的場景識別能力。
同時,個推獨有的冷、熱、溫資料標籤,也可以有效分析使用者的線上線下行為,挖掘使用者特徵,助力APP運營者篩選目標人群。同時,個推還可以為APP提供定製化標籤,滿足APP運營者在使用者數字化管理方面的需求。
在實踐中,定製化標籤的整合也有一定的難度,個推會結合雙方的資料,對其進行建模分析,輸出定製化標籤。總的來說,個推不僅有通用的標籤維度,也有定製化標籤的輸出能力。
舉兩個使用者畫像在個推業務中的典型應用:第一,精準推薦,APP的運營者可以通過個像提供的性別、年齡層次、興趣愛好等標籤,分別展示不同的內容給使用者,以達到精準化運營,千人千面。
第二,使用者聚類,處理客戶提供的使用者資料,補全使用者畫像,最終進行使用者聚類分析。
《即時物流場景下的機器學習實踐》
莊學坤 達達-京東到家 物流演算法團隊Leader
即時物流作為新零售的“水電煤”,在新零售模式中處於基礎核心環節,解決的是商品的配送效率問題。達達-京東到家作為國內即時物流的領先平臺,在這方面進行了大量的技術探索與積累。與傳統物流模式相比,即時物流場景下的配送具有更高的複雜度,具體表現為以下四點:1. 訂單型別多樣化;2. 時效性要求更高;3. 配送騎士的運力難以掌控;4.送達目的地複雜多樣。而即時物流形式中存在的問題和挑戰,也可以總結為四個部分:高度動態的物流訂單、配送成本的動態性、訂單派發需要兼顧公平與效率、騎士自由搶單的管理。
現如今,新的演算法模型層出不窮,演算法可以選擇的自由度較高。但是在實踐中,資料決定了機器學習的上限,而演算法只是儘可能逼近這個上限。一個成功而實用的演算法體系,必須非常重視特徵工程。開發者研發一套優秀演算法體系的前提,是獲取到優質的、具有精確特徵的資料。達達結合自身的配送場景,積累了海量而精確的配送場景特徵集合。
沒有最好的演算法,只有某種場景下最合適的演算法。在獲取到特徵資料之後,即時物流場景所應用的機器學習體系可以分為四層:基礎資料層、特徵工程層、演算法模型層、業務應用層。開發團隊還需要根據業務的應用場景,對不同的演算法模型進行技術選型,比如線性模型擅長處理高維微觀特徵,非線性模型則擅長處理較低維的巨集觀特徵,而在路徑規劃與排程當中,傳統的運籌學模型動態規劃等可能更加合適。
最後,更加通用的AI可以由兩部分組成,第一部分是深度學習(DeepLearning),解決端對端的學習問題;第二部分稱之為強化學習(Reinforcement Learning),允許更加通用的學習架構。如果這兩個部分結合到一起,就可以變為一個非常通用的學習演算法。達達智慧供需調控系統的設計中,借鑑了AlphaGo的思路,充分發揮了這種模式的優勢,使得調控效率的效果和自動化程度同時獲得了大幅提升。
《使用智慧對話機器人增強新零售服務鏈》
孔曉泉 吉利集團Ecarx演算法專家
與以往的零售方式不同的地方在於,新零售的過程中,沒有商超反饋和中間鏈條,企業需要直達顧客。這會使得一個to C企業,在客服和相關支援等方面,花費更多的成本,並且承擔很大的壓力。而使用智慧對話機器人提供新零售的服務鏈,則可以減少使用者的等待時間,提高使用者體驗,並且極大地減低公司的客服成本。智慧對話機器人應用最多的領域是線上客服,其次是智慧問答,如智慧醫療等。
從技術角度來說,人機對話的流程是:語音識別(ASR)、基於文字的方式進行自然語言理解(NLU)、通過理解到的意圖或實體進行對話管理(DM)、自然語言生成(NLG)和語音合成(TTS)。
企業可以選擇Rasa Stack作為構建智慧對話機器人的基礎,它是一款開源的、基於機器學習的、為開發者和公司設計的機器人,智慧性較高。由於對話機器人的軟體開發難度很高,自然語言的理解需要很多元件的配合,而Rasa Stack的優勢是完全的資料控制、自行擴充、自定義模型和完全的自驅動,並且其背靠德國的Rasa Technologies GmbH,有一定的發展保障。
Rasa NLU能夠提取使用者的意圖和相關的實體,這相當於把使用者千奇百怪的、非結構化的、長短不一的資料轉化成結構化資料。Rasa NLU的特色是基於 pipeline 的工作模式,擴充套件能力強,並且支援多種語言,如英語、德語、中文、日文等,RASA NLU還內建多種演算法和配置,如MITIE、CRF、Embedding等。
RASA Core則是一個對話管理體系,如下圖所示,圖中的每一個箭頭都代表資料的流動。
Rasa Core的特性是資料驅動、擴充套件能力強、支援多種Policy協同工作、內建多種演算法和配置,並且支援Interactive learning.
實際上,強化學習不僅是一種框架,它還提供了演算法和配置,但是具體的做法和引數調節,還需要在實踐場景下進行確定。另外,互動式學習能夠很快地測試到,使用者所得到的回覆是否正確,並在錯誤的情況下,進行相應的更改。
《AI賦能營銷數字轉化轉型》
李澤洲 Pinlan聯合創始人兼CTO
當前,線下營銷正在從以零售商為中心,轉化成以購物者為中心的形式。而在這其中,機器視覺的落地,也對整個零售行業的轉變起到了很大的推動作用。
計算機視覺是一個跨學科的領域,涉及到如何使計算機從數字影象或視訊中,獲得高層次的理解。硬體和演算法的進步均催生了大量計算機視覺的應用落地。
在深度學習進入到計算機視覺的領域之前,計算機視覺技術主要被應用於影象處理、特徵檢測和匹配以及運動估計。
隨著深度學習網路的發展,傳統的神經網路很難被單純地應用到計算機視覺領域。影象的緯度很大,而人的觀察方式是對影象當中的某個區域性資訊,進行認真的觀察之後,才會逐漸地觀察到全域性資訊。
機器學習的流程是資料採集、資料預處理、模型訓練、模型測試和模型服務。其中,零售行業的零售商更關心的是,SKU在超市中鋪貨時,是如何擺放的。
線下零售商有兩種方式可以進行資料採集。方式一是利用手持終端(SFA)採集資料; 方式二是在超市中架設攝像頭,進行固定場景的拍攝。方式二相較於方式一,有一定的優勢存在,如可選擇高畫素攝像頭,影象質量高;固定場景下的拍攝,變化較小;資料可用性高;模型可以確保細粒度商品的識別。
在資料預處理階段,也有兩種方式可以對已採集的影象資料資訊進行處理,方式一是提高影象質量,如調整亮度、對比度,對影象進行去模糊、超解析度重建等。
方式二是訓練影象增強,在AI的實現過程中,在訓練CNN網路之前,對資料進行增強是一個非常重要的環節。一般情況下,現實場景中所能收集到的資料量不是很大,這對於深度學習來說是一個致命的問題,這時便可以利用影象增強或者影象資料的擴充,增加資料量,如影象裁剪、影象對比度變化、影象亮度變化和影象微旋轉。
在商品檢測模型訓練的階段,目前前沿的演算法框架包括 Faster-RCNN、RetinaNet和YOLO等。
通用商品檢測模型能夠支援海量的多種包裝類別實際場景資料,可以針對大小目標和不同包裝類別,進行大類拆分,並且能夠優化模型結構,增強場景適應性。同時,通用商品檢測模型可以實現移動端壓縮,支援移動端檢測。
而細粒度商品識別模型訓練則需要先收集海量SKU資料,建立商品資料庫,之後結合注意力機制,訓練細粒度識別模型,然後在真實場景驗證模型效果。在實踐中,Pinlan的細粒度商品識別模型,已經能夠使自然場景商品識別準確率提升至97%.
建立檢測模型和識別模型之後,開發者可以將兩者進行結合,進行線下零售的智慧陳列分析,如陳列位置檢查、數量檢查、陳列規範檢查和陳列推薦。
以資料驅動的新零售時代已經來臨,面臨零售場所和消費觀念的轉變,傳統零售需要整合和重組,充分地利用電子商務、大資料雲平臺、移動網際網路和人工智慧等技術,讓線上線下一體化成為可能。