1. 程式人生 > >Google Maps 如何接地氣地本地化 “兩輪車模式” ?

Google Maps 如何接地氣地本地化 “兩輪車模式” ?

speech 可謂 快速 雙語 描述 個人 三種 語言環境 路線

技術分享圖片

先用一句話總結一下心得:從調研階段開始,一直到最後的每個細節,都要接地氣地做好本地化。這樣才能開發出更好、更有包容性的全球化產品。

當我們的 Google Maps 研究團隊開始前往印度和印度尼西亞時,我們希望了解生活在快速增長的全球社區中的人們不斷變化的需求。我們仔細研究了這些國家人口最多的兩個城市:德裏和雅加達,並很快意識到了 Google Maps 的不足。

在德裏,人們在交通上花費的時間在過去六年中翻了一番。在雅加達,平均每年在路上得用掉 22 天。因此,靈活機動的兩輪機動車,比如摩托車和踏板車,成為了一種非常受歡迎的出行方式。穿梭於擁堵車流的能力和較為便宜的價格 (與汽車相比) 使兩輪車顯得極具效率。我們的實地研究清楚地表明,這種交通方式是這些城市的一種生活方式。問題是:當時 Google Maps 基本上是專為汽車設計的。

首先,我們必須使產品適應越來越多依賴兩輪車的人。通過與駕駛員們的實地交流,我們為 Google Maps 構建了新的摩托車模式 —— 目前在印度和印度尼西亞的 Android 版本上已經可以使用,包括改進版的語音導航、自定義路線、快捷方式和更多地標建築指示,以便在進行兩輪,而不是四輪,出行時更好地定位。我們認為,雖然這些特定場景的特定功能可能不會直接應用於您自己的產品,但沈浸式研究策略可以為任何設計流程提供價值並帶來更好的產品。在本篇文章中,我們的研究員 Raj Arjan 和設計師 Lauren Celenza 大概講述了他們是如何幫助產品團隊找機會與他們在意的人們建立聯系的,以及從中得到了哪些重大收獲。

技術分享圖片

△ 摩托車模式,顧名思義,會顯示可供摩托車通行的路線。該功能包括提供快速到達目的地的捷徑提示 (請註意上面示例中汽車和自行車會采用不同的路線和速度預估)、用來強化駕駛員位置感的地標建築指示,以及包含其他語言的語音導航。

與當地用戶互動

重新思考 Google Maps 如何為兩輪機動車 (以下我們簡稱 “兩輪車”) 司機工作,這意味著要改變我們對手頭問題的思考方式。我們不能依賴現成的解決問題思維模式,而是要專註於面對面的研究,以幫助我們更好地理解人們的日常經驗和需求。這種轉變需要過程:我們需要到兩輪車司機生活的地方去,我們還需要帶去一個多元化的團隊。

技術分享圖片

△ 雅加達的兩輪車司機向我們展示了他們的車輛。您會驚訝於他們選擇的多樣性。

研究團隊包括來自世界各地的工程師、用戶體驗設計師、產品經理和營銷主管。我們面見了來自齋浦爾、德裏、班加羅爾和雅加達的兩輪車司機,地點從繁華的交通樞紐到人們家中的廚房桌旁不一而足。我們的目的是通過沈浸式的學習和調研,以真誠的方式去理解他人。

在旅行過程中,我們與兩輪車司機進行了交談,並搭上他們的車與他們一起穿越了整個城市。這種沈浸式研究過程幫助我們更好地理解了兩輪車司機在路上做出決策的方式。我們發現人們會使用各種方法來駕駛他們的兩輪車,有些人預先記住了路線,其他人則跟隨語音導航。許多人聽從了隨行乘客的意見,使用吸盤將手機連接到車速表上 (註意這會遮蓋住車速的顯示)。

技術分享圖片

△ 雅加達的兩輪車司機展示了他們如何將手機固定到兩輪車上,包括找個能放手機的位置 (左) 和使用吸盤 (右)。

這些對話還有助於研究團隊了解哪些功能對駕駛員最有幫助。很明顯,捷徑和地標可以幫助駕駛員更快、更安全地在城市中通行。當時,Google Maps 沒有提供用於自行車和輕便摩托車或兩輪運輸的具體路線或到達時間,導致體驗不夠準確。親眼看到這些問題有助於我們了解巨大的改進機遇,並激勵我們在學習過程中更進一步。

與當地社區合作

為了真正了解這些問題是如何在每一天影響駕駛員的,我們開始與那些將大部分工作時間用在兩輪車上的人們進行更密切的合作。在雅加達期間,我們與來自 Go-Jek 的一群司機開辦了一個研討會, Go-Jek 是一個摩托車打車服務,在印度尼西亞的 50 個城市開展業務。

技術分享圖片

?△ 一位 Go-Jek 車手與 Google 設計師 Lauren Celenza 和集團產品經理 Krish Vitaldevara 描述他一天的行程。

我們學到了司機對城市、日常需求和社區價值的深刻了解。我們繪制了司機在一天中所做的事情的時間表,討論了生活在雅加達的 “便利與不便”,並勾勒出了各種想法。這些活動幫助我們優先考慮最重要的需求。例如,一些司機告訴我們,Google Maps 經常推薦一些無法供兩輪車通行的道路,從而導致了挫敗感。

本次研討會的另一個重要內容是了解 Go-Jek 司機如何與社區互動。司機們描述了如果他們迷路或者設備運行不良時他們如何互相依賴,展示了人們如何作為社區,而不僅僅是作為個人,是如何做出決策的。

在沈浸式調研之旅完成後,我們繼續在整個產品開發過程中與更多司機進行遠程合作。我們在印度和印度尼西亞的合作夥伴幫助我們測試了路線規劃質量、到達時間、路標提示的質量和導航服務。此測試過程還幫助我們快速識別了不適合兩輪車通行的道路,以及地圖中缺少的其他地標。無論產品是什麽,在整個產品周期中與當地社區人員合作,都有助於讓流程更負責任、更具包容性。

通過講故事來分享數據

通過對當地社區的沈浸式體驗,實地研究團隊得以理解我們的用戶並與之共情,但另一個挑戰仍然擺在我們面前。我們需要將這種深刻的理解帶給那些沒有參與這個過程並且生活在數千英裏之外的同事們。

在傳統的研究報告中,學習結果經常通過數據傳達。但數字只能揭示故事的一部分,忽視了我們作為人類的情感、社會和環境。建立周到的體驗需要對人們進行更細致的理解,所以我們在研究過程中很早就決定通過視頻、照片和音頻記錄我們的體驗。我們希望創造一種可以感受到的深刻理解,而不僅僅是 “知曉”。這種感性的多媒體方法可以幫助我們遠在大本營的同事們在情緒層面上回應我們的發現。

△ 由 Munish Dabas 拍攝的全景視頻突出顯示了在印度齋浦爾街道駕駛兩輪車的景象、聲音和感覺。

在我們的實地研究中,我們攝制了全景視頻、聲音、照片和個人故事,以表達在擁擠的環境中搭乘兩輪車的感受。當我們完成現場研究時,我們收集了這些物料並創建了一個沈浸式的故事,重現真實生活在該區域之中的感覺。這些敘事元素可能會耗費一定的工作時間和資源,但它們可以促進跨多個團隊和時區的同理心、主張和一致性。

盡早定義設計原則,以建立產品願景和方向

我們的沈浸式故事包括我們與團隊在實地調研和分析時一起編寫的一系列設計原則。這些原則是跨學科團隊合作的基礎,並幫助我們專註於力所能及的最有影響力的改進。其中一些原則和改進甚至使得 Google Maps 體驗更好地適用於居住在印度和印度尼西亞的每個人 —— 而不僅僅是兩輪車司機:

上面這些設計原則也影響到了我們工作中非常細節的層面。例如,文案設計師 Christine Nguyen 在為該模式選擇名稱時就參考了我們的指南。為了更密切地與當地方言建立聯系,我們在印度為用戶選擇了 “兩輪車” 一詞,而在印度尼西亞則選擇了 “摩托” 一詞。

“同理心” 不僅僅是一個概念,而是所有學科在整個過程中共享的一種實踐

技術分享圖片

△ 沈浸在當地社區的經歷,幫助我們的實地研究團隊更好地體察用戶。

為 Google Maps 開發兩輪車模式是多年來我們第一次在應用中添加新的交通模式。與產品團隊一起設計、一起共情體驗並與當地社區合作,確保了為兩輪車司機提供更具包容性的、更度身的體驗。

閱讀研究報告或參加會議所提供的價值,永遠比不上在當地用戶的兩輪車後座待上 45 分鐘,並一起經歷因為 Google Maps 的故障或者錯誤而迷路的體驗。建立強大的聯系和共振不僅意味著對產品設計的提升;還意味著將共情實踐和文化實踐作為產品開發過程的核心部分,並最終影響到最終的體驗品質。

了解?“Building for Billions”?的詳細信息,請訪問?

>>?https://developer.android.google.cn/distribute/best-practices/develop/build-for-the-next-billion?hl=zh-cn

我們期待著大家的作品也能被世界各地的社區從心底裏接受和喜愛。

?點擊屏末?|?閱讀原文?|?"我們願意更好地傾聽您的聲音 "

推薦閱讀:

·?Google Play Console 新增獲客分析功能,幫您深入洞察用戶行為

·?Android 安全更新的發展與沿革

·?魚和熊掌兼得!這些應用是如何使用 Material Design 的??

文 /?副總裁 Johan Schalkwyk 和 Google Speech 工程師 Ignacio Lopez Moreno

多語言家庭正變得越來越普遍,一些數據來源 [1][2][3] 表明,多語言使用者的人數已超過單語言使用者,而且這一數字還會繼續增長。鑒於多語言使用者人群龐大且不斷增加,與以往相比,我們更需要使 Google 開發產品能夠同時支持多種語言,以便更好地為用戶服務。?

今天,我們將推出 “Google 智能助理” 的多語言支持功能,讓用戶在查詢時可以切換兩種不同的語言,而無需返回語言設置。用戶從英語、西班牙語、法語、德語、意大利語和日語中選擇兩種受支持的語言後,便可使用其中任意一種語言與 “智能助理” 對話,而 “智能助理” 會以相同的語言回應。之前,用戶需要為 “智能助理” 選擇一種語言設置,而每當他們想使用另一種語言時,便需要更改設置,但現在,多語言家庭無需動手,即可享受簡便的體驗。?

技術分享圖片

“Google 智能助理” 現在能夠識別語言、解讀查詢內容,並使用正確的語言作出回應,而且用戶無需觸摸 “智能助理” 設置,便可完成這些操作

然而,實現這項強大的功能卻並非易事。事實上,我們付出多年的努力解決了諸多難題。最終,我們將問題拆分成三個獨立的部分:識別多種語言、理解多種語言,以及為 “Google 智能助理” 用戶優化多語言識別。

識別多種語言

當有人在說另一種語言時,即使我們自己並不說這種語言,也能夠識別出來,只要註意語言的聲學效果(語調、音域等),便可做到這一點。但是,即便有了完整自動語音識別系統的幫助,定義自動口語識別的計算框架也非常具有挑戰性?1。在 2013 年,Google 開始使用深度神經網絡 [4][5] 來研究口語識別 (LangID) 技術。如今,借助遞歸神經網絡,我們最先進的 LangID 模型可以在超過 2000 個備選語言對中識別各種語言對。作為其中一類神經網絡,遞歸神經網絡在解決序列建模問題上尤為有效,例如語音識別、語音檢測、語者識別等方面的問題。我們遇到的挑戰之一是如何處理更大的音頻集,這需要獲取能夠自動大規模理解多種語言的模型,並且達到可以讓這些模型正常運作的質量標準。

理解多種語言

要同時理解多種語言,便需要並行運行多個進程,且每個進程產生增量結果,從而使 “智能助理” 不僅能夠識別用戶提出查詢時所使用的語言,還可以解析查詢以創建可操作指令。舉例來說,即使是在單語言環境中,如果用戶要求 “設定下午 6 點的鬧鐘”,則 “Google 智能助理” 必須理解 “設定鬧鐘” 的意思是打開鬧鐘應用,輸入 “下午 6 點” 的顯式參數,而且還要推斷出鬧鐘應該設在今天。要對受支持語言的任何給定語言對執行這項操作可謂一項挑戰,因為 “智能助理” 執行與在單語言情況中相同的工作,但現在必須額外啟用 LangID,並且不只是一個,而是同時運行兩個單語言語音識別系統(在本篇博文的稍後部分,我們會進一步說明當前兩種語言的限制)。?

重要的是,我們需要在幾毫秒的時間內評估 “Google 智能助理” 和用戶查詢中提及的其他服務異步生成的實時增量結果。我們借助另一種算法來完成這項工作。該算法使用由 LangID 產生的候選語言概率、我們的轉錄置信度和用戶偏好(例如最喜歡的藝術家),對兩個語音識別系統中每個系統提供的轉錄假設進行排名。?

技術分享圖片

我們用於 “Google 智能助理” 的多語言語音識別系統與標準單語言語音識別系統示意圖。排名算法用於根據有關用戶和增量 LangID 結果的相關信息,從兩個單語言語音識別器中選擇最佳識別假設

當用戶停止講話時,模型不僅可確定用戶所說的語言,還能解讀用戶的說話內容。當然,這個流程需要復雜的架構,因而會增加處理開銷,而且可能會造成不必要的延遲。?

優化多語言識別

為了盡可能降低這些不良影響,系統能越快確定所說的語言就越好。如果系統在用戶查詢結束前就可以確定所說的語言,則系統會忽略識別器以停止處理用戶的語音並舍棄忽略的假設,進而降低處理開銷,並減少任何潛在的延遲。考慮到這一點,我們發現了幾種優化系統的方法。?

我們考慮的一個用例是人們通常在查詢中使用同一種語言(用戶通常也希望 “智能助理” 使用該語言作出回應),除非所查詢實體的名稱使用不同語言。這意味著,在大多數情況下,即使句子中包含使用不同語言的實體,“智能助理” 也可以通過關註查詢的第一部分來對所說的語言作出初步猜測。借助這種早期識別,我們可以通過切換到單個單語言語音識別器來簡化任務,這與我們處理單語言查詢一樣。然而,快速決定如何以及何時切換為單一語言需要最終的技術整合:具體來說,我們使用隨機森林技術來結合多個情境信號,例如所使用的設備類型、所發現的語音假設數量、我們接收類似假設的頻率、單個語音識別器的不確定性,以及每種語言的使用頻率。

我們用來簡化和提升系統質量的另一個方法是限制用戶可以選擇的候選語言列表。用戶可以在我們的家居設備目前支持的六種語言中選擇兩種,如此一來,我們就可以支持大部分多語言使用者。不過,我們還在繼續改進技術,希望接下來可以解決三語支持問題,因為我們深知這會進一步提升不斷增長的用戶群的體驗。

從雙語支持到三語支持

從一開始,我們的目標就是讓 “智能助理” 可以自然地與所有用戶對話。多語言支持是用戶翹首以待的功能,也是我們團隊幾年前就提上日程的項目。然而,現在全球不只有許多雙語使用者,還有使用三種語言的用戶,或使用兩種以上語言的家庭,我們也想讓他們的生活更加便利。?

今天的更新讓我們走上正軌,是我們先進的機器學習技術、語音和語言識別技術,中老年冬裝以及我們團隊為優化 LangID 模型所作出的努力讓這一切成為可能。目前,我們正在努力教導 “Google 智能助理” 如何同時處理兩種以上的語言,並致力於在日後添加更多受支持的語言 —?敬請期待!?


1:人們通常認為,口語識別比基於文本的語言識別更具挑戰性,後者只需要基於字典的相對簡單技術就能出色地完成工作。語音內容的時間/頻率模式很難加以比較,而且由於用戶在講話時可以不加停頓,語速也有所不同,並且麥克風除了錄制語音以外還會保留背景噪聲,因此確定語音內容也更加困難。

更多 AI 相關閱讀:

·?Dopamine - 靈活、可重復的強化學習研究新框架

·?利用 Universal Transformer,翻譯將無往不利!

·?Google 最新推出了 The Lever,分享應用機器學習的最佳案例


文章來源:https://blog.csdn.net/jILRvRTrc/article/details/82598490

Google Maps 如何接地氣地本地化 “兩輪車模式” ?