突破 100 種，微軟翻譯新增對 12 種語言/方言支援，包括藏語、維吾爾語...

阿新 • • 發佈：2021-10-14

10 月 12 日訊息，微軟翻譯今天宣佈支援 12 種新的語言和方言。有了這項支援，微軟翻譯現在總共支援 103 種語言，覆蓋了世界人口的 72%。有了這個版本，微軟翻譯服務可以將文字和檔案翻譯成全世界 56.6 億人所使用的本土語言。

獲悉，微軟翻譯新增加的語言是巴什基爾語、迪維希語、喬治亞語、吉爾吉斯語、馬其頓語、蒙古語（西里爾語）、蒙古語（傳統版）、塔塔爾語、藏語、土庫曼語、維吾爾語和烏茲別克語（拉丁語）。這些新語言有 8460 萬人使用。

微軟技術研究員和 Azure 人工智慧首席技術官黃學東說：“一百種語言對我們來說是一個很好的里程碑，可以實現我們的雄心壯志，讓每個人無論說什麼語言都能進行交流。”

微軟翻譯的演變

20 多年前，微軟研究院首次開發了機器翻譯系統。2003 年，一個機器翻譯系統將整個微軟知識庫從英文翻譯成西班牙文、法文、德文和日文，並將翻譯內容釋出在其網站上，成為當時網際網路上最大的面向公眾的原始機器翻譯應用。

微軟在統計機器翻譯（SMT）模型的基礎上進一步發展了這些系統，並通過 Windows Live Translator、Translator API 以及微軟 Office 應用程式的內建功能向公眾提供。

微軟表示，多年來，我們為世界上許多最常用的語言增加了翻譯系統。隨著人工智慧（AI）技術的發展，微軟採用了神經機器翻譯（NMT）技術，並將所有機器翻譯系統遷移到基於 Transformer 技術的神經模型上，實現了翻譯流暢性和準確性的巨大提升。

雖然 NMT 技術顯著提高了整體翻譯質量，但 Transformer 架構的出現為建立機器翻譯模型鋪平了新的道路，使其能夠用比以前更少的材料進行訓練。使用多語言 Transformer 架構，現在可以用其他語言的材料來增加訓練資料，通常是在同一或相關的語言家族中，為資料量小的語言製作模型，通常被稱為低資源語言。

即使有了這些技術，也必須要有一套目標語言的數字檔案，以及另一種已經包括在內的語言的翻譯--通常被稱為 parallel 檔案。

▲ 微軟翻譯所翻譯的語言數量折線圖，從 2007 年的 7 種到 2021 年的 100 多種。該系統從 2007 年到 2016 年一直使用統計機器翻譯（SMT）。2016 年採用神經機器翻譯（NMT）技術有助於提高翻譯質量，2019 年採用 Transformer 架構，使微軟團隊能夠用較少的資料量為低資源語言建立模型。

在增加新語言時，微軟表示，最大的挑戰之一是獲得訓練和製作機器翻譯模型所需的足夠的雙語資料。這些資料由高質量的人工翻譯內容組成，既包括想要新增的語言，也包括該服務已經支援的語言之一。對於許多語言來說，這種雙語資料是很難獲得的，特別是對於數字資源不足或瀕臨滅絕的語言。

微軟稱，很幸運與語言社群的夥伴合作，他們可以獲得人工翻譯的文字，並可以幫助收集資源不足的語言的資料。這些社群合作伙伴，通常是與他們各自社群合作的志願者，通過諮詢社群成員，不辭辛苦地收集雙語句子。然後，他們評估所產生的機器翻譯模型的質量。

Azure 認知服務翻譯在微軟產品中公開了 NMT 模型，並通過文字翻譯和文件翻譯 API 向翻譯客戶公開。這些 API 將純文字和複雜檔案從一種語言翻譯成另一種語言。Azure 認知服務翻譯器 API 可在公共雲和安全的微軟 Azure 政府雲中使用。此外，文字翻譯 API 在 Docker 容器中可用，允許客戶在企業內部處理內容以滿足特定的監管要求。

Azure 認知服務翻譯還包括自定義翻譯服務，該服務使使用者能夠使用自己的翻譯記憶庫來建立自定義機器翻譯模型，以翻譯其業務和相關行業中使用的特定領域術語。這些自定義機器翻譯模型可以通過文字和文件翻譯 API 使用。

為了翻譯音訊或語音內容，Azure 認知服務翻譯與 Azure 認知服務語音緊密結合，通過 Azure 語音 SDK 支援語音翻譯和多裝置對話。

Azure 認知服務翻譯器及其支援的產品被客戶廣泛採用。該服務無縫整合到許多微軟產品中，並隨時供每個人使用和建立他們選擇的語言內容。一些微軟產品整合包括用於翻譯文字和檔案的 Microsoft 365，用於翻譯整個網頁的 Microsoft Edge 瀏覽器，用於翻譯資訊的 SwiftKey，用於翻譯使用者提交的內容的 LinkedIn，用於在移動中進行多語言對話的 Translator 應用程式，以及更多。

突破 100 種，微軟翻譯新增對 12 種語言/方言支援，包括藏語、維吾爾語...

微軟翻譯的演變

突破 100 種，微軟翻譯新增對 12 種語言/方言支援，包括藏語、維吾爾語...

虛引用是引用關係中最弱的一種引用，也被稱為幽靈引用或者幻影引用。一個物件是否存在虛引用，完全不會對其生存時間構成影響，也無法通過虛引用來獲取一個物件例項

仍未支援安卓 App、Fluent 設計尚未展開，微軟承諾將對 Win11 進行大改造

HMS Core 機器學習服務6.4.0版本更新啦，文字翻譯功能增加10種小語種語言型別！

寫一個猜拳遊戲，從控制檯輸入石頭、剪刀、布，後臺隨機生成對應和輸入的做比較，看看誰能贏，輸，和平局。

高興得太早了，微軟 Lumia 950 XL 還未成功執行 Win11，此前是遠端桌面效果

Win11/Win10 桌面最完整，微軟 Windows 365 雲電腦僅部分功能支援 iOS /安卓/網頁端

微軟 Win11 全新右鍵選單獲開發者支援，WinRAR 已完成適配：無須再忍受二級選單

慶祝 Windows Insider 計劃 7 週年，微軟釋出 Win11 全新主題桌布下載：支援深色/淺色模式

《DOTA2》釋出更新，正式移除對 32 位系統的支援

實戰技能分享，減小開關中斷對系統實時性的影響，提升系統響應速度

違反隱私規定，法國監督機構對 Facebook 和谷歌分別罰款 6000 萬歐元、1.5 億歐元

微軟：舊版 Visual Studio 即將停止支援，2012/2017/2019 都受影響

蘋果 M1 Mac 獨享，這 7 項 macOS 12 Monterey 功能不再支援 Intel Mac 電腦

英偉達釋出 471.11 WHQL 驅動更新，新增對微軟 Win10 21H1 的支援

華為花瓣郵箱新增翻譯功能，支援法語、德語、俄語等 12 種語言

zabbix使用自己編寫指令碼模板和zabbix自帶模板兩種方法新增對指定程序和埠的監控...

福布斯釋出 2021 公平 100 企業榜，微軟英偉達蘋果名列前三

微信小程式雲開發，資料獲取突破100條限制

官宣：僅僅 21 天，小米 11 銷量突破 100 萬

突破 100 種，微軟翻譯新增對 12 種語言/方言支援，包括藏語、維吾爾語...

微軟翻譯的演變

相關推薦