Facebook 開源資料增強庫：可令 AI 精準識別盜版圖文音視訊

阿新 • • 發佈：2021-07-18

7 月 18 日訊息，只要稍微動點手腳，就會給 AI 模型的魯棒性帶來挑戰。在 AI 眼裡，下面這兩張圖片可能毫無關聯。

不過，Facebook AI 在近日開源了用於資料增強的新 Python 庫 ——AugLy。

使用 AugLy 資料增強訓練 AI 模型，訓練後 AI 可以對使用者上傳的內容，進行更精確的識別，有助於識別盜版圖文音視訊。

它支援音訊、影象、視訊和文字 4 種模態，提供了超過 100 種資料增強功能，可以對輸入內容進行多種處理。

比如，改變文字的大小寫、字型、編碼方式，給文字新增標點、調整字母位置、模擬錯別字，以及裁剪、旋轉圖片，給圖片加文字、增加飽和度、增加亮度、改變清晰度等。

這一專案已經獲得 1.8k 顆星，並且登上了 GitHub 熱榜。

讓 AI 識別「截圖轉發」

AugLy 的目的是涵蓋現實網路中具體的資料增強，用來建立樣本，從而訓練和測試模型。

根據 Facebook 和 Instagram 等平臺上的生活影象和視訊，AugLy 在統一的庫和 API 下轉換專案的所有資料，提供了超過 100 種資料增強方式。

其中包括 4 個子庫，分別對應音訊、影象、視訊和文字 4 種模態。

這些子庫包括基於函式和類的變換、組合，並且可以選擇所應用的元資料及其強度。

以圖片處理為例，AugLy 可以對圖片進行裁剪、旋轉、新增噪聲、模糊處理、灰度處理等。

就像這樣：

或者圖片或視訊上疊加文字和 emojis：

除了包含許多通用的增強功能，AugLy 更大的特點在於 —— 提供“網際網路使用者”型別的資料增強方式

。

比如，把圖片轉換成螢幕截圖的樣式，更加符合生活中常見的樣子。

使用 AugLy 資料增強訓練 AI 模型，這些內容相同而形式不同的資訊，能幫助模型提高魯棒性。

在複製檢測、言論檢測或版權侵權等工作中，訓練後 AI 可以對使用者上傳的內容，進行更精確的識別。

此外，AugLy 已經被用於 Deepfake 檢測挑戰賽，用來評估模型的魯棒性。

網友熱議

這個新的 Python 庫也受到了網友們的關注，在 Reddit 上獲得了 350 + 贊。

有網友提出疑問：文字模組只支援英語嗎？

一位熱心網友表示：

看起來文字模組在很大程度上是對 nlpaug 的一種包裝，因此 AugLy 支援其他語言，只需修改幾個引數。

也有網友提出，為什麼不直接把它加到 pytorch 裡？

對此，有人回覆道：

這樣在安裝的時候會很慢，有需要的的人單獨安裝就可以了，沒必要讓 pytorch 那麼臃腫。

AugLy 要求 Python 3.6 以上版本，通過 pip 安裝，但是在虛擬環境和系統環境中，還需要用 conda 和 sudo apt-get 命令單獨安裝 python-magic。

比較遺憾的是，AugLy 目前不支援輸入批量影象，不過開發人員表示，以後將會完善這一功能。

Facebook 開源資料增強庫：可令 AI 精準識別盜版圖文音視訊

7 月 18 日訊息，只要稍微動點手腳，就會給 AI 模型的魯棒性帶來挑戰。在 AI 眼裡，下面這兩張圖片可能毫無關聯。

資料增強庫Albumentations

0 過擬合與影象增強通常我們訓練一個深度卷積神經網路需要足夠多的資料來防止模型過擬合，然而收集任務所需的資料往往代價較大。因此我們需要另闢蹊徑，而影象增強就是另一種簡單可行的防止過擬合的方法。

Facebook 開源平臺增長迅速：去年新增 200 多個專案，接近 130 萬關注者

1月31日訊息根據外媒 ZDNet 訊息，Facebook 的開源平臺釋出了 2020 年報告，表示其所有開源專案前在 GitHub 的關注者已經接近 130 萬。Facebook 開源專案主管 Suraj 表示，有 12.7 萬名新開發者為開源專案標註收藏，

索尼正開發新資料壓縮技術：可將遊戲檔案大小縮小 60%

5 月 22 日訊息據外媒 Computerbase 報道，索尼正在開發一種新的資料壓縮技術，可以將遊戲檔案大小縮小 60%，該技術被索尼暫稱為“Kraken”技術。

Facebook開源遊戲平臺ELF：一個用於實時戰略遊戲研究的輕量級平臺

ELF是一個用於遊戲研究的應用廣泛的（Extensive）、輕量級的（Lightweight）、靈活的（Flexible）平臺，特別適用於實時戰略（RTS）遊戲。在C++方面，ELF採用C++執行緒來併發執行多個遊戲。在Python方面，ELF可以一次

用於快速開發 3D 資料處理軟體的開源資料處理庫 —— Open3D | Github 專案推薦

Open3D 是一個可以支援 3D 資料處理軟體快速開發的開源庫。Open3D 前端公開了一組用 C++ 和 Python 寫成的精心挑選的資料結構和演算法，後端高度優化並設定為並行。Open3D 可以在不同的平臺上設定，並以最少的工作量

與蘋果對抗，Spotify 收購技術公司：可通過 AI 生成播客精彩片段

據外媒 Techcrunch 報道，流媒體平臺 Spotify 已經實現對播客發現平臺 Podz 的收購，在播客服務領域再下一城。Spotify 表示：“我們正在投資建立和擴大世界上最好（也是最個性化）的播客發現體驗。我們相信，Podz 的

蘋果Mac圖片清晰度增強軟體：Topaz Sharpen AI

蘋果Mac圖片清晰度增強軟體：Topaz Sharpen AI Topaz Sharpen AIfor Mac 是一款通過人工智慧AI分辨影象真實細節及噪點的銳化和減少抖動的軟體。它可以一鍵提高圖片的清晰度，適用於一些解析度不是很高、影象細節

三星宣佈世界首款搭載 MRAM 非易失磁阻記憶體的電腦：可用於 AI 運算

1 月 13 日訊息，據外媒 techpowerup 報道，三星電子今日正式公佈了世界首款搭載 MRAM 記憶體的電腦，相關論文發表在《Nature》網站，並即將在雜誌上發表。論文題目為《用於記憶體內計算電腦的磁阻儲存器件交叉陣列

谷歌產品包容性努力：Pixel 相機確保精準呈現任何膚色

作為一名習慣用左手的、海地裔美國女性，我曾經歷過社交媒體上的濾鏡自動將我的膚色美白，使用的產品也大多是為慣用右手的人設計的；甚至當我想為家裡人拍張照片時，有些家庭成員卻不能在照片上正常顯示，我朋友還因

我國科研團隊研發出動物個體識別系統，可精準識別 “猴臉”

2 月 24 日訊息，據央視新聞報道，西北大學科研團隊研發出具有完全國產自主智慧財產權的動物個體識別系統。

小米首款 4K 專業顯示器預熱：出廠逐臺精準校色，“準的狠，ΔE＜1”

12 月 3 日訊息，今日上午，小米官方通過社交媒體繼續預熱小米首款 4K 專業裝置，稱其出廠逐臺校色，滿足專業嚴苛需求，且每一臺都 ΔE＜1。綜合官方近期公佈的資訊，這款產品應當是一款4K 顯示器。瞭解到，小米首款

為 AI 程式設計師減負：微軟開源深度學習庫 SynapseML，支援可擴充套件的智慧

本週三，微軟宣佈開源一個簡單、多語言的、大規模並行的機器學習庫 SynapseML（以前稱為 MMLSpark），以幫助開發人員簡化機器學習開發與部署。即使對於最有經驗的開發人員來說，構建機器學習管道也會很困難。對於初學

超級好用的 Java 資料視覺化庫：Tablesaw

本文作者：HelloGitHub-秦人本文適合剛學習完 Java 語言基礎的人群，跟著本文可瞭解和使用 Tablesaw 專案。示例均在 Windows 作業系統下演示

Python資料視覺化：箱線圖多種庫畫法

概念箱線圖通過資料的四分位數來展示資料的分佈情況。例如：資料的中心位置，資料間的離散程度，是否有異常值等。

Python資料分析入門：Numpy庫講解

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

python -爬蟲學習2：獲取資料requests 庫

上一篇介紹的主要是爬蟲的工作原理，大致分為四個步驟：獲取資料解析資料提取資料儲存資料。這一篇主要就從獲取資料介紹起。

CVPR 2020 細粒度分類挑戰賽冠軍方案：資料增強+知識蒸餾，效果大幅提升

本文轉載自機器之心。近日，支付寶天筭安全實驗室在 CVPR FGVC（細粒度視覺分類）workshop 舉辦的植物病理學挑戰賽（Plant Pathology Challenge）中奪冠。本文介紹了冠軍隊伍及其解決方案。

Python資料視覺化：詞雲庫的講解和如何製作詞雲

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

紅外街道影象的目標檢測：多尺度物件級資料增強

紅外街道影象的目標識別：多尺度+物件級資料增強 Multiscale Object Detection in Infrared Streetscape Images Based on Deep Learning and Instance Level Data Augmentation

Facebook 開源資料增強庫：可令 AI 精準識別盜版圖文音視訊

讓 AI 識別「截圖轉發」

網友熱議

相關推薦