DALL・E 這波超進化，畫質藝術感雙飛昇，還學會了無痕 P 圖

阿新 • • 發佈：2022-04-09

把椅子上的萌犬 P 成貓貓，需要幾步？第一步，圈出狗狗。第二步，告訴 AI 你的需求。滑鼠一點，齊活。

這位 AI P 圖大師，其實是位老朋友 ——OpenAI 風靡全球的那位 DALL・E。現在，它剛剛完成了“2.0 超進化”。不僅新學了一手出神入化的 P 圖絕技，創作質量也有了飛躍式的提升。

話不多說，直接看作品感受一下~ 這是 DALL・E 2 在“星雲爆炸狀柯基頭”這一提示下的創作出來的畫作：

這幅薩爾瓦多・達利的畫像，是不是有點薩爾瓦多・達利內味兒了？

跟初代 DALL・E 比起來，著實是畫質與藝術感雙雙飛昇了。

△ “日出時分安坐在田野裡的狐狸，莫奈風格”

所以，研究人員具體如何點亮了 DALL・E 的新技能點？

CLIP + 擴散模型

DALL・E 此番進化，簡單來說就是解析度更高了，延遲更低了。此外，還有更新 2 大新功能：

首先，在更細粒度上實現文字 → 影象功能。也就是說，DALL・E 2 可以根據自然語言提示進行 P 圖。在 P 圖的過程中，還會考慮陰影、反射、紋理等元素的變化。比如在左圖示“2”的位置 P 一個火烈鳥泳圈，DALL-E 2 會把水面倒影這種細節也處理到位。

其次，是可以在保留原作核心元素的基礎之上，賦予原作船新的風格。並且生成畫面的畫質是 DALL・E 1 的 4 倍，即從 256×256 提升到了 1024×1024。

具體的實現方法，用 OpenAI 官方的話來說，就是結合了 CLIP 和擴散模型兩種技術的優點。CLIP 是原版 DALL・E 功能實現的基礎，是一個負責給影象重排序的模型，其零樣本學習能力已經在各種視覺和語言任務上大放異彩。而擴散模型的特點在於，在犧牲多樣性的前提下，能大大提升生成影象的逼真度。於是，OpenAI 的研究人員設計了這樣一種方案：

在這個名為 unCLIP 的架構中，CLIP 文字嵌入首先會被餵給自迴歸或擴散先驗，以產生一個影象嵌入。而後，這個嵌入會被用來調節擴散編碼器，以生成最終的影象。

OpenAI 解釋稱，DALL・E 能夠 get 影象和用於描述畫面的文字之間的關係。其影象的生成是在“擴散”過程中完成的，可以理解為是從“一堆點”出發，用越來越多的細節去把影象填充完整。

研究人員將 DALL・E 2 與 DALL・E、GLIDE 等模型進行了對比。

實驗結果顯示，DALL・E 2 的影象生成質量與 GLIDE 相當，但 DALL・E 的生成結果更具多樣性。

目前，DALL・E 2 並未對公眾開放，不過如果你感興趣，可以線上註冊申請一發~

專案地址：

https://openai.com/dall-e-2/#demos

DALL・E 這波超進化，畫質藝術感雙飛昇，還學會了無痕 P 圖

把椅子上的萌犬 P 成貓貓，需要幾步？第一步，圈出狗狗。第二步，告訴 AI 你的需求。滑鼠一點，齊活。這位 AI P 圖大師，其實是位老朋友 ——OpenAI 風靡全球的那位 DALL・E。現在，它剛剛完成了“2.0 超進化”。不僅

iQOO 9 標準版爆料：雙 X 軸線性馬達 / 雙壓感 / 雙揚，全系驍龍 8 Gen 1

12 月 9 日訊息，iQOO 9 系列新機有望於 2022 年年初正式釋出。今日微博博主@熊貓很禿然透露，該系列手機將全系搭載驍龍 8 Gen 1 旗艦晶片。具體來看，iQOO 9 標準版會有四個“2”，兩個“120”。這款手機會配備第

十一長假我肝了這本超硬核PDF，現決定開源！！

寫在前面在【冰河技術】微信公眾號中的【網際網路工程】專題，更新了不少文章，有些讀者反饋說，在公眾號中刷歷史文章不太方便，有時會忘記自己看到哪一篇了，當開啟一篇文章時，似乎之前已經看過了，

類linux作業系統的幾個超實用小技巧（這波肯定不虧）

此文轉載自：https://blog.csdn.net/weixin_45277161/article/details/110313478#commentBox 因為我用的是mac，所以對類linux系統的操作比較熟悉，平時經驗和探索積攢下來的幾個實用小技巧分享給大家：

這波印度疫情大坑，把蘋果和富士康都陷進去了，全球手機大廠打一陣“寒顫”

5 月 11 日，路透社報道稱，有訊息人士透露，由於感染了新冠肺炎的工人無法上班，印度富士康工廠的蘋果 iPhone 12 產能已經下降了 50％以上。也就是說，剛遷過去一年多時間，專注於生產 iPhone 12 機型的富士康，也遭

【IT之家評測室】MateBook 16 筆記本測評：屏好效能高，這波不虧

從 2008 年喬布斯從信封裡掏出那臺 MacBook Air 開始，人們對筆記本輕薄化的追求便沒有停下腳步。根據資料報告，目前筆記本市場最熱門的品類有兩種，一是輕薄本，二是遊戲本。並且輕薄本的受歡迎程度還要遠高於遊戲本

不止蘋果，這波疫情讓印度汽車製造業也“坑倒”一片

此前一篇印度遭受疫情導致蘋果產能受阻的文章，大致分析了目前手機產業鏈在印度遭遇的困境，這篇《這波印度疫情的大坑，把蘋果和富士康陷進去了》之後，我們又看到全球汽車製造業在印度遭遇的另一波險情。說實話，這

全網首發！涵蓋位元組美團騰訊等大廠前端高頻面試題，這波看了不虧

雖現在不是金九銀十面試好時候，但還是會有小夥伴找工作參加面試，小編把最近參加面試被問到的面試題做了個集合，其中裡面的題目包括有位元組、騰訊、滴滴、美團等題目，現整理好的面試題有HTML、CSS、JS相關的，全

迷你版 DALL-E：模型縮小 27 倍，訓練成本僅 200 美元，線上可玩

自從今年 1 月份 OpenAI 祭出 120 億引數魔法模型 DALL・E，眾多科研工作者開始對其進行多方位的剖析，希望也能做出給定“自然語言文字描述直接生成對應圖片”的程式或軟體。

海信視像：公司 TV TCON、畫質晶片已對外銷售，2020 年整體出貨量超 4000 萬片

8 月 10 日訊息海信視像在互動平臺表示，1、目前青島信芯微電子科技股份有限公司主要聚焦於晶片設計，晶片生產採用外包方式。2、公司的晶片產品所屬的類別包括：TV TCON 晶片、TV 畫質晶片、MCU 晶片、低功耗藍芽晶

AMD FSR 2.0 超解析度技術釋出：畫質大提升，N 卡也能用，將於第二季度上線

3 月 17 日訊息，AMD 今日正式釋出了 FSR 2.0 超解析度技術，比 FSR 1.0 有了長足的進步。FSR 2.0 將從空間縮放改為全新一代時間縮放，可以提供比原始解析度更好的影象質量，同時抗鋸齒能力也大大提升。官方表示，F

switch版的巫師三，超頻後畫質讓人眼前一亮

從圖中可以看出，巫師三在switch上的光影表現並沒有縮水，表現非常強勁，雖然材質略有削弱，但從大體上看，光影的強勁彌補了材質的不足，整體畫質保持在了次世代的水平

給出 3 個詞，AI 直接作畫！OpenAI 釋出 DALL・E 2.0，掌握多種畫風，解析度提高 4 倍

大家還記得去年 1 月 OpenAI 釋出的 120 億引數魔法模型 DALL・E 嗎？當時，DALL・E 的畫風是這樣的：只要「閱讀」文字，DALL・E 就能根據文字的內容「自動」生成栩栩如生的大師級畫像。因此，當時一經發布，DALL・E

Windows10自帶輸入法新增小鶴雙拼，超簡單！！！

1、複製以下程式碼到記事本，儲存。 #############（以下是文字內容）##############

曹工說面試：當應用依賴jar包的A版本，中介軟體jar包依賴B版本，兩個版本不相容，這還怎麼玩？

背景大一點的公司，可能有一些組，專門做中介軟體的；假設，某中介軟體小組，給你提供了一個jar包，你需要整合到你的應用裡。假設，它依賴了一個日期類，版本是v1；我們應用也依賴了同名的一個日期類，版本是v2.

如何科學地完成一場 AR 釋出會？全在這份超細節活動策劃 Xmind 裡了

你們在哪個酒店搭的景？ 5 月 28 日，網易智慧企業完成了一場實景人物拍攝 + 虛擬舞臺渲染的 AR 線上見面會。非常有趣的是，在直播過程中，不止一位觀眾問我們，“你們是在哪個酒店搭的景？”。看來我們

美國數學家維納(N.Wiener)智力早熟，11歲就上了大學。他曾在1935~1936年應邀來中國清華大學講學。一次，他參加某個重要會議，年輕的臉孔引人注目。於是有人詢問他的年齡，他回答說：我年齡的立方是個4位數。我年齡的4次方是個6位數。這10個數字正好包含了從0到9這10個數字，每個都恰好出現1次。” 請你推算一下，他當時到底有多年輕。結果只有一個數。

#include<stdio.h>int main(){ int age=1; int san=0; int si=0; int sum=0;while(age>0) { san=age*age*age; si=age*age*age*age; int t1,t2,t3,t4; int f1,f2,f3,f4,f5,f6;

DALL・E 這波超進化，畫質藝術感雙飛昇，還學會了無痕 P 圖

CLIP + 擴散模型

DALL・E 這波超進化，畫質藝術感雙飛昇，還學會了無痕 P 圖

iQOO 9 標準版爆料：雙 X 軸線性馬達 / 雙壓感 / 雙揚，全系驍龍 8 Gen 1

十一長假我肝了這本超硬核PDF，現決定開源！！

類linux作業系統的幾個超實用小技巧（這波肯定不虧）

這波印度疫情大坑，把蘋果和富士康都陷進去了，全球手機大廠打一陣“寒顫”

【IT之家評測室】MateBook 16 筆記本測評：屏好效能高，這波不虧

不止蘋果，這波疫情讓印度汽車製造業也“坑倒”一片

全網首發！涵蓋位元組美團騰訊等大廠前端高頻面試題，這波看了不虧

迷你版 DALL-E：模型縮小 27 倍，訓練成本僅 200 美元，線上可玩

海信視像：公司 TV TCON、畫質晶片已對外銷售，2020 年整體出貨量超 4000 萬片

AMD FSR 2.0 超解析度技術釋出：畫質大提升，N 卡也能用，將於第二季度上線

switch版的巫師三，超頻後畫質讓人眼前一亮

給出 3 個詞，AI 直接作畫！OpenAI 釋出 DALL・E 2.0，掌握多種畫風，解析度提高 4 倍

Windows10自帶輸入法新增小鶴雙拼，超簡單！！！

曹工說面試：當應用依賴jar包的A版本，中介軟體jar包依賴B版本，兩個版本不相容，這還怎麼玩？

如何科學地完成一場 AR 釋出會？全在這份超細節活動策劃 Xmind 裡了

全網最全！這份深入講解jdk和jvm原理的筆記，重新整理了我對JVM的認知

金九銀十想去跳槽面試？那這份Java面經你真得看看了，寫的非常詳細！

這份java多執行緒筆記，你真得好好看看，我還沒見過總結的這麼全面的

DALL・E 這波超進化，畫質藝術感雙飛昇，還學會了無痕 P 圖

CLIP + 擴散模型

相關推薦