展會信息港展會大全

人工智能和創造力:為什么說OpenAI的新AI模型DALL
來源:互聯網   發布日期:2021-01-26   瀏覽:3286次  

導讀:OpenAI語言模型GPT-3的研究機構本月初發布了一個名為DALL-E的新AI模型。雖然DALL-E沒有GPT-3那么受歡迎,但它對人工智能的未來可能有著更深遠的影響。 DALL-E這個名字是對超現實主義藝術家薩爾瓦多達利(Salvador Dali)和可愛的皮克斯機器人瓦力(WALL-E)...

OpenAI語言模型GPT-3的研究機構本月初發布了一個名為DALL-E的新AI模型。雖然DALL-E沒有GPT-3那么受歡迎,但它對人工智能的未來可能有著更深遠的影響。

DALL-E這個名字是對超現實主義藝術家薩爾瓦多達利(Salvador Dali)和可愛的皮克斯機器人瓦力(WALL-E)的致敬。它將文本作為輸入,然后生成原創圖像作為輸出。例如,當輸入諸如“五角形綠色時鐘”、“火球”或“建筑側面的藍色南瓜壁畫”之類的短語后,DALL-E能夠產生令人震驚的精確的視覺渲染。

為什么說DALL-E很重要?

首先,它預示著一種被稱為“多模態AI”的新型AI范式的到來,這種范式似乎注定了人工智能的未來。多模態AI系統能夠在多種信息模態之間進行解釋、綜合和翻譯在DALL-E的例子中,是語言和圖像。DALL-E并不是第一個多模態AI的例子,但它是迄今為止最令人印象深刻的。

OpenAI聯合創始人IlyaSutskever總結得很好:“世界不只是文本。人類不僅會說話,我們還會看。很多重要的背景都來自于看。”

目前存在的大多數AI系統只處理一種類型的數據。NLP模型(例如,GPT-3)只處理文本;計算機視覺模型(如面部識別系統)只處理圖像。這是一種遠不如輕松獲得豐富信息的人類大腦的智力形式。

人類不斷地從五種感官接收和整合信息我們通過視覺、聽覺、觸覺、嗅覺和味覺的結合來理解我們周圍的世界。我們用各種各樣的方式向世界傳達信息言語,文字,肢體語言,面部表情,音樂。

通過將對自然語言的理解與生成相應視覺表現的能力結合起來換句話說,通過“讀”和“看”的能力DALL-E有力地展示了多模態AI的潛力。

這僅僅是個開始。在未來的幾個月和幾年里,AI系統將能夠無縫連接音頻、視頻、語音、圖像、書面文本、觸覺等內容并進行交互。隨著AI學會以越來越復雜的方式整合多種信息模式,它理解世界和產生新見解的能力將會組合性爆發。

DALL-E之所以重要,還有一個更根本的原因:人們越來越難以否認人工智能具有創造力。

DALL-E生成的圖像未曾存在于世界上或任何人的想象中。它們不是對互聯網上現有圖像進行操作的結果它們是新穎的效果圖,有時因其聰明和獨創性而令人驚嘆。這些圖像是DALL-E的人類創造者在很多情況下沒有預料到的,也不可能預料到的。

看看DALL-E那令人愉快、富有創意的涂鴉,比如“一碗陷入愛河的拉面的表情符號”、“鱷梨制成的企鵝”如果這些圖像是人類創作的,我們會毫不猶豫地認為它們是創作過程的輸出。我們能否認DALL-E的創造力嗎?

這種創新能力使DALL-E在產品設計、時尚和建筑等領域具有直接的現實意義。用不了多久,人類設計師將DALL-E這樣的AI作為創意伙伴和靈感來源將會很普遍。

舉個例子,當被要求設計“一個甜甜圈風格的扶手椅”時,DALL-E會給出各種富有想象力的選擇當然,有些設計得更好,也比其他的好看。我們很容易想象一個家具設計師反復使用DALL-E,探索模型的輸出,在文本提示下進行迭代,然后使用AI的設計作為自己的扶手椅設計的出發點。類似的創意過程適用于許多產品從汽車到燈具,從珠寶到房屋。

DALL-E遠非完美,但會繼續快速發展

關于這項技術,有幾個重要的警告。DALL-E遠非完美。它生成的圖像并不總是能準確地表達文本的意義,例如它經常會弄錯顏色、數量或空間關系。

而OpenAI公開的DALL-E作品的例子,雖然不是人工挑選的,但首先是由另一個名為CLIP的神經網絡進行排名和挑選的。對于每個文本輸入,只給出512個示例中的前32個示例。換句話說,DALL-E還生成了大量不那么好的鱷梨企鵝和甜甜圈椅的圖像。

不過總體來說,DALL-E的生產能力是驚人的,而且該技術將繼續快速發展。

DALL-E將為機器的創造能力開啟新的可能性

與人工智能領域的任何重大發展一樣,DALL-E不可避免地會引發一個古老的問題:機器是否正在越來越接近“真正的”人類級的智能?

一方面,DALL-E的公布引發了對超級智能到來的喧囂。另一方面,像著名的深度學習批評家加里馬庫斯(Gary Marcus)這樣的懷疑論者則認為,DALL-E并沒有真正推動AI技術的發展。

馬庫斯的觀點值得認真對待。深度學習包括DALL-E和GPT-3背后的架構作為一種智能概念模型確實有很大的局限性。

然而,從某種意義上說,這場辯論沒有抓住要點。不管OpenAI的新模型是否代表著向“人工通用智能”邁出了真正的一步,不管深度學習是否是一條通往像人類認知一樣強大的機器智能的可行道路,DALL-E是一種具有非凡新能力的新工具,這一事實難以質疑。

DALL-E及其繼任者將在人類和機器之間的創造性的關系中開啟新的可能性。這一過程將創造巨大的經濟價值,成為新一輪創新創業和產品浪潮的基矗

事情只會從現在開始變得更神奇!緮底謹⑹ 原文:Rob Toews;編譯:Lighting】

贊助本站

人工智能實驗室
AiLab云推薦
展開
Copyright © 2010-2021 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯系我們 | 廣告服務 | 公司動態 | 免責聲明 | 隱私條款 | 工作機會 | 展會港
AG体育app,AG体育投注,AG手机平台,AG体育平台