亚洲欧美色一区二区三区,日韩欧美国产v一区二区三区,精品久久久久久综合日本,jap,免费观看片,2020每日更新国产精品视频

思杰拓才匯云

新浪蜂鳥 | 被Sora支配的恐懼:坐立不安的制片人與起訴

新浪蜂鳥 | 被Sora支配的恐懼:坐立不安的制片人與起訴

 

   ?為什么Sora更勝一籌?基于一些公開技術(shù)報(bào)告,可以從中一瞥其創(chuàng)新秘訣。

春節(jié)黃金周期間,互聯(lián)網(wǎng)上涌現(xiàn)了一批令人贊嘆的超短視頻作品,它們以驚人的頻率在全球范圍內(nèi)傳播,每日都帶來新的視覺盛宴。這些視頻作品,無一例外,均由人工智能完全獨(dú)立生成,未經(jīng)人手直接干預(yù)。最早的視頻之一,是描繪冰河世紀(jì)猛犸象的畫面,精美程度可以秒殺侏羅紀(jì)公園或其它好萊塢CGI制作。

另一個(gè)廣為傳播的視頻中,長鏡頭跟隨游客,掃過盛開櫻花下的東京街景。專業(yè)人士使用其它AI視頻生成平臺(tái)以相同的提示詞嘗試制作時(shí),驚訝的發(fā)現(xiàn)這部新視頻在拍攝角度、畫面的精細(xì)度,以及清晰度等多個(gè)維度上,均顯著超越了以往的作品。

AI甚至模擬出170多年前,當(dāng)攝影技術(shù)還未出現(xiàn)的加州淘金熱時(shí)期的場景。而且,制作這個(gè)視頻的提示詞簡單無比,顯示了AI技術(shù)在理解和創(chuàng)造歷史場景方面的驚人能力。

這些具有前所未有高保真度的AI視頻畫面,徹底震驚了業(yè)內(nèi)。它們來自O(shè)penAI新推出的視頻生成平臺(tái)Sora。

像搭積木一樣重新排列創(chuàng)建視頻

根據(jù)OpenAI的解釋,Sora的名字取自日語“天空”一詞,其目標(biāo)是教人工智能“理解和模擬運(yùn)動(dòng)中的物理世界”,從而訓(xùn)練模型,協(xié)助人們解決需要現(xiàn)實(shí)世界互動(dòng)的各種問題。

?通過一個(gè)簡單的提示詞,Sora自動(dòng)生成的完整視頻長度長達(dá)1分鐘。

?當(dāng)下的情形,與兩年前人工智能靜態(tài)圖像生成出現(xiàn)時(shí)有些類似。 

?當(dāng)時(shí),OpenAI的DALL-E2和Midjourney以及Statble Diffusion幾個(gè)公司幾乎同時(shí)推出了靜態(tài)圖像模型,并且對(duì)外開放,允許數(shù)百萬用戶通過簡單的文字提示,得到AI制作的奇妙圖片。

?而Sora的問世,意味著在視頻生成領(lǐng)域邁出的一大步,也將競爭對(duì)手遠(yuǎn)遠(yuǎn)拋出了腦后。

?OpenAI的創(chuàng)始人山姆·奧特曼(Sam Altman)再一次證實(shí)了自己的地位。就在前不久,他還剛經(jīng)歷了OpenAI與微軟的“辭退風(fēng)波”,重返OpenAI首席執(zhí)行官后,他就通過Sora的推出,向世人證明他個(gè)人在AI行業(yè)的影響力。

?為什么Sora更勝一籌?OpenAI并沒有公開技術(shù)真正的內(nèi)部運(yùn)作,但基于一些公開技術(shù)報(bào)告,可以從中一瞥其創(chuàng)新秘訣。

?明顯的是,Sora借鑒了ChatGPT和DALL-E的關(guān)鍵技術(shù)經(jīng)驗(yàn):它將視頻分割成同等大小的“補(bǔ)丁”片段,類似于ChatGPT訓(xùn)練模型時(shí)用的“令牌”。這些片段可以像搭積木一樣,重新排列,創(chuàng)建新的視頻,是視頻生成更為高效和靈活。

?它還基于DALL-E-3的擴(kuò)散模型,把嘈雜的、不完整的數(shù)據(jù),通過一系列反饋循環(huán)和預(yù)測計(jì)算,轉(zhuǎn)換成清晰、連貫的視頻內(nèi)容。比如,為了做出一只正在玩耍的狗,AI會(huì)將無意義,模糊的點(diǎn)陣圖(充滿了技術(shù)噪音)變成了看起來真實(shí)的狗(“干凈”的輸出)。

Sora也和其它生成式人工智能模型一樣,使用了變形器技術(shù)(Transformer,也就是ChatGPT中最后一個(gè)字母T的意思),并使用復(fù)雜的數(shù)據(jù)分析技術(shù)來處理海量的數(shù)據(jù),辨別最重要的和最不重要的部分,并找出不同數(shù)據(jù)塊之間的上下文和關(guān)聯(lián)。此外,Sora還會(huì)為訓(xùn)練視頻幀添加高度精細(xì)的字幕,幫助進(jìn)一步修正視頻。

Sora結(jié)合深度學(xué)習(xí)、自然語言處理和計(jì)算機(jī)視覺,不斷跟真實(shí)現(xiàn)實(shí)比較,它的訓(xùn)練基礎(chǔ),是數(shù)百萬個(gè)真實(shí)視頻,使得它可以從現(xiàn)實(shí)世界中學(xué)習(xí)并理解視頻的“語言”。

Sora的推出,很快在股市上產(chǎn)生了悲喜結(jié)果。圖像制作軟件巨頭Adobe的股價(jià)在Sora發(fā)布后暴跌7%。主要受益者則是為OpenAI等模型提供核心計(jì)算芯片的英偉達(dá)。

其近期發(fā)布季度財(cái)報(bào)后,股價(jià)上漲了16%,相當(dāng)于市值增加了2730億美元。

傳播公司EEAGLI制作的一段英偉達(dá)與英特爾股價(jià)比較的視頻顯示,受新冠疫情導(dǎo)致居家辦公、游戲和疫苗研發(fā)需求高漲,英偉達(dá)股價(jià)此后開始反超英特爾,雖然隨后受通脹等原因下降,但很快又憑借OpenAI的ChatGPT熱潮再度快速高漲,成為當(dāng)前科技領(lǐng)域名副其實(shí)的領(lǐng)軍者兼最佳股票。

凜冬將至的電影工業(yè)

如同當(dāng)初ChatGPT一度震撼各行各業(yè),Sora的問世同樣吸引了諸多領(lǐng)域的密切關(guān)注。

人們首先想到的是電影制作。好萊塢去年發(fā)生的罷工事件,已經(jīng)顯示了創(chuàng)意產(chǎn)業(yè)對(duì)ChatGPT取代他們工作的深度焦慮?,F(xiàn)在,輪到電影制片人和特效制作公司坐立不安了。

一些人已經(jīng)迅速反應(yīng)。好萊塢演員、制片人Tyler Perry在Sora推出后,立即宣布,暫停8億美元的工作室擴(kuò)張計(jì)劃。

整體上,長片受到的直接影響可能有限。目前的Sora視頻只長至一分鐘,而每次用類似的提示詞生成視頻,AI生成結(jié)果都不盡一致,因此,是很難把60個(gè)短視頻拼成一部連貫的長電影的。

盡管如此,動(dòng)畫領(lǐng)域可能會(huì)感到不安。此前,皮克斯公司最引以為豪的,是耗費(fèi)數(shù)月和大量人力資源制作出來的精細(xì)動(dòng)畫細(xì)節(jié),如人和動(dòng)物有著超復(fù)雜紋理的毛發(fā),而現(xiàn)在,Sora幾秒鐘就能制作出同等精美的效果。

國際動(dòng)畫電影協(xié)會(huì)好萊塢分會(huì)臨時(shí)執(zhí)行主任Aubry Mintz對(duì)媒體表示,如果Sora開始用于參考動(dòng)畫、概念制圖和故事板,一些專業(yè)人士有可能會(huì)失業(yè)。但他同時(shí)表示,從CGI到計(jì)算機(jī)動(dòng)畫軟件,好萊塢經(jīng)歷了很多次技術(shù)進(jìn)步,它應(yīng)該也能從人工智能創(chuàng)新中幸存下來。“它們(AI)無法復(fù)制人類的創(chuàng)造性思維,也無法做出創(chuàng)造性決定,這是人類藝術(shù)家們幾個(gè)世紀(jì)以來一直在做的。”

事實(shí)上,最先釋放出巨大創(chuàng)意潛力的,很可能是短視頻領(lǐng)域。根據(jù)OpenAI官方介紹,除了文字轉(zhuǎn)視頻之外,它同樣具備從靜態(tài)圖像轉(zhuǎn)化為視頻的能力,因此,今后,創(chuàng)意人士除了用提示詞外,還可以將自己創(chuàng)作的圖畫,通過AI轉(zhuǎn)化為視頻,這開啟了個(gè)人創(chuàng)作全新的可能性。

人工智能電影制作組Curious Refuge對(duì)媒體表示,迫不及待地想要使用這款工具了。

一旦Sora對(duì)外開放,最先開始采納的,很可能是短視頻博主和制作商,會(huì)出現(xiàn)一大批充滿創(chuàng)意的人工智能合成視頻。另一個(gè)帶來機(jī)遇的是廣告和營銷領(lǐng)域,ChatGPT已經(jīng)成為了營銷工具的一部分,Sora也很可能會(huì)很快為廣告設(shè)計(jì)、營銷活動(dòng)制作出吸引眼球的視頻內(nèi)容。

教育培訓(xùn)機(jī)構(gòu)也很可能從中受益,相關(guān)公司可以利用Sora開發(fā)出針對(duì)特定主題和場景的教育和培訓(xùn)視頻,增強(qiáng)學(xué)員的學(xué)習(xí)體驗(yàn)---例如,想象帶孩子進(jìn)入AI制作的逼真的史前世界,或戰(zhàn)火紛飛的二戰(zhàn)現(xiàn)場中講解古生物和歷史。

AI視頻未來還可以應(yīng)用于各類動(dòng)態(tài)商品演示,給電子商務(wù)、零售商、網(wǎng)絡(luò)帶貨等行業(yè)帶來全新的商品展示模式。比如,AI視頻可以用于虛擬試穿,讓顧客可以直觀看到新衣服穿在身上的效果,這就大大減少了網(wǎng)購帶來的不確定性。

《紐約時(shí)報(bào)》的起訴與備受期待的新法律框架

對(duì)視頻生成工具被濫用的擔(dān)憂從技術(shù)誕生第一天起便存在。高仿真的視頻內(nèi)容,會(huì)以假亂真,傳播錯(cuò)誤的,危險(xiǎn)的信息,以“深度仿造”的形式破壞社會(huì)結(jié)構(gòu),給個(gè)人帶來災(zāi)難。此前,就出現(xiàn)了過將名人嫁接到色情明星身上或仿造政客言論等虛假視頻,使得傳播這些視頻的社交媒體廣受批評(píng)。

現(xiàn)在,Sora生成視頻的逼真程度再次引發(fā)擔(dān)憂,其一旦被社會(huì)濫用,后果可能甚為不堪。因此,Sora也十分謹(jǐn)慎。目前尚未對(duì)公眾開放(只針對(duì)少數(shù)一些進(jìn)行風(fēng)險(xiǎn)測試的人員,以及特定的視覺藝術(shù)家和電影制片人開放),OpenAI也沒有說明何時(shí)開放。

根據(jù)OpenAI的說法,要達(dá)到正式對(duì)外開放的程度,需要設(shè)置一些安全防護(hù)措施,比如無法生成極端暴力、色情、仇恨畫面或名人肖像的視頻。OpenAI也可能計(jì)劃在Sora視頻中加入源數(shù)據(jù),表示這些視頻是人工智能生成的,從而防止視頻濫用。

對(duì)于Sora多大程度上具有革新意義,現(xiàn)在的各類討論也很多。很多人震驚于視頻逼真程度的同時(shí),人工智能專家也再一次看到了AI的本質(zhì)局限。《華爾街日?qǐng)?bào)》邀請(qǐng)的AI專家表示,仔細(xì)看,Sora發(fā)布的這些逼真視頻,充斥了很多物理上,或常識(shí)上說不過去的地方。

當(dāng)對(duì)象是人的時(shí)候,總有一些地方讓人憑直覺,感覺到奇異之處。比如燒意大利菜的老奶奶,她揮手的動(dòng)作,就顯得很奇怪,真人不會(huì)這樣揮手。

場景視頻也有很多細(xì)節(jié)錯(cuò)誤。如模仿無人機(jī)拍攝的意大利海邊城市的視頻,波浪向外而非向岸邊推動(dòng),違反了物理常識(shí)。此外,上面的一些臺(tái)階也突然中斷,顯示AI只是把各種不同視頻中的臺(tái)階摘錄過來,但并沒有按照常識(shí)將其連接到建筑上。

而引發(fā)贊譽(yù)的淘金熱時(shí)期仿古膠卷,專家指出,里面并列著來自不同歷史時(shí)期的建筑,而且,視頻中人和馬順著右邊按秩序走路,完全是現(xiàn)代馬路的交通規(guī)則,在古時(shí)是不存在的。視頻中也存在馬走著走著就消失了的情況。而在東京街景的畫面中,也出現(xiàn)馬路上的汽車開著開著就消失了的情況。

OpenAI也公開承認(rèn),模型在因果關(guān)系、混淆左右、遵循軌跡等方面還存在問題,也“沒有準(zhǔn)確模擬許多基本交互等物理過程“。

這些問題,在兩年前靜態(tài)圖像模型大紅大紫的時(shí)候,也都出現(xiàn)過。當(dāng)時(shí),就有人批評(píng)這些靜態(tài)圖像笨拙、呆板、缺乏人性,有的還存在明顯缺陷。有人工智能專家認(rèn)為,AI無法處理“構(gòu)圖性“,不知道如何組成場景元素,這反映了人工智能技術(shù)的根本缺陷。

此后,DALL-E3和Midjourney的靜態(tài)圖像生成的確得到了很大的進(jìn)步,對(duì)場景元素的處理更為逼真,更少出現(xiàn)邏輯錯(cuò)誤。因此,Sora很可能也會(huì)快速,很可能不遠(yuǎn)的一天,至少對(duì)于大眾而言,真的會(huì)出現(xiàn)真假難辨的那一刻。

一個(gè)重要挑戰(zhàn),是版權(quán)問題。OpenAI方面表示,訓(xùn)練數(shù)據(jù)來自授權(quán)內(nèi)容和公開內(nèi)容,但已經(jīng)有知識(shí)產(chǎn)權(quán)持有者在質(zhì)疑,這數(shù)百萬訓(xùn)練視頻中,到底有多少是“公開內(nèi)容”了,模型有可能在不經(jīng)意中使用的視頻侵犯了現(xiàn)有版權(quán)。

OpenAI本身已經(jīng)因版權(quán)侵犯和知識(shí)產(chǎn)權(quán)問題多次遭到了起訴。去年,《紐約時(shí)報(bào)》就其數(shù)百萬篇文章被侵權(quán)用于訓(xùn)練ChatGPT,而將OpenAI和微軟告上法庭,該案的最終判決結(jié)果將定義人工智能生成技術(shù)與知識(shí)產(chǎn)權(quán)關(guān)系的新法律框架。去年,OpenAI向英國上議院承認(rèn),如果不使用受版權(quán)保護(hù)的資料,就不可能訓(xùn)練出當(dāng)今領(lǐng)先的人工智能模型。他們?cè)谧约旱牟┪闹袨樽约恨q護(hù),稱紐約時(shí)報(bào)的訴訟“毫無根據(jù)”,該公司稱,如果無法獲取受版權(quán)的資料,人工智能的發(fā)展將是“不可能”的。

這一說法激怒了一些業(yè)內(nèi)人士。著名的人工智能批評(píng)家Gary Marcus對(duì)此寫道:“簡略翻譯就是:你如果不讓我們盜竊,我們就不會(huì)暴富,所以請(qǐng)不要讓盜竊成為犯罪……當(dāng)然,網(wǎng)飛公司可以一年支付數(shù)十億美元的許可費(fèi),但‘我們’不應(yīng)該也這樣!”

在另一篇文章中,Marcus寫道:“四十年前,當(dāng)我開始研究人工智能時(shí),我根本沒有想到它最大的用途,竟然是衍生模仿,并把藝術(shù)家和其它創(chuàng)作者的價(jià)值轉(zhuǎn)移給巨型企業(yè)。“

不管如何,潘多拉的盒子已經(jīng)打開。AI生成的視頻最終將全面滲透到我們的生活中。它究竟會(huì)如何改變我們的社會(huì),會(huì)產(chǎn)生怎樣正面抑或負(fù)面的影響,更多取決于技術(shù)之外的因素,特別是人工智能行業(yè)如何設(shè)計(jì)規(guī)則,規(guī)范自己,并與版權(quán)所有者、創(chuàng)意人士以及監(jiān)管機(jī)構(gòu)等實(shí)現(xiàn)共贏共治的程度。

附錄:AI視頻生成競爭者

 

雖然一鳴驚人,但Sora也并非沒有競爭者,事實(shí)上,它很可能帶動(dòng)一大波視頻生成技術(shù)企業(yè)。

 

● 紐約的初創(chuàng)公司Runway早于Sora進(jìn)入市場,它得到了谷歌和英偉達(dá)的支持,在Sora推出前剛剛推出了人工智能視頻模型的第二代版本,并對(duì)公眾開放;

 

● 在圖像生成領(lǐng)域知名的Stability AI也在去年11月推出了視頻生成模型Stable Video Diffusion,目前尚處于研究階段;

 

● Pika Labs也是一家具有競爭力的公司,去年底推出了視頻生成工具Pika1.0,向所有人開放;

 

● Meta也有類似的工具,名為Emu Video,其很可能被整合到臉書和Instagram中;

 

● 此外,上個(gè)月,谷歌也發(fā)布了它的文字視頻版本,名為Lumiere,目前尚不清楚谷歌何時(shí)公開此工具。

 

 

本文轉(zhuǎn)自于   新浪熱點(diǎn)

以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“才匯云網(wǎng)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
0條評(píng)論
評(píng)論