亚洲欧美色一区二区三区,日韩欧美国产v一区二区三区,精品久久久久久综合日本,jap,免费观看片,2020每日更新国产精品视频

思杰拓才匯云

我們也許都將在數字世界里得到「永生」

我們也許都將在數字世界里得到「永生」

 


計算機圖形學:構建惟妙惟肖的數字世界

?
未來的我們,可能「活」在兩個世界里。

?
一個是我們早已習慣的現(xiàn)實世界;另一個是曾經在我們對面、供我們?yōu)g覽的互聯(lián)網世界,我們將「身臨其境」。比如,身處異地的兩個人在虛擬世界里見面,會感覺像在現(xiàn)實中見面一樣。如果你坐在我的右邊,「當你說話的時候,聲音就從我的右邊傳來」。或者,「你將能夠作為全息圖坐在我的沙發(fā)上,或者我將能夠作為全息圖坐在你的沙發(fā)上」。

?
周昆對這個未來充滿期待。他46歲,是浙江大學計算機科學與技術學院教授、「科學探索獎」獲獎人,一直專注于計算機圖形學、虛擬現(xiàn)實及相關領域的研究。從大學三年級第一次進實驗室算起,周昆在計算機圖形學領域已經工作了近30年。

?
一方面是個人情感層面的期待,在越來越逼真的數字世界里,計算機圖形學將是支撐其發(fā)展的關鍵技術,這意味著他和他的同行將得到一個更大的舞臺。另一方面,他相信,在未來,數字世界會變得越來越豐富,也越來越重要,數字世界與現(xiàn)實世界將發(fā)生越來越深的融合,它們相互滲透,彼此影響。

?
周昆不愿過于具體地預測未來,「不同的人有不同的視角,我可以想象未來是一個什么樣子,但你不見得會認同」,但有一點他很篤定:3D創(chuàng)作將會成為核心內容。就像PC(個人計算機)互聯(lián)網有文字和圖片,移動互聯(lián)網有短視頻,新世界里將會有3D內容創(chuàng)作。到那時,普通用戶通過簡單的描述就可以創(chuàng)作出屬于自己的動畫,就像現(xiàn)在發(fā)微博和制作短視頻一樣簡單。

?
關于這一可能的未來,三維虛擬現(xiàn)實和增強現(xiàn)實領域的法國計算機科學家給出過更具體的細節(jié),他們在2017年出版的書里想象,2027年9月6日,21歲的大學生瑪麗(虛構人物)的一天是這樣度過的:

?
早上醒來第一件事是戴上配有傳感器系統(tǒng)和顯示系統(tǒng)的隱形眼鏡,然后穿上「高科技」衣服,它可與米粒大小的體內微型計算機通信。她有晨跑鍛煉的習慣,穿戴完畢后便走到家中的「鍛煉區(qū)」,開始與幾位朋友「一起」晨跑。盡管他們的「肉身」都在各自家中,但他們的數字分身「相聚」在了虛擬世界里的挪威峽灣,在這里,他們可以像在現(xiàn)實世界里一樣隨意交談,也可以看到彼此的狀態(tài)好壞,甚至能夠傾聽彼此的呼吸。

?
到學校后,上課用的也是一套專門的設備(就藏在座椅的扶手里),學生們通過它進入虛擬世界,虛擬世界里的教學方便學生「更好地理解某些復雜的概念」。實驗課上,解剖用的人體頭部模型是數字化的,但看起來像真的一樣,學生也能「觸摸」到;練習網球時,「她的隱形眼鏡會顯示她發(fā)球的圖像、球的軌跡以及球與網的碰撞,這樣她就可以完全沉浸在訓練中」;電視劇不再有固定的情節(jié),「任何人都可以隨意進行選擇或混合」,「一千個人眼里有一千個哈姆雷特」不再僅停留在審美和理解的差異層面,而著實成了客觀事實。

?
這樣一個新世界的搭建,離不開計算機圖形學。

?
如果將虛擬現(xiàn)實比作人,那么計算機圖形學所做的,就相當于在構建虛擬現(xiàn)實的「肉身」(人工智能相當于在構建虛擬現(xiàn)實的「靈魂」)。就像畫家用畫筆和顏料將他們看見和想象的三維世界轉化為畫紙上的二維世界,計算機圖形學是用算法將三維世界轉化到計算機屏幕上。一言以蔽之,周昆和他計算機圖形學的同行們做的工作,便是通過算法創(chuàng)造一個數字化的世界。

?
計算機圖形學的起點是伊萬·薩瑟蘭(Ivan Sutherland)在1963年完成的交互式繪圖系統(tǒng)「畫板」——這符合我們對「計算機圖形學」的直觀印象——它最初的確就是研究如何用計算機顯示圖形,但它也像整個計算機科學一樣,不斷地在往更復雜、更高效和更智能的方向發(fā)展。現(xiàn)在,像《阿凡達》《玩具總動員》《少年派的奇幻漂流》這樣的電影,以及畫面越來越逼真的游戲,都有計算機圖形學的重要貢獻。從一個計算機科學家的視角看,幫助導演創(chuàng)造出電影里栩栩如生的角色和環(huán)境,以及未來可能的全真互聯(lián)網所需要的更為復雜的計算機圖形學技術,與當初薩瑟蘭寫出「畫板」程序并無本質的不同。它們都是在將現(xiàn)實世界數字化,背后的支撐力都是算法與計算。

?
對普通公眾來說,計算機圖形學研究者的工作通常具有雙重色彩。一方面——如果延展開來討論的話——他們的工作很有科幻感,很「酷」;另一方面,他們的日常對普通人來說是枯燥乏味的,他們每天打交道的都是很具體的一個個問題和一堆外行人看不懂的公式、算法。他們與「科幻」的關系更多在于,他們的工作提示著我們的未來,他們是我們通往「數實共生」之路的鋪路人。

 

「螞蟻」的革命

?
不過,計算機圖形學研究者的樂趣,往往不來自于對未來的宏觀構想。算法及其所附著的東西——高深也好,枯燥也罷——才是他們真正的樂趣所在。

?
「我可以不停地去探索一些未知的東西,現(xiàn)在沒有人能做出來的東西。這肯定是一個很新奇的(體驗)?!怪芾フf。

?
周昆很懂這當中的樂趣。比如,他提出的基于單幅圖像的真實感頭發(fā)建模、數字化身構建技術,已經授權給包括迪士尼、歐萊雅在內的全球1000多家企業(yè);他提出的紋理映射的網格參數化方法也被游戲產業(yè)廣泛采用......「很多這樣的例子」。

?
計算機圖形學的表達早已融入了我們的生活。「桌面」「圖標」「窗口」,我們在使用個人計算機時早已習以為常的操作,其實都是通過圖形來進行的。20世紀80年代之后,開始有了「真實感圖形繪制」的研究,到了周昆入行時的90年代下半葉,「實時計算機圖形學」誕生,而2010年以后,「智能圖形學」興起了。

?
計算機科學技術的迭代往往是需求觸發(fā)的,計算機圖形學需要解決的核心問題常常是,如何讓虛擬世界更逼真?越逼真,意味著需要的數據量越大,那如何解決計算速度問題?「真實感圖形繪制」「實時計算機圖形學」都致力于解決真實感和計算效率協(xié)同的問題。

?
近些年,隨著人工智能的再次興起以及深度學習等技術的發(fā)展,圖形學的智能化也成為研究者關注的議題。它研究的是,在創(chuàng)造虛擬世界的這個領域,如何讓機器代替(至少是部分代替)人的工作??茖W研究的路上總擺著各種問題,關鍵問題總是格外醒目。

?
但選擇什么問題去解決,能最先解決什么,以及解決的方式是否巧妙、簡潔和優(yōu)雅,這是將科學家以及他們的研究區(qū)分開來的核心要素。

?
在周昆看來,選問題在科研工作中「可能是最重要的」,「你到底要解決一個什么問題,這個到后面可能是你的品位問題」。周昆的研究習慣是先選定一個「大的問題」,然后接下來5~10年都圍繞著這個問題去開展研究?!复蟮膯栴}」意味著它是一個系統(tǒng)工程(當然,從整個學科的角度看,它依然是一個「點」),解決它的過程中要解決和突破一系列的問題。

?
以周昆和他的團隊于2009年開發(fā)的RenderAnts為例。RenderAnts是完全在GPU上運行的電影渲染系統(tǒng),首次實現(xiàn)了將電影渲染流水線的所有階段映射到GPU上運行。當時,工業(yè)界廣泛使用的渲染工具是RenderMan,由皮克斯研發(fā),《阿凡達》《玩具總動員》這些我們耳熟能詳的電影都是用RenderMan做圖像渲染的。同樣的渲染效果,周昆團隊開發(fā)的RenderAnts,速度是RenderMan的10倍以上。

?

?RenderAnts就來自周昆于2008年剛從微軟亞洲研究院回到母校浙江大學的時候選定的一個「大的問題」——如何在GPU上做電影渲染。這是當時同行們普遍關注的待解難題。

?
這里先簡單介紹一下「渲染」。電影或游戲里的動畫場景呈現(xiàn)在觀眾面前之前,一般需要經歷五道主要的工序(計算機的行話叫pipeline,中文翻譯為「管道」或「流水線」):建模(modeling),動畫(animation),渲染(rendering),交互,后處理。

?
這五道工序,通俗地講,建模與動畫都是創(chuàng)建「骨架」,只不過一個是靜態(tài)模型,一個是動態(tài)模型;渲染是添加紋理、陰影等更多的細節(jié),讓它成為我們最終看到的樣子;交互,就是增加互動功能;后處理則相當于文章發(fā)布之前的編輯和圖片發(fā)布之前的處理。很多研究者會待在其中的一兩個領域,周昆對五個領域都有涉獵。

?
在RenderAnts出現(xiàn)之前,電影渲染都是基于CPU的。CPU服務于通用計算,GPU則是因圖形處理這一特殊目的而發(fā)展起來的專用處理器。二者的區(qū)別,從周昆為他的軟件取的名字RenderAnts與皮克斯的RenderMan之間的對比可以看出來:RenderMan在CPU上進行的串行計算像是一個超人獨自作戰(zhàn),而RenderAnts在GPU上進行的并行計算則像是很多個小螞蟻一起協(xié)同作戰(zhàn);超人擅長復雜的計算,小螞蟻只能做簡單的計算。

?
如果面前是海量的簡單計算,顯然小螞蟻一起工作,要比超人效率更高。GPU一般進行的計算都屬于此類,即「規(guī)則數據結構的規(guī)則運算」,但電影渲染涉及的是復雜的計算,是「不規(guī)則數據結構的不規(guī)則運算」。到了2007年前后,隨著GPU的發(fā)展成熟,一個問題就出現(xiàn)在了研究者面前:如何讓電影渲染也搭上GPU的效率便車呢?

?
GPU效率高,但在GPU上做「不規(guī)則數據結構的不規(guī)則運算」需要強行把不規(guī)則的東西變成規(guī)則的,這當然是要付出代價的,問題的核心是,如何以盡可能低的代價實現(xiàn)這種「映射」?

?
研發(fā)RenderAnts的過程,用周昆的話說,便是「逢山開路,遇水搭橋」。數據結構的問題要解決——這些不規(guī)則的數據結構,怎么在GPU里構建和訪問?算法的問題要解決——比如說,一道光線,照到物體表面會發(fā)生反射,有時可能還會發(fā)生二次反射,這一類的不規(guī)則計算如何「映射」到GPU上?還有編程和調試的問題,在GPU上寫程序并不是一件容易的事,現(xiàn)有的編程語言和調試程序都「不好用」,「效率太低」,那就只能自己去開發(fā)GPU的編程語言和調試工具,這就好比搭橋之前還要自己去制造搭橋的工具。

?
現(xiàn)在回過頭看,RenderAnts對周昆來說是一個「集大成」的工作,多個不同細分領域的研究經驗都用得上,并且產出了「副產品」。他和他的團隊在向RenderAnts進發(fā)的過程中,「順便」做出了兩項開創(chuàng)性工作:提出了新的GPU并行算法和更高效的編程語言,「讓GPU程序像串行C語言程序一樣易于閱讀、編寫和維護」。這有些像一個人出發(fā)去尋找寶藏,旅途中,他做生意賺了錢,買了越野車,還在阻攔去路的河上修了橋,當他解決沿路所有難題找到寶藏的時候,那價值連城的寶藏倒更像是一項水到渠成的嘉獎了。

?
尋寶的路上修了一座橋,這個比喻如果用到整個計算機圖形學領域也是合適的。除了像電影渲染、數字人這樣的常規(guī)研究領域,計算機圖形學還有一些衍生的「領地」。比如,基于GPU的通用計算。盡管GPU最初是為圖形處理而生的,但后來人們發(fā)現(xiàn)它擅長大規(guī)模的數據并行計算(很多小螞蟻一起協(xié)同作戰(zhàn))的優(yōu)勢可以為其他領域所用。深度學習(deep learning)就從GPU的發(fā)展中受益良多,如今絕大多數的深度學習系統(tǒng)訓練和實時運轉都需要用到GPU。于是,基于GPU的通用計算也逐漸演變?yōu)橐粋€成熟的研究課題和領域。

 

 

行走在兩個世界之間

?
計算機圖形學不斷演化,涉足的「領地」越來越多,周昆自己的研究也是。2005年的時候,他做過一個研究,是用計算機生成有豐富紋理圖案的數字模型。10年后,他開始研究如何打印出有豐富紋理圖案的實物模型了。

?
2015年,周昆的團隊發(fā)明了一種名為「計算水轉印」的技術,盡管這不屬于他所說的那種「大的問題」,但他很喜歡這個「有特色」的「小」項目,它的產生與產業(yè)發(fā)展、「技術的夢想」無關,而是源于平日「零零散散的靈感」。生活常常是靈感的來源,而計算機圖形學幾乎就是周昆生活中最主要的方法論。碰到一個新玩意兒,他第一個念頭經常是,能不能使用計算機圖形學的方法將它變?yōu)椤缚捎嬎愕摹梗苛曇詾槌5臇|西說不定也會觸發(fā)靈感的開關,比如有天他突發(fā)奇想:人類的發(fā)聲過程可不可以拆解,用計算機模擬出來?從胸腔到口腔到鼻腔,可不可以為聲音產生和傳播的過程建立一個可計算的模型?如今的計算機圖形學早已不只與「圖形」有關,它涉及整個虛擬環(huán)境的構建,比如在游戲里,除了有畫面,還有聲音,其中的畫面和聲音都屬于周昆的研究范疇,背后的研究方法也都是相通的。

?
計算水轉印這個題目源于他偶然看到的一個視頻。視頻介紹的是一個有幾十年歷史的傳統(tǒng)工藝——水轉印。他的方法論又登場了:能不能用計算機圖形學改進這個傳統(tǒng)工藝呢?

?
水轉印目前廣泛應用于汽車、家具,以及各類電子產品表面的著色環(huán)節(jié)。它的基本工序是:先將圖案打印到一張高分子水轉印膜上;然后將膜放到溫水里,作為載體的高分子膜在水中溶解后,作為承載物的圖案(顏料)會在水面形成一層黏稠的薄膜;最后將需要著色的物體浸入水里,圖案便附著在物體表面了。這是一個利用物理和化學規(guī)律進行的巧妙設計,但它有個很大的缺陷:水轉印的過程是手工操作完成的,它只在圖案不需要與物體表面位置精確對應著色的情況下適用,如迷彩、大理石和木紋等圖案。

?
周昆用半年時間實現(xiàn)了他的想法,發(fā)明了計算水轉印技術。它的核心突破在于,通過設計算法,將設計師的三維設計圖「降維」為打印機可以制作的二維「展開圖」,并對水轉印過程中水轉印薄膜的形變進行物理建模,進而得到三維設計圖與膜上的每一個點的映射關系,實現(xiàn)了「瞄準」,這樣一來,手工操作的偏差就被避免了,因此計算機水轉印又被稱為「三維曲面精準著色技術」。

?
計算水轉印技術發(fā)布后,它極具想象力的應用前景吸引了上百家企業(yè),產業(yè)界希望周昆團隊能繼續(xù)研究和完善這項技術,讓它真正實現(xiàn)產業(yè)化——周昆自己也很想做這件事,不過由于缺乏合適的團隊,加之自己精力有限,這件事直到現(xiàn)在還被擱置著。

?
計算機水轉印這個「小」技術,不僅震動了工業(yè)界,還清晰地提示出,計算機圖形學不光關乎如何創(chuàng)建一個更逼真的數字世界,還涉及「逆反應」,即從數字世界回到現(xiàn)實世界,這里也有許多工作可以做。計算機圖形學創(chuàng)建的虛擬世界除了可以直接觀看和使用,還可以成為虛擬實驗室,目前商場裝修和自動駕駛已經在使用這項技術了。商場發(fā)生火災如何疏散,自動駕駛的安全性如何,這些都很適合用仿真測試,而測試的準確性正與虛擬環(huán)境的逼真度有直接關系?!改銊?chuàng)建了一個足夠逼真的數字模型以后,就能夠服務于真實場景的很多仿真。某種意義上來講,它其實是站在更高層級上——你已經開始具備一個可以自己運作的世界,它可以幫助你(進行)很多的認知和決策。」周昆說。

?
在日復一日的工作中,周昆逐漸明確,計算機圖形學研究者「就是在這兩個世界之間」行走的人,他們一直不輟思考,兩個世界之間該如何「互相轉化,互相影響」?
 


「永生」

?
受限于計算能力,虛擬世界往往只是現(xiàn)實世界的一種近似。近似,意味著很多細節(jié)被忽略和舍棄了。從某個角度來說,計算機圖形學的發(fā)展是一個將曾經被忽略和舍棄的細節(jié)重新加以考慮的過程。正是從這個角度來說,虛擬的世界會越來越「真實」,無論是視覺效果還是人在其中的體驗?!柑摂M現(xiàn)實」的英文詞「virtual reality」中的virtual本意是「幾乎像真的一樣」。澳大利亞哲學家、認知科學家大衛(wèi)·查默斯(David Chalmers)在他的《現(xiàn)實+:每個虛擬世界都是一個新的現(xiàn)實》中預測:「在一個世紀內,我們將創(chuàng)造出與真實世界難以區(qū)分的虛擬現(xiàn)實?!?/span>

?
目前,周昆及其團隊的一個工作重點是「新一代三維數字化技術」的研究。所謂「新」,其實就是運用最新的技術成果,采用新的思路,讓「人」「物」「景」的數字化更加逼真。就拿「物」來說,原先只考慮物體的幾何形狀,現(xiàn)在物體表面的「流光溢彩」也必須被考慮進來。

?
計算機圖形學的研究成果以一種非常直觀的形式體現(xiàn)在電影和游戲之中。在20世紀六七十年代,出現(xiàn)在電影中的動畫真的只是一些可以動的畫面,比如在1977年的《星球大戰(zhàn)》中,反叛軍訓練用的3D動畫只是一些由線條組成的(可以動的)示意圖,與現(xiàn)實中的真實場景毫無關系。但到了30多年后,《阿凡達》中的一切都變得栩栩如生;《少年派的奇幻漂流》也是如此——你幾乎很難想象里面讓人恐懼的老虎、波瀾壯闊的大海都是計算機圖形學的產物,飾演主角派的蘇拉·沙瑪面前實際上只有一個21米長、7米寬、1.2米深的大水槽和只存在于想象中的老虎。游戲也是類似的,最初只有一些像《俄羅斯方塊》這樣的簡單游戲——簡單的圖形,簡單的移動方式,而如今,很多游戲的畫面都像制作精良的高品質電影,「幾乎像真的一樣」。

 

增強現(xiàn)實也是周昆很感興趣以及接下來想探索的一個方向。虛擬現(xiàn)實是在現(xiàn)實世界之外另造一個以假亂真的現(xiàn)實,而增強現(xiàn)實則是在現(xiàn)實世界之中「嵌入」虛擬的事物。這是從另一個方向模糊現(xiàn)實與虛擬之間的界限。

?
這在商業(yè)上會很實用,比如,在一個已經制作完成的真實拍攝的視頻里,任意植入A品牌、B品牌、C品牌......的動畫廣告,這樣一來,已經被電商網站廣泛使用的「千人千面」將會出現(xiàn)在我們看到的視頻里。從觀眾的角度看,「真」與「假」的界限消失了,看似真實拍攝的視頻里面,混進了一些虛擬的畫面,而我們毫無察覺。周昆預測,未來5~10年,這方面的技術可能會有一個突破性的進展。

?
在周昆看來,同樣會在不遠的將來有突破性進展的是數字化身。他覺得,也許5~10年后,每個人都有一個數字化身,就像互聯(lián)網上每個人都有ID一樣。它也許會成為新的個體記錄的方式,就像全家福、個人寫真甚至家譜曾經發(fā)揮的作用一樣。

?
「我其實對『人』這件事情感興趣的程度,要超過對『物』『景』感興趣的程度。我覺得這可能是人性的追求,因為人總想追求永恒,這個是比較深層次的(話題)。」周昆說。從某種意義上講,在未來,人類期待的「永生」也許會以數字化身的形式實現(xiàn)。目前,「數字永生」已經以一種尚顯初級的方式進入少數人的現(xiàn)實生活。2020年,美國知名女星金·卡戴珊收到了一份特別的40歲生日禮物,她的丈夫找到一家視覺制作公司,花了一個多月的時間為她已故的父親制作了一個「全息影像」。視頻中,與父親神似的數字人回憶了他們一起的時光,對卡戴珊說了一堆贊美和祝福的話,就像他仍然活著、在為她錄生日祝福視頻一般。卡戴珊和家人們「懷著深情看了一遍又一遍」。

?
只是,目前的數字化身還需要發(fā)展更多的「心智」(否則只是看起來像真人而已),以及更高的效率、更低的成本。前者是人工智能研究者的工作范疇,以ChatGPT為代表的語言大模型技術代表了當前的最新發(fā)展趨勢。后者則是周昆的工作。他接下來正想在這一方面有所突破,他想讓制作數字人這件如今成本高昂、耗時漫長的事情變成一個普通人可及的日常行為——「我在手機上拍一些照片,之后我就可以做一個非常逼真的數字人出來」。

?
無論是數字化身還是虛擬世界,本質都是人類為(某種程度上)突破現(xiàn)實限制所做的努力??v觀人類的歷史,人類一直走在通往「虛擬」的路上,并且越走越遠:從早期的小說、戲劇到19世紀末出現(xiàn)的電影,再到如今的互聯(lián)網、游戲、虛擬現(xiàn)實,以及未來可能出現(xiàn)的全真互聯(lián)網......即便是虛擬現(xiàn)實,這一想法也可以追溯到6個世紀前。1420年,一位意大利工程師就在他名為《戰(zhàn)爭器械之書》(Bellicorum instrumentorum liber)的書里描述了一種「可以將圖像投射到房間墻壁上的魔燈」——「讓人想起幾個世紀后由伊利諾伊大學的卡洛琳娜·克魯茲-涅拉等人開發(fā)的大型沉浸式系統(tǒng)CAVE」——那是一個人人都是「阿凡達」的世界。

?
這就是我們不可低估計算機圖形學的原因,因為其中可能藏著人類未來的密碼。不過——未來也許終將到來,但還不至于那么快(虛構大學生瑪麗的三位法國科學家可能過于樂觀了一些)。以真實世界為參照標準的話,目前的虛擬世界依然初級而簡陋。周昆承認,虛擬世界做到可以與真實世界的體驗和交互相媲美的程度,「非常困難」,有「很多的問題」尚待解決。但這也正是周昆和他的同行們的工作機會,他們正是解決問題的人。

 

楊國安對話周昆——未來的「人」,有自然人,有機器人,有數字人

楊國安 騰訊集團高級管理顧問、騰訊青騰教務長

周昆 浙江大學教授、「科學探索獎」獲獎人


楊國安:從物理世界到數字世界這方面,你的主要研究方向是什么,在突破什么東西?

?
周昆:我要把真實世界做成一個數字模型,這里面會涉及兩個問題:第一,是不是足夠逼真,按我們的說法是,真實感到底怎么樣?第二,你的整個算法或者你的軟件的性能到底怎么樣。真實感越強,計算越多、交互越多,所以真實感與性能是一對矛盾。如果我們不計代價和成本,這個事情可以做到什么程度呢?比如人的數字化,諸如好萊塢的工作室已經可以做得非常逼真了。英偉達的黃仁勛在2020年做過一個演講,這個演講實際上是把他家的廚房,甚至他本人全部數字化下來,現(xiàn)在這在技術上已經可以做到了,也就是逼真度現(xiàn)在可以做得很好了。(但)英偉達可能需要二三十個程序員花半年時間才能夠把它做得那么好。我們想要把這件事情簡單化,就是一個普通用戶用手機拍一些照片,通過這些照片他就可以做一個非常逼真的數字人出來,這是我們想要突破的一件事情。這件事情,現(xiàn)在技術上還做不到。

?
楊國安:聽起來你的努力方向——更加真實,算法更加高效,然后更自動化,更容易操作——普羅大眾都可以受益,但是模型,普通大眾應該搞不定吧,渲染也搞不定......

?
周昆:普通人不用去碰這個。過去計算機圖形學最典型的應用,一個是游戲,一個是電影。但是針對游戲和電影,我們做出的這些工具和算法,其實都是給藝術家用的。而現(xiàn)在,從技術的觀點來看,有點兒像騰訊之前提到的所謂「全真互聯(lián)網」這個概念:從PC互聯(lián)網,到移動互聯(lián)網,再往后發(fā)展,如果我們認為「元宇宙」「全真互聯(lián)網」是下一步的發(fā)展目標,那整個互聯(lián)網的內容形式,會從過去的文本加圖像,加視頻,發(fā)展到加3D的內容。不是說3D內容一定把圖像和視頻給替代掉,它是一個「+」的關系,不同形式的內容之間會相互轉化。為什么會相互轉化?想想專業(yè)的美術人員對一個場景的創(chuàng)作,他們用工具很辛苦地做出來。但是我們人的想象力是非常豐富的,比如從前有座山,山上有座廟,廟里有兩個和尚,山下有一條河......這樣一描述,其實你腦子里已經有了畫面。未來,我們希望普通人能夠具備這樣一個能力:只是去描述一些事情,然后動畫就能將這些全部構建出來。這是一個大的發(fā)展趨勢。

?
楊國安:每個人對山的樣子、想法都會有不同。

?
周昆:雖然我們腦子里面都會出現(xiàn)一座山,但是每個人想象的山都不一樣,那兩個和尚,大家想的也不一樣。不過我們覺得,從內容創(chuàng)作的角度來看,如果3D的內容是元宇宙的核心要素,那么一定要把工具和算法做到普通人就能夠用的水平,這樣才能創(chuàng)建出足夠多的內容。我講的3D是說它在計算里面有一個3D模型,但是最終呈現(xiàn)出來的,你看見的,還是視頻。深度學習給這件事情帶來的最大機會就是使得3D內容的創(chuàng)作,有可能做到互聯(lián)網這種體量和規(guī)模,只有做到這樣一個規(guī)模,才可能有足夠多的內容。我們以前看電影,比如說皮克斯的電影,它質量很高。電影把科學和藝術結合到頂尖水平,但是它的成本太高、周期太長;還有一點,每個人看的電影都一樣,它是沒有個性化的。內容要到互聯(lián)網規(guī)模和體量的話,一定要做到每個人都可以定制,像短視頻,每個手機用戶都可以隨手拍。就像以前圖像處理是有專業(yè)軟件的,這個軟件只能在PC端用,但后來處理圖像的企業(yè)把給人拍照這件事情做到最傻瓜。之前,視頻的各種專業(yè)后期處理編輯軟件也只能在PC端用,甚至要功能很強的PC才能用得很好,但現(xiàn)在有了短視頻剪輯軟件,就把這件事情做到了足夠簡單,就可以讓大家去創(chuàng)作很多內容。我們認為在3D的階段也是一樣的。

?
楊國安:你覺得技術上要多久才能夠實現(xiàn)簡單易行的3D創(chuàng)作?

?
周昆:我覺得這件事情至少還要5~10年,不過也看要做到多復雜。我們目前主要在單個的點突破,還沒有把它們連成線和面。我們講人、物、景,但最終還是需要把這些元素串起來,形成「故事」。就像好萊塢拍電影要有一個劇本,3D創(chuàng)作也是要想辦法到達故事層面的。要做一個通用的東西是很難,但是一些特定的場景,比如虛擬直播帶貨,可能就比較好做,一個主播,一些商品,再加上背景、一些互動,這是比較好設計的。但是如果到達一個通用的層面,這個事情就會非常有挑戰(zhàn)性。從我們的角度來講,技術一定會往通用的方向發(fā)展,但我們不會等到10年之后,(等所有的環(huán)節(jié)都成熟了)才真正應用,我們會探索在中間的某一些應用場景下,這個(「點」上的)技術是不是能夠真正用起來,所以我們會做一些兩到三年之內馬上就能應用的技術。

?
楊國安:通過一個簡單的描述就能創(chuàng)作一個虛擬的視頻,這也是在5~10年內能實現(xiàn)的嗎?

?
周昆:對于這個事情,我沒有那么樂觀。簡單地做總是可以做的,但是能做到大家的體驗很好,有很多的創(chuàng)作者都愿意去用,我覺得這個可能沒那么容易......這其實是現(xiàn)在非常熱門的一個研究方向,叫AIGC,就是人工智能生成內容?,F(xiàn)在AIGC做的就是,比如我描述「一個老人戴著一頂帽子」,敲這么幾個字,它就可以生成一個圖像,甚至很多圖像,圖像里面都是一個老人戴一頂帽子。但是到現(xiàn)在它也只是在圖像的范疇,如果描述動態(tài),比如說「這個人去喝水,站起身來走到門外,打開了燈」,你想要對此生成一段視頻,現(xiàn)在它還做不了。三維的模型,三維的場景,三維的動畫,那就更做不了了。

?
楊國安:從技術發(fā)展的角度,請你展望一下未來10年,虛實融合對我們的日常生活有什么樣的改變。

?
周昆:從技術化角度來看,我還是對元宇宙、全真互聯(lián)網這個概念——盡管是概念——充滿了期待,因為我覺得這里面3D內容的滲透會越來越深入。我覺得未來——不見得是10年——每個人的數字化身,甚至會像我們現(xiàn)在的身份證系統(tǒng)一樣。比如二三十年前,每到過年的時候,家里就要拍一個全家福,這實際上是對此刻的記憶;現(xiàn)在還有很多人會去拍寫真集,或者婚紗照,其實都是要去紀念這件事情,是一種留影,把這件事記錄下來。從我們做這個技術來看,數字化身是全息的記錄,不只是一個狀態(tài)的記錄,而是可以互動的。打個比方來說,這個時候的「我」可以全部被數字化,這個「我」是可以跟未來的「我」進行互動的。我的小孩十二三歲了,其實他三四歲的樣子,我的記憶已經很淡了,我們那個時候拍了很多照片、視頻,但實際上很少有機會去翻,數據量太大了,但如果把那個時候的孩子全息記錄下來,它能供我們之后隨時翻看,還能跟我進行互動對話,這會是非常了不起的事情。

?
楊國安:數字人這塊,將來(比如說5年后)技術比較成熟的話,大概是什么樣的應用場景?

?
周昆:我覺得有很多,泛娛樂、泛社交都會有。數字人是三維的、全息的,如果做得好,可能會變成類似于身份認證系統(tǒng)。因為在數字世界里面,人總歸是要有一個映射的,那么數字化身就是這個映射。除此之外,在未來的世界里面,我們覺得還會有很多不是對應到真實人的數字人。這些人可能就像現(xiàn)在的人工智能(產物),有點像助手,或者是虛擬人,可以干各種各樣的工作,有各種各樣的任務。未來的「人」,有自然人,有數字人,有機器人。

?
楊國安:你覺得哪些技術對人的生活是真正有幫助的?哪些是你期待度比較高的?

?
周昆:我對「人」感興趣的程度,其實要超過對「物」「景」感興趣的程度,我覺得這可能是人性的追求,因為人總想追求永恒,這個是比較深層次的話題。

?
楊國安:數字永生?

?
周昆:這個我感觸會比較大。另外,如果要說對生活的影響,其實我對制造這塊兒比較感興趣。之前大家做了很多,都是在數字世界做,回到真實世界(的事情)會少一些,但是現(xiàn)在已經有了這個趨勢,最終是要將數字世界和物理世界融合在一起的。融合的方式,數字化的也可以,但是如果通過一個物理的方式融合,落到一個實實在在的產品上,我自己會覺得成就感更強一些。

 

 

 

本王轉自于   新浪  人物

以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“才匯云網”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
0條評論
評論