Nvidia公司的研究人員宣布了一系列創(chuàng)新,可以幫助開發(fā)者和藝術(shù)家將人工智能與計算機圖形軟件結(jié)合起來,將他們的創(chuàng)造性想法變成現(xiàn)實。
Nvidia發(fā)布計算機圖形方面的突破性AI研究
該公司表示將在8月6日至10日舉行的SIGGRAPH 2023年會上發(fā)布不少于18篇新的研究論文詳細介紹其創(chuàng)新成果,該會議是一個專注于計算機圖形的年度會議。這些論文是與美國、歐洲和以色列的幾十所大學的研究人員合作完成的,涵蓋了將文本轉(zhuǎn)化為圖像的生成式人工智能模型、可以將靜止圖像轉(zhuǎn)化為三維版本的逆渲染工具、使用人工智能模擬復雜三維元素的物理模型等等。
Nvidia在一篇博文中解釋說,創(chuàng)作者已經(jīng)可以使用各種生成式人工智能模型將文本轉(zhuǎn)化為圖像。這類工具被廣泛用于創(chuàng)建概念藝術(shù)、電影故事板、視頻游戲和3D虛擬世界等任務(wù)。然而,它們?nèi)杂幸欢ǖ木窒扌裕貏e是在藝術(shù)家有非常具體的想法的時候。例如,一個廣告主管可能正在計劃圍繞一款新的泰迪熊進行宣傳,并希望創(chuàng)造出各種場景,在不同的情況下(例如泰迪熊的茶會)展示這個玩具。
現(xiàn)有的工具無法很好地創(chuàng)造出這樣的特定內(nèi)容,所以Nvidia的研究人員設(shè)計出了一種技術(shù),讓生成式人工智能能夠使用一張示例圖像,以非常具體的方式定制輸出的內(nèi)容。第二種技術(shù)描述了一種名為Perfusion的高度緊湊模型,它允許用戶將多個個性化元素和一些概念圖結(jié)合起來,利用AI創(chuàng)建出更具體的視覺效果。
另外,將2D圖像渲染成3D環(huán)境的過程非常耗時,Nvidia的研究人員也一直專注于加快這個過程。第三篇研究論文圍繞的是一種新技術(shù),Nvidia稱該技術(shù)能夠在傳統(tǒng)筆記本電腦上運行,用一張2D肖像生成3D頭部和肩部模型。該公司表示,這是一項重大突破,能夠極大地加快3D頭像的創(chuàng)建,對視頻會議和虛擬現(xiàn)實應(yīng)用具有重大影響。
Nvidia的另一項舉措是與斯坦福大學的研究人員合作,為3D任務(wù)生成逼真的運動。例如,用戶可以向模型提供網(wǎng)球比賽的視頻,然后將這些逼真的運動轉(zhuǎn)移到3D網(wǎng)球運動員的角色上。Nvidia表示,然后這個模擬球員可以與其他角色進行長時間的對攻。該模型的獨特之處在于它能夠解決具有不同技能和逼真運動的3D角色的問題,而且不需要昂貴的動作捕捉視頻數(shù)據(jù)。
Nvidia還將其AI智能應(yīng)用于神經(jīng)渲染,這是一種模擬光線在虛擬場景中反射的物理學的技術(shù)。它的研究展示了如何利用紋理、材料和體積的人工智能模型,為電子游戲和虛擬世界實時創(chuàng)建電影級、逼真的物體視覺效果。
該公司介紹了其最新的神經(jīng)渲染壓縮技術(shù)能夠如何大幅提高此類場景的真實性,捕捉到比以往格式更清晰的細節(jié),例如,在以往格式中模糊不清的文字變得更加清晰。
最后,Nvidia的研究人員展示了他們在神經(jīng)材料研究方面的最新進展。該論文詳細介紹了一個人工智能系統(tǒng),該系統(tǒng)可以學習光線如何從擬真多層材料中反射出來,然后將這些資產(chǎn)的復雜程度降低到更小的神經(jīng)網(wǎng)絡(luò)可以實時運行的程度。Nvidia的研究人員表示,其結(jié)果是著色速度提高了10倍。下面這張神經(jīng)渲染的茶壺圖片中展現(xiàn)了它所能達到的極端真實水平,準確地表現(xiàn)了陶瓷材料及其透明釉面涂層的不完美性質(zhì),以及指紋、污點和灰塵。
Nvidia表示,所有的最新研究都將在今年的SIGGRAPH會議上公布。它希望開發(fā)者和企業(yè)能夠擁抱這些新技術(shù),用它們生成合成物體和人物,為機器人和自動駕駛汽車培訓等應(yīng)用填充虛擬世界。此外,它還希望藝術(shù)家、建筑師、電影制片人和視頻游戲設(shè)計師等創(chuàng)作者利用這些技術(shù),生產(chǎn)出比以往質(zhì)量更高的視覺效果。