LIFESTYLE熱門話題
黃仁勳 COMPUTEX 2025 演講重點整理:AI是新世代基礎建設、機器人將創兆元商機,NVIDIA 辦公室落腳北投士林
by 美麗佳人編輯部-更新
Text/Kitkat Edit/小律 Photo/YT@NVIDIA截圖、nvidia.com

演講中黃仁勳不僅提及NVIDIA的AI新品趨勢、未來的合作夥伴,並且表示,台灣是電腦生態圈的中心,NVIDIA將在台設置辦公室,地點就在士林北投。以下是黃仁勳在台北 COMPUTEX 2025 前夕發表演講的逐字稿整理與重點摘錄。
NVIDIA 30年來有著戲劇化的成長,從原本是為了創造全新運算平台的晶片公司,2006年創造了Cuda(Compute Unified Device Architecture),2016年,我們發現新的演算方法來臨,我2006年在GTC提及「DGX-1」時沒有人知道我在說什麼,我捐了一台給當時的一家非營利組織,那家公司叫做OpenAI。而那開啟了AI革命。
電腦不再只是一台PC
數年後我們發現,這種軟體運行方法(現在叫做AI),跟以往我們所知道的方法截然不同。以往許多應用程式只需少數處理器,在一個大型的資料中心我們叫它Hyperscale(超大規模),而這種創新的方式則是需要大量的處理器同時運作,為上百萬的人們服務。而這個資料庫的架構完全不同。我們發現有兩種網絡,一是North-South traffic(南北向流量),你還是必須要控管儲存與計畫,也必須外連。但更重要的則是East-West traffic(東西向流量),電腦們彼此溝通去試著解決問題。我們認為最好最棒的東西向網路公司,這家公司與NVIDIA 也非常親近,叫做Mellanox,因此我們5年前收購了他們。我之前也提過,這個世代所說的電腦,是指一個完整的資料中心,不再只是一台個人電腦、一台伺服器,而是整個資料中心共同完成一項任務。
NVIDIA在「資料中心」方面的旅程,現在已經被大家熟知。過去三年,大家可以看見概念被塑造出來,而我們開始用不同的視角來看整家公司。
NVIDIA是基礎建設公司
歷史上絕對沒有任何一家科技公司會一口氣揭露未來5年的規劃藍圖。沒有人會告訴你下一步會如何,大家會極端機密。然而我們知道NVIDIA已經不再只是單純的科技公司,我們是一家基礎建設公司。如果你不知道未來的計畫,那麼你要怎麼規劃包括土地、建設、能源、電力、經濟等等的基礎建設?因此我們用非常細節的方式來描繪公司未來的藍圖,細節到全世界的每個人都能夠也開創一家資料中心。我們知道我們是一家AI基礎建設公司。全世界、任何地區、任何行業都需要基礎建設公司。
今日的AI如同工業革命的電力
而什麼是基礎建設?有點像是第一次工業革命時大家知道的通用電氣、西屋電器、西門子那種公司,讓當時的世人知道了電力是最新的科技,也讓世界上所有的人都廣為建設。多年後,我們這個世代的人發現一種新的基礎建設,而這種新的基礎建設是非常抽象且難以理解,叫做資訊(Information)。「資訊」是基礎建設的概念,一開始沒有人聽得懂,而我們後來理解了,那就是「網路」。網路無所不在,而且連結所有的事情。如今一項更新的基礎建設出現了,這種基礎建設奠基於網路和資訊之上,這種基礎建設指的是「智能的基礎建設」。我知道這聽起來好像很不合理,但我保證,十年後你回頭來看,你會發現,AI現在已經處處可見,而且事實上我們到處都需要AI。而且全世界每個角落、每家公司、每個行業都需要AI。AI已經是基礎建設的一部分,而且是如同網路、電力一樣需要工廠,這個工廠就是我們今日正在建構的。
AI工廠化
這不像過去的資料中心,為百萬元產業提供資訊與儲存空間,支援企業ERP系統和僱員,雖然和這行業中的你我以往提供的概念很類似,但即將發展成截然不同的東西。雖然這個說明不太恰當,但即將演變成「AI工廠」:像工廠的概念,你花精力投入,然後產出有價值的東西,這東西我們稱為Token。簡單來說,未來大家將會討論的是,公司上一季或上個月產出了多少Token,甚至很快地,我們每小時產出多少Token,就像工廠一樣。世界將會變得不一樣。
1993年我創辦公司時曾經思考公司有多大的商機,我的結論是NVIDIA的商機非常巨大,有三億元的市場,我們會變得很富有。而當時三億元的晶片公司,現在即將成長為具有兆元商機的資料中心、一個AI工廠、AI基礎建設產業,未來將是以兆元估算的商機,這是我們全力以赴迎接的令人興奮的未來。
本質上來看,我們正在做的都與幾項重要科技有關,當然我很常提到高速運算、AI,但什麼是NVIDIA獨特之處?是這些技術的整合。而更特別的是,我們稱為Cuda-X Libraries的演算法與程式庫。我們老是在講程式庫,其實我們似乎是全世界唯一不停提及程式庫的科技公司,原因是程式庫就是我們的核心,也是我們的起點,我今天也會展示一些新的程式庫給你們看。
巨大圖像9成由AI推測
你們看到的一切,都是模擬科學技術與AI人工智能,沒有藝術創作,都是模擬,只是剛好看起來很美。我身後的螢幕是電腦即時圖像技術,並不是拍攝的影片,是由G-force提供,我手中的G-force RTX 5060是來自ASUS,筆電來自MSI,我們將G-force RTX 5060的GPU塞進薄薄的筆電裡,這很棒吧!因此讓MSI最新的筆電裡有了G-force RTX 5060。G-force 讓Cuda來到世人眼前,你看見的這個超大影像,每個像素都做了真實的光線追蹤模擬處理。我們怎麼可能做到在這麼大的影像中以如此大的解析度模擬光線粒子?原因就是AI智能。你看到的像素只有十分之一是由電腦生成的,剩餘的十分之九是AI推測的。這看起來很完美,也就是說AI推測的非常完美,這項技術叫做「DLSS類神經渲染技術」。這花了我們很多年來研發,我們從開始研發AI就著手研發DLSS,所以至少花了十年。而AI徹底革新了電腦圖像的進展。G-force將AI帶到這個世界,如今AI回來,帶給G-force一場革命。G-force RTX 50系列剛完成了最成功的上市,30年電玩史上最快速的上市,這說明了G-force有多厲害。
接下來我們談談程式庫。簡單來說當然所有一切都跟Cuda有關,我們盡可能優化Cuda效能並且普及化,所以安裝基礎遍佈全世界,好讓應用程式方便找到Cuda的GPU。當裝機量越大,就越多開發商樂於創造程式庫,當程式庫越多,就會有越多好的應用程式,使用者覺得更好用,他們就會買更多的電腦。越多人買電腦,就會有越多的Cuda,這個良性反饋循環是至關重要的。
然而,高速運算與通用運算不同,通用運算像是寫程式,Python、C、C++,讓電腦跑得順暢就行。但這概念無法用在高速運算上,因為如果可以,那就叫做CPU了。高速運算是另外一種邏輯,而通用運算有成千上萬的人在做,上兆元的創新,但要如何能做到在一個晶片中只需更動一些小工具,就能讓所有的電腦速度變快五十倍甚至一百倍,聽起來不可能,所以我們提出的邏輯是,如果所有人都能理解這件事,我們就可以讓應用程式變快。
如果你想讓所開發的應用程式像光速一樣快,99%的運作時間只需佔據5%的程式碼,很妙的是,大多數應用程式的運算都來自於很小部分的程式碼,我們發現了這件事,所以我們的程式庫一一拜訪不同應用程式的網域。當然程式庫本身導致我們能夠串連一個個不同知識網域,來達到加速的目的,但這也打開了我們的市場。我們看見每個不同的領域與市場,科學、醫學我們發現將那轉換成電腦運算用途是非常重要的。
未來所有電腦都有量子加速器
當通用電腦運算已經發展多年,但為什麼沒有運用在所有的產業呢?因此「通訊」是非常重要的。正當世上所有的雲端資料庫都成為軟體定義網路(SDN) ,傳統倚賴硬體的資料傳輸也應該由軟體控制,來提升靈活性與可編程性。我們花了六年時間,開發並優化一套全加速的無線接取網路(RAN,Radio Access Network),實現了驚人的效能表現。每兆瓦所能提供的資料傳輸速率,都是最先進的ASICs(Application-Specific Integrated Circuits)晶片等級,一旦我們能夠做到如此頂尖的效能,我們就能加入AI。我們有很棒的合作夥伴,包括 SoftBank、T-Mobile、Indosat、Vodafone 都在進行測試;Nokia、Samsung、Kyocera 與我們合作整個堆疊;Fujitsu 與 Cisco 則專注於系統層面。所以我們今天能將AI應用於5G、6G 通訊系統,就如同我們將AI應用於傳統運算一樣。
我們也在推進量子運算。雖然目前仍處於稱為雜訊中尺度量子階段 (NISQ,Noisy Intermediate Scale Quantum Computing),但已有許多有潛力的應用開始浮現。我們正在研發一個量子與GPU混合的運算平台,稱為 CUDA-Q,與全球許多很棒的公司攜手合作。GPU 可用於前處理與後處理、錯誤修正與控制。未來我預測,所有超級電腦都會具有量子加速器(QPU),與 GPU 和 CPU 一同構成一個現代化的超級運算系統。
AI是通用的翻譯機
12 年前,我們從感知型 AI 開始,AI能夠識別語音、圖像與模式,這是起點。過去五年,我們進入了 生成式 AI(Generative AI),AI 不僅能理解,還能創造。它可以從文字產生文字,我們在ChatGPT很常見,也可以從文字產生圖像、影片,反過來也可以。也就是說,它可以將任何形式的資料轉換為另一種形式,這正是我們所說的AI的優點:「通用函數逼近器(Universal Function Approximator)」,亦即一種通用的轉譯器,可以將任何形式的資料轉譯成另一個形式,只要能將資訊用Token來呈現,就能讓AI轉譯與推理。
現在,我們來到更進一步、更重要的階段:生成式AI讓我們體驗了具備一次學習能力的人工智慧系統(One-shot AI),可以跟你一問一答,兩年前我們與ChatGPT的相遇使我們感到驚艷與突破,你打字、他回覆,並且預測下一段文字。然而所謂「智能」,應該不只是從大量資料中學習,而是應該要有推論能力,能夠解決未曾見過的難題。能夠把複雜問題逐步拆解,甚至或許運用邏輯與定理去解決沒遇過的難題,甚至能模擬多種選擇並分析其利弊。或許你聽過一種科技叫做「Chain of Thought」讓AI拆解問題;「Tree of Thought」則是讓AI列出許多方法途徑,這些都讓AI擁有了「推理能力」。
明年會是數位機器人的重要時代
當 AI 能夠推理,並結合多模態理解,像是閱讀 PDF、搜尋、使用工具等,它就成為「代理型 AI(Agentic AI)」。這種 AI 就像人類:理解任務 → 拆解步驟 → 推理決策 → 執行行動。我們人類會考慮後果,並且執行計畫。這種代理AI可以研究、使用工具、與其他 AI 協作。也就是說,Agentic AI 是能理解、思考並採取行動的AI。這正是機器人(robotics)的回路,Agentic AI 基本上就是數位形式的機器人。明年會是重要的一年,我們將會看到在這個領域有許多進展。
而下一波則是「實體 AI(Physical AI)」,它能理解現實世界的物理定律,例如慣性、摩擦力、因果關係。當我滾一顆球到車子下方,它會知道依照球的速度,球會從車子的另一側出現,它能理解「物體恆存性」(Object Permanence),球不會在車下消失;如果有一張桌子在你面前,當你要去另一端,它能推論最好的選擇不是撞向桌子,而是繞過桌子或是從桌子底下通過會更合理。要能理解這些物理性原則,才能通往下一個階段。我們稱為「實體 AI」,你可以看見這類 AI 能生成影片來訓練自動駕駛的車輛等各種場景,例如加入鳥、人、狗等變數 。
AI能生成影像就能撿起瓶子
下一步,我們將這些推理系統、生成系統與實體理解能力,全部結合進一個實體載具,也就成為了「機器人」。如果你能用文字下指令要求AI「生成一段撿起瓶子的影片」,那麼你可以想像能夠對機器人下達「撿起瓶子」的指令,現今的 AI 技術已經具備這樣的能力。
為了實現這一點,我們打造了一種全新的電腦架構,叫做Hopper,三年前問世,徹底改變了 AI 運算方式,成為全球最知名的電腦之一。這幾年我們又開發了一款新系統,想要進行「推理時刻擴展(inference-time scaling)」,基本上就是指用非常快的速度思考。你可以想成當你在思考的時候,其實腦中生成了大量的Token,而你在腦中反覆運算後,輸出了最終的答案。因為想讓AI從單次輸出(one-shot AI)進展成思考型 AI(thinking AI)、推理型 AI,都需要非常大量的計算力,為此我們開發了最新的Grace Blackwell 系統。
Grace Blackwell具有幾項功能,它能「向上擴展(scale up)」—— 將一台電腦變成一台巨型電腦。這與「向外擴展(scale out)」—— 將任務分配至多台電腦不同。向外擴展容易,向上擴展非常困難,尤其是已接近半導體物理極限,而Grace Blackwell做到了,它幾乎突破了所有限制,很多夥伴正在與我們合作構建 Grace Blackwell 系統。現在它已全面量產,儘管這過程異常艱難。基於HGX架構的 Blackwell系統,從去年底已開始量產,自今年二月起開放使用,如今全球每一天都在各個角落快速上線中,各地的CSP(雲端服務供應商)都已導入,推特上也有許多人發表Grace Blackwell相關訊息。而正如我承諾每年都要優化平台,今年第三季我們將升級至Grace Blackwell GB300。仍然是相同架構、相同外型與機械構造設計,但內部晶片升級了,包括推理效能提升1.5倍、高頻寬記憶體(HBM)提升 1.5 倍、網路連接提升2倍等,可說是整體系統效能全面提升。記得我說過嗎?NVIDIA 在近十年內將AI運算能力提升了大約一百萬倍,而我們仍然維持進度。要做到這些並非將晶片做得快一點就可以,因為晶片的速度和大小有其限制。而Grace Blackwell可以將晶片連結在一起。Grace Blackwell 的計算節點已全面改良,從上一代的B200到B300,外觀一致,可插入相同的機櫃與底座,這就是Grace Blackwell的偉大之處。
「你投資越多,賺得就越多」
NVIDIA建造的東西都很巨大,原因是我們並非在做資料中心或伺服器,我們是在建構AI工廠。這些系統動輒花費400億、500億,因此是非常鉅額的工廠投資,但你們都明白為什麼:「你投資越多,賺得就越多」,工廠就是這個道理。
科技非常複雜,光看這些,你可能還是無法充分感受到我們在台灣的夥伴公司的貢獻,這些非常精彩,而且都是你們做到的。今日的台灣不只是為了世界生產超級電腦,我很高興地宣布,我們也正在為台灣建造AI,我們正式宣佈,鴻海、台灣政府、台積電、與NVIDIA將為台灣打造第一台超級電腦,用來建構AI基礎建設與AI生態圈。
每一位學生、研究員、科學家、新創公司、大型企業,像是台積電早已建構了大量的AI與科學研究,鴻海在機器人領域貢獻良多,我知道坐在觀眾席中有許多人都在AI、機器人領域有所研究,因此擁有世界級的AI基礎建設對台灣來說是非常重要的。
這一代的NVLink和Blackwell使我們能夠創造這個強大的系統,一個巨型的晶片,這裡有 Pegatron(和碁)、QCT(雲達)、Wishtron(緯穎)、WeWin 等公司所做的系統,包括 Foxconn(鴻海)、Gigabyte(技嘉)、ASUS(華碩)等150家公司耗費三年來打造的成果,以及其中的軟硬體,這都是巨大的產業投資。
NVLink Fusion的半客製化計畫
而今天我們希望所有想打造資料中心的人都能做到,我們將發表一項特別的NVLink Fusion計畫,以此可做出半客製化的AI基礎建設,並不只是半客製晶片,那已經是過去的做法。每個人都想要AI基礎建設,但每個人想要的可能都有點不同,要做到很困難,NVLink晶片就是關鍵。NVLink 能讓你將這些半客製系統擴展成真正強大的電腦,你能夠混搭整個系統,甚至可以使用客製化的ASICs晶片,你同樣可以整合進我們的超級電腦生態系統。你的AI架構可以部分使用 NVIDIA,也可以大部分是你自己的。你依然能夠享有 NVLink 和 SpectrumX 帶來的連結性與擴展性,以及背後龐大產業生態系的穩定性。這就是 NVLink Fusion。
如果你所有東西都買NVIDIA,我當然很高興;但如果你只有部分東西買NVIDIA,我會欣喜若狂。
我們現在有以下重要合作夥伴:Alchip、Astera Labs、Marvell、聯發科(MediaTek):他們會協助客戶打造自己的 ASIC或是半客製化系統。富士通(Fujitsu)、高通(Qualcomm):正在打造支援 NVLink 的 CPU。Cadence 和 Synopsys:我們和他們合作,將 IP 授權給他們,以便你們都能使用這些技術來建構晶片。
你的桌上型超級電腦
這是個令人驚嘆的生態系,這只是 NVLink Fusion 生態的一部分亮點。一旦與這些夥伴合作,你就能被整合進更大的 NVIDIA 生態系中,讓你能建構自己的 AI 超級電腦。
現在我來談談一些新的產品。你剛剛看到我展示幾款不同的電腦,但為了滿足世界上更廣泛的需求,還有一些電腦我們需要補上。首先,我要告訴大家一個更新:我們的 DGX Spark 已經全面進入量產。幾週後就會上市。合作夥伴包括:Dell、HPI(惠普)、ASUS、MSI、Gigabyte、Lenovo 等等,這就是DGX Spark。這其實是我們的量產機型,我們的合作夥伴也會推出他們不同的版本。這是為 AI 原生開發者設計的電腦:如果你是開發者、學生、研究人員;你不想每次開雲端、用完再關,你想要有一台永遠開機、專屬你用的個人AI雲端電腦,這台就是為你打造的。你可以用來做原型設計、早期開發,回顧2016年的DGX-1,重 300 磅(大約 136 公斤),我根本沒辦法拿起來,效能達到每秒1千兆次浮點運算、128GB HBM。而今天這台DGX Spark,128GB LPDDR5X,效能其實是很相似的,但更棒的是,你能做的工作,跟在大型電腦DGX上能做的工作是一樣的。這是十年來驚人的成就。我們的合作夥伴將自行定價,但可以確定的是:大家今年聖誕節都能擁有一台。
DGX Station:牆上插座能使用的極限
如果你覺得還不夠大,還想要自己的個人超級電腦,這是另一台桌上型超級電腦,Dell、HPI、ASUS、Gigabyte、MSI、Lenovo 都會推出,也會由Box和 Lambda 等工作站品牌販售,這台就是你個人的DGX超級電腦,這是你能從牆上的插座獲得的最強運算效能。我想你可以把它放在廚房,但有點勉強,因為如果有人使用微波爐,可能就會跳電,這就是極限,這台是你牆上插座所能使用的極限了,這台是DGX Station。他的程式設計系統和我方才展示的巨大電腦是一樣的,這是最棒的事,一台架構就具有足夠的容量和效能可運作一兆參數的AI模型。
這些系統都是以AI為核心建構的系統,是為了軟體世代建構的電腦,不需要相容x86架構,也不需要能夠運作傳統的IT軟體,不需要能夠運作虛擬化管理程式(Hypervisor),也不需要能夠使用Windows系統。這些電腦是為了現代AI應用程式打造的,當然這些AI應用程式也可以封裝為 API(Application Programming Interface),供其他傳統應用程式系統調用。但為了讓我們帶AI進入嶄新的世界,我們得回到根源,我們得革新運算方式,將人工智慧引入傳統企業運算環境。傳統產業的運算環境就我們所知,大概就是三個層級,運算、儲存、網路,AI的導入肯定會改變產業IT。它必須能夠和產業IT共同運作,並且增加新的功能,對產業來說,具備新功能的就是代理AI。
代理AI就是數位員工
數位行銷活動經理、數位研究員、數位軟體工程師、數位客服、數位晶片設計師、數位供應鏈經理等等,基本上就是我們以往工作的數位AI版本,正如我先前提到的,代理AI具有推理能力,能使用工具,並且與其他AI協作,所以從各方面來講,它們都是數位工作者,是數位員工。世界正缺乏勞動力,勞工短缺,到2030年我們將短缺3000萬至5000萬的人力,這其實限制了世界的成長,現在我們有了數位員工能夠一起工作。100%的NVDIA軟體工程師現在已有數位代理AI跟他們一起工作,幫助他們研發更好的編碼並且有更好的生產力。我們的願景就是在未來,產業IT中會有一個新的層級是代理AI。
這世界會發生什麼事?企業會發生什麼?我們有給人類員工的人力資源部門,而IT部門就是數位員工的HR。因此我們必須發展所需的工具讓IT使用,讓IT具有管理、提升和評估數位員工工作的能力,這是我們未來要研發的。但如前所述,我們得先重新定義演算方法,產業IT使用的是相容x86架構的傳統電腦、跑的是傳統的軟體,使用的可能是來自VMware、IBM Red Hat、Nutanix的虛擬化管理程式,使用大量的傳統應用程式,但我們將會需要能夠處理這些事情的電腦,同時要具備「代理AI」的新功能。
所有工作都能駕馭的企業級伺服器
這是全新的RTX Pro 企業級 Omniverse 伺服器(RTX Pro Enterprise Omniverse Server),它能夠解決一切問題。它當然有x86架構,可以運作所有經典的虛擬化管理程式,它使用kubernetes容器管理系統,當IT想要管理網路、管理所有叢集、自動化部署編排工作量,都可以像以前那樣操作,幾乎世上使用的所有東西都能在這裡運作。不僅如此,它也是為了產業AI代理所設置的電腦。代理AI不只能夠用文字呈現,也可以是電腦圖像,就像Toy Jensen那樣。AI代理員工可以是文字形式,也可以是圖像,也可以是影像,所有的工作都可以在這台電腦裡運作。所有這世上的模組、應用程式,都可以在這台電腦使用。它可以快速運算每秒產出的Token,但因為每個代理AI的工作不同,有些需要更多的推理能力,因此你必須算出每位使用者、每秒產出的Token產量,而且越高代表成效越好。而身為工廠需要高產能或低延遲,雖然不需總是兩者兼顧,但挑戰就是如何創造一個能夠盡可能提高產能、降低延遲的運算系統。
RTX Pro 企業級 Omniverse 伺服器能運用不同方式來提高產能、降低延遲。世界最知名的電腦Hopper H100,$225,000。這台RTX Pro 企業級 Omniverse 伺服器,具有Blackwall系統1.7倍的效能,更棒的是它是DeepSeek R1。DeepSeek R1是給世界的禮物,是一大突破,也開啟後續許多很棒的研究,我去世界各地,都看到DeepSeek R1是如何影響人們思考AI以及模擬和推理能力,他們真的對這世界和產業有極大的貢獻。DeepSeek R1成效表現是H100的4倍,所以如果你想要建構產業AI,我們有非常好的伺服器和系統可以提供給你。你可以在這電腦上運作所有的東西,有非常好的成效,而且能夠兼顧x86和AI。RTX Pro 企業級 Omniverse 伺服器已經在大量生產中,這可能會是我們有史以來最大規模的上市計畫。
Vast整合AI搜尋
演算平台改變,儲存平台也不同。原因是人類傾向查詢像是SQL這類結構化資料庫,但AI傾向查詢非結構化的資料庫,他們想要語意和意義,所以我們需要創造一個全新的儲存平台,而這是NVDIA AI數據平台,上層正如SQL伺服器、軟體,以及廠商提供的儲存系統,如你所知,大多數提供儲存系統的公司都是軟體公司,這一層軟體非常複雜,所以這種新型儲存系統,會有一個我們稱之為 iQ 的新查詢系統,NVIDIA AiQ 或 iQ,這真的是最先進的,並且與儲存產業幾乎所有人合作。未來你的存儲不再是CPU,而是搭載GPU的儲存空間。原因是你會需要這個系統嵌入並且在非結構化、原始數據中索引、搜索和排序,這個過程需要大量計算的資源,所以未來大多數存儲伺服器將會在前面配備一個GPU 計算節點。這一切都奠基在我們創造的AI模型之上。
我們創造AI模型,並且灌注大量精力與科技在OpenAI模型的後訓練處理,我們後訓練這些模型,資料都是公開透明化的,都是安全公開的清單讓大家都可見,而我們後訓練模型的成效是非常驚人的,現在可下載的公開來源具有推理邏輯的AI模型中,Llama Nemotron模型是最強大的,下載次數非常可觀,而我們也讓利用AI搜尋的功能「iQ」,比市面上所有AI搜尋都快了15倍,而且有50%的機率是更好的搜尋結果。這些都是公開的藍圖,而且我們與儲存業者合作,整合這些AI模型到儲存平台中的AI系統,我們稱為「Vast」。
Dell擁有強大的AI平台,是世上具領導地位的儲存廠商,Hitachi有著強大的AI平台、IBM使用NVIDIA的Nemo建構AI資料平台,NetApp正在建構網路資料平台,你可以看到這些資料全都公開透明,如果你正在建構一個使用語意查詢的AI平台,NVIDIA Nemo是世上最棒的。
智能IT運營將進入市場
接下來是關於新的軟體,我們稱為AIOps(智能 IT 運營,Artificial Intelligence for IT Operations)。正當供應鏈和HR都有他們自己的運營軟體,未來IT也會有自己的運營軟體,它們會整理數據、微調模型,他們會評估模型、設置護欄模型,我們也有許多程式庫和模型將會整合進入AI運營生態圈。我們有很棒的夥伴幫助我們做這些事,並且協助進入市場,CROWDSTRIKE、DataIQ、DataRobot都正與我們合作。你可以看見,這些 AI 運營操作,包括建立微調模型與部署模型,都是用於企業使用的代理AI(Agentic AI),而你也可以看見NVIDIA的程式庫與模型都無所不在。elastic我好像聽說已經被下載了4000億次。還有NUTANIX、Red Hat,以及台灣的趨勢科技,Weights and Biases等,這就是我們將如何讓產業IT擁有讓AI做各種工作的能力。我們可以在原有的功能上加入AI,如今藉由包括Dell等很棒的夥伴們協助,我們有了能夠讓企業做好準備的系統,我們將把這些平台帶給全世界的產業IT。
接下來我們談談機器人。代理AI你可以有很多種叫法,但基本上他就是數位機器人,因為機器人就是可以感知、理解並且策劃行動,而這就是代理AI做的事情。但我們也會想要建構實體機器人,但實體機器人的前提就是它必須要有能夠學習當機器人的能力。但學習當機器人的能力無法在實體世界有效地執行,你必須創造一個虛擬世界讓機器人在那能夠學習當一個好機器人。在那個虛擬世界必須遵照物理原則,大多數虛擬世界使用的物理引擎,在處理剛體和軟物體時沒有擬真的能力,因此我們和Google DeepMind和迪士尼研究部門(DisneyReserch)合作打造了世界最棒的物理引擎「Newton」(牛頓),它會在7月開放原始碼釋出。它完全使用GPU動能,能做到很不可思議的事。它是可微分的(differentiable),變化率是可計算的,因此能夠從經驗中學習,具有高擬真度,且非常即時,它也被整合到機器人用物理函式庫MuJoCo以及NVIDIA的Isaac Sim模擬平台,因此不論你使用的模擬環境和框架是什麼,我們可以藉此讓機器人成真。
實體機器人成為事實
你能想像這些小機器人在你家跑來跑去,追逐你家的小狗並且把牠們惹毛嗎?你看到的這不是動畫,是模擬畫面,畫面中的機器人在沙子裡滑行,所有一切都是模擬畫面,機器人的軟體正在運作模擬機制。所以在未來,我們會將訓練好的模型讓實體機器人模擬,讓他們學習如何當一個好機器人。我們正在做一些事情協助機器人產業,你們都知道我們已經著手自動化系統有一段時間,像是自駕車我們基本上就有三個系統,有創造AI模型的系統,GB 200、GB 300就是用在訓練AI模型。然後也有Omniverse去模擬AI模型,然後當你訓練完AI模型,你得把AI模型放入車裡,我們今年就在世界各地的賓士車中部署了我們的自駕車軟體組合。我們創造了完整技術,然後開放技術,我們的夥伴能夠隨心所欲地使用,他們可以用電腦但不用程式庫,也可以用完電腦與程式庫後還使用我們的執行程序,怎麼使用都取決於你自己。但我們希望能夠讓大家盡可能方便地整合運用NVIDIA的技術。就像我前面說的,我當然喜歡你什麼都從我這裡買,但如果你只買一部分那會更好,我很實際。
所以我們也在機器人產業做相同的事情,就像自駕車一樣。這是Isaac GR00T平台(開放式機器人開發平台),模擬器就跟Omniverse一樣,訓練系統也是一樣的,當你訓練完AI模型,你就放到Isaac GR00T平台,這個平台使用的是全新的電腦Jetson Thor,這是一個非常驚人的處理器,而且正要開始生產。基本上機器人處理器是用在訓練自駕車,也可以用在導入人類或機器人系統上,它的運行系統是NVIDIA Isaac,常被運用在神經元網路處理、感測器和管線處理流程,然後產出最終的結果。我們今天在此宣告Isaac GR00T N1.5已經正式開放,全世界都可用,而且已經被下載了6000次之多,也受到大家的喜愛和讚賞。
用AI教AI當個好機器人
除了創造模型外,我們也告訴大家我們創造模型的方法,在機器人或說整個AI產業最大的挑戰就是你的資料庫策略,那通常是大量的技術和研究所在,在機器人產業,我們教機器人就像教自己的小孩,或像是教練示範給運動員看,你用遠端遙控的方式告訴機器人如何執行任務,機器人能夠「泛化」(Generalization),AI有能力從展示中學習,甚至從一次示範中學到其他的方法技巧。那麼如果你想要教機器完整的技巧,那將會需要多少人員?當然會非常多。所以我們想做的是利用AI來強化人類的示範系統,所以這是從現實到現實,只是利用AI去擴大且強化人類示範時所蒐集到的資料數量,再用來訓練AI模型。所以,想要讓機器人變成事實,你就需要AI。而為了訓練AI,你更需要AI。值得慶幸的是,雖然我們需要大量人工生成資料,但我們剛好處在一個AI代理的世代。機器人需要大量人工生成的資料,微調也需要經由大量的強化學習,以及鉅額的運算,這是一個需要大量運算的世代,來訓練AI、發展AI以及使用AI。就像先前提過的,世界勞工短缺,這也是為什麼實體機器人如此重要的原因之一,這是唯一一種幾乎能夠在各種惡劣狀況都能部署的機器人類型。它們能夠融入我們創造的各種世界,可以完成我們自己的任務。我們為自己開創了一個世界,現在我們可以設計出能融入這個世界的機器人來協助我們。
數位雙胞胎讓機器人學習共事
另一項很棒的事情是,如果機器人真的成真,他們會多才多藝,而且也可能會是最成功的機器人,因為每項科技都需要規模,我們現有的其他機器人都是少量的,因此永遠無法達到會成為科技巨輪的規模,發展得不夠快、不夠長遠,我們就不會願意投注技術來使它更好。但實體機器人很有可能會成為下一個數以兆元的產業,科技創新速度會非常快,對運算和資料中心的需求量會非常的大。不過這會是需要三種電腦的應用,一是AI學習,二是模擬引擎,讓AI在虛擬環境學習當一個機器人。三是用來部署。任何會動的東西都可以是機器人,當我們將機器人放入工廠,請記得,工廠本身也是機械化。現在的工廠是驚人地複雜,畫面上是Delta的生產線,而他們已經準備好未來要啟用機器人。工作過程已經是機械化並且以軟體定義,未來將會有真的機器人在裡面工作。
為了讓我們能夠創造且設計出能夠像是團隊合作的機器人,我們必須利用Omniverse讓他們學習共事。你將會有一個數位雙胞胎,所有的設備也會有數位雙胞胎,你會有一個數位雙胞胎工廠。這就是Omniverse能夠做的訓練。如果你以為這是照片,其實這也是模擬畫面,也是一種數位雙胞胎。此時,一項高達五兆元的廠房正在世界各地規劃中,在接下來的三年內,世界正在重塑,各地正在重新工業化,到處都在蓋新廠房,這對我們來說是很好的機會,將所有的東西都交由數位雙胞胎來執行,會是迎接機器人未來的第一步。這還不包含我們即將建構的新型態工廠,而且就連我們自己的工廠,我們也使用了數位雙胞胎。NVIDIA有數位雙胞胎,就連高雄也有數位雙胞胎。
台灣將會迎來重大商機
我整篇演講都在講在座各位的成就,台灣身為產業的中心,也將會是未來許多AI和機器人的產地,這是台灣的好機會,也將會是世界最大的電子製造地區,因此AI和機器人會轉型為我們要做的事。所以這會是史上第一次,你做的事情將對所有產業造成革命性的影響,而最終也將對你的工作產生革新。你將AI帶來這世界,現在AI要來革新你做的所有事情。
NVIDIA辦公室落腳北投士林
最後我還有一個新產品要宣布,大家都知道我們持續成長,與夥伴們的合作也持續成長,我們在台灣的工程師數量也持續成長,已經突破了現有的辦公室容量,所以我要為他們建造一座NVIDIA台灣辦公室,叫做NVIDIA CONSTELLATION,我們一直在挑選地點,所有的市長和城市都對我們很好,我想我應該獲得一個很好的交易,不過我不太確定,因為也滿昂貴的,不過畢竟是黃金地段,今天我很高興宣布,NVIDIA CONSTELLATION會在北投士林。我們經由協商,才從現有的地主手中取得租約,然而據我所知,要讓市長核准這份租約,他需要知道台北市民都同意我們建造巨大美麗的NVIDIA CONSTELLATION,他也要求大家打電話告訴他,所以我相信你們都有他的電話,請告訴他大家都覺得這是個好主意。我們會盡快開始建造NVIDIA CONSTELLATION,因為我們需要辦公空間。NVIDIA CONSTELLATION北投士林,令人振奮!
我要感謝大家一直相伴,這將是我們一生一次的重大機會,這絕非輕描淡寫,在我們眼前的機會將會超乎尋常。我們正在創造IT的下一個世代,其實我們不是第一次這麼做,從PC到網路,到雲端、行動雲端,這次我們不只是再創在IT的新時代,我們更是在創造一個全新的產業。這個全新的產業,將讓我們接觸巨大的商機。期待未來在各種領域與各位合作,祝你們有個很棒的Computex。
黃仁勳 COMPUTEX 2025 演講全文
延伸閱讀: