【資料圖】
快科技12月7日消息,日前NVIDIA正式推出了CUDA 13.1,官方將其定位為"自2006年CUDA平臺誕生以來最大、最全面的升級"。
此次更新的核心亮點,是引入了革命性的CUDA Tile編程模型,標志著GPU編程范式邁入一個新的、更高抽象的階段。
傳統的GPU編程基于SIMT (單指令多線程) 模式,開發者需要關注線程、內存和同步等底層細節。
而CUDA Tile是一種基于tile(瓦片、數據塊)的模型,開發者現在可以專注于將數據組織成塊,并對這些數據塊執行計算,而底層的線程調度、內存布局以及硬件資源映射等復雜工作,將由編譯器和運行時自動處理。
為支持Tile編程,CUDA 13.1引入了虛擬指令集(Tile IR),并配套發布了cuTile工具,允許開發者使用Python來編寫基于Tile的GPU Kernel。
這極大地降低了GPU編程的門檻,使得不熟悉傳統CUDA C/C++或底層SIMT模型的數據科學家和研究者也能編寫GPU加速代碼。
Tile編程并非取代SIMT,而是提供了一個并存的可選路徑,開發者可根據具體應用場景,靈活選擇最合適的編程模型。
CUDA 13.1的意義,不僅在于新增功能或優化性能,更在于為構建新一代高層、跨架構的GPU計算庫和框架奠定了基礎,通過引入Tile IR和高層抽象,NVIDIA在硬件和軟件之間增加了一個更厚的中間層。
過去,競爭對手(如AMD的ROCm、Intel的OneAPI)主要依賴兼容層進行CUDA代碼轉譯,但對于CUDA Tile這種更高抽象的新模式,單純的代碼轉譯已遠不足夠。
競爭對手必須構建同樣智能的編譯器來處理Tile IR,這無疑增加了技術對齊的難度,客觀上進一步提升了CUDA生態系統的粘性和用戶鎖定度。
營業執照公示信息