GPU,即圖形處理器,其內(nèi)部的圖形處理流水線執(zhí)行著一系列復(fù)雜而精細(xì)的任務(wù),這些任務(wù)共同協(xié)作以在屏幕上呈現(xiàn)出精美的圖像。盡管任務(wù)的執(zhí)行順序可能有所變化,但以下步驟概括了GPU工作流程的核心環(huán)節(jié):
首先,頂點(diǎn)處理階段是關(guān)鍵一步。GPU會(huì)讀取描述3D圖形外觀的頂點(diǎn)數(shù)據(jù),這些數(shù)據(jù)如同3D圖形的骨架,幫助GPU確定圖形的形狀及其在空間中的位置關(guān)系。在支持DX8和DX9標(biāo)準(zhǔn)的GPU中,這一工作由硬件加速的頂點(diǎn)著色器(VertexShader)高效完成。
接下來,光柵化計(jì)算過程將圖形上的點(diǎn)和線轉(zhuǎn)換為屏幕上的像素點(diǎn)。這一步驟至關(guān)重要,因?yàn)樗鼘?shí)現(xiàn)了從矢量圖形到像素圖像的轉(zhuǎn)換。想象一下,一條數(shù)學(xué)定義的斜線,在光柵化后,會(huì)被轉(zhuǎn)換為一系列緊密相連的像素點(diǎn),形成視覺上連續(xù)的線段。
隨后,紋理映射(Texture Mapping)為多邊形表面賦予了生動(dòng)的外觀。這一過程,通常由紋理映射單元(TMU)執(zhí)行,它將圖像或圖案“粘貼”到多邊形表面,從而創(chuàng)造出逼真的3D圖形。
像素處理階段則是確定每個(gè)像素最終屬性的關(guān)鍵。在支持DX8和DX9的GPU中,像素著色器(Pixel Shader)負(fù)責(zé)這一復(fù)雜任務(wù),而光柵化引擎(ROP)則負(fù)責(zé)最終的像素輸出。當(dāng)一幀圖像渲染完成后,它會(huì)被送往顯存幀緩沖區(qū),等待顯示。
在GPU出現(xiàn)之前,CPU承擔(dān)了計(jì)算機(jī)中的大部分運(yùn)算任務(wù),包括多媒體處理。然而,CPU的串行架構(gòu)和有限的暫存器數(shù)量,使其在處理多媒體計(jì)算時(shí)顯得力不從心。這類計(jì)算通常需要高運(yùn)算密度、多并發(fā)線程和頻繁的存儲(chǔ)器訪問,而CPU的CISC架構(gòu)難以滿足這些需求。
盡管Intel等廠商推出了多媒體擴(kuò)展指令集(SSE)等改進(jìn)方案,但由于多媒體計(jì)算對(duì)浮點(diǎn)運(yùn)算和并行計(jì)算的高要求,CPU在硬件層面上的局限性仍然明顯。相比之下,GPU的設(shè)計(jì)則更加適合并行處理大量任務(wù)。其簡(jiǎn)單的控制結(jié)構(gòu)和較小的Cache需求,使得GPU能夠投入更多晶體管用于構(gòu)建專用電路和流水線,從而實(shí)現(xiàn)了計(jì)算速度的飛躍,特別是在處理浮點(diǎn)運(yùn)算方面。
因此,CPU和GPU在架構(gòu)上存在顯著差異。CPU功能全面,適應(yīng)復(fù)雜運(yùn)算環(huán)境;而GPU則專注于并行處理任務(wù),擁有更強(qiáng)大的浮點(diǎn)運(yùn)算能力。這種分工合作,使得計(jì)算機(jī)在處理圖形和多媒體任務(wù)時(shí)更加高效。