出版時(shí)間:2011-3-1 出版社:機(jī)械工業(yè)出版社 作者:Jason Sanders,Edward Kandrot 譯者:聶雪軍
Tag標(biāo)簽:無
內(nèi)容概要
cuda是一種專門為提高并行程序開發(fā)效率而設(shè)計(jì)的計(jì)算架構(gòu)。在構(gòu)建高性能應(yīng)用程序時(shí),cuda架構(gòu)能充分發(fā)揮gpu的強(qiáng)大計(jì)算功能。本書首先介紹了cuda架構(gòu)的應(yīng)用背景,并給出了如何配置cuda c的開發(fā)環(huán)境。然后通過矢量求和運(yùn)算、矢量點(diǎn)積運(yùn)算、光線跟蹤、熱傳導(dǎo)模擬等示例詳細(xì)介紹了cuda c的基本語法和使用模式。通過學(xué)習(xí)本書,讀者可以清楚了解cuda c中每個(gè)功能的適用場合,并編寫出高性能的cuda軟件?! ”緯m合具備c或者c++知識(shí)的應(yīng)用程序開發(fā)人員、數(shù)值計(jì)算庫開發(fā)人員等,也可以作為學(xué)習(xí)并行計(jì)算的學(xué)生和教師的教輔。
作者簡介
作者:(美國)桑德斯(Jason Sanders) (美國)Edward Kandrot 譯者:聶雪軍 等桑德斯(Jason Sanders),是NVIDIA公司CUDA平臺(tái)小組的高級(jí)軟件工程師。他在NVIDIA的工作包括幫助開發(fā)早期的CUDA系統(tǒng)軟件,并參與OpenCL 1.0規(guī)范的制定,該規(guī)范是一個(gè)用于異構(gòu)計(jì)算的行業(yè)標(biāo)準(zhǔn)。Jason在加州大學(xué)伯克利分校獲得計(jì)算機(jī)科學(xué)碩士學(xué)位,他發(fā)表了關(guān)于GPU計(jì)算的研究論文。此外,他還獲得了普林斯頓大學(xué)電子工程專業(yè)學(xué)士學(xué)位。在加入NVIDIA公司之前,他曾在ATI技術(shù)公司、Apple公司以及Novell公司工作過。Edward Kandrot是NVIDIA公司CUDA平臺(tái)小組的高級(jí)軟件工程師。他在代碼性能優(yōu)化方面擁有20多年的工作經(jīng)驗(yàn),他曾經(jīng)在Adobe公司Microsoft公司以及Autodesk公司等工作過。
書籍目錄
譯者序序前言致謝作者簡介第1章 為什么需要CUDA1.1 本章目標(biāo)1.2 并行處理的歷史1.3 GPU計(jì)算的崛起1.4 CUDA1.5 CUDA的應(yīng)用1.6 本章小結(jié)第2章 入門2.1 本章目標(biāo)2.2 開發(fā)環(huán)境2.3 本章小結(jié)第3章 CUDAC簡介3.1 本章目標(biāo)3.2 第一個(gè)程序3.3 查詢?cè)O(shè)備3.4 設(shè)備屬性的使用3.5 本章小結(jié)第4章 CUDAC并行編程4.1 本章目標(biāo)4.2 CUDA并行編程4.3 本章小結(jié)第5章 線程協(xié)作5.1 本章目標(biāo)5.2 并行線程塊的分解5.3 共享內(nèi)存和同步5.4 本章小結(jié)第6章 常量內(nèi)存與事件6.1 本章目標(biāo)6.2 常量內(nèi)存6.3 使用事件來測量性能6.4 本章小結(jié)第7章 紋理內(nèi)存7.1 本章目標(biāo)7.2 紋理內(nèi)存簡介7.3 熱傳導(dǎo)模擬7.4 本章小結(jié)第8章 圖形互操作性8.1 本章目標(biāo)8.2 圖形互操作8.3 基于圖形互操作性的GPU波紋示例8.4 基于圖形互操作性的熱傳導(dǎo)8.5 DirectX互操作性8.6 本章小結(jié)第9章 原子性9.1 本章目標(biāo)9.2 計(jì)算功能集9.3 原子操作簡介9.4 計(jì)算直方圖9.5 本章小結(jié)第10章 流10.1 本章目標(biāo)10.2 頁鎖定主機(jī)內(nèi)存10.3 CUDA流10.4 使用單個(gè)CUDA流10.5 使用多個(gè)CUDA流10.6 GPU的工作調(diào)度機(jī)制10.7 高效地使用多個(gè)CUDA流10.8 本章小結(jié)第11章 多GPU系統(tǒng)上的CUDAC11.1 本章目標(biāo)11.2 零拷貝主機(jī)內(nèi)存11.3 使用多個(gè)GPU11.4 可移動(dòng)的固定內(nèi)存11.5 本章小結(jié)第12章 后記12.1 本章目標(biāo)12.2 CUDA工具12.3 參考資料12.4 代碼資源12.5 本章小結(jié)附錄 高級(jí)原子操作
章節(jié)摘錄
版權(quán)頁:插圖:當(dāng)人們?cè)谔剿魅绾翁嵘齻€(gè)人計(jì)算機(jī)的性能時(shí),超級(jí)計(jì)算機(jī)中性能提升方式引出了一個(gè)很好的問題:為什么不在個(gè)人計(jì)算機(jī)中放置多個(gè)處理器,而不是僅提升單個(gè)處理器核的性能?這樣,在不需要提高處理器運(yùn)行頻率的情況下,個(gè)人計(jì)算機(jī)的性能就能獲得持續(xù)的提升。在2005年,當(dāng)面對(duì)競爭日趨激烈的市場以及越來越少的可行方式時(shí),業(yè)界一些領(lǐng)先的CPIJ制造商們開始提供帶有兩個(gè)計(jì)算核的處理器。在接下來的幾年中,他們延續(xù)了這種發(fā)展趨勢,不斷推出3核、4核、6核以及8核的中央處理器。這種趨勢也稱為多核革命(Multicore Revolution),它標(biāo)志著在個(gè)人計(jì)算機(jī)上開始發(fā)生重大的轉(zhuǎn)變。當(dāng)前,要購買一臺(tái)單核CPIJ的桌面計(jì)算機(jī)已經(jīng)比較困難了。即使在低端、低能耗的中央處理器中,通常都包含有兩個(gè)或多個(gè)計(jì)算核。一些業(yè)界領(lǐng)先的CPU制造商已經(jīng)宣布在未來將計(jì)劃推出12核和16核的CPU,這進(jìn)一步證明了并行計(jì)算已經(jīng)給人們帶來了不可忽視的好處。1.3 GPU計(jì)算的崛起與中央處理器傳統(tǒng)的數(shù)據(jù)處理流水線相比,在圖形處理器(Graphics Processing unit,GPU)上執(zhí)行通用計(jì)算還是一個(gè)新概念。事實(shí)上,在計(jì)算領(lǐng)域中,GPU本身在很大程度上就是一個(gè)新概念。然而,在圖形處理器上執(zhí)行計(jì)算卻并非新概念。1.3.1 GPU簡史在前面介紹了中央處理器在時(shí)鐘頻率和處理器核數(shù)量上的發(fā)展歷程。與此同時(shí),圖形處理技術(shù)同樣經(jīng)歷了巨大的變革。在20世紀(jì)80年代晚期到90年代早期之間,圖形界面操作系統(tǒng)(例如Microsoft公司的Windows)的普及推動(dòng)了新型處理器的出現(xiàn)。在20世紀(jì)90年代早期,用戶開始購買配置2D顯示加速器卡的個(gè)人計(jì)算機(jī)。這些顯卡提供了基于硬件的位圖運(yùn)算功能,能夠在圖形操作系統(tǒng)的顯示和可用性上起到輔助作用。
媒體關(guān)注與評(píng)論
“對(duì)于開發(fā)基于GPU加速的并行計(jì)算系統(tǒng)的讀者來說,本書絕對(duì)值得一讀?!薄 狫ack Dongarra 田納西大學(xué)杰出教授美國橡樹嶺國家實(shí)驗(yàn)室杰出研究人員
編輯推薦
《GPU高性能編程CUDA實(shí)戰(zhàn)》由機(jī)械工業(yè)出版社出版。
圖書封面
圖書標(biāo)簽Tags
無
評(píng)論、評(píng)分、閱讀與下載
GPU高性能編程CUDA實(shí)戰(zhàn) PDF格式下載