GPU简介及高性能并行计算
12页1、第一章.GPU的诞生NVIDIA公司在1999年8月31日发布GeForce 256图形处理芯片时首先提出GPU的概 念。GPU 之所以被称为图形处理器,最主要的原因是因为它可以进行几乎全部与计算机图形 有关的数据运算,而这些在过去是CPU的专利。目前,计算机图形学正处于前所未有的发展时期。近年来,GPU技术以令人惊异的速度 在发展。渲染速率每6个月就翻一番。性能自99年, 5 年来翻番了10次,也就是(2 的10 次方比2)提高了上千倍!与此同时,不仅性能得到了提高,计算质量和图形编程的灵活性 也逐渐得以改善。以前,PC和计算机工作站只有图形加速器,没有图形处理器(GPU),而图形加速器只 能简单的加速图形渲染。早期GPU的强大处理功能只被用于3D图像渲染,应用领域受到了 限制。随着以CUDA为代表的GPU通用计算API的普及,GPU在计算机中的作用将更加重要, GPU的含义也可能从图形处理器(Graphic Processing Unit)扩展为通用处理器(General Purpose Unit)。第二章.GPU发展简介2.1 GPU渲染流水线GPU 的渲染流水线的主要任务是完成
2、 3D 模型到图像的渲染工作。常用的图形学 API (Direct3D/0penGL)编程模型中的渲染过程被分为几个可以处理的阶段,分别由GPU中渲 染流水线的不同单元进行处理。GPU输入的模型是数据结构(或语言)定义的对三维物体的 描述,包括几何、方向、物体表面材质以及光源所在位置等;而SPU输出的图像则是从观察 点对3D场景观测到的二维图像。在GPU渲染流水线的不同阶段,需要处理的对像分别是顶 点(vertex)几何图元(primitive)、片元(fragment)像素(pixel)。如下图Vertex buffer-谛人散AH円山蜡述)iI.I顶点生成卜W呷嵋片.兀牛rasterization)典型渲染过程可分为以下几个阶段:1. 顶点生成图形学API用简单的图元(点、线、三角形)表示物体表面。每个顶点除了(x,y,z)三维 坐标属性外还有应用程序自定义属性,例如位置、颜色、标准向量等。2. 顶点处理 本阶段主要是通过计算把三维顶点坐标映射到二维屏幕,计算各顶点的亮度值等。这个阶段 是可编程的,由ver tex shader完成。输入与输出一一对应,即一个顶点被处理后仍然是一
3、个顶点,各顶点间的处理相互独立,可以并行完成。3. 图元生成 根据应用程序定义的顶点拓扑逻辑,把上阶段输出的顶点组织起来形成有序的图元流。顶点 拓扑逻辑定义了图元在输出流中的顺序,一个图元记录由若干顶点记录组成。4. 图元处理这一阶段也可编程的,由geometry shader完成。输入和输出不是一一对应,一个图元被处 理后可生成0个或者多个图元,各图元处理也是相互独立的。本阶段输出一个新的图元流。5. 片元生成 这一阶段将对每一个图元在屏幕空间进行采样,及光栅化。每一个采样点对应一个片元记录, 记录该采样点在屏幕空间的位置,与视点之间的距离以及通过插值获得的顶点属性等。6. 片元处理片元处理阶段是可编程的,有pixel shader完成,主要完成图形的填色功能。模拟光线和 物体表面的交互作用,决定每个片元的颜色及透明程度等属性。7. 像素操作 用每个片元的屏幕坐标来计算该片元对最终生成图像上的像素的影响程度。本阶段计算每个 采样点离视点的距离,丢弃被遮挡住的片元。当来自多个片元影响同一个像素时,往往都根 据图元处理输出流中定义的图元位置进行像素更新。图形渲染过程具有内在的并行性:顶点
4、之间、图元之间、片元之间的数据相关性很弱,对他 们计算可以独立并行进行。这使得通过并行处理提高吞吐量成为可能。首先,渲染流水线具有时间上的功能并行。流水线的各级可以同时工作,当各级都能满负荷 工作时,能够获得最高性能。其次,渲染流水性具有数据并行性。不仅可以通过SIMD提高每一个可编程着色器的性能, 还可以在一个GPU内集成多条渲染流水线实现更高的吞吐量。2.2 着色器模型在图形熏染中,GPU中可编程计算单元被称为着色器(shader),着色器的性能由DirectX 中规定的 shader model 来区分。 GPU 中最主要的可编程单元是顶点着色器和像素着色器。为了实现更细腻逼真的画质,GPU的体系架构从最早的固定功能流水线到可编程流水线,再 到 DirectX 10 时代的以通用的可编程计算单元为主、图形固定功能单元为辅的形式。在这 一过程中,着色器的可编程性也随着架构的发展不断提高。下面给出每代模型的大概特点。表仁2 Shader Model SJ6本Shader ModelGPU代表显卡时代特点1999年第-代GeForce 256DirectX 71999*- 2001GP
《GPU简介及高性能并行计算》由会员工****分享,可在线阅读,更多相关《GPU简介及高性能并行计算》请在金锄头文库上搜索。
北京住总第六开发建设有限公司施工组织设计推荐模板
软件操作手册V11
重点项目竹浆一体化建设项目可行性研究报告申请立项备案可修改案例
《小学数学合作学习中学生独立思考的意识和能力的培养》中期研究报告---于华
重庆市彭水一中高一生物下学期期中试题06151
公司人事助理转正工作总结2023年.doc
制药类个人简历模板
江苏省丹阳市八年级语文上学期期末复习讲义2新人教版
南平市生物经济项目投资决策报告
2016IT运维服务目录SLA
分式先化简再求值集中练习题
2022年区民政局上年工作总结
通用变频器原理与变频器选用原则
2019年两化融合管理体系
中小学美术教师招聘考试试题
成仁路道路改移方案88修改定
太阳能风光光互补控制器检测方案
论据的选择与运用一精选范文
南开大学21秋《药学概论》在线作业一答案参考45
节能减排考核与奖惩制度完
2023-12-29 12页
2023-05-24 5页
2023-09-02 7页
2024-02-04 3页
2022-08-07 7页
2022-08-15 9页
2023-03-14 3页
2023-12-28 17页
2023-12-10 12页
2023-10-14 10页