炼数成金 门户 CUDA 查看内容

从图形处理到通用并行计算

2015-9-9 12:22| 发布者: 炼数成金_小数| 查看: 1626| 评论: 0|原作者: 风辰|来自: it168

摘要: 市场对实时、高清晰度的三维图形具有无法满足的需求,由于这种需求的推动,可编程图形处理器(GPU)已经演化成高并行度,多线程,拥有强大计算能力和极高存储器带宽的多核处理器,如图1-1所示:图1-1. GPU 和CPU 每秒 ...

模型 存储 金融 GPU 并行计算

市场对实时、高清晰度的三维图形具有无法满足的需求,由于这种需求的推动,可编程图形处理器(GPU)已经演化成高并行度,多线程,拥有强大计算能力和极高存储器带宽的多核处理器,如图1-1所示:
CUDA开发:从图形处理到通用并行计算
图1-1. GPU 和CPU 每秒浮点操作数和存储器带宽

GPU 和CPU 的浮点计算能力差异的原因是:GPU 是特别为计算密集,高并行度计算(如同图像渲染)设计的,因此将更多的晶体管用于数据处理而不是数据缓存和流控,如图1-2 所示。
CUDA开发:从图形处理到通用并行计算
 
特别地,GPU 非常适合处理那些能够表示为数据并行计算(同一程序在多个数据上并行执行)的问题,数据并行计算的算术计算密度(算术操作和存储器操作的比例)非常高。由于同一程序在每个元素上执行,因此对复杂流控的要求非常少,更因为在多个元素上执行和高计算密度,访存延迟可以被计算隐藏,因此用不着大的数据缓存。

数据并行处理将数据元素映射到并行处理的线程上。很多处理大的数据集的应用可以使用数据并行处理模型加速。三维图像渲染处理中,大量的像素和顶点被映射到并行线程。类似地,图像和多媒体处理应用、图像渲染的后处理、视频编解码、图像缩放、立体视觉和模式识别能够将图像块和像素映射到并行处理的线程。实际上,除了图像渲染和处理领域,还有很多算法已被数据并行处理加速,从普通信号处理或物理模拟到计算金融或计算生物学。

鲜花

握手

雷人

路过

鸡蛋

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

热门文章

     

    GMT+8, 2020-10-30 11:53 , Processed in 0.162856 second(s), 23 queries .