CUDA与TensorRT部署实战课程(完结8章,附源码+课件) – 夸克网盘吧kuakeba.cn

资源信息 资源名称:CUDA与TensorRT部署实战课程(完结8章,附源码+课件) 资源类型:课程 资源标签:#CUDA与TensorRT部署实战课程(完结8章,附源码+课件)#课程 资源来源:夸克网盘吧Kuakeba.cn 资源简介 CUDA(Compute Unified Device Architecture

CUDA与TensorRT部署实战课程(完结8章,附源码+课件)

资源信息

资源名称:CUDA与TensorRT部署实战课程(完结8章,附源码+课件)
资源类型:课程
资源标签:#CUDA与TensorRT部署实战课程(完结8章,附源码+课件)#课程
资源来源:夸克网盘吧Kuakeba.cn

资源简介

CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员可以使用C语言来为CUDA™架构编写程序,所编写出的程序可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。

 

从CUDA体系结构的组成来说,包含了三个部分:开发库、运行期环境和驱动(表2)。

开发库是基于CUDA技术所提供的应用开发库。CUDA的1.1版提供了两个标准的数学运算库——CUFFT(离散快速傅立叶变换)和CUBLAS(离散基本线性计算)的实现。这两个数学运算库所解决的是典型的大规模的并行计算问题,也是在密集数据计算中非常常见的计算类型。开发人员在开发库的基础上可以快速、方便的建立起自己的计算应用。此外,开发人员也可以在CUDA的技术基础上实现出更多的开发库。

运行期环境提供了应用开发接口和运行期组件,包括基本数据类型的定义和各类计算、类型转换、内存管理、设备访问和执行调度等函数。基于CUDA开发的程序代码在实际执行中分为两种,一种是运行在CPU上的宿主代码(Host Code),一种是运行在GPU上的设备代码(Device Code)。不同类型的代码由于其运行的物理位置不同,能够访问到的资源不同,因此对应的运行期组件也分为公共组件、宿主组件和设备组件三个部分,基本上囊括了所有在GPGPU开发中所需要的功能和能够使用到的资源接口,开发人员可以通过运行期环境的编程接口实现各种类型的计算。

由于存在着多种GPU版本的NVidia显卡,不同版本的GPU之间都有不同的差异,因此驱动部分基本上可以理解为是CUDA-enable的GPU的设备抽象层,提供硬件设备的抽象访问接口。CUDA提供运行期环境也是通过这一层来实现各种功能的。基于CUDA开发的应用必须有NVIDIA CUDA-enable的硬件支持,NVIDIA公司GPU运算事业部总经理Andy Keane在一次活动中表示:一个充满生命力的技术平台应该是开放的,CUDA未来也会向这个方向发展。由于CUDA的体系结构中有硬件抽象层的存在,因此今后也有可能发展成为一个通用的GPGPU标准接口,兼容不同厂商的GPU产品。

 

Tensor是一个有助于在NVIDIA图形处理单元(GPU)上高性能推理c++库。它旨在与TesnsorFlow、Caffe、Pytorch以及MXNet等训练框架以互补的方式进行工作,专门致力于在GPU上快速有效地进行网络推理。

 

TensorRT是nvidia家的一款高性能深度学习推理SDK。此SDK包含深度学习推理优化器和运行环境,可为深度学习推理应用提供低延迟和高吞吐量。在推理过程中,基于TensorRT的应用程序比仅仅使用CPU作为平台的应用程序要快40倍。

 

TensorRT包含两个阶段:编译build和部署deploy。

编译阶段对网络配置进行优化,并生成一个plan文件,用于通过深度神经网络计算前向传递。plan文件是一个优化的目标代码,可以序列化并且可存储在内存和硬盘中。

部署阶段通常采用长时间运行的服务或者用户应用程序的形式。它们接收批量输入数据,通过执行plan文件在输入数据上进行推理,并且返回批量的输出数据(分类、目标检测等)

 

为了优化模型的inference,TensorRT会根据网络的定义执行优化【包括特定平台的优化】并生成inference engine。此过程被称为构建阶段,尤其是在嵌入式平台上会消耗大量的时间,因此,一个典型的应用程序只会被构建一次engine,然后将其序列化为plane file以供后续使用。【注意:生成的plane file 不能跨平台或TensorRT 版本移植。另外,因为plane file是明确指定GPU 的model,所以我们要想使用不同的GPU来运行plane file必须得重新指定GPU】

资源目录

CUDA与TensorRT部署实战课程(完结8章,附源码+课件)
├─ 源码+课件+答疑手册.rar
├─ 第1章 并行处理与GPU体系架构.rar
├─ 第2章 CUDA编程入门.rar
├─ 第3章 TensorRT基础入门.rar
├─ 第4章 TensorRT模型部署优化.rar
├─ 第5章TensorRT API的基本使用.rar
├─ 第6章 实战:部署分类器(CNN&ViT).rar
├─ 第7章 实战:部署YOLOv8检测器.rar
├─ 第8章 实战:部署BEVFusion模型.rar
├─ 试看(随机抽取3节,普通播放器打开).rar
└─ 课程目录截图.png

下载地址:

夸克网盘

暂无介绍....

延伸阅读:

《樊登小读者》大合集 – 夸克网盘吧kuakeba.cn

资源信息 资源名称:《樊登小读者》大合集 资源类型:教育/课程 资源标签:#阅读 #文学 #亲子教育 #课程 #樊登小读...

2024 年 12 月 21 日
B站-盗月社沐上&闫帅奇《男性生活化减脂课程》 – 夸克网盘吧kuakeba.cn

资源信息 资源名称:B站盗月社沐上&闫帅奇《男性生活化减脂课程》 资源类型:课程 资源标签:#健身 #减脂 #教...

2024 年 12 月 19 日
B站精品课《搭建读书体系:编辑渡边的阅读课》 – 夸克网盘吧kuakeba.cn

资源信息 资源名称:B站精品课《搭建读书体系:编辑渡边的阅读课》 资源类型:课程 资源标签:#文学 #阅读 #课程 #B...

2024 年 12 月 19 日
《假日博物馆合集》知识动漫科普,价值大几千的课程 – 夸克网盘吧kuakeba.cn

资源信息 资源名称:《假日博物馆合集》知识动漫科普,价值大几千的课程 资源类型:课程 资源标签:#历史 #文化 #中国通...

2024 年 12 月 19 日
米你课堂《PS+Ai软件零基础到实训班第15期》 – 夸克网盘吧kuakeba.cn

资源信息 资源名称:米你课堂《PS+Ai软件零基础到实训班第15期》 资源类型:课程 资源标签:#PS #Ai #办公效...

2024 年 12 月 18 日