Skip to main content

12 docs tagged with "GPU"

View all tags

CUDA 第一个Hello World程序

本文从CUDA “Hello World”程序展开CUDA编程讲解。解析源码特殊点,介绍`__global__`等执行空间限定符。阐述线程层次结构,包含Grid、Block、Thread关系及内置坐标变量,助读者掌握CUDA编程基础概念。

CUDA代码编译流程

文章介绍CUDA Toolkit,涵盖NVCC编译器等核心组件。阐述CUDA程序编译流程,解析NVCC编译原理,包括代码分离、PTX中间表示。提及多架构支持与编译优化技术,通过实际示例说明,助开发者掌握原理,编写高效稳定CUDA程序。

CUDA共享内存的用法

文章介绍CUDA共享内存,它是GPU关键内存层次,位于SM芯片上,速度快,由同线程块线程共享。使用它可减少对全局内存慢速访问,有静态和动态两种声明方式。还提及使用注意事项及应用场景,并通过数组平方和示例演示其优势。

CUDA开发环境搭建

本文讲解CUDA开发环境搭建,适用于Windows、Linux平台(macOS自2019年后不再获NVIDIA支持)。先介绍系统要求,后分平台说明安装步骤,包括检查兼容性、安装依赖与工具包、设置环境变量及验证,还给出测试程序与故障排除方法。

CUDA编程概述

CUDA是并行计算平台与编程模型,能借GPU算力提升性能,在多领域广泛应用。先阐述GPU优势,其专为并行计算优化,性能高于CPU。接着说明CUDA为通用平台,支持多种语言。还介绍其可扩展编程模型,以及CPU+GPU异构计算模型,二者优势互补

用CUDA实现数学计算

文章从CUDA简单算术运算讲起,以两数加法示例阐述参数传递、执行配置等。接着介绍一维向量加法,说明并行计算思想与线程配置。最后讲解二维矩阵乘法,涵盖原理、代码实现及性能对比,展示CUDA在数学计算中的应用与优势。