皮皮网

皮皮网

【freertos源码注释】【溯源码燕窝的起源】【身份证溯源码】gcn源码分析

时间:2025-01-08 00:08:16 分类:探索

1.AMD 编译概述 & Fatbin 文件生成 & HIP Runtime API(启动 CUDA 核函数)
2.ROCm-RV生态分析
3.st-gcn环境搭建

gcn源码分析

AMD 编译概述 & Fatbin 文件生成 & HIP Runtime API(启动 CUDA 核函数)

       AMD 平台的码分术语概览

       AMD GPU 计算生态基于 ROCm(Radeon Open Computing platform),ROCm 包括ROC 和 Radeon 等简称,码分ROC:Radeon 开放计算平台,码分Radeon 是码分 AMD GPU 产品的品牌名。ROCm 类似于 CUDA 于 NVIDIA GPU。码分ROCx 包含 ROCr - ROC Runtime,码分freertos源码注释ROCk - ROC kernel driver,码分 ROCt - ROC Thunk。

       HIP(Heterogeneous-Computing Interface for Portability)是码分一个旨在简化 CUDA 应用程序到便携式 C++ 代码转换的接口,支持 C 风格的码分 API 和 C++ 内核语言。

       HIP-Clang 是码分 AMDGPU 异构编译器,用于在 AMD 平台上编译 HIP 程序。码分

       HCC(Heterogeneous Compute Compiler)是码分面向异构设备的开源 C++ 编译器,基于 LLVM + CLANG,码分实现将并行编程程序转换为 AMD GCN ISA。码分

       在 ROCM v3.5 版本前,码分HCC 编译器被使用,之后引入了 HIP-Clang 编译器,HCC 编译器不再发展新特性,AMD 公司不再维护。溯源码燕窝的起源

       “HIP化”工具,即 HIPify,能将 CUDA 代码转换为便携式 C++ 代码,自动执行大部分转换工作。

       ROCm 计算平台的编译流程包括使用 HIPify 工具转换 CUDA 源码到 HIP 源码,HIP 源码能够在 AMD 或 NVIDIA GPU 上运行。

       在 AMD ROCm 平台上,HIP 提供 HIP 运行时 API,实现与应用程序链接的对象库,包括流、事件和内存管理。在 NVIDIA CUDA 平台上,提供头文件,从 HIP 运行时 API 转换为 CUDA 运行时 API,提供内联函数以实现低开销。

       在 AMD ROCm 平台生成 Fat Binary 文件,使用 clang-offload-bundler 工具,将针对不同架构的身份证溯源码多个 ELF 二进制文件合并成单个捆绑文件。

       clang-offload-bundler 工具在编译过程中对翻译单元进行多次编译,生成主机和设备代码对象,然后合并这些代码对象到单个捆绑文件中。

       HIP Runtime API 支持 CUDA <<<>>> 核函数语法,通过 hip-clang 编译选项选择 -fhip-new-launch-api,遇到 <<<>>> 时,调用一系列 API 来存储和处理核运行参数,最终通过 hipLaunchKernel API 运行核函数。

       在编译过程中,使用 hip-clang 时,会调用 API 来存储核运行参数,然后通过桩函数调用,再通过 hipLaunchKernel API 实现核函数的运行。

       API 包括用于初始化和注册函数的 API,如 __hipRegisterFatBinary 和 __hipRegisterFunction,保证 fatbin 文件只加载一次。

ROCm-RV生态分析

       ROCm(Radeon Open Compute)是一个开放源代码的软件平台,其核心功能在于支持AMD GPU的源码贴牌骗局曝光并行计算与加速计算任务。该平台提供了一系列工具和库,方便开发者利用AMD GPU性能进行高性能计算、深度学习和机器学习等任务。然而,ROCm的成熟度相对CUDA而言有所不足。ROCm主要针对Linux系统,而CUDA则广泛兼容包括Windows、Linux和macOS等操作系统平台。

       ROCm的底层结构基于Linux的admgpu Driver,而RV生态的基础则是Linux显卡驱动。此驱动包含部分闭源代码,且目前尚不完全清楚RV生态下的开源GPU已达到何种程度。在开始讨论RV硬件生态环境之前,我们先来看看AMD通过ROCm支持的GPU硬件设备。

       AMD的ROCm支持涵盖AMD Instinct、AMD Radeon PRO和AMD Radeon三个GPU系列。国内开发者主要接触到的是AMD Radeon PRO和AMD Radeon两个系列,分别面向专业工作站和消费市场。行业涨幅指标公式源码ROCm未来将淘汰的GPU型号,开发者在RV生态开发时可将其置于次要优先级。

       接下来,我们探讨RV生态的移植平台分析。市面上的SG处理器基本满足桌面端与服务端需求,具备单路与双路实现能力。以XTX为例,其需要PCIe 4.0 X通道,SG能够满足这一需求,因此硬件环境符合要求。

       至于RV生态中对GPU的支持情况,RISC-V已全面支持旧款GCN架构显卡,并正在支持Navi架构GPU。当前Linux内核版本已更新至V6.9,对于Navi架构GPU的支持可进行验证。同时,老款GCN架构显卡在ROCm中被舍弃,需要特定版本支持特定GPU。

       综上所述,RV生态支持ROCm需同时考虑软硬件配合。当前硬件环境基本满足要求,但不如X或ARM平台丰富。对于软件开发者而言,在RV环境下运行ROCm,可能需关注以下几点。

       考虑到RV生态的建设任重道远,硬件和软件都需要大量开发才能实现多元化发展。

st-gcn环境搭建

       搭建ST-GCN环境的步骤如下:

       一、硬件与系统准备

       推荐使用基于Ubuntu .的系统,可从浙大官网下载稳定版本的镜像。通过U盘启动制作Ubuntu系统盘,完成格式化后使用深度制作工具进行系统安装。在桌面计算机中使用磁盘管理工具创建Ubuntu分区,一般GB空间足矣。通过BIOS设置将U盘设置为启动优先项,然后开始安装Ubuntu系统。

       二、安装Python3

       在Ubuntu系统中,将Python3设置为默认版本,使用pip进行包管理无需额外命令。在终端中通过快捷键或命令行操作完成Python3的安装。

       三、软件源配置

       使用国内服务器作为Ubuntu软件源,推荐使用阿里云提供的服务,无需额外配置。如果使用官方镜像,可能需要更新软件源以获取最新软件包。

       四、安装显卡驱动

       使用NVIDIA显卡的用户,需安装对应版本的驱动程序。通过三种方法之一:官方PPA源安装、下载并编译安装、添加官方PPA源后安装。

       五、安装CUDA和cuDNN

       检查NVIDIA显卡型号和系统内核版本,确保CUDA版本与驱动匹配。下载CUDA和cuDNN,按步骤安装,确保安装成功并验证。

       六、安装Python3的pip虚拟环境

       在Python3环境下安装pip,所有pip命令都将在Python3环境中执行。创建虚拟环境管理目录,将虚拟环境添加到环境变量中,并创建Python3虚拟环境。

       七、安装torch和torchvision

       使用国内源安装torch和torchvision,可永久修改pip安装源。查看Python版本与对应torch版本的关系,确保兼容性。

       八、安装cmake

       使用cmake配置编译参数,安装cmake和cmake-gui,确保cmake操作顺利进行。

       九、安装opencv

       可以选择通过apt-get安装opencv-python或从源码构建。构建时注意解压、更新依赖、下载ippicv,确保opencv功能齐全。

       十、安装caffe

       从openpose提供的链接下载caffe源码,解压后修改Makefile配置参数,编译安装。

       十一、安装openpose

       在caffe目录下连接openpose,下载源码,配置编译参数,确保兼容性和接口接入,测试安装成功。

       十二、安装ffmpeg

       下载ffmpeg源码,安装依赖环境,配置并编译安装。推荐使用smplayer作为视频播放软件。

       完成上述步骤后,环境搭建就已基本完成。评估官方模型,训练自己的模型,进行样本示例展示。安装视频播放软件,如smplayer,用于观看可视化效果。欢迎指出错误与建议,祝您搭建成功!