1 GPU基本概念1.1 CUDACUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 CUDA核心数量决定了GPU并行处理的能力,在深度学习、机器学习等并行计算类业务下,CUDA核心多意味着性能好一些。1.2 Tensor(张量) 内            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-14 19:15:41
                            
                                592阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            CUDA核函数  在GPU上执行的函数称为CUDA核函数(Kernel Function),核函数会被GPU上多个线程执行,我们可以在核函数中获取当前线程的ID。// CUDA核函数的定义
__global__ void addKernel(int *c, const int *a, const int *b)
{
    int i = threadIdx.x;
    c[i] = a[i]            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-20 19:09:50
                            
                                49阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            GPU 编程可以称为异构编程,最近由于机器学习的火热,很多模型越来越依赖于GPU来进行加速运算,所以异构计算的位置越来越重要;异构编程,主要是指CPU+GPU或者CPU+其他设备(FPGA等)协同计算。当前的计算模型中,CPU主要用来进行通用计算,其更多的是注重控制,我们可以通过GPU和FPGA等做专用的计算。CPU负责逻辑性强的事物处理和串行计算,GPU则专注于执行高度线程化的并行处理任务(大规            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-07 22:57:20
                            
                                150阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            GPU架构及CUDA基础理解cuda core,sm,sp显存显存(Global Memory):显存是在GPU板卡上的DRAM,类似于CPU的内存,就是那堆DDR啊,GDDR5啊之类的。特点是容量大(可达16GB),速度慢,CPU和GPU都可以访问。计算单元计算单元(Streaming Multiprocessor):执行计算的。每一个SM都有自己的控制单元(Control Unit),寄存器(            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-24 22:07:21
                            
                                520阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            一篇文章理解CUDA架构、编程与进阶使用一、CUDA架构二、CUDA编程基础1.矩阵加法2.矩阵乘法三、CUDA进阶 I——利用共享内存加速访存1.CUDA内存读写速度比较2.申请共享内存四、CUDA进阶 II——利用stream加速大批量文件IO读写耗时1. 认识CUDA stream2. CUDA stream API介绍五、CUDA进阶 III——调用cuBLAS库API进行矩阵计算 本文            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-07 18:04:39
                            
                                210阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1、GPU的起源GPU缩写为Graphics Processing Unit的,一般称为视觉处理单元。GPU被广泛用于嵌入式系统、移动电话、个人电脑、工作站和电子游戏解决方案当中。现代的GPU对图像和图形处理是十分高效率的,这是因为GPU被设计为很高的并行架构这样使得比通用处理器CPU在大的数据块并行处理算法上更具有优势。1985年 8月20日 ATi公司成立,同年10月ATi使用ASIC技术开发            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-10-01 15:26:17
                            
                                186阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            在英伟达和AMD发布了一段时间的一致显卡之后,事情在二月份已经降温。没有新的GPU可以谈论,没有特别惊人的交易或任何东西,但仍然值得看看市场现在的表现如何,因为它已经稳定下来,以及我们在未来几个月可以期待什么。过去一个月的两个主要亮点之一:美国的一些幸运客户在百思买(Best Buy)的Nvidia GeForce 30系列卡上获得了“清仓”价格。其中包括RTX 3090 Ti跌至880美元,RT            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-26 19:28:09
                            
                                122阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            基本概念:GPU: Graphic Processing Unit;图形处理单元;GPGPU: General Purpose computations on GPU;通用计算图形处理单元;CPU与GPU的相同点:(1)都是计算机体系结构中的重要组成部分;(2)都是超大规模集成电路元件;(3)都能够完成浮点运能功能;            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-09-19 00:23:21
                            
                                407阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            GPU是一个外围设备,本来是专门作为图形渲染使用的,但是随着其功能的越来越强大,GPU也逐渐成为继CPU之后的又一计算核心。但不同于CPU的架构设计,GPU的架构从一开始就更倾向于图形渲染和大规模数据的并行计算处理。而大规模的并行计算,离不开大规模的数据传输,只有深入了解了GPU的存储体系,才能真正发挥GPU的威力,写出高性能的软件产品。但是由于GPU存储体系相关的资料非常少,加之非常分散,所以在            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-30 18:27:42
                            
                                372阅读
                            
                                                                             
                 
                
                             
         
            
            
            
             概述今天主要介绍一下GPU、CPU和两者之间的区别。1、CPU即中央处理器CPU( Central Processing Unit, 中央处理器)就是机器的“大脑”,也是布局谋略、发号施令、控制行动的“总司令官”。 CPU的结构主要包括运算器(ALU, Arithmetic and Logic Unit)、控制单元(CU, Control Unit)、寄存器(Register            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-05-26 14:40:59
                            
                                179阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            文章目录一、微架构二、主频三、IPC(每个时钟周期执行的指令数)四、总结 一、微架构笔者主要从它们执行运算的速度与效率的两方面探讨这个论题。 CPU和GPU都是具有运算能力的芯片,CPU更像“通才”——指令运算(执行)为重+ 数值运算,GPU更像“专才”——图形类数值计算为核心。在不同类型的运算方面的速度也就决定了它们的能力——“擅长和不擅长”。芯片的速度主要取决于三个方面:微架构,主频和IPC            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-07-30 22:19:04
                            
                                302阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            不同操作系统进行跑分测试【win、linux】跑分通常是指,我们通过一些专业的软件来综合检测一个计算机的总体性能的方法1 Windows1.1 操作步骤从网上下载一些专业的软件【如:鲁大师、everest等】如果是win10的话,可以使用微软自带的跑分工具win+R,输入winsat formal等待系统自动跑分,跑完之后窗口会闪烁几次,然后自动关闭,如果没有看到数据结果的也不用慌张回到桌面,然后            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-26 10:14:56
                            
                                517阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            简介在本专栏的上一篇文章中,初步介绍了MMDetection的由来以及环境的配置,并提到了控制整个pipeline的配置文件,本文就来详细聊一聊配置文件的点点滴滴。配置文件结构不同于Detectron2采用YAML文件作为配置文件的方式,MMDetection采用Python脚本作为配置文件,这一定程度上方便了解析。不过,在谈具体的配置文件的结构之前,首先介绍一个官方提供的工具,它位于mmdete            
                
         
            
            
            
            写在前面的话使用深度学习解决计算机视觉相关问题Python为主的互联网应用服务基于MIPS指令集的CPU微体系结构设计引言目前,由于大数据、深度学习、人工智能的快速发展,传统的计算机受限于算力的不足,已经无法满足相关学科在进行科研训练、实验的需求。科研人员希望可以获得更多的算力来提升运算的速度,以便于能够在更短的时间内取得结果。解决算力的主要方法有如下几种使用多个计算机或服务器搭建一个集群用于计算            
                
         
            
            
            
            【C++】获得本机所有网卡的IP和MAC地址信息 
 一台机器上可能有多个网卡,每一个网卡只有一个MAC地址,但是每一个网卡可能配置有多个IP地址;如平常的笔记本电脑中,就会有无线网卡和有线网卡(网线接口)两种;因此,如果要获得本机所有网卡的IP和MAC地址信息,则必须顺序获得每个网卡,再依次获取其信息等;在windows sdk中,用IP_ADAPTER_INFO结构体存储网卡信息,包括网            
                
         
            
            
            
            随着人工智能越来越火,越来越多的人想从事人工智能相关的工作,如计算机视觉等。如果你正想或已经入门计算机视觉行业,你必须拥有GPU。因为深度学习的成功与否很大程度上取决于硬件承载的能力,所以你必须要一个GPU来训练你的模型!作者&编辑 | 汤兴旺&言有三 1 什么是GPU计算机常见的处理器包括CPU和GPU,CPU即中央处理单元(Central processing u            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-17 07:14:16
                            
                                43阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            1、GPU架构概述GPU是一种众核架构,非常适合解决大规模的并行计算。GPU是CPU的协处理器,必须通过PCIe总线与基于CPU的主机(Host)相连来进行操作,形成异构架构,如下图所示。其中CPU为主机端(Host),负责逻辑控制、数据分发,GPU为设备端(Device),负责并行数据的密集型计算。其中,ALU为算数运算单元。GPU架构是围绕一个流式多处理器(SM)的可扩展阵列搭建的。下图是英伟            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-06-06 06:46:54
                            
                                1212阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            主参考:ubuntu16.04安装tensorflow-gpu-1.7.1-cuda 9.0+cudnn v7.1+Anaconda3辅助参考:ubuntu16.04下安装CUDA,cuDNN及tensorflow-gpu这里系统各项环境为:ubuntu16.04系统,显卡为GTX1080.装的是9.0的CUDA+7.1的CUDNN开始安装步骤前,需要先确认自己电脑配置:1.查看显卡(确认你有一个            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-06-30 13:06:54
                            
                                40阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            概念 GPU(Graphics Processing Unit),也即显卡,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上作图像运算工作的微处理器。它已经是个人PC和移动设备上不可或缺的芯片,有界面有显示的地方,一般就离不开它。高清电视、智能手机、个人电脑。GPU的产生是为了解决图形渲染效率的问题,但随着技术进步,GPU越来越强大,尤其是shader出现之后(这个允            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-15 12:37:52
                            
                                98阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            物理概念:streaming processor(sp): 最基本的处理单元。GPU进行并行计算,也就是很多个sp同时做处理。现在SP的术语已经有点弱化了,而是直接使用thread来代替。thread(sp)是一起工作的,执行相同的指令,如果没有这么多t            
                
                    
                        
                                                            
                                                                        
                                                                                        原创
                                                                                    
                            2023-01-20 10:38:32
                            
                                573阅读
                            
                                                                             
                 
                
                                
                    