【GPU】图形流水线基础【GPU】逻辑上的模块划分【GPU】部署到硬件【GPU】完整的软件栈前几期我们过了一遍GPU的软硬栈。这次我们将深入GPU图形流水线的一些细节,看看那些不可编程的模块是怎么工作的。对于GPU的图形流水线来说,最核心最重要的一个组件就是光栅化器。它的存在,直接决定了GPU在实时渲染方面的优势。以至于很多时候光栅化就是GPU图形流水线的代称。以前说过,经过vertex shad            
                
         
            
            
            
            第二章:寄存器(CPU工作原理)10让编程改变世界Change the world by program段寄存器 段寄存器就是提供段地址的。 8086CPU有4个段寄存器:  CS、DS、SS、ES 当8086CPU要访问内存时,由这4个段寄存器提供内存单元的段地址。    CS和IP CS和IP是8086CPU中最关键的寄存器,它们指示了CPU当前要读取指令的地址。  CS为代码段寄存            
                
         
            
            
            
            随着电脑日益进入到我们的生活,它们已经是我们密不可分的伙伴。CPU则是电脑中最重要的部件之一,对系统性能有着决定性的影响。物尽其用,让CPU发挥出系统最大性能,能够更好地为我们服务,何乐而不为呢? 
  
 如何让CPU发挥系统最大性能 
 让系统运行更快,可以通过给CPU“提速”和减少无用系统程序占用CPU资源两种方案解决。一为硬件手段,通过对            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-18 00:00:37
                            
                                148阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            ubuntu16.04 + cuda9.1 + cudnn7.1 + OpenCV3.4 + caffe(GPU)
    //系统平台:Ubuntu16.04.4 LTS//默认安装cuda9.1+cudnn7.1+opencv3.4+caffe(GPU)//同时测试基本兼容了cuda8.0+cudnn6.0+opencv3.2+caffe(GPU)安装//如            
                
         
            
            
            
            1 前言原料:我有两台电脑,一台是Win10系统的小米笔记本12.5(简称为A电脑),一台是Ubuntu系统的小米游戏本(简称为B电脑)。A电脑没有GPU,没有配置任何深度学习环境;而B电脑的GPU是GTX 1060,配置好了深度学习环境,已经能用CUDA跑代码了。A电脑和B电脑使用的IDE都是VS Code。需求:代码调试:因为B电脑有GPU,我希望能够用A电脑调试B电脑的代码。场景1(远程调试            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-27 10:20:35
                            
                                314阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            我使用的YOLO的GPU版本工程是代码链接是:yolo-windows-master,其博客地址是:CPU版本的博客地址是:1、GPU配置,其中yolo使用的GPU版本的,其网上下载的代码基本是用CUDA7.5计算版本的,如果自己系统装的不是这个版本的则会出现加载工程失败,其错误信息如下:此时双击上面的无法加载cuda属性表的错误,这个属性表是我们在安装CUDA时会在系统目录下自动生产相应版本的。            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-03-25 17:42:25
                            
                                96阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            目录如何在GPU上训练pytorch代码?1.需要将哪些数据送入gpu里呢?2. 如何将这三个部分送入gpu呢?如何确认程序是否在GPU上跑——查看GPU使用情况在Python代码中指定GPU设置定量的GPU使用量设置最小的GPU使用量PyTorchGPU利用率较低问题原因: 1.1 GPU内存占用率问题1.2 GPU利用率问题问题原因分析与总结记录:3.1 模型提速技巧如何在GPU上训            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-05-03 22:37:00
                            
                                356阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
                      没GPU也能玩梵高作画:Ubuntu tensorflow CPU版一、前言    9月22号,我们开发/市场团队的两同事利用DL学梵高作画,安装cuda 8.0趟遍无数坑,很多朋友求避坑。因此,3天后的9月25日,便把教程《教你从头到尾利用DL学梵高作画:GTX 1070 cuda 8.0 tensorf            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-08-30 14:07:56
                            
                                102阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            在使用 PyTorch 进行深度学习任务时,GPU 加速可以显著提高模型训练和推理的性能。然而,当我们需要将 GPU 上的 tensor 转换到 CPU 上进行处理时,了解如何顺利完成这一过程至关重要。接下来,我将详细记录解决这一问题的过程,涵盖环境准备、分步指南、配置详解、验证测试、优化技巧和扩展应用。
## 环境准备
为了顺利进行 tensor 的转换,我们首先需要准备适合的环境。在这里,            
                
         
            
            
            
            怎样识别哪些地方需要重构代码?个人觉得应该有两个层次。第一个层次是直观感觉。例如当你看到很多相似的代码时,肯定是代码的复用没有做好,应该从加强代码复用;当你看到很多全局变量,应该是数据的隐蔽性没有做好,应该需要加强数据隐蔽性;当你看到没有使用类,而是结构体,应该需要加强类的使用频率,因为这样才会对于继承、数据保护、多态、设计模式等高阶的应用开发思想进行更大力度的重构。第二个层次是主观分析。这个层次            
                
         
            
            
            
            1. 引言如果有人问你 “什么是最快的编程语言?”,你可能会说"肯定不是Python!”其实,Python比我们想象的运行的要快。我们之所以有先入为主的认为Python运行慢,可能是我们平常的误用和缺乏使用技巧知识。接下来让我们看看如何用一些简单的Trick来提高我们程序的运行性能。2. 使用内置函数Python中的许多内置函数都是用C实现的,并且经过了很好的优化。因此,如果熟悉这些内置函数,就可            
                
         
            
            
            
            win10 + bazel-0.20.0 + tensorflow-1.13.1 编译tensorflow GPU版本的C++库安装所需软件/库Step1. 安装vs2015,CUDA 10.0和cuDNN 7.6Step2. 安装msys2Step3. 安装bazelStep4. 下载编译所需文件(tensorflow源码及其他文件)Step5. 使用powershell进行配置与编译Step            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-07-25 11:42:17
                            
                                216阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
             将作为一名程序员,进一步确定的目标是成为一个架构师,那么能耗必须考虑。        写代码与能耗的关系不言自明,现在假设将网络视频监控的监控识别算法放在客户端,既不利于算法的保护,也不利于算法的优化,更不利于降低能耗。    谈到能耗,每一台服务器都是吃电器,如果我不是老板,就不考虑耗电的情况,但是如果作为这个公司的一员,也            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-25 15:12:07
                            
                                120阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            你可能已经知道在Intel x86计算机中,应用程序的能力是有限的,并且只有操作系统代码才能执行某些任务,但是你知道这是如何真正工作的吗?本文将介绍x86特权级别(运行级别),即操作系统和CPU一起合作来限制用户模式程序所能做的事情。有4个特权级别,编号为0(特权最大)到3(特权最小),以及3个受保护的主要资源:内存、I/O端口和执行某些机器指令的能力。在任何给定的时间,x86 CP            
                
         
            
            
            
            对于程序员来说,工欲善其事,必先利其器,毕竟电脑是吃饭的家伙,属于生产力工具,每天对着电脑十几个小时,若是电脑不称手,那工作体验就不好,效率也会降下去,所以对自己好一点,买到自己喜欢的,投入回报率也会高很多。那么程序员在选择电脑时需要考虑哪几个方面的因素呢?性能对于程序员来说,如果能做到流畅、快速就已经算是一台性能合格的笔记本了。CPU上最好能选择双核四线程以上的规格,代码编译上也会比较流畅,效率            
                
         
            
            
            
            【如果电脑配置了GPU,那么使用Ubuntu 16.04+caffe+cuda 8.0安装教程】本文是在新安装的Ubuntu16.04上进行Caffe的安装。一、检查自己电脑是否具有GPU通常Caffe在计算时有两种模式可以选择,CPU或GPU,使用GPU处理图像速度会更快,但往往有的计算机没有GPU,配置太低,所以只能选择CPU,作者的电脑不支持GPU,因此选择CPU安装的版本。输入:
lspc            
                
         
            
            
            
            程序员一般喜欢用thinkpad或者Mac,因为价位等方面的因素,还是用thinkpad多点,从事不同研发方向需要的计算机的配置也不太相同,现在开发软件要求的机器配置也和十几年不太一样,那个时候嵌入式刚好是红利期,很多的培训机构呼呼涉足这个领域,那个时期AMD的cpu还能和intel抗衡一下,不像现在有这么大的差异,记得第一家公司属于创业性质的公司,公司配置的电脑是神州牌子的,在上面开发软件,需要            
                
         
            
            
            
            重 叠 GPU 和 CPU 执 行  相对而言,实现GPU和CPU执行重叠是比较简单的,因为所有的内核启动在默认情况下都是异步的。因此,只需简单地启动内核,并且立即在主机线程上实现有效操作,就能自动重叠GPU和CPU执行。  接下来的示例主要包含两个部分:1.内核被调度到默认流中;2.等待GPU内核时执行主机计算。#include <stdio.h>
#include <cuda            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-02-24 23:04:57
                            
                                249阅读
                            
                                                                             
                 
                
                             
         
            
            
            
            利用Google Colaboratory运行本地深度学习代码前提条件一、创建Colaboratory二、连接GPU云服务器查看GPU型号三、将本地项目压缩包上传到谷歌云盘并解压3.1上传3.2 解压绑定GoogleDrive开始解压  最近学习使用了Google免费的GPU云服务器用于训练GitHub上的一个深度学习项目,下面记录一下环境配置过程 前提条件拥有谷歌账号,并注册谷歌云盘(注册登录            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2024-04-18 16:32:56
                            
                                130阅读
                            
                                                                             
                 
                
                                
                     
                                    
                             
         
            
            
            
            安装OpenCVMxnet在编译的时候依赖Opencv,这里我主要参考了这篇博客。但是我并没有像这篇博客一样将OpenCV安装到虚拟环境,而是直接将其安装到了系统环境下。安装Opencv依赖#安装基本编译工具:
sudo apt-get install build-essential cmake pkg-config
#由于OpenCV是计算机视觉库,总需要加载一些图像文件( JPEG, PNG,            
                
                    
                        
                                                            
                                                                        
                                                                                        转载
                                                                                    
                            2023-08-24 23:35:06
                            
                                80阅读