技术日新月异,物联网、人工智能、深度学习等遍地开花,各类芯片名词GPU, TPU, NPU,DPU层出不穷…它们都是什么鬼?又有什么不一样?01CPUCPU,作为机器的“大脑”,它是布局谋略、发号施令、控制行动的“总司令官”,担负着整个计算机系统的核心任务。CPU由多个结构组成,其中包括运算器(ALU, Arithmetic and Logic Unit)、控制单元(CU, C
转载
2024-08-30 14:10:38
286阅读
转载
2018-10-26 20:30:00
272阅读
2评论
一、K-近邻算法概述 k近邻算法(k-nearest neighbor,k-NN)是一种基本的分类与回归方法。简单的说,K-近邻算法采用测量不同特征值之间的距离方法进行分类。 - 优点:进度高,对异常值不铭感、无数据输入假定。 - 缺点:计算复杂度高、空间复杂度高。 - 适用数据范围:数值型和标称型。 工作原理:给定一个训练数据集,对新的输入实例,在
fiddler
转载
2021-06-05 17:26:20
875阅读
储能变流器介绍: 储能变流器(PCS)也是一种DC/AC三相逆变器,与风电变流器、光伏逆变器的拓扑都是一样的,但PCS对能量可充可放,同一厂家的这几类产品,同一功率等级的话硬件差别很小,软件虽有差别,但继承性也很强,所以同一功率等级的PCS与光伏逆变器的成本应很接近。 传统的PCS在并网时的控制方式简称PQ模式,是电流源型的,即其电路模型等效为一个电流源并联在电网上;在离网时的控制方式简称VF模式
转载
2024-09-20 12:13:36
138阅读
本文转载自本EEFOCUS与非网一篇很不错的文章,来开启我们桐烨科技嵌入式AI平台的开发之旅。
转载
2018-05-29 12:00:50
10000+阅读
前言 先给大家讲一则小故事,在我们很小的时候是没有手机的,那时候跟女神聊天都靠小纸条。某屌丝A男对隔壁小王的隔壁女神C倾慕已久,于是天天小纸条骚扰,无奈中间隔着一个小王,这样小王就负责传小纸条了。有一天小王忍不住偷偷打开A男表白的纸条,把里面内容改了下,改成了:我的同桌小王喜欢你。最后女神C和小王走
原创
2021-06-03 16:38:55
202阅读
一、BPU trace 理论基础在学习 BPU trace 前,希望大家对 UCP trace 已经有简单的了解,详情可见工具链用户手册《统一计算平台(UCP)-UCP 性能分析工具-UCP Trace 使用说明》章节。1.1 BPU Trace 配置文件模板在 system 模式下抓取 BPU trace,需在 perfetto 配置文件中加入 BPU trace 的数据源,ucp_bpu_tr
今天分享的这篇Paper来自Los Alamos National Laboratory(LANL), Los Alamos国家实验室的项目, 他们提出了新的GPU model, 也是开源项目, PPT-GPU (Performance Prediction Toolkit) GPU model. 预测误差在10%以内, 可扩展, 比GPGPU-Sim快450倍, 而且更精确.Background
转载
2024-05-14 21:55:37
497阅读
什么是CPU与GPU,它们之间有什么关系一、CPU1. 核心功能2. 工作原理3. 组成部分4. 发展历程5. 性能指标6. 架构种类7. 发展趋势8. 应用领域二、GPU三、CPU与GPU的关系 什么是CPU与GPU,它们之间有什么关系一、CPUCPU,全称是“Central Processing Unit”,中文名为“中央处理器”。它是计算机系统的运算和控制核心,是信息处理、程序运行的最终执
1向量向量,也被称为矢量,是数学、物理学和工程学中的基本概念,它指的是同时拥有大小和方向的几何物体,通常以蒜头符号命名,以区别于其他量(例如标量〉。矢量通常被标记为带有箭头的线条,线条的长度用来表示向量的大小,箭头所指的方向则是向量的方向。与向量概念相对的是标量,它只有大小没有方向1.1相关概念(1 )反向量:大小相等 方向相反的向量。 (2 )零向盘:始点与终点重合的向量。 (3 )等向量:大小
CPU ,Central Processing Unit主要包括三大部件:
运算器(算术逻辑运算单元,ALU,Arithmetic Logic Unit)
高速缓冲存储器(Cache)及实现它们之间联系的数据(Data)、控制及状态的总线(Bus)。
内部存储器(Memory)和输入/输出(I/O) CPU的性能主要体现在其运行程序的速度上。影响运行速度的性能指标包括CPU的
主板、cpu、显卡可以说是电脑种最重要的硬件了,现在很多用户都喜欢自己搭配组装电脑,不仅可以根据自己的需要调整各种硬件搭配,装好后还很有成就感。那么主板、cpu、显卡这些硬件怎么搭配合理呢? 在搭配兼容性上面,显卡与cpu、主板没有什么限制,随意搭配都可以。cpu搭配主板分平台,如AMD的cpu需要搭配一个AMD平台与针数都相同的主板,如果cpu支持超频,建议选择一个可超频的主板充分发
我们知道做深度学习离不开GPU,不过一直以来对GPU和CPU的差别,CUDA以及cuDNN都不是很了解,所以找了些资料整理下,希望不仅可以帮助自己理解,也能够帮助到其他人理解。 先来讲讲CPU和GPU的关系和差别吧。截图来自资料1(CUDA的官方文档): GPU有更多的运算单元(如图中绿色的ALU),而Control和Cache单元不如CPU多,这是因为GPU在进行并行计算的时候每个运算单元都是
转载
2024-07-19 14:05:47
3014阅读
所谓的AI芯片,一般是指针对AI算法的ASIC(专用芯片)。 传统的CPU、GPU都可以拿来执行AI算法,但是速度慢,性能低,无法实际商用。 比如,自动驾驶需要识别道路行人红绿灯等状况,但是如果是当前的CPU去算,那么估计车翻到河里了还没发现前方是河,这是速度慢,时间就是生命。如果用GPU,的确速度要快得多,但是,功耗大,汽车的电池估计无法长时间支撑正常使用,而且,老黄家的GP
转载
2024-06-12 09:24:10
73阅读
GPU即图形处理器,Graphics Processing Unit的缩写。CPU即中央处理器,Central Processing Unit的缩写。TPU即谷歌的张量处理器,Tensor Processing Unit的缩写。三者区别:CPU虽然有多核,但一般也就几个,每个核都有足够大的缓存和足够多的数字和逻辑运算单元,需要很强的通用性来处理各种不同的数据类型,同时又要逻辑判断又会引入大量的分支
转载
2024-04-30 13:41:06
146阅读
1. CUDA的内存模型每个线程有自己的私有本地内存(local memory) , 每个线快有包含共享内存, 可以被线程块中所有线程共享,其声明周期与线程块一致。此外,所有的线程都可以访问全局内存(global memory) 还可以访问一些只读内存块: 常量内存(Constant Memory)和纹理内存(Texture Memory).2. GPU的核心组件 – SM(Streaming M
转载
2024-03-04 21:49:01
1987阅读
要写出高效率的CUDA代码,还必须对GPU的硬件系统有整体的了解,不能只停留在软件层面。所以这一篇,我们来介绍一下GPU的硬件结构相关知识,再把软件逻辑层面和硬件底层结构结合起来,深入了解一下GPU。GPU硬件结构GPU实际上是一个SM的阵列,每个SM包含N个计算核,现在我们的常用GPU中这个数量一般为128或192。一个GPU设备中包含一个或多个SM,这是处理器具有可扩展性的关键因素。如果向设备
转载
2024-10-18 09:53:24
288阅读
作者 | Hardy责编 | 阿秃早期内存通过存储器总线和北桥相连,北桥通过前端总线与CPU通信。从Intel Nehalem起,北桥被集成到CPU内部,内存直接通过存储器总线和CPU相连。 所以,在AMD采用Socket FM1,Intel采用LGA 1156插槽之后的处理器都集成了北桥,独立的北桥已经消失,主板上仅余下南桥。计算机体系的主要矛盾在于CPU太快了,而磁盘太慢了。所以它俩是不能
转载
2024-08-13 10:27:10
331阅读
1、单处理器和到多处理器的演变 尽管单处理器仍在发展,但由于指令级并行的开发空间正在减小,再加上散热等问题限制了时钟频率的继续提高,所以单处理器发展的速度正在减缓,这最终导致了起源于在单独一个晶片设计多个内核的多处理器系统结构的出现。 多处理器系统结构允许多个处理器执行同一个程序,共享同一个程序的代码和地址空间,并利用并行技术来提高计
转载
2024-09-28 23:40:29
263阅读