TVM 各个模块总体架构

TVM 各个模块总体架构_其他

 

  TVM 各个模块总体架构_人工智能_02

 

 Deploy Deep Learning Everywhere

 TVM 各个模块总体架构_sed_03

 

 Existing Deep Learning Frameworks

 TVM 各个模块总体架构_自动驾驶_04

 

 Limitations of Existing Approach

 TVM 各个模块总体架构_sed_05

 

 Learning-based Learning System

 TVM 各个模块总体架构_自动驾驶_06

 

 Problem Setting

 TVM 各个模块总体架构_其他_07

 

 Example Instance in a Search Space

 TVM 各个模块总体架构_人工智能_08

 

 TVM 各个模块总体架构_sed_09

TVM 各个模块总体架构_其他_10

 

  Optimization Choices in a Search Space

 

TVM 各个模块总体架构_人工智能_11

 

 Problem Formalization

 TVM 各个模块总体架构_自动驾驶_12

 

 Black-box Optimization

 TVM 各个模块总体架构_其他_13

 

 Cost-model Driven Approach

 TVM 各个模块总体架构_sed_14

 

 Statistical Cost Model

 TVM 各个模块总体架构_其他_15

 

 Unique Problem Characteristics

 TVM 各个模块总体架构_其他_16

 

 Vanilla Cost Modeling

 TVM 各个模块总体架构_人工智能_17

 

 Program-aware Modeling: Tree-based Approach

 TVM 各个模块总体架构_人工智能_18

 

 Program-aware Modeling: Neural Approach

 TVM 各个模块总体架构_自动驾驶_19

 

 Comparisons of Models

 TVM 各个模块总体架构_其他_20

 

 Unique Problem Characteristics

 TVM 各个模块总体架构_自动驾驶_21

 

 Transferable Cost Model

 TVM 各个模块总体架构_sed_22

 

 Impact of Transfer Learning

 TVM 各个模块总体架构_自动驾驶_23

 

 Learning to Optimize Tensor Programs

 TVM 各个模块总体架构_sed_24

 

 Device Fleet: Distributed Test Bed for AutoTVM

 TVM 各个模块总体架构_其他_25

 

 TVM: End to End Deep Learning Compiler

 TVM 各个模块总体架构_其他_26

 

 Tensor Expression and Optimization Search Space

 TVM 各个模块总体架构_人工智能_27

 

 Search Space for CPUs

 TVM 各个模块总体架构_sed_28

 

 Hardware-aware Search Space

 TVM 各个模块总体架构_其他_29

 

 Search Space for GPUs

 TVM 各个模块总体架构_人工智能_30

 

 Search Space for TPU-like Specialized Accelerators

 TVM 各个模块总体架构_sed_31

 

 Tensorization Challenge

 TVM 各个模块总体架构_sed_32

 

 Tensorization Challenge

 TVM 各个模块总体架构_人工智能_33

 

 Search Space for TPU-like Specialized Accelerators

 TVM 各个模块总体架构_自动驾驶_34

 

 Software Support for Latency Hiding

 TVM 各个模块总体架构_人工智能_35

 

 TVM 各个模块总体架构_人工智能_36

 

 Summary: Hardware-aware Search Space

 TVM 各个模块总体架构_其他_37

 

 VTA: Open & Flexible Deep Learning Accelerator

 TVM 各个模块总体架构_其他_38

 

 TVM: End to End Deep Learning Compiler

 TVM 各个模块总体架构_自动驾驶_39

 

 Need for More Dynamism

 TVM 各个模块总体架构_sed_40

 

 Relay Virtual Machine

 TVM 各个模块总体架构_人工智能_41

 

 uTVM: TVM on bare-metal Devices

 TVM 各个模块总体架构_其他_42

 

 Core Infrastructure

 TVM 各个模块总体架构_自动驾驶_43

 

 TSIM: Support for Future Hardware

 TVM 各个模块总体架构_人工智能_44

 

 Unified Runtime For Heterogeneous Devices

 TVM 各个模块总体架构_sed_45

 

 Unified Runtime Benefit

 TVM 各个模块总体架构_其他_46

 

 Effectiveness of ML based Model

 TVM 各个模块总体架构_其他_47

 

 Comparisons of Models

 TVM 各个模块总体架构_人工智能_48

 

 Device Fleet in Action

 TVM 各个模块总体架构_sed_49

 

 End to End Inference Performance (Nvidia Titan X)

 TVM 各个模块总体架构_人工智能_50

 

 Portable Performance Across Hardware Platforms

 TVM 各个模块总体架构_人工智能_51

 

人工智能芯片与自动驾驶