Java onnx模型加载和推理

转载

flybirdfly 2024-09-04 18:37:10

文章标签 Java onnx模型加载和推理 java jvm 编程语言多线程 文章分类 Java 后端开发

什么是JMM模型

Java内存模型(Java Memory Model简称JMM)是一种抽象的概念，并不真实存在，它描述的是一组规则或规范，通过这组规范定义了程序中各个变量（包括实例字段，静态字段和构成数组对象的元素）的访问方式。JVM运行程序的实体是线程，而每个线程创建时JVM都会为其创建一个工作内存(有些地方称为栈空间)，用于存储线程私有的数据，而Java内存模型中规定所有变量都存储在主内存，主内存是共享内存区域，所有线程都可以访问，但线程对变量的操作(读取赋值等)必须在工作内存中进行，首先要将变量从主内存拷贝的自己的工作内存空间，然后对变量进行操作，操作完成后再将变量写回主内存，不能直接操作主内存中的变量，工作内存中存储着主内存中的变量副本拷贝，前面说过，工作内存是每个线程的私有数据区域，因此不同的线程间无法访问对方的工作内存，线程间的通信(传值)必须通过主内存来完成。

JMM不同于JVM内存区域模型

JMM与JVM内存区域的划分是不同的概念层次，更恰当说JMM描述的是一组规则，通过这组规则控制程序中各个变量在共享数据区域和私有数据区域的访问方式， JMM是围绕原子 性，有序性、可见性展开 。JMM与Java内存区域唯一相似点，都存在共享数据区域和私有数据区域，在JMM中主内存属于共享数据区域，从某个程度上讲应该包括了堆和方法区，而工作内存数据线程私有数据区域，从某个程度上讲则应该包括程序计数器、虚拟机栈以及本地方法栈。

JMM存在的必要性

在明白了Java内存区域划分、硬件内存架构、Java多线程的实现原理与Java内存模型的具体关系后，接着来谈谈Java内存模型存在的必要性。由于JVM运行程序的实体是线程，而每个线程创建时JVM都会为其创建一个工作内存(有些地方称为栈空间)，用于存储线程私有的数据，线程与主内存中的变量操作必须通过工作内存间接完成，主要过程是将变量从主内存拷贝的每个线程各自的工作内存空间，然后对变量进行操作，操作完成后再将变量写回主内存，如果存在两个线程同时对一个主内存中的实例对象的变量进行操作就有可能诱发线程安全问题。

假设主内存中存在一个共享变量x，现在有A和B两条线程分别对该变量x=1进行操作， A/B线程各自的工作内存中存在共享变量副本x。假设现在A线程想要修改x的值为2，而B线程却想要读取x的值，那么B线程读取到的值是A线程更新后的值2还是更新前的值1呢？答案是，不确定，即B线程有可能读取到A线程更新前的值1，也有可能读取到A线程更新后的值2，这是因为工作内存是每个线程私有的数据区域，而线程A变量x时，首先是将变量从主内存拷贝到A 线程的工作内存中，然后对变量进行操作，操作完成后再将变量x写回主内，而对于B线程的也是类似的，这样就有可能造成主内存与工作内存间数据存在一致性问题，假如A线程修改完后正在将数据写回主内存，而B线程此时正在读取主内存，即将x=1拷贝到自己的工作内存中，这样B线程读取到的值就是x=1，但如果A线程已将x=2写回主内存后，B线程才开始读取的话，那么此时B线程读取到的就是x=2，但到底是哪种情况先发生呢？

Java onnx模型加载和推理_多线程

主内存与工作内存之间的具体交互协议，即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步到主内存之间的实现细节，Java内存模型定义了以下八种操作来完成：

（1） lock(锁定) ：作用于主内存的变量，把一个变量标记为一条线程独占状态

（2） unlock(解锁) ：作用于主内存的变量，把一个处于锁定状态的变量释放出来，释放后的

变量才可以被其他线程锁定

（3） read(读取) ：作用于主内存的变量，把一个变量值从主内存传输到线程的工作内存中，

以便随后的load动作使用

（4） load(载入) ：作用于工作内存的变量，它把read操作从主内存中得到的变量值放入工作

内存的变量副本中

（5） use(使用) ：作用于工作内存的变量，把工作内存中的一个变量值传递给执行引擎

（6） assign(赋值) ：作用于工作内存的变量，它把一个从执行引擎接收到的值赋给工作内存

的变量

（7） store(存储) ：作用于工作内存的变量，把工作内存中的一个变量的值传送到主内存中，

以便随后的write的操作

（8） write(写入) ：作用于工作内存的变量，它把store操作从工作内存中的一个变量的值传送

到主内存的变量

Java onnx模型加载和推理_编程语言_02

并发编程的可见性，原子性与有序性问题

原子性

原子性指的是一个操作是不可中断的，即使是在多线程环境下，一个操作一旦开始就不会被其他线程影响。

在java中，对基本数据类型的变量的读取和赋值操作是原子性操作有点要注意的是，对于 32位系统的来说，long类型数据和double类型数据(对于基本数据类型，byte,short,int,float,boolean,char读写是原子操作)，它们的读写并非原子性的，也就是说如果存在两条线程同时对long类型或者double类型的数据进行读写是存在相互干扰的，因为对于32位虚拟机来说，每次原子读写是32位的，而long和double则是64位的存储单元，这样会导致一个线程在写时，操作完前32位的原子操作后，轮到B线程读取时，恰好只读取到了后32 位的数据，这样可能会读取到一个既非原值又不是线程修改值的变量，它可能是“半个变量”的数值，即64位数据被两个线程分成了两次读取。但也不必太担心，因为读取到“半个变量”的情况比较少见，至少在目前的商用的虚拟机中，几乎都把64位的数据的读写操作作为原子操作来执行，因此对于这个问题不必太在意，知道这么回事即可。

X=10; //原子性（简单的读取、将数字赋值给变量）

Y = x; //变量之间的相互赋值，不是原子操作

X++; //对变量进行计算操作

X = x+1;

可见性

理解了指令重排现象后，可见性容易了，可见性指的是当一个线程修改了某个共享变量的

值，其他线程是否能够马上得知这个修改的值。对于串行程序来说，可见性是不存在的，因为

我们在任何一个操作中修改了某个变量的值，后续的操作中都能读取这个变量值，并且是修改

过的新值。

但在多线程环境中可就不一定了，前面我们分析过，由于线程对共享变量的操作都是线程

拷贝到各自的工作内存进行操作后才写回到主内存中的，这就可能存在一个线程A修改了共享

变量x的值，还未写回主内存时，另外一个线程B又对主内存中同一个共享变量x进行操作，但

此时A线程工作内存中共享变量x对线程B来说并不可见，这种工作内存与主内存同步延迟现象

就造成了可见性问题，另外指令重排以及编译器优化也可能导致可见性问题，通过前面的分

析，我们知道无论是编译器优化还是处理器优化的重排现象，在多线程环境下，确实会导致程

序轮序执行的问题，从而也就导致可见性问题。

有序性

有序性是指对于单线程的执行代码，我们总是认为代码的执行是按顺序依次执行的，这样

的理解并没有毛病，毕竟对于单线程而言确实如此，但对于多线程环境，则可能出现乱序现

象，因为程序编译成机器码指令后可能会出现指令重排现象，重排后的指令与原指令的顺序未

必一致，要明白的是，在Java程序中，倘若在本线程内，所有操作都视为有序行为，如果是多

线程环境下，一个线程中观察另外一个线程，所有操作都是无序的，前半句指的是单线程内保

证串行语义执行的一致性，后半句则指指令重排现象和工作内存与主内存同步延迟现象。

JMM如何解决原子性&可见性&有序性问题

原子性问题

除了JVM自身提供的对基本数据类型读写操作的原子性外，可以通过 synchronized 和 Lock 实现原子性。因为synchronized和Lock能够保证任一时刻只有一个线程访问该代码块。

可见性问题

volatile关键字保证可见性。当一个共享变量被volatile修饰时，它会保证修改的值立即被其他的线程看到，即修改的值立即更新到主存中，当其他线程需要读取时，它会去内存中读取新值。synchronized和Lock也可以保证可见性，因为它们可以保证任一时刻只有一个线程能访问共享资源，并在其释放锁之前将修改的变量刷新到内存中。

有序性问题

在Java里面，可以通过volatile关键字来保证一定的“有序性”。另外可以通过synchronized和Lock来保证有序性，很显然，synchronized 和Lock保证每个时刻是有一个线程执行同步代码，相当于是让线程顺序执行同步代码，自然就保证了有序性。

Java内存模型 ：每个线程都有自己的工作内存（类似于前面的高速缓存）。线程对变量的

所有操作都必须在工作内存中进行，而不能直接对主存进行操作。并且每个线程不能访问其他

线程的工作内存。Java内存模型具备一些先天的“有序性”，即不需要通过任何手段就能够得

到保证的有序性，这个通常也称为happens-before 原则。如果两个操作的执行次序无法从

happens-before原则推导出来，那么它们就不能保证它们的有序性，虚拟机可以随意地对它

们进行重排序。

指令重排序 ：java语言规范规定JVM线程内部维持顺序化语义。即只要程序的最终结果与

它顺序化情况的结果相等，那么指令的执行顺序可以与代码顺序不一致，此过程叫指令的重排

序。指令重排序的意义是什么？JVM能根据处理器特性（CPU多级缓存系统、多核处理器等）

适当的对机器指令进行重排序，使机器指令能更符合CPU的执行特性，最大限度的发挥机器性

能。

as-if-serial语义

as-if-serial语义的意思是：不管怎么重排序（编译器和处理器为了提高并行度），（单线

程）程序的执行结果不能被改变。编译器、runtime和处理器都必须遵守as-if-serial语义。

为了遵守as-if-serial语义，编译器和处理器不会对存在数据依赖关系的操作做重排序，因

为这种重排序会改变执行结果。但是，如果操作之间不存在数据依赖关系，这些操作就可能被

编译器和处理器重排序。

happens-before 原则

只靠sychronized和volatile关键字来保证原子性、可见性以及有序性，那么编写并发程序可能会显得十分麻烦，幸运的是，从JDK 5开始，Java使用新的JSR-133内存模型，提供了 happens-before 原则来辅助保证程序执行的原子性、可见性以及有序性的问题，它是判断数据是否存在竞争、线程是否安全的依据，happens-before 原则内容如下：

1. 程序顺序原则，即在一个线程内必须保证语义串行性，也就是说按照代码顺序执行。

2. 锁规则解锁(unlock)操作必然发生在后续的同一个锁的加锁(lock)之前，也就是说，

如果对于一个锁解锁后，再加锁，那么加锁的动作必须在解锁动作之后(同一个锁)。

3. volatile规则 volatile变量的写，先发生于读，这保证了volatile变量的可见性，简单

的理解就是，volatile变量在每次被线程访问时，都强迫从主内存中读该变量的值，而当

该变量发生变化时，又会强迫将最新的值刷新到主内存，任何时刻，不同的线程总是能

够看到该变量的最新值。

4. 线程启动规则线程的start()方法先于它的每一个动作，即如果线程A在执行线程B的

start方法之前修改了共享变量的值，那么当线程B执行start方法时，线程A对共享变量

的修改对线程B可见

5. 传递性 A先于B ，B先于C 那么A必然先于C

6. 线程终止规则线程的所有操作先于线程的终结，Thread.join()方法的作用是等待当前

执行的线程终止。假设在线程B终止之前，修改了共享变量，线程A从线程B的join方法

成功返回后，线程B对共享变量的修改将对线程A可见。

7. 线程中断规则对线程 interrupt()方法的调用先行发生于被中断线程的代码检测到中

断事件的发生，可以通过Thread.interrupted()方法检测线程是否中断。

8. 对象终结规则对象的构造函数执行，结束先于finalize()方法

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：mysql给表中添加int类型字段sql

下一篇：python tkinker label 更改

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯