java实现多线程压缩文件夹zip

转载

mob6454cc7aaa9d 2024-09-15 21:23:59

文章标签 java实现多线程压缩文件夹zip 多线程处理大文件单线程多线程丢包 文章分类 Java 后端开发

多线程从网上下载一个大文件为什么要更快(比之单线程)？网上查了有人说“是因为io堵塞的原因，因为网速肯定快不过cpu，单线程单io通道，而多线程多io通道“ 。我理解他的意思是：单线程因为网速慢赶不上cpu的处理速度，所以造成大量的堵塞，而多线程多io通道，所以堵塞减少。我的疑问是：同一个多核处理器，io通道会随着线程的增加而一直增加吗？单线的一个io通道和多线程中每个io通道速度都是一样的吗？单线程为什么不能通过提升io通道的速度进而提快速度呢？难道是因为io通道是一个硬件？其速度是受限于硬件的？如果io通道是硬件的话，那么一个处理器的最大io通道个数是不是就是和其核数相等呢？如果真的是我上面猜想的，那么是不是可以认为，如果是单核处理器，通过时间片实现的多线程下载大文件并不能更快呢？

java实现多线程压缩文件夹zip_单线程

决定用户下载大文件速度快慢的终极因素，在于用户下载进程实时抢占网络带宽的大小。其它的因素与它相比，可以忽略不计。

实时最大可用带宽

任意一个与互联网通信的进程，理论上都有一个实时最大可用带宽，这是客观存在，不以用户意志为转移。如果 用户进程实时抢占的带宽 = 实时网络可用带宽

那是最最理想的，用户进程100%利用网络带宽，无论进程(Process)是单线程(Thread)的还是多线程的，下载速度几乎没有任何区别。理想是丰满的，但现实是骨感的，因为： 用户进程实时抢占的带宽 ≤

实时网络可用带宽 Forever！！！

既然如此，如果能让用户进程实时抢占的带宽无限接近实时网络可用带宽，那也是非常完美的。可是，实时网络带宽是多少？

没有人知道！实时网络可用带宽每一刻都在变化！操作系统很愿意为用户效劳，TCP通过流量探测机制，不间断地探测实时网络可用带宽，并将实时的发送速率与之匹配(相等)起来，这个骚操作看起来很美！ 为什么这么说呢？

传统的TCP流量探测机制有一个非常致命的缺陷：一旦检测到有丢包，立马将发送速率降为1/2。降速1/2后，如果没有丢包，将会在1/2速率的基础上，按照固定的增长值(线性增长)，加大发送的速率。接下来就会一直按照这个节奏到达丢包的那一刻(实时可用带宽)为止。然后再1/2降速，循环往复，直到文件下载结束。

如果下一个检测周期依然有丢包现象，会在当前1/2速率的基础上继续降速1/2。剩下的故事情节以此类推。

java实现多线程压缩文件夹zip_多线程_02

很显然，指数级降速，线性增速，这很不公平！降速很快，但升速却很漫长！造成的直接恶果就是真实的传输速率远远小于实时可用带宽。

多线程Vs 单线程

多线程相比单线程的优势是，由于有多个线程在竞争实时可用带宽。尽管多线程逻辑上是并行的，但其实还是按时序的串行处理。所以每个线程处于的阶段并不一致。在任意时刻，有的线程处于丢包被罚1/2降速，有的线程处于2倍增速阶段(SlowStart)，而有的线程处于线性增长阶段。通过多个线程的下载速率的加权平均，得到的是一根相对平滑的下载曲线。这条平滑曲线在大多数时候应该位于单线程下载速率的上方。这就是多线程下载速率更有优势的体现。但是，如果TCP流量探测机制更加智能，比如BBR算法。BBR算法最大的进步，就是摒弃传统TCP流量调度算法(基于是否丢包而升速或降速)， BBR采取的是，实时测量网络最大的可用带宽，并将发送速率与之相匹配，一直在实时可用带宽附近小范围徘徊，避免大起大落的情况发生。测量速率能无限接近实时可用带宽，多线程相比单线程，优势就体现不出来了。 如何成为专业的网络安全工程师？

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。