要想学文件续点或者是多线程下载,这篇文章不错.原贴地址:http://hi.baidu.com/myspcae/blog/item/edf08f3d5293ed00baa167e3.html

        由于Linux操作系统的兴起和Java语言的日渐成熟,使用Java语言实现一个跨平台的、外观一致的下载工具软件已成为可能。网络蚂蚁是大家非常熟知的下载工具软件,我采用Java语言实现了类似网络蚂蚁的基本功能的软件Jants。本文介绍了一些技术实现要点。

  

  单线程直接获取网络文件

  

  单线程直接获取网络文件的关键点是获取网络文件,以确定基本方法的正确性。它的初始代码的内容比较简单,可以利用HTTP的基本知识进行设计。它的基本原理是:连接网络地址,打开连接并获取输入流,从输入流中读取数据。实现代码(测试过程中使用的)如下:

int data;//从输入流中获取数据
  URL url=new URL("http://www.sohu.com");
  //创建连接的地址
  HttpURLConnection connection=url.openConnection();
  //打开连接
  int responsCode=connection. getResponseCode();
  //返回Http的响应状态码
  InputStream input=connection.getInputStream();
  //获取输入流
  System.out.println("responseCode:"+responseCode);
  While((data=input.read())!=-1)
  System.out.println(data);
  //将获取的数据打到屏幕显示出来

  单线程断点续传

  大家常常有这样的体会:下载一个几十兆的文件时突然断线,结果前功尽弃。可以使用断点续传解决这个问题。

  

  基本原理   

  这里主要介绍一下断点续传的原理。断点续传的原理很简单,只是在HTTP请求上和一般的下载有所不同。   

  所谓断点续传,也就是要从文件已经下载的地方开始继续下载。所以,在客户端传给Web服务器的时候,要多加一条信息——下载的起始位置,且服务器返回的HTTP状态代码也从200转变为206。   

  上述要点,可以使用Java语言中的HttpURLConnection类中的setRequestProperty()方法来设置。   

  断点续传的关键步骤   

  1.实现提交断点续传下载的起始位置   

  Java的Net包中提供了这种功能,代码如下:

URL url = new URL("http://www.mydomain.com/down.zip";); 
  HttpURLConnection httpConnection=(HttpURLConnection) url.openConnection(); 
  //设置断点续传的开始位置 
  httpConnection.setRequestProperty("RANGE","bytes=10000"); 
  //设置请求信息
  httpConnection.setRequestProperty("GET","/down.zip HTTP/1.1");
  //设置接受信息
  httpConnection.setRequestProperty("Accept","image/gif,image/x-xbitmap,application/
  msword,*/*");
  //设置连接信息
  httpConnection.setRequestProperty("Connection","Keep-Alive"); 
  //获得输入流 
  InputStream input = httpConnection.getInputStream();

  从输入流中取出的字节流,就是down.zip文件从10000字节开始的字节流。

  

  2.保存获得的字节流到文件中   

  由于文件的下载涉及到断点续传,因此,在保存文件的时候,需要对文件进行随机读写。特别是在多线程下载的过程中,需要在写文件之前在文件中定位。   

  在Java的IO包中的RandomAccessFile类可以满足这种设计需求。该类在文件中定位指针时,用到的方法是seek(Long)。   

  操作相当简单。假设从10000字节处开始保存文件,代码如下:

RandomAccessFile oSavedFile = new RandomAccessFile("down.zip","rw"); 
  //创建随机文件
  long nPos = 10000; 
  //定位文件指针到nPos位置 
  oSavedFile.seek(nPos); 
  byte[] b = new byte[1024]; 
  int nRead; 
  //从输入流中读入字节流,然后写到文件中 
  while((nRead=input.read(b,0,1024)) > 0) 
  { //input为网络输入流
   oSavedFile.write(b,0,nRead); 
  }

  

  3.保存已经下载的文件的长度值   

  由于在每次断开连接时都要保存已下载文件的长度,且应进行永久保存,因此将它保存到文件介质中。这里采用的是对象序列化的方法——将要保存的内容序列化到一个临时文件中。代码如下:

long nStart;
  //记录已经下载的字节数
  File tempFile=new File(“donwzip.tmp”);
  //创建临时文件
  FileOutputStream file=new FileOutputStream(tempFile); 
  //创建文件输出流
   ObjectOutputStream serialize=new ObjectOutputStream(file);
  //创建文件序列化流
  serialize.writeObject(nStart);//序列化
  serialize.flush();
  //刷新序列化流
  file.close();
  //关闭文件输出流
  serialize.close();
  //关闭序列化流

  多线程的断点续传    

  加入断点续传以后,下载速度还没能得到提高。为防止已下载文件数据的丢失,也为提高网络文件的下载速度,可在其中加入多线程。虽然前两步已经基本实现,似乎再加入多线程时应该比较容易,但是并非如此。在多线程的编程过程中,需要考虑到线程的同步与互斥。由于是多线程进行断点续传,还要考虑记录多个断点位置,且记录断点位置时也要考虑同步互斥等问题。所有这些都使得这一步比较复杂。   

  同步的考虑   

  同步的基本思想是避免多个线程访问同一个资源时出现问题。由于多线程对同一个文件资源进行读写,因此,为了避免出现错误,要进行读写控制——即同步。Java中使用synchronized实现线程之间的同步。Java是面向对象的语言,它的资源是以对象的形式表现的。因此,Java同步机制的作用就是力图避免对“对象”的访问冲突。   

  对需要同步的方法或代码段进行标记以实现同步,需要用到关键字synchronized。系统使用synchronized关键字声明的方法就是为其设置特殊的标记。这个标记起着信号量的作用,每当调用该方法时,Java的运行系统都将进行检查,以确认此标记的状态,看相应的代码是否已经被调用执行。如没有执行,系统将把这个内部标记授予调用代码的线程,方法运行结束后,标记被释放。在标记被释放之前,任何其它的对象不得调用此方法。   

  主要的同步代码如下(在下载数据保存入文件中时使用):

public synchronized int write(byte[] b,int nStart,int len){
   int n=-1;
   try{
   rf.write(b,nStart,len); 
  //调用另一个类的方法,向文件中写入数据
   n=len;
   }catch(IOException ioe){
   ioe.printStackTrace();
   }
   return n;
   }

  在保存已下载的字节数时,由于多个断点位置在不同的线程中记录,所以必须在所有线程都结束时才能保存。为此,解决的办法是再开出一个线程,用以持续监测是否所有的线程都已经结束。若结束,保存所有的断点位置;否则,继续监测。同样,在文件下载的线程中,需要设置标志位以记录线程是否结束。基本代码如下(在监测线程中使用):

stop=false;
  while(!stop){
     if(Utility.bStop[0] && Utility.bStop[1] && Utility.bStop[2] && Utility.bStop[3] && Utility.bStop[4]){
      System.out.println("Serialize...");
      Utility.serializeOut();
      //调用序列化函数以保存断点位置于文件中
      javaants.setStopFalse();
      javaants.setStartTrue();
      stop=true;
      }

  断点数据的记录   

  笔者使用的是一个静态数组以记录断点位置。由于有多个断点位置,可采用一个函数进行统一保存:

public static void serializeOut(){
    try{
     File tempFile=new File(getTempFileName()+"."+"tmp");
       FileOutputStream file=new FileOutputStream(tempFile);
      ObjectOutputStream serialize=new ObjectOutputStream(file);
     for(int i=0;i<5;i++){
      serialize.writeObject(String.valueOf(nStart[i]));
      serialize.writeObject(String.valueOf(nStop[i]));
     }
     serialize.flush();
     file.close();
     serialize.close();
   }catch(Exception e){
       System.out.println(e.toString());
    }
  }

  图形界面  

  该文件下载系统的图形界面与流行下载软件——网络蚂蚁很相似。图形界面的实现,使用了Swing包。限于篇幅,这里不再赘述。Jants的图形界面如图1和图2所示。   

  图1 Jants主界面  

  图1 Jants下载过程中的界面  

  发布  

  使用jar命令将所有的文件下载系统的.class文件打包为javaants.jar文件,并在其中加入Menifest.mf文件,指定Main-Class。   

  打包代码: jar cfv *.* javaants.jar

  运行代码:javaw -classpath javaants.jar Main