URL和URLConnection类

    URL是Uniform Resource Locator(统一资源定位器)的缩写。在WWW风行后,以URL表示Internet上各种数据资源的位置,已经成为一种标准的方式。为了处理方便, Java将URL封装成URL类, 我们可以用一个URL对象记录下完整的URL信息。

    URL类为我们提供了不同的构造方法:

  • public URL(String spec)
        这个构造方法用指定的URL来创建一个URL对象,比如:
try {
URL rul=new URL("http://www.sina.com.cn/***/***.html");
catch(MalformedURLException e){ 
…… 
}

  • public URL(String protocol,String host,int port,String file) 该构造方法用指定的协议、主机名、端口号、文件路径及文件名创建一个URL对象,记住file变量必须以下划线开始。比如我们要表示URL:http: //www.ntu.edu.cn:80/local/searchresult.html
        则可以这样表示:
try {
URL url=new URL("http","www.ntu.edu.cn",80,"/local/searchresult.html");
}
catch(MalformedURLException e) {
……
}

  • public URL(String protocol, String host, String file)
        该构造方法用指定的协议、主机名、路径及文件名创建URL对象。
        
  • public URL( URL contoxt, String spec)
        该构造方法用已存在的URL对象context创建URL对象。示例如下:
try{
URL base=new URL("http://www.strange.com.cn:80/x-file/1112.html");
URL loc=new  URL(base , "#change");
}
catch(MalformedURLException e) {
}

  •     URL类中一些很基本的方法如下:
  • public final Obect getContent() 这个方法取得传输协议。
        
  • public String getFile() 这个方法取得资源的文件名。
        
  • public String getHost() 这个方法取得机器的名称。
        
  • public int getPort() 这个方法取得端口号。
        
  • public String getProtocol() 这个方法取得传输协议。
        
  • public String toString() 这个方法把URL转化为字符串。

    1 实例:URL对象的创建及使用

        下面我们举例介绍URL对象的创建及使用,见示例12-3。
        【程序源代码】
1	// ==================== Program Description ==========================
2	// 程序名称:示例12-3: Myurl.java
3	// 程序目的:熟悉URL对象的创建及使用
4	// ==============================================================
5	import java.net. *;
6	import java.io.*;
7	
8	class Myurl
9	{
10	   public static void main(String args[])
11	   {
12	      try {
13	         URL url=new URL("http://www.tsinghua.edu.cn/chn/index.htm");
14	         System.out.println("the Protocol: "+url.getProtocol());
15	         System.out.println("the hostname: " +url.getHost());
16	         System.out.println("the port: "+url.getPort());
17	         System.out.println("the file:"+url.getFile());
18	         System.out.println(url.toString());
19	      }
20	      catch(MalformedURLException e) {
21	         System.out.println(e);
22	      }
23	   }
24	}

  •     【程序输出结果】
the Protocol: http
the hostname: www.tsinghua.edu.cn
the port: -1
the file:/chn/index.htm
http://www.tsinghua.edu.cn/chn/index.htm

  •     【程序注解】

        在第13行先实例化一个URL对象url,然后在第14~18行分别调用了URL对象的一些基本方法:getProtocol ()、getHost()、getPort()和getFile(),分别取得了与URL相应的协议、主机名、端口和文件。如果URL地址不对,在第21 行抛出MalformedURLException异常。

        URLConnection是一个抽象类,代表与URL指定的数据源的动态连接,URLConnection类提供比URL类更强的服务器交互控制。URLConnection允许用POST或PUT和其他HTTP请求方法将数据送回服务器。在java.net包中只有抽象的 URLConnection类,其中的许多方法和字段与单个构造器一样是受保护的,这些方法只可以被URLConnection类及其子类访问。

        使用URLConnection 对象的一般方法如下:
        (1)创建一个URL对象。


        (2)调用URL对象的openConnection()方法创建这个URL的URLConnection对象。
        (3)配置URLConnection。
        (4)读首部字段。
        (5)获取输入流并读数据。
        (6)获取输出流并写数据。
        (7)关闭连接。

        当然我们并不需要完成所有这些步骤。比如我们可以接受URL类的默认设置,则可以不设置URLConnection;还有我们有时仅仅需要从服务器读取数据,并不需要向服务器发送数据,则我们就可以省去获取输出流并写数据这一步。

        当创建URLConnection对象后,我们可以使用URLConnection对象的操作方法:
  • public int getContentLength() 获得文件的长度。
        
  • public String getContentType() 获得文件的类型。
        
  • public long getDate() 获得文件创建的时间。
        
  • public long getLastModified() 获得文件最后修改的时间。
        
  • public InputStream getInputStream() 获得输入流,以便读取文件的数据。

        如果URL类的构造函数的参数有问题,比如字符内容不符合URL位置表示法的规定、指定的传输协议不是Java所能接受时,那么构造函数就会抛出MalformedURLException异常,这时一定要用try 和catch语句处理。

    2 实例:使用URLConnection从Web服务器读取文件

        接下来,我们用上面的方法从Web服务器上读取文件的信息,将文件的信息打印到屏幕。见示例12-4。
        【程序源代码】
1	// ==================== Program Description =====================
2	// 程序名称:示例12-4: URLDemo .java
3	// 程序目的:URLConnection类的用法
4	//=============================================================
5	import java.io.*;
6	import java.net.*;
7	import java.util.Date;
8	
9	class  URLDemo
10	{
11		public static void  main(String args[]) throws Exception
12	 	{  
13	 	    System.out.println("starting....");
14	 		int c;
15	 		URL url=new URL("http://www.sina.com.cn");
16	 		URLConnection  urlcon=url.openConnection();
17	 		System.out.println("the date is :"+new Date(urlcon.getDate()));
18	 		System.out.println("content_type :"+urlcon.getContentType());
19	 		InputStream in=rulcon.getInputStream();
20	 		while (((c=in.read())!=-1))
21	 		{
22	 			System.out.print((char)c);
23	 		}
24	 		in.close();
25	 	}
26	 }

  •     【程序输出结果】
starting....
the date is :Thu Mar 27 00:00:13 CST 2003
content_type :text/html
………………//网页文件内容
//-->

  •     【程序注解】

        在第15行中我们实例化了一个URL,接着就通过调用URL对象的openConnection()方法返回一个 URLConnection类的对象urlcon。然后就分别调用了URLConnectin类的常用方法,返回了URL的一些基本信息。这些方法是: getDate()返回日期,getContentType()返回文件类型text/html,getInputStream()获得输入流,然后通过输入流取得文件(in.read()),并在标准输出上输出(System.out.println()),我们看到的是一个网页源代码文件。在IE中我们可以查看源代码文件,其实就是通过这种方法实现的。