什么叫短链或短址?
就是把长的 URL 转成短的 URL, 现在提供这种服务的有很多公司,我们以google家的 URL shortener 服务: http://goo.gl/ 为例。 任何长网址都会转换成6位由大小写字母和数字组合而成的短址,例如:http://goo.gl/QfuI3i 。长网址和短址都会存在google服务器,当我们请求http://goo.gl/QfuI3i这个短址,google服务器就会根据QfuI3i这个参数找到并跳转到对应长网址。
新浪微博为什么使用短链?
- 无论多长的微博,都能够转成固定长短的短链,防止某些连接太长影响用户输入其他内容;
- 所有短链在算法上无法直接解链,必须经过新浪的服务器,把链接系统控制到自己的手上。这对网络内容审察来说作用极其大,如果有人发的微博包含敏感内容,新浪就不予中转;
- 重新组织链接网页的内容,方便用户在手机端查看;
- 由于长链中可能会包含#或者@这些特殊字符,给客户端的字符串处理带来压力,编码可以消除这些特殊符号;
- 由于所有链接都要经新浪的服务器,因此服务器保存有所有的链接,方便进行数据挖掘和统计分析。
Java实现
1 package com.wanda.restful.framework.test.shorturl;
2
3 import java.security.MessageDigest;
4
5 /**
6 * @version v1.0.0
7 * @author: wangyang
8 * Date: 2016-9-8 Time: 15:32
9 */
10 public class Encript {
11 //十六进制下数字到字符的映射数组
12 private final static String[] hexDigits = {"0","1","2","3","4","5","6","7","8","9","A","B","C","D","E","F"};
13
14 /**把inputString加密*/
15 public static String md5(String inputStr){
16 return encodeByMD5(inputStr);
17 }
18
19 /**
20 * 验证输入的密码是否正确
21 * @param password 真正的密码(加密后的真密码)
22 * @param inputString 输入的字符串
23 * @return 验证结果,boolean类型
24 */
25 public static boolean authenticatePassword(String password,String inputString){
26 if(password.equals(encodeByMD5(inputString))){
27 return true;
28 }else{
29 return false;
30 }
31 }
32
33 /**对字符串进行MD5编码*/
34 private static String encodeByMD5(String originString){
35 if (originString!=null) {
36 try {
37 //创建具有指定算法名称的信息摘要
38 MessageDigest md5 = MessageDigest.getInstance("MD5");
39 //使用指定的字节数组对摘要进行最后更新,然后完成摘要计算
40 byte[] results = md5.digest(originString.getBytes());
41 //将得到的字节数组变成字符串返回
42 String result = byteArrayToHexString(results);
43 return result;
44 } catch (Exception e) {
45 e.printStackTrace();
46 }
47 }
48 return null;
49 }
50
51 /**
52 * 轮换字节数组为十六进制字符串
53 * @param b 字节数组
54 * @return 十六进制字符串
55 *
56 */
57 private static String byteArrayToHexString(byte[] b){
58 StringBuffer resultSb = new StringBuffer();
59 for(int i=0;i<b.length;i++){
60 resultSb.append(byteToHexString(b[i]));
61 }
62 return resultSb.toString();
63 }
64
65 //将一个字节转化成十六进制形式的字符串
66 private static String byteToHexString(byte b){
67 int n = b;
68 if(n<0)
69 n=256+n;
70 int d1 = n/16;
71 int d2 = n%16;
72 return hexDigits[d1] + hexDigits[d2];
73 }
74 }
1 package com.wanda.restful.framework.test.shorturl;
2
3 /**
4 * Generator ShortUrl
5 * 数据库中需要保存长链与短链之间的关系,通过访问短链跳转到长链接
6 *
7 * @version v1.0.0
8 * @author: wangyang
9 * Date: 2016-9-8 Time: 15:42
10 */
11 public class ShortUrlGenerator {
12 public static void main(String[] args) {
13 String sLongUrl = "http://www.baidu.com";
14 for (String shortUrl : shortUrl(sLongUrl)) {
15 System.out.println(shortUrl);
16 }
17 }
18
19 public static String[] shortUrl(String url) {
20 // 可以自定义生成 MD5 加密字符传前的混合 KEY
21 String key = "wangyang";
22 // 要使用生成 URL 的字符
23 String[] chars = new String[]{"a", "b", "c", "d", "e", "f", "g", "h",
24 "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t",
25 "u", "v", "w", "x", "y", "z", "0", "1", "2", "3", "4", "5",
26 "6", "7", "8", "9", "A", "B", "C", "D", "E", "F", "G", "H",
27 "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T",
28 "U", "V", "W", "X", "Y", "Z"
29 };
30 // 对传入网址进行 MD5 加密
31 String sMD5EncryptResult = (Encript.md5(key + url));
32 String hex = sMD5EncryptResult;
33 String[] resUrl = new String[4];
34 //得到 4组短链接字符串
35 for (int i = 0; i < 4; i++) {
36 // 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算
37 String sTempSubString = hex.substring(i * 8, i * 8 + 8);
38 // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用 long ,则会越界
39 long lHexLong = 0x3FFFFFFF & Long.parseLong(sTempSubString, 16);
40 String outChars = "";
41 //循环获得每组6位的字符串
42 for (int j = 0; j < 6; j++) {
43 // 把得到的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引(具体需要看chars数组的长度 以防下标溢出,注意起点为0)
44 long index = 0x0000003D & lHexLong;
45 // 把取得的字符相加
46 outChars += chars[(int) index];
47 // 每次循环按位右移 5 位
48 lHexLong = lHexLong >> 5;
49 }
50 // 把字符串存入对应索引的输出数组
51 resUrl[i] = outChars;
52 }
53 return resUrl;
54 }
55 }
参考资料