1. 程式人生 > >URL短地址壓縮演算法-短網址對映

URL短地址壓縮演算法-短網址對映

 微博短地址原理解析 (Java實現)

一種方法是呼叫第三方提供短址服務的介面來生成即可。一般他們提供介面或呼叫包。

如:

怎樣呼叫百度短網址api?  http://www.baidu.com/search/dwz.html (無需授權即可呼叫)



請求方式:GET

請求引數:

  1. access_token:  授權後獲得
  2. url_long:  待轉換的長地址

返回結果:

複製程式碼
{
    "urls": [
        {
            "url_short": "http://t.cn/h4DwT1",
            "url_long": "http://finance.sina.com.cn/",
            "type": 0,
            "result": "true"
        }
    ]
}
複製程式碼

注意:每次使用時都需要access_token,而access_token是需要登入後授權才能得到的。如果你想做一個短網址轉換的應用,肯定不能要求使用者先登入微博、授權、然後才能使用你的功能,這樣使用者體驗太差。你可以在伺服器端用個測試帳號定期授權來獲取access_token,這樣就不需要使用者登入微博授權了,使用者可以直接輸入長網址,獲取轉換後的短網址。


第二種方法是自己實現,可以單獨搭建伺服器提供短網址對映服務。

(

有個關鍵點 ..短網址 是否可以直接通過演算法還原..如果不能直接通過演算法還原..

需要藉助儲存(無論是db,快取,nosql或者別的什麼),那麼其實採用什麼樣的演算法都不是重點.

)

 最近,專案中需要用到短網址(ShortUrl)的演算法,於是在網上搜索一番,發現有C#的演算法,有.Net的演算法,有PHP的演算法,就是沒有找到Java版的短網址(ShortUrl)的演算法,很是鬱悶。同時還發現有不少網友在發帖求助,怎麼實現Java版的短網址(ShortUrl)的演算法。乾脆一不做,二不休,參考了一下網上比較流行的PHP版短網址(ShortUrl)演算法:

再根據自己的理解,用Java實現了該短網址(ShortUrl)的演算法。(\(^o^)/YES!我還真厲害!)

先來廢話一下,是在別人的帖子上看到的,主要是讓大家瞭解一下短網址(ShortUrl)。

時下,短網址應用已經在全國各大微博上開始流行了起來。例如QQ微博的url.cn,新郎的t.cn等。

我們在新浪微博上釋出網址的時候,微博會自動判別網址,並將其轉換,例如:http://t.cn/hrYnr0。為什麼要這樣做的,原因我想有這樣幾點:

1、微博限制字數為140字一條,那麼如果我們需要發一些連線上去,但是這個連線非常的長,以至於將近要佔用我們內容的一半篇幅,這肯定是不能被允許的,所以短網址應運而生了。

2、短網址可以在我們專案裡可以很好的對開放級URL進行管理。有一部分網址可以會涵蓋性、暴力、廣告等資訊,這樣我們可以通過使用者的舉報,完全管理這個連線將不出現在我們的應用中,應為同樣的URL通過加密演算法之後,得到的地址是一樣的。

3、我們可以對一系列的網址進行流量,點選等統計,挖掘出大多數使用者的關注點,這樣有利於我們對專案的後續工作更好的作出決策。

其實以上三點純屬個人觀點,因為在我接下來的部分專案中會應用到,所以就瞭解了一下,下面先來看看短網址對映演算法的理論(網上找到的資料):

① 將長網址用md5演算法生成32位簽名串,分為4段,,每段8個字元;

② 對這4段迴圈處理,取每段的8個字元, 將他看成16進位制字串與0x3fffffff(30位1)的位與操作,超過30位的忽略處理;

③ 將每段得到的這30位又分成6段,每5位的數字作為字母表的索引取得特定字元,依次進行獲得6位字串;

④ 這樣一個md5字串可以獲得4個6位串,取裡面的任意一個就可作為這個長url的短url地址。

很簡單的理論,我們並不一定說得到的URL是唯一的,但是我們能夠取出4組URL,這樣幾乎不會出現太大的重複。

首先,請大家瞭解在Java中如何用MD5來加密字串得到32位的加密後的字串,下面是我已經封裝好的Java MD5演算法:

  1. privatefinalstatic String[] hexDigits = {  
  2.       "0""1""2""3""4""5""6""7",   
  3.       "8""9""a""b""c""d""e""f"};   
  4.     publicstatic String byteArrayToHexString(byte[] b){  
  5.         StringBuffer resultSb = new StringBuffer();  
  6.         for (int i = 0; i < b.length; i++){  
  7.             resultSb.append(byteToHexString(b[i]));  
  8.         }  
  9.         return resultSb.toString();  
  10.     }  
  11.     privatestatic String byteToHexString(byte b){  
  12.         int n = b;  
  13.         if (n < 0)  
  14.             n = 256 + n;  
  15.         int d1 = n / 16;  
  16.         int d2 = n % 16;  
  17.         return hexDigits[d1] + hexDigits[d2];  
  18.     }  
  19.     publicstatic String MD5Encode(String origin){  
  20.         String resultString = null;  
  21.             try {  
  22.                 resultString=new String(origin);  
  23.                 MessageDigest md = MessageDigest.getInstance("MD5");  
  24.                 resultString.trim();  
  25.                 resultString=byteArrayToHexString(md.digest(resultString.getBytes("UTF-8")));  
  26.             }catch (Exception ex){}  
  27.             return resultString;  
  28.         }  
  29.     publicstaticvoid main(String[] args)   
  30.     {  
  31.         String data = "189022881112011111118:09sz0000123456789987654321";  
  32.         System.out.println(MD5Encode(data));  
  33.     }  
  1. publicclass ShortUrl {   
  2.     publicstaticvoid main(String[] args) {   
  3.         String url = "http://www.sunchis.com";   
  4.         for (String string : ShortText(url)) {   
  5.             print(string);   
  6.         }   
  7.     }   
  8.     publicstatic String[] ShortText(String string){   
  9.         String key = "XuLiang";                 //自定義生成MD5加密字串前的混合KEY 
  10.         String[] chars = new String[]{          //要使用生成URL的字元 
  11.             "a","b","c","d","e","f","g","h",   
  12.             "i","j","k","l","m","n","o","p",   
  13.             "q","r","s","t","u","v","w","x",   
  14.             "y","z","0","1","2","3","4","5",   
  15.             "6","7","8","9","A","B","C","D",   
  16.             "E","F","G","H","I","J","K","L",   
  17.             "M","N","O","P","Q","R","S","T",   
  18.             "U","V","W","X","Y","Z"
  19.         };   
  20.         String hex = MD5Encode(key + string);   
  21.         int hexLen = hex.length();   
  22.         int subHexLen = hexLen / 8;   
  23.         String[] ShortStr = new String[4];   
  24.         for (int i = 0; i < subHexLen; i++) {   
  25.             String outChars = "";   
  26.             int j = i + 1;   
  27.             String subHex = hex.substring(i * 8, j * 8);   
  28.             long idx = Long.valueOf("3FFFFFFF"16) & Long.valueOf(subHex, 16);   
  29.             for (int k = 0; k < 6; k++) {   
  30.                 int index = (int) (Long.valueOf("0000003D"16) & idx);   
  31.                 outChars += chars[index];   
  32.                 idx = idx >> 5;   
  33.             }   
  34.             ShortStr[i] = outChars;   
  35.         }   
  36.         return ShortStr;   
  37.     }   
  38.     privatestaticvoid print(Object messagr){   
  39.         System.out.println(messagr);   
  40.     }   
  41. }   

下面來看看程式部分:現在可以直接使用ShortText(url)方法,可以等到下面四組值:

  1. ShortText("http://www.sunchis.com")[0];  //得到值:Jzyqma   
  2. ShortText("http://www.sunchis.com")[1];  //得到值:QBrMzm   
  3. ShortText("http://www.sunchis.com")[2];  //得到值:bQreM3   
  4. ShortText("http://www.sunchis.com")[3];  //得到值:VNBRna   

選取結果中四個值的任何一個值即可作為URL對應生成的短網址了。