1. 程式人生 > >各種編碼整理

各種編碼整理

整理一些CTF中常用的編碼。

1.ASCII編碼
ascii碼錶
線上轉換

2.Base64/32/16編碼
線上轉換(b64)
線上1/線上2

5.UUencode編碼
線上解碼

6.URL編碼

url編碼是一種瀏覽器用來打包表單輸入的格式。
    URL編碼遵循下列規則: 每對name/value由&;符分開;每對來自表單的name/value由=符分開。如果使用者沒有輸入值給這個name,那麼這個name還是出現,只是無值。任何特殊的字元(就是那些不是簡單的七位ASCII,如漢字)將以百分符%用十六進位制編碼,當然也包括象 =,&;,和 % 這些特殊的字元。其實url編碼就是一個字元ascii碼的十六進位制。不過稍微有些變動,需要在前面加上“%”
。比如“\”,它的ascii碼是9292的十六進位制是5c,所以“\”的url編碼就是%5c。那麼漢字的url編碼呢?很簡單,看例子:“胡”的ascii碼是-17670,十六進位制是BAFA,url編碼是“%BA%FA”。

線上解碼

7.Unicode編碼
線上解碼

8.Escape/Unescape編碼

Escape/Unescape加密解碼/編碼解碼,又叫%u編碼,從以往經驗看編碼字串出現有"u",它是unicode編碼,那麼Escape編碼採用是那一種unicode實現形式呢。其實是UTF-16BE模式。這樣一來問題非常簡單了。 Escape編碼/加密,就是字元對應UTF-16 16
進製表示方式前面加%u。Unescape解碼/解密,就是去掉"%u"後,將16進位制字元還原後,由utf-16轉碼到自己目標字元。如:字元“中”,UTF-16BE是:“6d93”,因此Escape是“%u6d93”,反之也一樣!因為目前%字符,常用作URL編碼,所以%u這樣編碼已經逐漸被廢棄了!

線上解碼

9.HTML實體編碼

字元實體是用一個編號寫入HTML程式碼中來代替一個字元,在使用瀏覽器訪問網頁時會將這個編號解析還原為字元以供閱讀。

這麼做的目的主要有兩個:
1、解決HTML程式碼編寫中的一些問題。例如需要在網頁上顯示小於號(<)和大於號(>),由於它們是HTML的預留標籤,可能會被誤解析。這時就需要將小於號和大於號寫成字元實體:
小於號這樣寫:&lt
; 或 &#60; 大於號這樣寫:&gt; 或 &#62; 前面的寫法稱為實體名稱,後面的寫法則是實體編號。ISO-8859-1字符集(西歐語言)中兩百多個字元設定了實體名稱,而對於其它所有字元都可以用實體編號來代替。 2、網頁編碼採用了特定語言的編碼,卻需要顯示來自其它語言的字元。例如,網頁編碼採用了西歐語言ISO-8859-1,卻要在網頁中顯示中文,這時必須將中文字元以實體形式寫入HTML程式碼中。

線上解碼

10.敲擊碼(Tap code)

 tap code —— 兩個一位數字編碼一個字母

這裡寫圖片描述

11.莫爾斯電碼(Morse Code)

相關推薦

各種編碼整理

整理一些CTF中常用的編碼。 1.ASCII編碼 —ascii碼錶 —線上轉換 2.Base64/32/16編碼 —線上轉換(b64) —線上1/線上2

各種編碼問題

存儲 頁表 unicode 避免 字符 中文字符 系列 維護 中國 UNICODE字符集和UTF系列編碼 UNICODE是一個標準,他為每個字符規定了編號。 UTF系列編碼是對UNICODE標準規定的編號進行編碼,以便於傳輸或者存儲。 16位存不下UNICODE所有字符。

各種編碼格式

就是 ron 問題 shift 全世界 轉化 可變 兩個 code   ASCII:由於計算機是美國人發明的,因此,最早只有127個字符被編碼到計算機裏,也就是大小寫英文字母、數字和一些符號,這個編碼表被稱為ASCII編碼,比如大寫字母A的編碼是65,小寫字母z的編碼是12

hadoop 各種概念整理

保存文件 replica 基本 linux中 最小 朋友 字節 並發訪問 尋址 Hadoop Hadoop實現了一個分布式文件系統(Hadoop Distributed File System),簡稱HDFS。 HDFS有高容錯性的特點,並且設計用來部署在低廉的(low

對於PrintStream 和PrintWriter的理解 以及各種編碼格式 以及編碼和解碼的解釋

PrintStream: 是一個位元組列印流,System.out對應的型別就是PrintStream。 它的建構函式函式可以接收三種資料型別的值。 1,字串路徑。 2,File物件。 3,OutputStream。 PrintWriter: 是一

Opencv各種編碼器下視訊檔案大小對比

轉載自http://blog.csdn.net/dcrmg/article/details/52215930 做視訊樣本切割,切片用ffv1編碼,比原資料大了幾十倍,看到了這篇文章,防止找不到記錄一下 開啟視訊檔案或攝像頭視訊需要使用Opencv中的VideoCapture類,儲存視訊或攝像頭視訊到本地磁

GB2312、GBK、ISO-8859-1、ASCII碼、Unicode、UTF-8各種編碼格式詳解(終於搞懂了)

從計算機編碼歷史這條主線來理解各種編碼格式 計算機發明於歐美語系世界,最初只需要處理英文字母的編碼就可以了,也就是ISO-8859-1編碼規範;後來傳到中國,原有的編碼規範不能識別中文,於是發展出了GB2312、GBK等格式來編碼中文,同樣的對於阿拉伯語系、德俄西班牙之類的也會有其相應的編碼

各種編碼型別總結

英文字母: 位元組數 : 1;編碼:GB2312 位元組數 : 1;編碼:GBK 位元組數 : 1;編碼:GB18030 位元組數 : 1;編碼:ISO-8859-1 位元組數 : 1;編碼:UTF-8 位元組數 : 4;編碼:UTF-16 位元組數 : 2;編碼:UTF

編碼整理

 java編碼方式: package com.tea.web.admin; import java.net.URLEncoder; public class EncodeTest { public static void main(String[] args) throws E

常用語音編碼的WAVE檔案頭格式剖析--各種編碼

  WAVE檔案頭作為多媒體中使用的聲波檔案格式之一,它是以RIFF格式為標準的。RIFF是英文Resource Interchange File Format的縮寫,每個WAVE檔案的頭四個位元組便是“RIFF”。合理利用WAVE檔案頭可以更有效地進行語音解碼。   通常意義上說

各種編碼UNICODE、UTF-8、ANSI、ASCII、GB2312、GBK詳解

GBK,ISO-8859-1,GB2312的本質區別 編碼有幾種 ,計算機最初是在美國等國家發明的 所以表示字元只有簡單的幾個字母只要對字母進行編碼就好 我們標準碼 iso-8859-1 這就是一個標準 但是後來計算機普及了 於是就中國要使用計算機了 但是機器不認得

Java中文編碼各種編碼互轉和Java判斷檔案編碼

Unicode UTF-8 GBK 及一點Java程式碼 Unicode UTF-8 GBK這些不同的編碼,我們可以想象為不同的字典。同一個漢字,在不同的字典裡面,我們用不同的編號儲存。比如漢字"陳"在Unicode裡編號為9648,在GBK裡面是0xB3C2,在UTF-8

各種編碼的對比

早期的計算機使用7位的ASCII編碼,為了處理漢字,程式設計師設計了用於簡體中文的GB2312和用於繁體中文的big5。  GB2312(1980年):16位字符集,收錄有6763個簡體漢字,682個符號,共7445個字元;  優點:適用於簡體中文環境,屬於中國國家標準,通

各種編碼之間的區別 用法 總結

1. ASCII和Ansi編碼 字元內碼(charcter code)指的是用來代表字元的內碼.讀者在輸入和儲存文件時都要使用內碼,內碼分為 單位元組內碼 -- Single-Byte character sets (SBCS),可以支援256個字元編碼

各種編碼方式的區別

ASCII ASCII碼是7位編碼,編碼範圍是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯數字和標點符號等字元。其中0x00-0x20和0x7F共33個控制字元。 只支援ASCII碼的系統會忽略每個位元組的最高位,只認為低7位是有效位。HZ字元編碼就是早

c++轉碼基礎(1):各種編碼型別及unicode和uft-8互轉

什麼是Ascii編碼? 單位元組編碼,適用於所有拉丁文字字母. ASCII 碼使用指定的7 位或8 位二進位制數組合來表示128 或256 種可能的字元. 標準ASCII 碼也叫基礎ASCII碼,使用7 位二進位制數(剩下的1位二進位制為0)來表示所有的大寫和小寫字母,數字

python unicode 編碼整理

unicode 是 character set character set 是把每個字元對應成數字的集合,比如unicode中 A對應0041,漢字『我』對應 ‘6211’ unicode 是個很大的集合,幾乎覆蓋世界上所有的字元,現在的規模已經可以容納100萬個字元。 utf-8 是對 unicode

各種編碼格式(非常經典)

GBK,ISO-8859-1,GB2312的本質區別 編碼有幾種 ,計算機最初是在美國等國家發明的 所以表示字元只有簡單的幾個字母只要對字母進行編碼就好 我們標準碼 iso-8859-1 這就是一個標準 但是後來計算機普及了 於是就中國要使用計算機了 但是機器不認得中文

關於資料處理使用python時出現的各種編碼問題的解決方案

關於python中出現的各種編碼問題 首先,windows下複製檔案的絕對路徑時請絕對不要使用屬性->安全中的直接複製,因為這樣做有時候會引入額外的不可見字元。請按下shift鍵的同時點選右鍵,會有一項是“複製為路徑”,點選這個項就可以得到一個帶雙引號的絕對檔案路

utf-8 unicode 各種編碼的區別與聯絡

1.編碼的大概認識 以UTF8格式儲存的檔案檔首標識為EF BB BF。  效率 從上述編碼原理中得出的結論是: 1).每個英文字母、數字所佔的空間為1 Byte; 2).泛歐語系、斯拉夫語字母佔2 Bytes; 3).漢字佔3 Bytes。 由此可見UTF8對英文來說是個