Win32API UNICODE編碼&寬字節

阿新 • • 發佈：2017-05-15

定義自己市場計算機數字 try type 文件 code

計算機是由於是美國人發明的，所以字符集先以英文為主。上世紀三十年代，滿足自己的編碼方式：ASC編碼方式，以7位（bit)代表一個字符，能表示的字符才128個。因為以前內存很貴。128個字符足夠美國人用的了。
計算機發展到歐洲，發現ASC是不夠用的。就發展為ASCII

歐洲有些國家是不用英文的：如西班牙等~~

升級ASCII後，用8位內存來表示字符編碼，有256個字符。如此前128個定下來永久不變，後面128個分配給歐洲其它語種。歐洲有十幾個國家，發現還是不夠用。美國人采取了一種折中辦法：在不增加內存的情況下，采取(CodePage)“代碼頁”的機制來表示字符編碼。用一個數字來表示一個語種：比如用936代碼漢語，或是用437代碼英語等。如果代碼頁是中文代碼頁，後128就是漢字。如果代碼頁437那麽後128就是英文。

記住ASCII的常用3個位置：

1 小寫a的ASCII編碼：97 ##助記：（眼鏡a)，香港回歸
2 大寫A的ASCII編碼：65
3 阿拉伯數字0的ASCII編碼：48 ##助記：“盜聖，你的事發(48)了~~”&&香港回歸，建國48年（97-49）

又過了些年發展，計算機來到亞洲，(8bit) 256也是不夠用的。

就是說漢字，後128給我們是絕對不夠用的。就發展成DBCS（單雙字節混合編碼6萬多個字符），當前計算機的主流編碼方式。
DBCS這種編碼先天具有缺陷，先天“小兒麻痹”，一個處理不當會產生亂碼。因為英文占一個字節，漢字占兩個字節，這個規定就不是唯一的，容易出錯。解析字符串的時候，要有兩種標準來分析字符串，處理就會先天的慢一些。

最後就出現了UNICODE編碼方式：可以認為是DBCS上的一個補丁，UNICODE統一規範：所有字符全部2個字符編碼，英文漢字全部一發切，能能按兩個字節來編碼。在英文高字節上補0.

UNICODE編碼方式有個缺點：占用內存空間，有浪費的嫌疑，但以現在的硬件來看，已經不是問題了。但它並不是市場上主流的編碼方式。
字符集的應用

char 有占用1個字節，有占用兩個字節（DBCS編碼）
寬字節 wchar_t每個占用兩個字節（UNICODE編碼）

wchar_t實際是unsigned short類型（占用2個字節）
定義時需要增加“L”. 給編譯器看，通知編譯器按照雙字節編譯字符串。
需要使用支持wchar_t類型的函數，來操作寬字節字符串。
wchar_t* pwszText = L"Hello wchar";
wprintf(L"%s \n",pwszText);?

這裏不能套用標準C中的char*的函數了，雙字節的操作一定要采用雙字節對應的函數來操作。

windows中的新類型： TCHAR
#ifdef UNICODE
typedef wchar_t ?

註意定義宏的位置，#ifdef XXX 具有向上朔源的屬性，如果代碼中有多個ifdef XXX 就應該讓它統一的找到定義，或者找不到定義，不能自相矛盾。
示範代碼定義宏的位置（#define UNICODE）要在windows.h文件的前面定義，因為windows.h頭文件包含有WINNT.H文件，WINNT.H裏面有“#ifdef UNICODE”的判斷檢測。

#define UNICODE
#include "stdafx.h"
#include "stdio.h"
#include <tchar.h>
#include <windows.h>

void T_char()
{
TCHAR *pszText = _TEXT("Hello");
#ifdef UNICODE
wprintf(L"%s\n",pszText);
#else
printf("單：%s\n",pszText);
#endif

}

int main()
{
T_char();
return 0;
}

示例： UNICODE編碼中wprintf函數的支持有限，不完善，需要更換
// WinChar.cpp : Defines the entry point for the console application.
//

#define UNICODE
#include "stdafx.h"
#include "stdio.h"
#include <tchar.h>
#include <windows.h>

void PrintUnicode()
{
for (WORD nHigh = 0; nHigh <256; nHigh++)
{
for (WORD nLow = 0; nLow<256; nLow++)
{
wchar_t wChar = nHigh * 256 +nLow;
wprintf(L"%s",&wChar);
}
printf("\n");
}
}

int main()
{
PrintUnicode();
return 0;
}
UNICODE打印輸出要使用 WriteConsole這個API來實施。
BOOL WriteConsole(
?IN HANDLE hConsoleOutput, //標準輸出句柄
?IN CONST VOID *lpBuffer, //輸出內容的Buffer緩沖
?IN DWORD nNumberOfCharsToWrite, //準備輸出內容長度
?OUT LPDWORD lpNumberOfCharsWritten, //返回實際輸出內容長度
?IN LPVOID lpReserved //備用
? );

只有三個特殊的指向設備的句柄：1 鍵盤 2 顯示器 3 錯誤設備（其它句柄均指向內存）
HANDLE WINAPI GetStdHandle(
_In_ DWORD nStdHandle //input,output, or error device
);//返回值獲取相應的標準句柄

Win32API UNICODE編碼&寬字節

定義自己市場計算機數字 try type 文件 code Win32API UNICODE編碼&寬字節計算機是由於是美國人發明的，所以字符集先以英文為主。上世紀三十年代，滿足自己的編碼方式：ASC編碼方式，以7位（bit)代表一個字符，能表示的字符才1

eclipse xml 編碼問題 “3 字節的 UTF-8 序列的字節 3 無效”

log 序列 odi div mit 原本嘗試編碼 utf 原本項目沒問題，git commit之後，突然報錯 “3 字節的 UTF-8 序列的字節 3 無效” 嘗試過改xml文件編碼等，沒成功。pom中設置屬性，成功解決 <project.build.sour

刨根究底字符編碼之十一——UTF-8編碼方式與字節序標記

所有碼元 unix 找到概念不可見執行大端位置 UTF-8編碼方式與字節序標記一、UTF-8編碼方式 1. 接下來將分別介紹Unicode字符集的三種編碼方式：UTF-8、UTF-16、UTF-32。這裏先介紹應用最為廣泛的UTF-8。為滿足基於AS

多字節和寬字節互相轉換

char nic code style class 轉換 ons unicode str 1 char* wchar2char(const wchar_t* _wsrc, char* _dest, size_t _destLen) 2 { 3 int iT

Mysql寬字節註入（轉）

strong com 效果編碼問題 blog 壓縮個數 magic sse 盡管現在呼籲所有的程序都使用unicode編碼，所有的網站都使用utf-8編碼，來一個統一的國際規範。但仍然有很多，包括國內及國外（特別是非英語國家）的一些cms，仍然使用著自己國家的一套編碼，

寬字節與多字節互相轉換

fun mes ide main 設置 def 允許 flags tom 這裏需要用到兩個函數：WideCharToMultiByte 與 MultiByteToWideChar 前者是從寬字節轉換為多字節，後者則相反，是從多字節轉換為寬字節。下面介紹下這兩個函數： W

【sqli-labs】 less32 GET- Bypass custom filter adding slashes to dangrous chars (GET型轉義了'/"字符的寬字節註入)

成了 less sql ati mas nbsp ble sch com 轉義函數，針對以下字符，這樣就無法閉合引號，導致無法註入 ‘　　-->　　\‘ "　　-->　　\" \　　-->　　\\ 但是，當MySQL的客戶端字符集為gbk時，就可能發生

【sqli-labs】 less33 GET- Bypass AddSlashes (GET型繞過addslashes() 函數的寬字節註入)

labs http add 寬字節添加 clas img union class 和less32一樣，對關鍵字符進行了添加\ 關於addslashes()函數 payload和less32一樣 http://192.168.136.128/sqli-labs-m

寬字節註入和防禦

south 保持 arch inno 字節 num == net 存儲 0、前言最近要為了自動化審計搜集所有PHP漏洞，在整理註入的時候，發現寬字節註入中使用iconv造成的漏洞原理沒有真正搞懂，網上的文章也說得不是很清楚，於是看了榮哥（lxsec）以前發的一篇htt

寬字節SQL註入

tro 反斜杠輸入 client 配置 mys 錯誤 dds mysql 註入產生的原理: 數據庫設置為GBK編碼: 　　寬字節註入源於程序員設置MySQL連接時錯誤配置為:set character_set_client=gbk,這樣配置會引發編碼轉換從而導致的註入漏洞

數字字每和中文的編碼所占字節的問題？？？

cto 編碼 src col shadow png 中文 watermark type 數字字每和中文的編碼所占字節的問題？？？

寬字節註入解析

ref 冒號 php函數 ctf 過程 process 過濾特殊字符 charset n) 在一個CTF練習的網站，看到了一個寬字節註入的題目，我是一個web萌新，沒什麽經驗，一開始也沒有想到是寬字節，還是一位朋友給我提到的，讓我猛然大悟，咳咳。。。做一些總結。練習題目網

Sql 註入詳解：寬字節註入+二次註入

.com 主動一個 from 攻擊過濾分享圖片 size 就是 sql註入漏洞原理：由於開發者在編寫操作數據庫代碼時，直接將外部可控參數拼接到sql 語句中，沒有經過任何過濾就直接放入到數據庫引擎中執行了。攻擊方式：（1）權限較大時，直接寫入webshell

Mysql寬字節註入 ---學習筆記

cat and 就是註入 lmap 單引號 xtra details you 轉自:https://blog.csdn.net/niexinming/article/details/49109683 先補充一點背景：大家都知道PHP在開啟magic_quotes_gpc

webug4.0寬字節註入-6

技術分享顯示 rman form sel add strong 斜杠反斜杠 0x00　　前言 GBK是一種多字符編碼，一個漢字占2個字節，utf-8編碼的漢字占3個字節。 addslashes() 函數會對括號裏 (‘) 、(")、 (\)、 (NULL)、的四個

3期淺析寬字節註入-----SQL註入

實驗不用數據輸入過程 hack sql 銀行收集通過分類的名稱，你就可以找到漏洞銀行的hack show視頻。吸收這個知識的幾個關鍵的信息。 1.通過視頻得到知識源。【信息來源】我怎麽從不清楚到知道這個信息來源？這個過程沒辦法，從i春秋

js字符串與Unicode編碼互相轉換

char 字符串 name targe ron strong target nbsp log ‘好‘.charCodeAt(0).toString(16) "597d" 這段代碼的意思是，把字符‘好‘轉化成Unicode編碼，看看charCodeAt()是怎麽個意思

刨根究底字符編碼之九——字符編碼方案的演變與字節序

不同桌面應用提示編碼方式 power 同時建議 travel n) 字符編碼方案的演變與字節序一、字符編碼方案的演變 1. 前文已經提及，編號字符集CCS(簡稱字符集)與字符編碼方式CEF(簡稱編碼方式)這兩個概念，在早期並沒有必要嚴格區分。在Unico

各個系統和語言對Unicode的支持字符集和編碼——Unicode(UTF&UCS)深度歷險

html www 程序設計語言 ans java 字符數組部分 .cn 程序 http://www.cnblogs.com/Johness/p/3322445.html 各個系統和語言對Unicode的支持：　　　　Windows NT從底層支持Unicode（不幸的是

黑馬程序猿——26，基本數據操作流，字節數組操作流，轉換流，編碼表

inpu ascii ref 程序猿 har 科學標準 name 字符數 -----------android培訓、java培訓、java學習型技術博客、期待與您交流！------------ 黑馬程序猿——26， DataI

Win32API UNICODE編碼&寬字節

相關推薦