帶中文的字串擷取

阿新 • • 發佈：2018-11-26

最近在頁面展示的時候遇到這樣的場景，文字有可能超長，卻又不允許換行。

當然，可以用高超的css來搞定。但如果你想要讓多餘的文字用“...”來代替，並且要相容很多瀏覽器，這種時候用css也會很頭疼吧。

1.C#對中文字串的擷取

與英文字元相比，我們把中文字元按兩個佔位來計算，對於帶中文的字串擷取，要面臨兩個問題：

1.無法擷取半個中文字元；

2.對於除漢字以外的中文字元如何處理，比如：標點符號。

在這之前，可以先看看大神對 UTF-8、UTF-16以及UTF-32區別的講解。

接下來，我們先來看一下C#的做法。

在C#中，Substring是最常用的字串擷取函式，但是這種擷取通常一箇中文字元只按一個位置計算。

比如：

“我是Lenmong楊”

擷取5個字元就是：

"我是Len"

但其實，我這裡想要的是：

“我是L”

在C#中還有很多辦法可以做到，介紹一種最簡便的方法，利用 System.Text.Encoding.Default 的 GetBytes 函式和 GetString 函式。

private string SubStrByByte(string str, int start, int length)
{
    int len = length;
    int byteCount = System.Text.Encoding.Default.GetByteCount(str);
     
//修改最大長度，防止溢位
    if (len > byteCount)
    {
        len = byteCount;
    }
    var strBytes = System.Text.Encoding.Default.GetBytes(str);
    string substr = System.Text.Encoding.Default.GetString(strBytes, start, len);
    //對於半個中文字元的特殊處理
    if (substr.EndsWith("?"))
    {
        //判斷原字串是否包含問號 

        var c = str.Substring(substr.Length - 1, 1);
        if (!c.Equals("?"))
        {
            substr = substr.Substring(0, substr.Length - 1);
        }
    }
    return substr + "...";
}

注：在此，對於第一個問題中描述的情況，做了特殊處理。比如從字串 “我是Lenmong楊” 中擷取 1 個或者 3個字元，在這種情況下，由於一箇中文字元佔兩個位置，但我們不可能擷取到半個中文字元，所以擷取的結果是 "?"或者 “我?”。無法擷取的那個中文被"?"代替。

所以我在最後判斷了一下，如果擷取結果是以"?"結尾，那麼就去掉"?"，但如果原字串本身就有問號（英文），那麼做就不去掉問號。

對於除了漢字以外的中文字元的處理，此處未作特殊處理。

網上還有幾種其他的辦法，不再贅述。

Javascript對於帶中文字串的擷取

獲取byte長度

String.prototype.byteLength = function() {
    var str = this,
        strLen = 0;
    for(var i = 0; i < str.length; i++) {
        strLen += str.charAt(i).match(/[^\x00-\xff]/ig) ? 2 : 1;
    }
    return strLen;
};

擷取一定長度

String.prototype.substrByByte = function(start, length) {

    var str = this,
        strLen = str.byteLength(),
        subLen = 0,
        substr = "";
    if(length < 1 || length > strLen) throw new Error("引數不正確");
    for(var i = 0; i < str.length; i++) {
        subLen += str.charAt(i).match(/[^\x00-\xff]/ig) ? 2 : 1;
        if(length <= subLen) {
            substr = str.slice(0, i + 1) + ((length == strLen) ? "" : "...");
            break;
        }
    }
    return substr;
};

在擷取字串的時候，不足一個漢字的按一個漢字計算。

被擷取的部分顯示'...'。

後半段寫的有點匆忙，臨時有些事情處理，後面有時間再來更新吧。

PHP中文處理中文字串擷取(mb_substr)和獲取中文字串字數

一、中文擷取：mb_substr() mb_substr( $str, $start, $length, $encoding ) $str，需要截斷的字串 $start，截斷開始處，起始處為0 $length，要擷取的字數 $encodin

CString型別中文字串截取出現亂碼的問題/實現中文字串擷取無亂碼的方法

原貼地址我的方法與他類似，先將cstring轉成寬位元組後再擷取字串方法原理：cstring下預設字元字母數字等佔一個位元組，而中文佔兩個位元組，轉換成寬位元組後每個單位元組後面會自動填充一個0x00 ，就能和中文一樣保持雙位元組，擷取時保證取得個數為偶數就可以了

PHP技術分享--實現中文字串擷取無亂碼的函式(適用於utf-8)

$re['utf-8'] = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|[\xe0-\xef][\x80-\xbf]{2}|[\xf0-\xff][\x80-\xbf]{3}/";

帶中文的字串擷取

最近在頁面展示的時候遇到這樣的場景，文字有可能超長，卻又不允許換行。當然，可以用高超的css來搞定。但如果你想要讓多餘的文字用“...”來代替，並且要相容很多瀏覽器，這種時候用css也會很頭疼吧。 1.C#對中文字串的擷取與英文字元相比，我們把中文字元按兩個佔位來計算，對於帶中文的字串擷取，要面臨兩

php擷取字串,帶中文,多餘的省略號代替

function subtext($text, $length) { if(mb_strlen($text, 'utf8') > $length) { return mb_

iOS開發字串中帶中文的注意！！！

說一下我自己遇到的問題吧，歡迎評論增加！ 1、使用AFNetworking下載檔案，下載連結中包含中文，下載失敗解決方法：除正常校驗下載連結外，增加一個編碼的過程 NSCharacterSet *characterSet = [NSCharacterSet URLQueryAllo

把帶中文的字串轉為 /u16進位制的 Unicode 碼

話不多說直接上程式碼: /** * 帶中文的字串轉為 /u16進位制的 Unicode 碼 */ private String tfToHex(String str){ Integer.toHexString(0); //匹配單字元是否中文的正則 String r

php擷取中文字串方法

/** * 擷取中文 * @param stirng $string 擷取內容 * @param int $sublen 擷取長度 * @param int $start 開始位置 * @param string $code 編碼方式 * @return stri

擷取中文字串的js方法

轉載地址：http://www.cnblogs.com/ztlyz/archive/2009/08/25/1553819.html 有時在顯示某段文字的時候，可能會太長，影響我們頁面的顯示效果。如果僅是英文，那麼我們可以用String.substring(start, en

win32控制檯輸出帶中文Unicode字串

方法一：將Unicode字符集轉化為ANSI字符集： // char rtn[200]; VOID wcs2mbs(LPCOLESTR wcstr, char* chResult) { size_t wLen = wcslen(wcstr) + 1; // 寬字

php中計算中文字串長度、擷取中文字串

header('Content-type:text/html;charset=utf-8');/*** 可以統計中文字串長度的函式* @param $str 要計算長度的字串* @param $type 計算長度型別，0(預設)表示一箇中文算一個字元，1表示一箇中文算兩個字元**/function abs

js 中文字串的友好擷取

在顯示字串的時候，避免字串過長往往會對字串進行擷取操作，通常會用到js 的 substr 或者 substring方法, 以及字串的length屬性對於非中文的字串處理是很簡單的，但是中文字元的 length 屬性值是1 而不是 2 ，所以處理就不是很友好了。

php 截圖中文字串帶省略號

/** * 字串擷取，支援中文和其他編碼 * @static * @access public * @param string $str 需要轉換的字串 * @param string $start 開始位置 * @param string $length 擷取長

關於VisualStudio一運行帶中文程序就出錯或輸出亂碼問題的解決

彈出 als 單擊 bsp 由於進入 cnblogs 中文標簽昨晚糾結了老半天，各種查資料最後終於解決了此問題。今天上午便來編寫這篇隨筆了！（由於問題已解決，未附上出狀況的截圖）以下是解決辦法：此問題的原因應是文件的編碼問題，選定好出錯的文件後，在菜單欄中選擇“文件

跳轉鏈接，帶中文參數亂碼的問題

button cape func put () bstr 進行 btn substr 這個遇到的幾率比較小，但還是記錄一下主要是當跳轉鏈接時，要攜帶輸入的中文參數後，要獲取鏈接裏的參數值，直接獲取就會出現亂碼解決方案，在提交時中文部分使用encodeURI （）進行編碼

mysql8使用自帶全文索引（帶中文分詞）

lte not null incr sdh values 自帶 var 科學全文索引修改配置文件：vim /etc/my.cnf [mysqld] ngram_token_size=2 創建表： create table test( id int(11) not nu

C語言--字串拷貝、字串查詢、字串比較、字串擷取

在實際的應用當中，字元和字串的操作是最常用的技能。總結下來，提升能力。一、字串拷貝 1、memcpy 2、strcpy 區別二、字串查詢三、字串比較四、字串擷取 1、一種簡單而又機智的方法–strncpy strncpy函

Shell 指令碼8種字串擷取

Linux 的字串擷取很有用。有八種方法。假設有變數 var=http://www.aaa.com/123.htm. 1. # 號擷取，刪除左邊字元，保留右邊字元。程式碼如下: echo ${var#*//} 其中 var 是

groovy風格字串擷取

1、擷取字串 def text1 = "My last character will be removed soon" println&n

String 字串擷取

private String DateTransfer(String validEndTime){ try { if(validEndTime.length() == 8){ validEndTime = validEnd

帶中文的字串擷取

1.C#對中文字串的擷取

Javascript對於帶中文字串的擷取

相關推薦