PHP中mb_substr與mb_strcut完美解決擷取中文亂碼及兩者區別

阿新 • • 發佈：2019-01-14

方法一：

<?php
header("Content-Type: text/html; charset=utf-8");
$str="107sadf網站工作室歡迎您！";
echo strlen($str)."<br>";
echo substr($str,0,12)."<br>";
echo mb_strlen($str,"UTF8")."<br>";
echo mb_substr($str,0,12,"UTF8")."<br>";
?>

顯示結果如下

34
107sadf網�
16
107sadf網站工作室

strlen()函式返回字串所佔的位元組長度，一個英文字母、數字、各種符號均佔一個位元組，它們的長度均為1。一箇中文字元佔兩個位元組，所以一箇中文字元的長度是2， 
對於一個UTF-8的中文字元，會把它當做長度為3來處理。

怎麼準確的計算字串的長度呢？這裡，得引入另外一個函式mb_strlen()。mb_strlen()函式的用法與strlen()幾乎一摸一樣，只是多了一個指定字符集編碼的引數。函式原型為：

int mb_strlen(string string_input, string encode);

在mb_strlen計算時，選定內碼為UTF8，則會將一箇中文字元當作長度1來計算。
因此，使用mb_substr()的第二個length引數，要比substr小！如果使用substr的長度，有可能會不盲目的認為mb_substr不起作用！

mb_substr也同樣的原理

注：mb_strlen與mb_substr並不是PHP的核心函式，使用前需要開啟php.ini中的extension=php_mbstring.dll這一項

方法二：

<?php
header("Content-Type: text/html; charset=utf-8");
$str="107sadf網站工作室歡迎您！";
function chinesesubstr($str,$start,$len){
        $strlen = $len - $start;    //定義需要擷取字元的長度
         
for($i=0;$i<$strlen;$i++){                   //使用迴圈語句，單字擷取，並用$tmpstr.=$substr(？，？，？)加起來
            if(ord(substr($str,$i,1))>0xa0){     //ord()函式取得substr()的第一個字元的ASCII碼，如果大於0xa0的話則是中文字元
                $tmpstr.=substr($str,$i,3);        //設定tmpstr遞加，substr($str,$i,3)的3是指三個字元當一個字元擷取(因為utf8編碼的三個字元算一個漢字)
                $i+=2;
            }else{                                             //其他情況（英文）按單字元擷取
                $tmpstr.=substr($str,$i,1);
            }

        }
        return $tmpstr;
}
echo chinesesubstr($str,0,12)."<br>";
?>

最後結果顯示為：

107sadf網站

2.mb_strcut();

$length = strlen(strip_tags($this->nostriptagcon))-1;

// $randlength=rand(6,30);
// echo $this->nostriptagcon;

for($i=0;$i<$this->mactharrnums;$i++){
$this->shorttext[] = mb_strcut($this->nostriptagcon, rand(0,$length),rand(12,30),"utf-8");
}

類似方式每次用mb_substr,有很多的陣列內容為空白的，更換mb_strcut()之後，就很ok了！

兩者的區別是：

從上面的例子可以看出，mb_substr是按字來切分字元，而mb_strcut是按位元組來切分字元，但是都不會產生半個字元的現象。

新增原文來自：https://www.cnblogs.com/blogforly/p/5657876.html

PHP中mb_substr與mb_strcut完美解決擷取中文亂碼及兩者區別

方法一： <?php header("Content-Type: text/html; charset=utf-8"); $str="107sadf網站工作室歡迎您！"; echo strlen($str)."<br>"; echo substr($str,0,12)."

PHP中substr擷取中文亂碼解決方案

方法一：<?php header("Content-Type: text/html; charset=utf-8"); $str="107sadf網站工作室歡迎您！"; echo strlen($str)."<br>"; echo substr($str,

PHP中elseif與else if的區別

else elseif if 在PHP中，正常情況下elseif和else if的用法及效果是一樣的，但在使用帶冒號的if語句時（也就是php替代）情況會有點不一樣，比如：<?php /*正確的寫法*/ $a = 1; $b = 2; if ($a > $b): ec

PHP中array_map與array_column之間的關系分析

取出 += 二維數組快速實現 true sharp first 情況重新 array_map()與array_column()用法如下： array_map();將回調函數作用到給定數組的單元上array_column();快速實現：將二維數組轉為一維數組 array_

php中@mysql_connect與mysql_connect有什麽區別

localhost php 16px 數據庫 root 什麽如果 spa link 屏蔽錯誤如果有錯的話，會把語句都顯示出來。加@就不顯示[email protected]_connect(‘localhost‘,‘root‘,‘123‘) or die ("數

PHP中exit()與die()的區別

能說需要存儲系統 str 建議 pen 鏈接布爾值 PHP手冊：die()Equivalent to exit()。說明：die()和exit()都是中止腳本執行函數；其實exit和die這兩個名字指向的是同一個函數，die()是exit()函數的別名。該函數只接

PHP中include()與require()的區別說明

靜態頁檢查服務器 code 中斷完全變量方式返回值 require 的使用方法如 require("MyRequireFile.php"); 。這個函數通常放在 PHP 程序的最前面，PHP 程序在執行前，就會先讀入 require 所指定引入的文件，使它變成

PHP中FUNCTION與METHOD的區別

con pre 興趣 back bsp return col round clas 你知道php中__FUNCTION__與__METHOD__的區別嗎？本文通過一個小例子，為大家介紹下二者的區別，有興趣的朋友可以參考下。 PHP中__FUNCTION__與__METH

PHP中Cookie與Session的異同以及使用

重寫不容易包含 ron pat 指示修改表持久 pri Cookie與Session的異同: 一、cookie機制 Cookies是服務器在本地機器上存儲的小段文本並隨每一個請求發送至同一個服務器。IETF RFC 2965 HTTP State Managemen

PHP中self與static

php self static 所謂延遲靜態綁定，顧名思義，靜態調用時::符號左側的部分的的綁定是延遲，也就是說不再被解析為定義當前方法所在的類，而是在實際運行時計算的。 class A { public static function who() { echo __

【整理分享1】PHP中exit()與die()的區別

輸入參數語言執行 spa 鏈接數字 web 總結 web服務器本篇文章簡要分析一下在php中經常用到的exit和die的區別，有需要的朋友可以看一下。首先思考一個問題：如下代碼會向頁面顯示什麽？ <?php die(123); ?> 曾經有段時間

PHP中urlencode()與urldecode()

因為有 urlencode()編碼：對字串中除了 -_. 之外的所有非字母數字字元都將被替換成百分號（%）後跟兩位十六進位制數，空格則編碼為加號（+）。 urldecode()解碼：還原 URL 編碼字串。 header('Content-type:text/html;charset=utf

PHP 中提示undefined index如何解決(多種方法)

PHP 中提示undefined index如何解決(多種方法) 這篇文章主要介紹了PHP 中提示undefined index如何解決(多種方法)的相關資料,需要的朋友可以參考下一、相關資訊平時用$_post['']或$_get['']獲取表單中引數時會出現Notice: Undefined i

在php中self與$this的分別

成員變量 static變量 stat func name 定義聲明 aud new 在訪問PHP類中的成員變量或方法時，如果被引用的變量或者方法被聲明成const（定義常量）或者static（聲明靜態），那麽就必須使用操作符:: <?php class Ca

PHP中json_encode與json_decode

元素 hex 進制 () 調用結果 json false san 一、json_encode() 對變量進行JSON編碼，語法： json_encode ( $value [, $options = 0 ] ) 註意：1、$value為要編碼的值，且該函數只對UTF8

機器學習中分類與迴歸的解決與區別

機器學習可以解決很多問題，其中最為重要的兩個是迴歸與分類。這兩個問題怎麼解決，它們之間又有什麼區別呢？以下舉幾個簡單的例子，以給大家一個概念 1. 線性迴歸迴歸分析常用於分析兩個變數X和Y 之間的關係。比如 X＝房子大小和 Y＝房價之間的關係， X=(公園人流量，公園門票票價

php中self與static的區別

1、假設我們有個Car類，它有2個方法：model()和getModel()。 class Car{ public function model(){ //這裡我們使用了關鍵字self self::getModel(); } p

php中url與路徑相關的函式

//1.urlencode($url):url編碼在特殊字元前加上%,防止伺服器解析出現歧義 $url = urlencode('http://www.php.cn/'); echo $url, '<br>'; //使用的時候,必須要進行解碼 echo '<a href="'.

php中陣列與變數和字串之間的轉換

陣列函式_陣列與變數,字串之間的轉換： 1.list($var1,$val2...) 2.extract($arr, $flag) 3.compact(str1,str2...) 4.explode($delimiter, $str

php中curl返回false的解決辦法

本文介紹一下自己在使用curl中遇到的問題解決辦法。希望可以幫助到大家。原文地址：程式碼匯個人部落格 https://www.codehui.net/info/37.html 首先來看一個封裝的curl函式 function request_post($url = '', $param = '

PHP中mb_substr與mb_strcut完美解決擷取中文亂碼及兩者區別

相關推薦