1. 程式人生 > >關於PHP的strtoupper函式

關於PHP的strtoupper函式

今天看到了PHP實現的標準擴充套件函式這一段,第一個挑了string相關的函式來看,畢竟這個是用的最多的。

看到了strtoupper函式的實現。如下:

char *php_strtoupper(char *s, size_t len)
{
    unsigned char *c, *e;
    
    c = (unsigned char *)s; 
    e = (unsigned char *)c+len;

    while (c < e) { 
        *c = toupper(*c);
        c++; 
    }    
    return s;
}

 第一感覺就是返回值和傳入值是一個東西,而且經過該函式的處理,實參也會被修改,也就是說傳入的字串也會被upper。

但這個和平時使用的感覺不對,立馬來試下:

<?php
$s = "helloworld";
echo strtoupper($s);
echo $s;
?>

執行結果是:

HELLOWORLD

helloworld

和直覺上是一樣的,但和上面的C程式碼中的邏輯不符啊。咋回事呢?

********************************************************

問題出在這裡:

其實上述C程式碼中的引數並不是直接來自於strtoupper($s)中的$s.

PHP內部獲取$s之後的處理過程為:

PHP_FUNCTION(strtoupper)
{
    char *arg;
    int arglen;
    
    if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "s", &arg, &arglen) == FAILURE) {
        return;
    }

    arg = estrndup(arg, arglen);
    php_strtoupper(arg, arglen);
    RETURN_STRINGL(arg, arglen, 0);
}

不難發現,即使通過zend_parse_parameters獲取的arg是指向$s字串的。後面在呼叫php_strtoupper函式之前還需要:

arg=estrndup(arg,arglen);

 那這個函式是幹什麼的呢?

順疼莫瓜,找到了這個東西:

#define estrndup(s, length)                 _estrndup((s), (length) ZEND_FILE_LINE_CC ZEND_FILE_LINE_EMPTY_CC)

 和這個東西:

ZEND_API char *_estrndup(const char *s, uint length ZEND_FILE_LINE_DC ZEND_FILE_LINE_ORIG_DC)
{
    char *p;

    p = (char *) _emalloc(length+1 ZEND_FILE_LINE_RELAY_CC ZEND_FILE_LINE_ORIG_RELAY_CC);
    if (UNEXPECTED(p == NULL)) {
        return p;
    }    
    memcpy(p, s, length);
    p[length] = 0; 
    return p;
}

注意哲理的_emalloc函式,這個重新分配了一段記憶體空間。然後memcpy(p,s,lenth)。

經過這個過程PHP中的$s已經在內部被“偷樑換柱”成這個“p”了。

到這裡就不難理解,php_strtoupper函式中的引數其實不是$s,而是這個*p。這個p指向的字串的每個字元都會被upper。然後在php_strtoupper中直接返回這個p也就正常了。

結合上面的例子,$s始終都是"helloworld",PHP內部建立的p一開是也是"helloworld",然後會變為"HELLOWORLD"。

最後strtoupper($s)這個也就是PHP在內部建立的這個p了。也就是"HELLOWORLD"。

到這裡就明白了。^_^