[PHP源码阅读]strpos、strstr和stripos、stristr函数，strposstristr

首頁

後端開發

php教程

[PHP源码阅读]strpos、strstr和stripos、stristr函数，strposstristr_PHP教程

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jul 12, 2016 am 08:52 AM

字串

[PHP源码阅读]strpos、strstr和stripos、stristr函数，strposstristr

strpos

<span>mixed</span> <span>strpos</span> ( <span>string</span> <span>$haystack</span>, <span>mixed</span> <span>$needle</span> [, int <span>$offset</span> = 0 ] )

如果offset指定了，查找会从offset的位置开始。offset不能为负数。

返回needle第一次出现在haystack的位置。如果在haystack中找不到needle，则返回FALSE。

needle，如果needle不是字符串，它会被转换成整型数值并赋值为该数值的ASCII字符。请看下面例子。

例子

<span>$str</span> = "hello"<span>;
</span><span>$pos</span> = <span>strpos</span>(<span>$str</span>, 111<span>);
</span><span>//</span><span> 111的ASCII值是o，因此$pos = 4</span>

strpos核心源码

<span>if</span> (Z_TYPE_P(needle) ==<span> IS_STRING) {
     </span><span>if</span> (!<span>Z_STRLEN_P(needle)) {
          php_error_docref(NULL TSRMLS_CC, E_WARNING, </span><span>"</span><span>Empty needle</span><span>"</span><span>);
          RETURN_FALSE;
     }

     </span><span>//</span><span> 调用php_memnstr函数查找needle</span>
     found = php_memnstr(haystack +<span> offset,
                            Z_STRVAL_P(needle),
                            Z_STRLEN_P(needle),
                            haystack </span>+<span> haystack_len);
     } </span><span>else</span><span> {
          </span><span>//</span><span> 如果不是字符串，转换成数字并赋值为该数字的ASCII字符。</span>
          <span>if</span> (php_needle_char(needle, needle_char TSRMLS_CC) !=<span> SUCCESS) {
               RETURN_FALSE;
          }
          </span><span>//</span><span>设置结束字符</span>
          needle_char[<span>1</span>] = <span>0</span><span>;
          found </span>= php_memnstr(haystack +<span> offset,
                            needle_char,
                            </span><span>1</span><span>,
                            haystack </span>+<span> haystack_len);<br />　　  }
}</span>

有一点要注意的是，如果needle不是字符串的话，会调用php_needle_char函数将needle转成整型数字并转换为其ASCII值。

查找函数

函数最后返回的是found，php_memnstr函数实现了查找的方法。那么再继续看看php_memnstr函数做了什么：

<span>#define</span> php_memnstr zend_memnstr

php_memnstr是函数zend_memnstr的宏定义，查看zend_memnstr函数如下：

<span>static</span> inline <span>char</span> *<span>
zend_memnstr(</span><span>char</span> *haystack, <span>char</span> *needle, <span>int</span> needle_len, <span>char</span> *<span>end)
{
    </span><span>char</span> *p =<span> haystack;
    </span><span>char</span> ne = needle[needle_len-<span>1</span><span>];
    </span><span>if</span> (needle_len == <span>1</span><span>) {
        </span><span>return</span> (<span>char</span> *)memchr(p, *needle, (end-<span>p));
    }

    </span><span>if</span> (needle_len > end-<span>haystack) {
        </span><span>return</span><span> NULL;
    }

    </span><span>//</span><span> 第一个优化，只查找end - needle_len次</span>
    end -=<span> needle_len;

    </span><span>while</span> (p <=<span> end) {
        </span><span>//</span><span> 第二个优化，先判断字符串的开头和结尾是否一样再判断整个字符串</span>
        <span>if</span> ((p = (<span>char</span> *)memchr(p, *needle, (end-p+<span>1</span>))) && ne == p[needle_len-<span>1</span><span>]) {
            </span><span>if</span> (!memcmp(needle, p, needle_len-<span>1</span><span>)) {
                </span><span>return</span><span> p;
            }
        }

        </span><span>if</span> (p ==<span> NULL) {
            </span><span>return</span><span> NULL;
        }

        p</span>++<span>;
    }

    </span><span>return</span><span> NULL;
}</span>

第一个优化，因为(char *)memchr(p, *needle, (end-p+1)是在end - needle_len + 1（即haystack_len+1）中查找，如果p为空，说明needle的第一个字符在p中从未出现过。

strstr

<span>string</span> <span>strstr</span> ( <span>string</span> <span>$haystack</span>, <span>mixed</span> <span>$needle</span> [, bool <span>$before_needle</span> = <span>false</span> ] )

返回needle在haystack中第一次出现的位置到结束的字符串。

这个函数的区分大小写的。

如果needle在haystack中不存在，返回FALSE。

如果before_needle为true，则返回haystack中needle在haystack第一次出现的位置之前的字符串。

strstr核心源码

<span>if</span><span> (found) {
        </span><span>//</span><span> 计算出found的位置</span>
        found_offset = found -<span> haystack;
        </span><span>if</span><span> (part) {
            RETURN_STRINGL(haystack, found_offset, </span><span>1</span><span>);
        } </span><span>else</span><span> {
            RETURN_STRINGL(found, haystack_len </span>- found_offset, <span>1</span><span>);
        }
    }</span>

strstr函数的前半部分跟strpos类似，区别在于strstr函数在找到位置后，需要返回haystack部分的字符串。part变量就是调用strstr函数时传递的before_needle变量。

stripos

<span>mixed</span> <span>stripos</span> ( <span>string</span> <span>$haystack</span>, <span>string</span> <span>$needle</span> [, int <span>$offset</span> = 0 ] )

不区分大小写的strpos。实现方式跟下面的类似，主要是使用一份拷贝然后将需要比较的字符串转换成小写字符后进行再进行查找。

stristr

<span>string</span> <span>stristr</span> ( <span>string</span> <span>$haystack</span>, <span>mixed</span> <span>$needle</span> [, bool <span>$before_needle</span> = <span>false</span> ] )

不区分大小写的strstr。

核心源码

<span>//</span><span> 拷贝一份haystack</span>
     haystack_dup =<span> estrndup(haystack, haystack_len);

    </span><span>if</span> (Z_TYPE_P(needle) ==<span> IS_STRING) {
        </span><span>char</span> *<span>orig_needle;
        </span><span>if</span> (!<span>Z_STRLEN_P(needle)) {
            php_error_docref(NULL TSRMLS_CC, E_WARNING, </span><span>"</span><span>Empty needle</span><span>"</span><span>);
            efree(haystack_dup);
            RETURN_FALSE;
        }
        orig_needle </span>=<span> estrndup(Z_STRVAL_P(needle), Z_STRLEN_P(needle));
        </span><span>//</span><span> 调用php_stristr函数找出orig_needle的值。</span>
        found =<span> php_stristr(haystack_dup, orig_needle,    haystack_len, Z_STRLEN_P(needle));
        efree(orig_needle);
    } </span><span>else</span><span> {
        </span><span>if</span> (php_needle_char(needle, needle_char TSRMLS_CC) !=<span> SUCCESS) {
            efree(haystack_dup);
            RETURN_FALSE;
        }
        needle_char[</span><span>1</span>] = <span>0</span><span>;

        found </span>= php_stristr(haystack_dup, needle_char,    haystack_len, <span>1</span><span>);
    }

    </span><span>if</span><span> (found) {
        found_offset </span>= found -<span> haystack_dup;
        </span><span>if</span><span> (part) {
            RETVAL_STRINGL(haystack, found_offset, </span><span>1</span><span>);
        } </span><span>else</span><span> {
            RETVAL_STRINGL(haystack </span>+ found_offset, haystack_len - found_offset, <span>1</span><span>);
        }
    } </span><span>else</span><span> {
        RETVAL_FALSE;
    }
    
    </span><span>//</span><span> 释放变量</span>
    efree(haystack_dup);

可以知道，found是从php_stristr中得到的，继续查看php_stristr函数：

PHPAPI <span>char</span> *php_stristr(<span>char</span> *s, <span>char</span> *<span>t, size_t s_len, size_t t_len)
{
    php_strtolower(s, s_len);
    php_strtolower(t, t_len);
    </span><span>return</span> php_memnstr(s, t, t_len, s +<span> s_len);
}</span>

这个函数的功能就是将字符串都转成小写之后调用php_mennstr函数来查找needle在haystack第一次出现的位置。

总结

因为strpos/stripos返回的是位置，位置从0开始计算，所以判断查找失败都用 === FALSE 更适合。

阅读PHP的源码收获挺多，一方面可以知道某个函数的具体实现原理是怎样的，另一方面可以学习到一些编程优化方案。

到此本文结束，如果还有什么疑问或者建议，可以多多交流，原创文章，文笔有限，才疏学浅，文中若有不正之处，万望告知。

如果本文对你有帮助，望点下推荐，谢谢^_^

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

PHP類型提示如何起作用，包括標量類型，返回類型，聯合類型和無效類型？Apr 17, 2025 am 12:25 AM

PHP類型提示提升代碼質量和可讀性。 1)標量類型提示：自PHP7.0起，允許在函數參數中指定基本數據類型，如int、float等。 2)返回類型提示：確保函數返回值類型的一致性。 3)聯合類型提示：自PHP8.0起，允許在函數參數或返回值中指定多個類型。 4)可空類型提示：允許包含null值，處理可能返回空值的函數。

PHP如何處理對象克隆（克隆關鍵字）和__clone魔法方法？Apr 17, 2025 am 12:24 AM

PHP中使用clone關鍵字創建對象副本，並通過\_\_clone魔法方法定制克隆行為。 1.使用clone關鍵字進行淺拷貝，克隆對象的屬性但不克隆對象屬性內的對象。 2.通過\_\_clone方法可以深拷貝嵌套對象，避免淺拷貝問題。 3.注意避免克隆中的循環引用和性能問題，優化克隆操作以提高效率。

PHP與Python：用例和應用程序Apr 17, 2025 am 12:23 AM

PHP適用於Web開發和內容管理系統，Python適合數據科學、機器學習和自動化腳本。 1.PHP在構建快速、可擴展的網站和應用程序方面表現出色，常用於WordPress等CMS。 2.Python在數據科學和機器學習領域表現卓越，擁有豐富的庫如NumPy和TensorFlow。

描述不同的HTTP緩存標頭（例如，Cache-Control，ETAG，最後修飾）。Apr 17, 2025 am 12:22 AM

HTTP緩存頭的關鍵玩家包括Cache-Control、ETag和Last-Modified。 1.Cache-Control用於控制緩存策略，示例：Cache-Control:max-age=3600,public。 2.ETag通過唯一標識符驗證資源變化，示例：ETag:"686897696a7c876b7e"。 3.Last-Modified指示資源最後修改時間，示例：Last-Modified:Wed,21Oct201507:28:00GMT。

說明PHP中的安全密碼散列（例如，password_hash，password_verify）。為什麼不使用MD5或SHA1？Apr 17, 2025 am 12:06 AM

在PHP中，應使用password_hash和password_verify函數實現安全的密碼哈希處理，不應使用MD5或SHA1。1)password_hash生成包含鹽值的哈希，增強安全性。 2)password_verify驗證密碼，通過比較哈希值確保安全。 3)MD5和SHA1易受攻擊且缺乏鹽值，不適合現代密碼安全。

PHP：服務器端腳本語言的簡介Apr 16, 2025 am 12:18 AM

PHP是一種服務器端腳本語言，用於動態網頁開發和服務器端應用程序。 1.PHP是一種解釋型語言，無需編譯，適合快速開發。 2.PHP代碼嵌入HTML中，易於網頁開發。 3.PHP處理服務器端邏輯，生成HTML輸出，支持用戶交互和數據處理。 4.PHP可與數據庫交互，處理表單提交，執行服務器端任務。

PHP和網絡：探索其長期影響Apr 16, 2025 am 12:17 AM

PHP在過去幾十年中塑造了網絡，並將繼續在Web開發中扮演重要角色。 1)PHP起源於1994年，因其易用性和與MySQL的無縫集成成為開發者首選。 2)其核心功能包括生成動態內容和與數據庫的集成，使得網站能夠實時更新和個性化展示。 3)PHP的廣泛應用和生態系統推動了其長期影響，但也面臨版本更新和安全性挑戰。 4)近年來的性能改進，如PHP7的發布，使其能與現代語言競爭。 5)未來，PHP需應對容器化、微服務等新挑戰，但其靈活性和活躍社區使其具備適應能力。