首頁 >後端開發 >php教程 >Redis在PHP應用程式中的全文搜索

Redis在PHP應用程式中的全文搜索

PHPz
PHPz原創
2023-05-19 08:01:351560瀏覽

隨著網路科技的不斷發展,搜尋引擎的應用越來越廣泛。在網路的背景下,搜尋引擎已成為用戶獲取資訊的主要途徑之一。而在過程中,全文搜尋技術扮演了至關重要的角色。全文搜尋透過文字內容的建立索引,在使用者查詢時快速定位到符合的文字。在PHP應用程式中實現全文搜索,有很多的方案,而本文將重點放在Redis在PHP應用中的全文搜尋。

Redis 是一個高效能的非關係型記憶體資料庫,它支援多種資料結構,包括字串、雜湊、列表、集合和有序集合。 Redis 還提供了許多強大的功能,例如發布/訂閱、事務、Lua 腳本等。因此,Redis 適用於多種場景,如快取、佇列、即時計數、分散式鎖等。同時,Redis 的高效能和高可用性也使它成為 PHP 應用中最常用的資料儲存方式之一。

Redis 實現全文搜尋的基本原理是透過建立索引,在查詢時快速定位到文字內容。而在建立索引的過程中,需要將文字內容分解成若干個單詞,然後將這些單字和文字內容的標識符建立映射關係。在儲存索引的資料結構中,每個單字對應一個有序集合,這個有序集合中儲存了該單字出現的文字內容的識別碼和出現的次數。在查詢時,先將查詢字串分解成若干個單詞,然後分別從該單字對應的有序集合中獲取文本內容的標識符,並根據出現次數排序,最後返回結果即可。

在 PHP 應用程式中,Redis 實作全文搜尋有多種方式,最常用的是透過 Redis 提供的 Sorted Set 和 Lua 腳本實作。具體實作細節如下:

  1. 建立索引

建立索引的程序一般在伺服器啟動時進行,將需要建立索引的文字內容從資料庫中讀取出來,然後分解成若干個單詞,將這些單字和文字內容的標識符建立映射關係,最後將結果儲存到Redis 中。具體程式碼如下:

<?php
// 建立索引
function buildIndex($redis, $db)
{
    $sql = "SELECT id, title, content FROM article";
    $sth = $db->query($sql);

    while ($row = $sth->fetch(PDO::FETCH_ASSOC)) {
        $id = $row['id'];
        $title = $row['title'];
        $content = $row['content'];

        // 分解单词
        $words = preg_split('/s+/', $title . ' ' . $content);
        $words = array_unique($words);

        foreach ($words as $word) {
            if (!$word) {
                continue;
            }

            $redis->zIncrBy('index:' . $word, 1, $id);
        }
    }
}
?>
  1. 查詢

查詢的過程分為兩個步驟,首先將查詢字串分解成若干個單詞,然後分別從該單字對應的有序集合中取得文字內容的標識符,並根據出現次數排序,最後傳回結果即可。具體程式碼如下:

<?php
// 全文搜索
function search($redis, $query, $offset, $count)
{
    $words = preg_split('/s+/', $query);
    $words = array_unique($words);

    $tmpKeys = array();
    foreach ($words as $word) {
        if (!$word) {
            continue;
        }

        $tmpKey = 'idx:' . $word;
        $redis->zInter($tmpKey, array('index:' . $word), array(1));
        $tmpKeys[] = $tmpKey;
    }

    $redis->zUnion('idx:result', $tmpKeys, array(1));
    $redis->zRevRange('idx:result', $offset, $offset + $count - 1);
}
?>
  1. Lua 腳本

為了減少網路傳輸和提高查詢效率,可以使用 Lua 腳本將查詢的程序封裝成一個指令。具體程式碼如下:

<?php
// 全文搜索,使用 Lua 脚本实现
function search($redis, $query, $offset, $count)
{
    $script = "
        local words = redis.call('SPLIT', ARGV[1], '[^%w]+')
        local tmpKeys = {}
        for i, word in ipairs(words) do
            if word ~= '' then
                local tmpKey = 'idx:' .. word
                redis.call('ZINTERSTORE', tmpKey, 1, 'index:' .. word)
                table.insert(tmpKeys, tmpKey)
            end
        end
        redis.call('ZUNIONSTORE', 'idx:result', #tmpKeys, unpack(tmpKeys))
        return redis.call('ZREVRANGE', 'idx:result', ARGV[2], ARGV[3])
    ";

    return $redis->eval($script, 3, $query, $offset, $offset + $count - 1);
}
?>

總結:

Redis 在PHP 應用程式中實現全文搜索,透過建立索引,在查詢時快速定位到文字內容,充分發揮了Redis 高效能和高可用的優點。透過使用 Redis 提供的 Sorted Set 和 Lua 腳本,能夠較好的完成全文搜尋的任務,為 PHP 開發人員提供了一個高效的方案。但是,需要注意的是在資料量很大的情況下,Redis 可能會面臨記憶體不足的問題。此時,需要合理的設計資料儲存和索引策略,避免 Redis 記憶體溢位。

以上是Redis在PHP應用程式中的全文搜索的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn