首頁 >後端開發 >php教程 >在 Laravel 中將花式文本標準化為普通文本

在 Laravel 中將花式文本標準化為普通文本

Susan Sarandon
Susan Sarandon原創
2024-10-06 18:08:30398瀏覽

Normalizing Fancy Text to Normal Text in Laravel

文章源自https://medium.com/@hafiqiqmal93/normalizing-fancy-text-to-normal-text-in-laravel-7d9ed56d5a78

使用者輸入的文字一點也不有趣。隨著智慧型手機中 Unicode 的出現,用戶現在可以奢侈地(有時甚至是奇思妙想)輸入各種樣式和格式的文字。從表情符號到變音符號,從連字到全角字符,「花俏文字」的範圍可能非常令人困惑或難以被系統理解。雖然視覺上很吸引人,但這些文字變化對系統提出了重大挑戰,特別是在資料一致性、可搜尋性和使用者體驗方面。

以下是精美文本的範例:-


???????? ???? ? ??? ?????????? ????? ?? ??? ????? ??? ?? ?????????? ?? ??????? ???? ?????? ??? ??? ???? ????? ??? ? ?? ???? ?? ????? ??? ??????? ?? ???? ???? ?? ??? ?? ????? ??? ???????? ?????? ????? ?????, ?? ???? ??????? ???? ????..????? ?? ??? ????. ??? ?????? ???? ?? ???? ????? ?????????


看起來像斜體字符,但實際上不是斜體。它實際上屬於數學字母數字符號。

PHP 有問題嗎?

嗯,一個非常明顯的問題是 PHP 無法在收到時對變形的 UTF-8 字元進行 JSON 編碼。在現代 Web 開發方式中,API 和前端框架使用 JSON 來傳輸數據,這是一個問題。如果處理不當,這種變形的字元將導致資料損壞、崩潰或憤怒的使用者。

我們的目標很簡單:- 提出了將每個精美文字轉換為正常可讀文字的解決方案。

PHP 規範化器

標準化形式對於理解標準化過程至關重要。它們滿足不同的語言和技術需求。例如,NFC 形式將字元組合成其組合形式,而 NFD 則相反,將組合字元分解為其組成部分。 NFKC 和 NFKD 形式更進一步,考慮了相容性字元 - 將字元的變體折疊成規範形式。這些形式確保文字比較、搜尋和儲存一致且可靠。

解決方案?

提供的程式碼片段是 PHP 方法的優秀範例,可以簡單且有效率地解決複雜問題。讓我們剖析這個解決方案,了解其組件,並看看它如何無縫整合:-


public static function normalizeText($text): ?string
{
    if (!$text) {
        return null;
    }
    $intl = [
        \Normalizer::FORM_C,
        \Normalizer::FORM_D,
        \Normalizer::NFD,
        \Normalizer::FORM_KC,
        \Normalizer::NFKC,
        \Normalizer::FORM_KC_CF,
        \Normalizer::FORM_KD,
        \Normalizer::NFKD,
        \Normalizer::NFC,
        \Normalizer::NFKC_CF,
    ];
    foreach ($intl as $form) {
        if (!\Normalizer::isNormalized($text, $form)) {
            return \Normalizer::normalize($text, $form);
        }
    }
    return $text;
}


使用方法很簡單:-


$normalText = Utils::normalizeText($YOUR_FANCY_STRING)


您可以在輔助函數中註冊以使其更易於使用。例如:-


if ( ! function_exists('normalize_text')) {
    function normalize_text(string $text): string
    {
         return Utils::normalizeText($text)
    }
}

// USAGE
$normalText = normalize_text($YOUR_FANCY_STRING)


這個函數的核心是利用 PHP 的 **Normalizer** 類別(國際化 (intl) 擴充的一部分)來解決規範化問題。 **Normalizer** 類別提供了多種標準化形式,每種形式都針對不同的標準化需求進行了客製化。此函數迭代這些表單,使用 **isNormalized** 函數檢查文字是否已以給定形式標準化。如果不是,它將文字標準化為該形式並返回標準化字串。


結論

雖然精美的文字可能會增加使用者輸入的視覺吸引力,但它對資料處理和系統互通性提出了重大挑戰。然而,透過採用 PHP 的 Normalizer 類別和規範化形式的實現,開發人員可以克服這些挑戰,並確保他們的應用程式在面對不同的文字輸入時保持資料的一致性和可靠性。


您在專案中處理精美文字方面是否有任何經驗或挑戰?您目前如何解決此類問題?您認為 PHP 的 Normalizer 類別在您的工作流程中有用嗎?讓我們繼續對話並分享我們的見解,以幫助彼此應對現代 Web 開發的複雜性。 ??

以上是在 Laravel 中將花式文本標準化為普通文本的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn