首页  >  文章  >  后端开发  >  在 Laravel 中将花式文本标准化为普通文本

在 Laravel 中将花式文本标准化为普通文本

Susan Sarandon
Susan Sarandon原创
2024-10-06 18:08:30330浏览

Normalizing Fancy Text to Normal Text in Laravel

文章源自https://medium.com/@hafiqiqmal93/normalizing-fancy-text-to-normal-text-in-laravel-7d9ed56d5a78

用户输入的文本一点也不有趣。随着智能手机中 Unicode 的出现,用户现在可以奢侈地(有时甚至是奇思妙想)输入各种样式和格式的文本。从表情符号到变音符号,从连字到全角字符,“花哨文本”的范围可能非常令人困惑或难以被系统理解。虽然视觉上很吸引人,但这些文本变化对系统提出了重大挑战,特别是在数据一致性、可搜索性和用户体验方面。

以下是精美文本的示例:-


???????? ???? ? ??? ?????????? ????? ?? ??? ????? ??? ?? ?????????? ?? ??????? ???? ?????? ??? ??? ???? ????? ??? ? ?? ???? ?? ????? ??? ??????? ?? ???? ???? ?? ??? ?? ????? ??? ???????? ?????? ????? ?????, ?? ???? ??????? ???? ????..????? ?? ??? ????. ??? ?????? ???? ?? ???? ????? ?????????


看起来像斜体字符,但实际上不是斜体。它实际上属于数学字母数字符号。

PHP 有问题吗?

嗯,一个非常明显的问题是 PHP 无法在收到时对变形的 UTF-8 字符进行 JSON 编码。在现代 Web 开发方式中,API 和前端框架使用 JSON 来传输数据,这是一个问题。如果处理不当,这种变形的字符将导致数据损坏、崩溃或愤怒的用户。

我们的目标很简单:- 提出了将每个精美文本转换为正常可读文本的解决方案。

PHP 规范化器

标准化形式对于理解标准化过程至关重要。它们满足不同的语言和技术需求。例如,NFC 形式将字符组合成其组合形式,而 NFD 则相反,将组合字符分解为其组成部分。 NFKC 和 NFKD 形式更进一步,考虑了兼容性字符 - 将字符的变体折叠成规范形式。这些形式确保文本比较、搜索和存储一致且可靠。

解决方案?

提供的代码片段是 PHP 方法的一个典型示例,可以简单高效地解决复杂问题。让我们剖析这个解决方案,了解其组件,并看看它如何无缝集成:-


public static function normalizeText($text): ?string
{
    if (!$text) {
        return null;
    }
    $intl = [
        \Normalizer::FORM_C,
        \Normalizer::FORM_D,
        \Normalizer::NFD,
        \Normalizer::FORM_KC,
        \Normalizer::NFKC,
        \Normalizer::FORM_KC_CF,
        \Normalizer::FORM_KD,
        \Normalizer::NFKD,
        \Normalizer::NFC,
        \Normalizer::NFKC_CF,
    ];
    foreach ($intl as $form) {
        if (!\Normalizer::isNormalized($text, $form)) {
            return \Normalizer::normalize($text, $form);
        }
    }
    return $text;
}


使用方法很简单:-


$normalText = Utils::normalizeText($YOUR_FANCY_STRING)


您可以在辅助函数中注册以使其更易于使用。例如:-


if ( ! function_exists('normalize_text')) {
    function normalize_text(string $text): string
    {
         return Utils::normalizeText($text)
    }
}

// USAGE
$normalText = normalize_text($YOUR_FANCY_STRING)


该函数的核心是利用 PHP 的 **Normalizer** 类(国际化 (intl) 扩展的一部分)来解决规范化问题。 **Normalizer** 类提供了多种标准化形式,每种形式都针对不同的标准化需求进行了定制。此函数迭代这些表单,使用 **isNormalized** 函数检查文本是否已以给定形式标准化。如果不是,它将文本标准化为该形式并返回标准化字符串。


结论

虽然精美的文本可能会增加用户输入的视觉吸引力,但它对数据处理和系统互操作性提出了重大挑战。然而,通过采用 PHP 的 Normalizer 类和规范化形式的实现,开发人员可以克服这些挑战,并确保他们的应用程序在面对不同的文本输入时保持数据的一致性和可靠性。


您在项目中处理精美文本方面是否有任何经验或挑战?您目前如何解决此类问题?您认为 PHP 的 Normalizer 类在您的工作流程中有用吗?让我们继续对话并分享我们的见解,以帮助彼此应对现代 Web 开发的复杂性。 ??

以上是在 Laravel 中将花式文本标准化为普通文本的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn