ホームページ >バックエンド開発 >PHPチュートリアル >CI フレームワークのソース コード レビュー - Utf8.php

CI フレームワークのソース コード レビュー - Utf8.php

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBオリジナル
2016-06-13 12:52:31994ブラウズ

CI フレームワークのソース コードの読み取り----------Utf8.php
ファイル アドレス: ./system/core/Utf8.php
主な機能: utf-8 エンコーディングの環境サポートを提供します
1.__construct() コンストラクターは、utf8 がサポートされているかどうかを決定します
(1) ロギング Utf8 クラスが初期化されました
(2) CodeIgniter.php の $CFG を現在のクラスに呼び出します。
(3) 正規表現が utf8 をサポートしているかどうか、iconv ライブラリがインストールされているかどうか、マルチバイト文字列関数のオーバーロードが有効になっていないかどうか、およびアプリケーションの単語 を確認します。 シンボルセットは utf8 であり、
(a) ロギング: UTF-8 サポートが有効になりました。
(b) 定数 UTF8_ENABLED を値 true で定義します
(c) mbstring 拡張機能がロードされている場合、内部エンコーディングを設定します
(d) extension_loaded() 関数を複数回使用する必要がないようにフラグを設定します
(4) 正規表現が utf8 をサポートしていないか、iconv ライブラリがインストールされていないか、マルチバイト文字列関数のオーバーロードが有効になっているか、アプリケーションの文字セットが utf8 ではないかを確認し、
(a) ロギング: UTF-8 サポートが無効です
(b) 定数 UTF8_ENABLED を false に設定します


2.clean_string() utf8 でエンコードされた文字列をクリーンアップします
(1) 文字列が ASCII コードではないかを判定します
(2) iconv 関数を使用して文字列をトランスコードします (iconv 関数の詳細については、 を参照してください) http://www.php.net/manual/zh/function.iconv.php)
(3) 戻り文字列


3.safe_ascii_for_xml() は、水平タブ、改行、復帰を除く、xml で問題を引き起こす可能性のあるすべての ASCII コード文字を削除します。
(1) Remove_invisible_characters()を直接呼び出して無効な文字を削除してリターンします。
注:remove_invisible_characters 関数は common.php で定義されています


4.convert_to_utf8() 文字列を utf8 エンコーディングに変換します
(1) iconv 関数が存在する場合は、iconv 変換を使用します
(2) mb_convert_encoding 関数が存在する場合は、mb_convert_encoding 関数を使用して
を変換します (3) 上記 2 つの関数がどちらも存在しない場合、変換できず false を返します
(4) 変換が完了したら、変換された文字列を返します


5._is_ascii() 文字列が ASCII コードであるかどうかをテストします

(1) 通常のマッチングを使用してテスト結果を返します。


<?php  if ( ! defined('BASEPATH')) exit('No direct script access allowed');
/**
 * CodeIgniter
 *
 * An open source application development framework for PHP 5.1.6 or newer
 *
 * @package		CodeIgniter
 * @author		ExpressionEngine Dev Team
 * @copyright	Copyright (c) 2008 - 2011, EllisLab, Inc.
 * @license		http://codeigniter.com/user_guide/license.html
 * @link		http://codeigniter.com
 * @since		Version 2.0
 * @filesource
 */

// ------------------------------------

/**
 * Utf8 Class
 *
 * Provides support for UTF-8 environments
 *
 * @package		CodeIgniter
 * @subpackage	Libraries
 * @category	UTF-8
 * @author		ExpressionEngine Dev Team
 * @link		http://codeigniter.com/user_guide/libraries/utf8.html
 */
class CI_Utf8 {

	/**
	 * Constructor
	 *
	 * Determines if UTF-8 support is to be enabled
	 *
	 */
	function __construct()
	{
		log_message('debug', "Utf8 Class Initialized");

		global $CFG;

		if (
			preg_match('/./u', 'é') === 1					// PCRE must support UTF-8
			AND function_exists('iconv')					// iconv must be installed
			AND ini_get('mbstring.func_overload') != 1		// Multibyte string function overloading cannot be enabled
			AND $CFG->item('charset') == 'UTF-8'			// Application charset must be UTF-8
			)
		{
			log_message('debug', "UTF-8 Support Enabled");

			define('UTF8_ENABLED', TRUE);

			// set internal 内部 encoding for multibyte 多字节 string functions if necessary 必需的
			// and set a flag so we don't have to repeatedly 多次 use extension_loaded()
			// or function_exists()
			if (extension_loaded('mbstring'))
			{
				define('MB_ENABLED', TRUE);
				mb_internal_encoding('UTF-8');
			}
			else
			{
				define('MB_ENABLED', FALSE);
			}
		}
		else
		{
			log_message('debug', "UTF-8 Support Disabled");
			define('UTF8_ENABLED', FALSE);
		}
	}

	// --------------------------------

	/**
	 * Clean UTF-8 strings
	 *
	 * Ensures 保证 strings are UTF-8
	 *
	 * @access	public
	 * @param	string
	 * @return	string
	 */
	function clean_string($str)
	{
		if ($this->_is_ascii($str) === FALSE)
		{
			$str = @iconv('UTF-8', 'UTF-8//IGNORE', $str);
		}

		return $str;
	}

	// --------------------------------

	/**
	 * Remove ASCII control characters
	 *
	 * Removes all ASCII control characters except horizontal tabs,
	 * line feeds, and carriage returns, as all others can cause
	 * problems in XML
	 *
	 * @access	public
	 * @param	string
	 * @return	string
	 */
	function safe_ascii_for_xml($str)
	{
		return remove_invisible_characters($str, FALSE);
	}

	// --------------------------------

	/**
	 * Convert to UTF-8
	 *
	 * Attempts 企图 to convert a string to UTF-8
	 *
	 * @access	public
	 * @param	string
	 * @param	string	- input encoding
	 * @return	string
	 */
	function convert_to_utf8($str, $encoding)
	{
		if (function_exists('iconv'))
		{
			$str = @iconv($encoding, 'UTF-8', $str);
		}
		elseif (function_exists('mb_convert_encoding'))
		{
			$str = @mb_convert_encoding($str, 'UTF-8', $encoding);
		}
		else
		{
			return FALSE;
		}

		return $str;
	}

	// --------------------------------

	/**
	 * Is ASCII?
	 *
	 * Tests if a string is standard 7-bit ASCII or not
	 *
	 * @access	public
	 * @param	string
	 * @return	bool
	 */
	function _is_ascii($str)
	{
		return (preg_match('/[^\x00-\x7F]/S', $str) == 0);
	}

	// --------------------------------

}
// End Utf8 Class

/* End of file Utf8.php */
/* Location: ./system/core/Utf8.php */




声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。