>백엔드 개발 >PHP 문제 >PHP에서 흔히 발생하는 오류는 무엇입니까?

PHP에서 흔히 발생하는 오류는 무엇입니까?

青灯夜游
青灯夜游원래의
2019-10-11 17:31:532423검색

PHP는 매우 인기 있는 오픈 소스 서버측 스크립팅 언어이며 World Wide Web에서 볼 수 있는 대부분의 웹사이트는 PHP를 사용하여 개발되었습니다. 이 기사는 PHP 개발에서 가장 일반적인 10가지 문제를 소개합니다. 이것이 여러분의 친구들에게 도움이 되기를 바랍니다.

PHP에서 흔히 발생하는 오류는 무엇입니까?

오류 1: foreach 루프 뒤에 매달린 포인터를 남김

foreach 루프에서 반복된 요소를 변경하거나 효율성을 향상해야 하는 경우 참조를 사용하는 것이 좋은 방법입니다.

$arr = array(1, 2, 3, 4); 
foreach ($arr as &$value) { 
    $value = $value * 2; 
} 
// $arr is now array(2, 4, 6, 8)

여기는 다음과 같습니다. 하나 많은 사람들이 이 질문에 혼란스러워합니다. 루프가 끝난 후 value는 실제로 배열의 마지막 요소에 대한 참조입니다. $value의 후속 사용에서 이를 모르면 설명할 수 없는 오류가 발생합니다. 다음 코드를 살펴보세요.

$array = [1, 2, 3]; 
echo implode(',', $array), "\n"; 
  
foreach ($array as &$value) {}    // by reference 
echo implode(',', $array), "\n"; 
  
foreach ($array as $value) {}     // by value (i.e., copy) 
echo implode(',', $array), "\n";

위 코드를 실행한 결과는 다음과 같습니다.

맞추셨나요? 왜 이런 결과가 나온 걸까요?

분석해보자. 첫 번째 루프 이후 $value는 배열의 마지막 요소에 대한 참조입니다. 두 번째 루프는 다음과 같이 시작됩니다.

● 첫 번째 단계: 값을 복사하고(이때 arr[2] 참조) 배열은 [1,2,1]

이 됩니다. ● 두 번째 단계: 값을 복사합니다. , this 배열이 [1,2,2]

● 3단계: 값을 복사하면 배열은 [1,2,2]

결론적으로 최종 결과는 1,2,2

가 됩니다. 이를 방지하려면 이 오류를 방지하는 가장 좋은 방법은 unset 함수를 사용하여 루프 직후에 변수를 삭제하는 것입니다.

$arr = array(1, 2, 3, 4); 
foreach ($arr as &$value) { 
    $value = $value * 2; 
} 
unset($value);   // $value no longer references $arr[3]

오류 2: isset() 함수 동작에 대한 잘못된 이해

isset() 함수의 경우 , 변수가 존재하지 않으면 false가 반환됩니다. 변수 값이 null인 경우에도 False가 반환됩니다. 이런 행동은 사람들을 쉽게 혼란스럽게 할 수 있습니다. . . 아래 코드를 보세요:

$data = fetchRecordFromStorage($storage, $identifier); 
if (!isset($data['keyShouldBeSet']) { 
    // do something here if 'keyShouldBeSet' is not set 
}

이 코드를 작성한 사람은 data['keyShouldBeSet']가 설정되었지만 설정된 값이 null인 경우 해당 논리가 계속 실행될 것이라고 의도했을 수 있습니다. 코드의 원래 의도대로.

여기 또 다른 예가 있습니다:

if ($_POST['active']) { 
    $postData = extractSomething($_POST); 
} 
  
// ... 
  
if (!isset($postData)) { 
    echo 'post not active'; 
}

위의 코드는 postData가 설정되어야 한다고 가정하므로 isset(postData)가 false를 반환하는 유일한 방법은 $_POST['active']도 false를 반환하는 경우입니다.

정말 그런가요? 물론 그렇지 않습니다!

postData도 null로 설정될 수 있으며, 이 경우 isset($postData)는 false를 반환합니다. 이는 코드의 의도에 어긋납니다.

위 코드의 의도가 $_POST['active']가 true인지 여부만 감지하는 것이라면 다음과 같이 구현하는 것이 좋습니다.

if ($_POST['active']) { 
    $postData = extractSomething($_POST); 
} 
  
// ... 
  
if ($_POST['active']) { 
    echo 'post not active'; 
}

변수가 실제로 설정되었는지 확인하려면(unset과 unset을 구별) 값을 null로 설정), array_key_exists() 함수가 더 나을 수도 있습니다. 위의 첫 번째 예를 다음과 같이 리팩토링하세요.

$data = fetchRecordFromStorage($storage, $identifier); 
if (! array_key_exists('keyShouldBeSet', $data)) { 
    // do this if 'keyShouldBeSet' isn't set 
}

또한 get_define_vars() 함수와 결합하면 변수가 현재 범위에 설정되어 있는지 여부를 더 확실하게 감지할 수 있습니다.

if (array_key_exists('varShouldBeSet', get_defined_vars())) { 
    // variable $varShouldBeSet exists in current scope 
}

오류 3: 반환 값을 혼동하고 ​​참조 반환

다음 코드를 고려하세요.

class Config 
{ 
  private $values = []; 
 
  public function getValues() { 
    return $this->values; 
  } 
} 
 
$config = new Config(); 
 
$config->getValues()['test'] = 'test'; 
echo $config->getValues()['test'];

위 코드를 실행하면 다음이 출력됩니다.

PHP Notice: Undefined index: test in /path/to/my/script.php on line 21

문제가 무엇인가요? 문제는 위의 코드가 반환 값과 반환 참조를 혼동한다는 것입니다. PHP에서는 반환 참조를 명시적으로 지정하지 않는 한 PHP는 배열의 복사본인 배열 값을 반환합니다. 따라서 위 코드에서 반환된 배열에 값을 할당하면 실제로는 원래 배열이 아닌 복사된 배열에 값이 할당됩니다.

// getValues() returns a COPY of the $values array, so this adds a 'test' element 
// to a COPY of the $values array, but not to the $values array itself. 
$config->getValues()['test'] = 'test'; 
 
// getValues() again returns ANOTHER COPY of the $values array, and THIS copy doesn't 
// contain a 'test' element (which is why we get the "undefined index" message). 
echo $config->getValues()['test'];

다음은 원본 배열 대신 복사된 배열을 출력하는 가능한 솔루션입니다.

$vals = $config->getValues(); 
$vals['test'] = 'test'; 
echo $vals['test'];

원래 배열만 변경하려는 경우, 즉 배열 참조를 반환하려는 경우 어떻게 처리해야 합니까? 방법은 지정된 반환 참조를 표시하는 것입니다:

class Config 
{ 
  private $values = []; 
 
  // return a REFERENCE to the actual $values array 
  public function &getValues() { 
    return $this->values; 
  } 
} 
 
$config = new Config(); 
 
$config->getValues()['test'] = 'test'; 
echo $config->getValues()['test'];

수정 후 위 코드는 예상한 대로 테스트를 출력합니다.

여러분을 더욱 혼란스럽게 할 또 다른 예를 살펴보겠습니다.

class Config 
{ 
  private $values; 
 
  // using ArrayObject rather than array 
  public function __construct() { 
    $this->values = new ArrayObject(); 
  } 
 
  public function getValues() { 
    return $this->values; 
  } 
} 
 
$config = new Config(); 
 
$config->getValues()['test'] = 'test'; 
echo $config->getValues()['test'];

위와 같이 "정의되지 않은 인덱스" 오류가 출력될 것이라고 생각했다면 착각입니다. 코드는 정상적으로 "test"를 출력합니다. 그 이유는 PHP는 기본적으로 값이 아닌 참조로 객체를 반환하기 때문입니다.

요약하자면 함수를 사용하여 값을 반환할 때 그것이 값 반환인지 참조 반환인지 파악해야 합니다. PHP의 객체의 경우 기본값은 참조로 반환되는 것이며, 배열 및 내장 기본 유형은 기본적으로 값으로 반환됩니다. 이는 다른 언어와 구별되어야 합니다(많은 언어가 참조로 배열을 전달합니다).

Java 또는 C#과 같은 다른 언어와 마찬가지로 getter 또는 setter를 사용하여 클래스 속성에 액세스하거나 설정하는 것이 더 나은 솔루션입니다. 물론 PHP는 이를 기본적으로 지원하지 않으며 직접 구현해야 합니다.

class Config 
{ 
  private $values = []; 
 
  public function setValue($key, $value) { 
    $this->values[$key] = $value; 
  } 
 
  public function getValue($key) { 
    return $this->values[$key]; 
  } 
} 
 
$config = new Config(); 
 
$config->setValue('testKey', 'testValue'); 
echo $config->getValue('testKey');  // echos 'testValue'

위 코드는 호출자가 액세스할 수 있습니다. 또는 배열에 공개 액세스 권한을 부여하지 않고 배열에 값을 설정할 수 있습니다. 느낌이 어떤가요 :)

Error 4: Executing sql query in a loop

PHP 프로그래밍에서 다음과 유사한 코드를 찾는 것은 드문 일이 아닙니다.

$models = []; 
 
foreach ($inputValues as $inputValue) { 
  $models[] = $valueRepository->findByValue($inputValue); 
}

물론 위 코드에는 문제가 없습니다. . 문제는 $valueRepository->findByValue()가 반복 프로세스 중에 매번 SQL 쿼리를 실행할 수 있다는 것입니다.

$result = $connection->query("SELECT `x`,`y` FROM `values` WHERE `value`=" . $inputValue);

10,000번 반복되면 각각 10,000개의 SQL 쿼리를 실행한 것입니다. 이러한 스크립트가 다중 스레드 프로그램에서 호출되면 시스템이 중단될 가능성이 높습니다. . .

코드를 작성하는 과정에서 언제 SQL 쿼리를 실행할지 알아야 하며, 하나의 SQL 쿼리에서 모든 데이터를 검색해 보아야 합니다.

有一种业务场景,你很可能会犯上述错误。假设一个表单提交了一系列值(假设为IDs),然后为了取出所有ID对应的数据,代码将遍历IDs,分别对每个ID执行sql查询,代码如下所示:

$data = []; 
foreach ($ids as $id) { 
  $result = $connection->query("SELECT `x`, `y` FROM `values` WHERE `id` = " . $id); 
  $data[] = $result->fetch_row(); 
}

但同样的目的可以在一个sql中更加高效的完成,代码如下:

$data = []; 
if (count($ids)) { 
  $result = $connection->query("SELECT `x`, `y` FROM `values` WHERE `id` IN (" . implode(',', $ids)); 
  while ($row = $result->fetch_row()) { 
    $data[] = $row; 
  } 
}

错误5:内存使用低效和错觉

一次sql查询获取多条记录比每次查询获取一条记录效率肯定要高,但如果你使用的是php中的mysql扩展,那么一次获取多条记录就很可能会导致内存溢出。

我们可以写代码来实验下(测试环境: 512MB RAM、MySQL、php-cli):

// connect to mysql 
$connection = new mysqli('localhost', 'username', 'password', 'database'); 
 
// create table of 400 columns 
$query = 'CREATE TABLE `test`(`id` INT NOT NULL PRIMARY KEY AUTO_INCREMENT'; 
for ($col = 0; $col < 400; $col++) { 
  $query .= ", `col$col` CHAR(10) NOT NULL"; 
} 
$query .= &#39;);&#39;; 
$connection->query($query); 
 
// write 2 million rows 
for ($row = 0; $row < 2000000; $row++) { 
  $query = "INSERT INTO `test` VALUES ($row"; 
  for ($col = 0; $col < 400; $col++) { 
    $query .= &#39;, &#39; . mt_rand(1000000000, 9999999999); 
  } 
  $query .= &#39;)&#39;; 
  $connection->query($query); 
}

现在来看看资源消耗:

// connect to mysql 
$connection = new mysqli(&#39;localhost&#39;, &#39;username&#39;, &#39;password&#39;, &#39;database&#39;); 
echo "Before: " . memory_get_peak_usage() . "\n"; 
 
$res = $connection->query(&#39;SELECT `x`,`y` FROM `test` LIMIT 1&#39;); 
echo "Limit 1: " . memory_get_peak_usage() . "\n"; 
 
$res = $connection->query(&#39;SELECT `x`,`y` FROM `test` LIMIT 10000&#39;); 
echo "Limit 10000: " . memory_get_peak_usage() . "\n";

输出结果如下:

Before: 224704 
Limit 1: 224704 
Limit 10000: 224704

根据内存使用量来看,貌似一切正常。为了更加确定,试着一次获取100000条记录,结果程序得到如下输出:

PHP Warning: mysqli::query(): (HY000/2013): 
       Lost connection to MySQL server during query in /root/test.php on line 11

这是怎么回事呢?

问题出在php的mysql模块的工作方式,mysql模块实际上就是libmysqlclient的一个代理。在查询获取多条记录的同时,这些记录会直接 保存在内存中。由于这块内存不属于php的内存模块所管理,所以我们调用memory_get_peak_usage()函数所获得的值并非真实使用内存 值,于是便出现了上面的问题。

我们可以使用mysqlnd来代替mysql,mysqlnd编译为php自身扩展,其内存使用由php内存管理模块所控制。如果我们用mysqlnd来实现上面的代码,则会更加真实的反应内存使用情况:

Before: 232048 
Limit 1: 324952 
Limit 10000: 32572912

更加糟糕的是,根据php的官方文档,mysql扩展存储查询数据使用的内存是mysqlnd的两倍,因此原来的代码使用的内存是上面显示的两倍左右。

为了避免此类问题,可以考虑分几次完成查询,减小单次查询数据量:

$totalNumberToFetch = 10000; 
$portionSize = 100; 
 
for ($i = 0; $i <= ceil($totalNumberToFetch / $portionSize); $i++) { 
  $limitFrom = $portionSize * $i; 
  $res = $connection->query( 
             "SELECT `x`,`y` FROM `test` LIMIT $limitFrom, $portionSize"); 
}

联系上面提到的错误4可以看出,在实际的编码过程中,要做到一种平衡,才能既满足功能要求,又能保证性能。

错误6:忽略Unicode/UTF-8问题

php编程中,在处理非ascii字符时,会遇到一些问题,要很小心的去对待,要不然就会错误遍地。举个简单的例子,strlen(name),如果name包含非ascii字符,那结果就有些出乎意料。在此给出一些建议,尽量避免此类问题:

 ● 如果你对unicode和utf-8不是很了解,那么你至少应该了解一些基础。推荐阅读这篇文章。

 ● 最好使用mb_*函数来处理字符串,避免使用老的字符串处理函数。这里要确保PHP的“multibyte”扩展已开启。

 ● 数据库和表最好使用unicode编码。

 ● 知道jason_code()函数会转换非ascii字符,但serialize()函数不会。

 ● php代码源文件最好使用不含bom的utf-8格式。

错误7:假定$_POST总是包含POST数据

PHP中的$_POST并非总是包含表单POST提交过来的数据。假设我们通过 jQuery.ajax() 方法向服务器发送了POST请求:

// js 
$.ajax({ 
  url: &#39;http://my.site/some/path&#39;, 
  method: &#39;post&#39;, 
  data: JSON.stringify({a: &#39;a&#39;, b: &#39;b&#39;}), 
  contentType: &#39;application/json&#39;
});

注意代码中的 contentType: ‘application/json' ,我们是以json数据格式来发送的数据。在服务端,我们仅输出$_POST数组:

// php 
var_dump($_POST);

你会很惊奇的发现,结果是下面所示:

array(0) { }

为什么是这样的结果呢?我们的json数据 {a: ‘a', b: ‘b'} 哪去了呢?

答案就是PHP仅仅解析Content-Type为 application/x-www-form-urlencoded 或 multipart/form-data的Http请求。之所以这样是因为历史原因,PHP最初实现$_POST时,最流行的就是上面两种类型。因此虽说现在有些类型(比如application/json)很流行,但PHP中还是没有去实现自动处理。

因为POST是全局变量,所以更改_POST会全局有效。因此对于Content-Type为 application/json 的请求,我们需要手工去解析json数据,然后修改$_POST变量。

// php 
$_POST = json_decode(file_get_contents(&#39;php://input&#39;), true);

此时,我们再去输出$_POST变量,则会得到我们期望的输出:

array(2) { ["a"]=> string(1) "a" ["b"]=> string(1) "b" }

错误8:认为PHP支持字符数据类型

看看下面的代码,猜测下会输出什么:

for ($c = &#39;a&#39;; $c <= &#39;z&#39;; $c++) { 
  echo $c . "\n"; 
}

如果你的回答是输出'a'到'z',那么你会惊奇的发现你的回答是错误的。

不错,上面的代码的确会输出'a'到'z',但除此之外,还会输出'aa'到'yz'。我们来分析下为什么会是这样的结果。

在PHP中不存在char数据类型,只有string类型。明白这点,那么对'z'进行递增操作,结果则为'aa'。对于字符串比较大小,学过C的应该都知道,'aa'是小于'z'的。这也就解释了为何会有上面的输出结果。

如果我们想输出'a'到'z',下面的实现是一种不错的办法:

for ($i = ord(&#39;a&#39;); $i <= ord(&#39;z&#39;); $i++) { 
  echo chr($i) . "\n"; 
}

或者这样也是OK的:

$letters = range(&#39;a&#39;, &#39;z&#39;); 
 
for ($i = 0; $i < count($letters); $i++) { 
  echo $letters[$i] . "\n"; 
}

错误9:忽略编码标准

虽说忽略编码标准不会导致错误或是bug,但遵循一定的编码标准还是很重要的。

没有统一的编码标准会使你的项目出现很多问题。最明显的就是你的项目代码不具有一致性。更坏的地方在于,你的代码将更加难以调试、扩展和维护。这也就意味着你的团队效率会降低,包括做一些很多无意义的劳动。

对于PHP开发者来说,是比较幸运的。因为有PHP编码标准推荐(PSR),由下面5个部分组成:

 ● PSR-0:自动加载标准

 ● PSR-1:基本编码标准

 ● PSR-2:编码风格指南

 ● PSR-3:日志接口标准

 ● PSR-4:自动加载

PSR最初由PHP社区的几个大的团体所创建并遵循。Zend, Drupal, Symfony, Joomla及其它的平台都为此标准做过贡献并遵循这个标准。即使是PEAR,早些年也想让自己成为一个标准,但现在也加入了PSR阵营。

在某些情况下,使用什么编码标准是无关紧要的,只要你使用一种编码风格并一直坚持使用即可。但是遵循PSR标准不失为一个好办法,除非你有什么特殊的原因要 自己弄一套。现在越来越多的项目都开始使用PSR,大部分的PHP开发者也在使用PSR,因此使用PSR会让新加入你团队的成员更快的熟悉项目,写代码时 也会更加舒适。

错误10:错误使用empty()函数

一些PHP开发人员喜欢用empty()函数去对变量或表达式做布尔判断,但在某些情况下会让人很困惑。

首先我们来看看PHP中的数组Array和数组对象ArrayObject。看上去好像没什么区别,都是一样的。真的这样吗?

// PHP 5.0 or later: 
$array = []; 
var_dump(empty($array));    // outputs bool(true) 
$array = new ArrayObject(); 
var_dump(empty($array));    // outputs bool(false) 
// why don&#39;t these both produce the same output?

让事情变得更复杂些,看看下面的代码:

// Prior to PHP 5.0: 
$array = []; 
var_dump(empty($array));    // outputs bool(false) 
$array = new ArrayObject(); 
var_dump(empty($array));    // outputs bool(false)

很不幸的是,上面这种方法很受欢迎。例如,在Zend Framework 2中,Zend\Db\TableGateway 在 TableGateway::select() 结果集上调用 current() 方法返回数据集时就是这么干的。开发人员很容易就会踩到这个坑。

为了避免这些问题,检查一个数组是否为空最后的办法是用 count() 函数:

// Note that this work in ALL versions of PHP (both pre and post 5.0): 
$array = []; 
var_dump(count($array));    // outputs int(0) 
$array = new ArrayObject(); 
var_dump(count($array));    // outputs int(0)

在这顺便提一下,因为PHP中会将数值0认为是布尔值false,因此 count() 函数可以直接用在 if 条件语句的条件判断中来判断数组是否为空。另外,count() 函数对于数组来说复杂度为O(1),因此用 count() 函数是一个明智的选择。

再来看一个用 empty() 函数很危险的例子。当在魔术方法 __get() 中结合使用 empty() 函数时,也是很危险的。我们来定义两个类,每个类都有一个 test 属性。

首先我们定义 Regular 类,有一个 test 属性:

class Regular 
{ 
  public $test = &#39;value&#39;; 
}

然后我们定义 Magic 类,并用 __get() 魔术方法来访问它的 test 属性:

class Magic 
{ 
  private $values = [&#39;test&#39; => &#39;value&#39;]; 
 
  public function __get($key) 
  { 
    if (isset($this->values[$key])) { 
      return $this->values[$key]; 
    } 
  } 
}

好了。我们现在来看看访问各个类的 test 属性会发生什么:

$regular = new Regular(); 
var_dump($regular->test);  // outputs string(4) "value" 
$magic = new Magic(); 
var_dump($magic->test);   // outputs string(4) "value"

到目前为止,都还是正常的,没有让我们感到迷糊。

但在 test 属性上使用 empty() 函数会怎么样呢?

var_dump(empty($regular->test));  // outputs bool(false) 
var_dump(empty($magic->test));   // outputs bool(true)

结果是不是很意外?

很不幸的是,如果一个类使用魔法 __get() 函数来访问类属性的值,没有简单的方法来检查属性值是否为空或是不存在。在类作用域外,你只能检查是否返回 null 值,但这并不一定意味着没有设置相应的键,因为键值可以被设置为 null 。

相比之下,如果我们访问 Regular 类的一个不存在的属性,则会得到一个类似下面的Notice消息:

Notice: Undefined property: Regular::$nonExistantTest in /path/to/test.php on line 10 
 
Call Stack: 
  0.0012   234704  1. {main}() /path/to/test.php:0

因此,对于 empty() 函数,我们要小心的使用,要不然的话就会结果出乎意料,甚至潜在的误导你。

위 내용은 PHP에서 흔히 발생하는 오류는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.