>백엔드 개발 >PHP 튜토리얼 >PHP 부동 소수점 숫자의 일반적인 문제_php 팁

PHP 부동 소수점 숫자의 일반적인 문제_php 팁

WBOY
WBOY원래의
2016-05-16 19:57:221033검색

PHP는 약한 유형의 언어입니다. 이러한 기능에는 필연적으로 원활하고 투명한 암시적 유형 변환이 필요합니다. PHP는 내부적으로 zval을 사용하여 모든 유형의 값을 저장합니다(예: 5.2).

struct _zval_struct {
 /* Variable information */
 zvalue_value value;  /* value */
 zend_uint refcount;
 zend_uchar type; /* active type */
 zend_uchar is_ref;
};
위 구조에서 값 자체는 실제로 zvalue_value 공용체에 저장됩니다.

typedef union _zvalue_value {
 long lval;     /* long value */
 double dval;    /* double value */
 struct {
  char *val;
  int len;
 } str;
 HashTable *ht;    /* hash table value */
 zend_object_value obj;
} zvalue_value;
오늘 주제에서는 lval과 dval이라는 두 가지에만 집중합니다. 긴 lval의 길이는 컴파일러와 OS 단어 길이에 따라 32비트일 수도 있고 64비트일 수도 있다는 점을 알아야 합니다. 배정밀도)는 IEEE 754에 의해 지정되고 고정 길이이며 64비트여야 합니다.

일부 PHP 코드를 "플랫폼 독립적"으로 만들기 때문에 이 점을 명심하세요. 달리 명시하지 않는 한 다음 논의에서는 long이 64비트라고 가정합니다.

여기서는 IEEE 754의 부동소수점 계산 방식을 인용하지 않겠습니다. 관심 있는 분들은 직접 확인해 보시면 됩니다. 핵심은 double의 가수가 숨겨진 1을 포함하여 52비트로 저장된다는 것입니다. 총 53비트입니다.

여기서 매우 흥미로운 질문이 발생합니다. 예를 들어 c 코드를 사용하겠습니다(long이 64비트라고 가정).

 long a = x;
 assert(a == (long)(double)a);
실례합니다. a의 값이 어느 범위 내에 있을 때 위의 코드가 성공했다고 주장할 수 있나요? (답은 글 끝에 남겨주세요)

이제 주제로 돌아가 보겠습니다. 스크립트를 실행하기 전에 PHP는 먼저 스크립트를 읽고 스크립트를 분석해야 합니다. 예를 들어 다음 스크립트의 경우 이 프로세스에는 스크립트의 리터럴화도 포함됩니다.

<&#63;php
$a = 9223372036854775807; //64位有符号数最大值
$b = 9223372036854775808; //最大值+1
var_dump($a);
var_dump($b);
출력:

int(9223372036854775807)
float(9.22337203685E+18)
즉, 어휘 분석 단계에서 PHP는 리터럴 값이 현재 시스템의 긴 테이블 값 범위를 초과하는지 여부를 판단하고, 그렇지 않은 경우 lval을 사용하여 이를 저장하고, 그렇지 않은 경우 zval을 사용합니다. dval을 사용하여 표현합니다(zval IS_FLOAT).

가장 큰 정수 값보다 큰 값을 사용하면 정확도가 떨어질 수 있으므로 주의해야 합니다.

<&#63;php
$a = 9223372036854775807;
$b = 9223372036854775808;
 
var_dump($a === ($b - 1));
출력이 거짓입니다.

이제 시작 부분에 대한 논의를 계속하자면 앞서 언급한 것처럼 PHP의 정수는 32비트일 수도 있고 64비트일 수도 있으므로 64비트에서 정상적으로 실행될 수 있는 일부 코드는 보이지 않는 유형 변환 원인으로 인해 실패할 수도 있다고 판단됩니다. 정밀도 손실로 인해 32비트 시스템에서 코드가 제대로 실행되지 않습니다.

그래서 우리는 이 중요한 값에 주의해야 합니다. 다행히도 이 중요한 값은 PHP에 정의되어 있습니다.

<&#63;php
 echo PHP_INT_MAX;
 &#63;>
물론 안전을 위해 문자열을 사용하여 큰 정수를 저장하고 bcmath와 같은 수학 함수 라이브러리를 사용하여 계산을 수행해야 합니다.

또한 우리를 혼란스럽게 할 또 다른 주요 구성이 있습니다. 이 구성은 PHP가 부동 소수점 값을 출력할 때 출력하는 유효 자릿수를 결정합니다.

마지막으로 위에서 제기한 질문, 즉 float로 변환했다가 다시 long으로 변환한 후 정밀도가 손실되지 않도록 하기 위한 long 정수의 최대값은 무엇인지 다시 살펴보겠습니다.

예를 들어 정수의 경우 이진 표현이 101이라는 것을 알고 있습니다. 이제 두 비트를 오른쪽으로 이동하여 1.01이 되도록 하고 상위 비트의 암시적 유효 비트 1을 버리고 다음과 같은 이진 표현을 얻습니다. 5가 double로 저장됩니다. 값은 다음과 같습니다.

0/*부호 비트*/ 10000000001/*지수 비트*/ 01000000000000000000000000000000000000000000000000

5의 이진 표현은 손실 없이 가수 부분에 저장됩니다. 이 경우 double back에서 long으로 변환할 때 정밀도 손실이 없습니다.

2^53 - 1 == 9007199254740991; // 명심하세요. 이제 길이는 64비트라고 가정합니다.

그러면 이 정수는 long->double->long 값 변환이 발생할 때 정밀도를 잃지 않습니다.

부동 소수점 숫자와 관련하여 또 다른 점이 있는데, 이는 다음과 같은 일반적인 질문에 대한 답변입니다.


왜 출력이 57인가요? PHP 버그인가요?

bugs.php.net에 자주 질문하는 것은 물론, 비슷한 질문을 하는 분들이 많아서 많은 학생들이 이런 질문을 했을 거라 믿습니다...

이 이유를 이해하려면 먼저 부동 소수점 숫자(IEEE 754)의 표현을 알아야 합니다.

예를 들어 64비트 길이(이중 정밀도)를 사용하는 부동 소수점 숫자는 1개의 부호 비트(E), 11개의 지수 비트(Q) 및 52비트 가수(M)로 표시됩니다(총 64비트).

부호 비트: 가장 높은 비트는 데이터의 부호를 나타내며, 0은 양수, 1은 음수를 나타냅니다.

지수 비트 : 2진수로 거듭제곱한 데이터를 나타내며, 지수는 오프셋 코드로 표현됩니다.

가수 : 데이터의 소수점 이하 유효숫자를 나타냅니다.

여기서 핵심은 십진수를 이진수로 표현하는 것입니다. 십진수를 이진수로 표현하는 방법은 Baidu에서 검색할 수 있습니다. 여기서는 이진수에 대해 자세히 설명하지 않겠습니다. 표현, 0.58은 무한합니다. 긴 값(아래 숫자는 암시적 1을 생략함)..

0.58의 이진 표현은 기본적으로(52비트)입니다: 0010100011110101110000101000111101011100001010001111
0.57의 이진 표현은 기본적으로(52비트)입니다: 0010001111010111000010100011110101110000101000111101

이 52비트를 통해서만 계산할 경우 둘의 이진수는 다음과 같습니다.

0.58 -> 0.579999999999999996
0.57 -> 0.56999999999999995

0.58*100의 구체적인 부동소수점 곱셈은 자세히 다루지 않겠습니다. 관심있는 분들은 보시면 됩니다(부동소수점). 암산을 통해 막연하게 살펴보겠습니다... 0.58 * 100 = 57.999999999

그럼 인테이크하면 자연스럽게 57이 되겠죠…

이 문제의 핵심은 "유한해 보이는 소수는 컴퓨터의 이진 표현에서 실제로는 무한하다"는 점임을 알 수 있습니다.

이것이 PHP 버그라고 생각하지 마세요. 이것이 바로...

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.