PHP는 약한 유형의 언어입니다. 이러한 기능에는 필연적으로 원활하고 투명한 암시적 유형 변환이 필요합니다. PHP는 내부적으로 zval을 사용하여 모든 유형의 값을 저장합니다(예: 5.2).
struct _zval_struct { /* Variable information */ zvalue_value value; /* value */ zend_uint refcount; zend_uchar type; /* active type */ zend_uchar is_ref; };
typedef union _zvalue_value { long lval; /* long value */ double dval; /* double value */ struct { char *val; int len; } str; HashTable *ht; /* hash table value */ zend_object_value obj; } zvalue_value;
일부 PHP 코드를 "플랫폼 독립적"으로 만들기 때문에 이 점을 명심하세요. 달리 명시하지 않는 한 다음 논의에서는 long이 64비트라고 가정합니다.
여기서는 IEEE 754의 부동소수점 계산 방식을 인용하지 않겠습니다. 관심 있는 분들은 직접 확인해 보시면 됩니다. 핵심은 double의 가수가 숨겨진 1을 포함하여 52비트로 저장된다는 것입니다. 총 53비트입니다.
여기서 매우 흥미로운 질문이 발생합니다. 예를 들어 c 코드를 사용하겠습니다(long이 64비트라고 가정).
long a = x; assert(a == (long)(double)a);
이제 주제로 돌아가 보겠습니다. 스크립트를 실행하기 전에 PHP는 먼저 스크립트를 읽고 스크립트를 분석해야 합니다. 예를 들어 다음 스크립트의 경우 이 프로세스에는 스크립트의 리터럴화도 포함됩니다.
<?php $a = 9223372036854775807; //64位有符号数最大值 $b = 9223372036854775808; //最大值+1 var_dump($a); var_dump($b);출력:
int(9223372036854775807) float(9.22337203685E+18)즉, 어휘 분석 단계에서 PHP는 리터럴 값이 현재 시스템의 긴 테이블 값 범위를 초과하는지 여부를 판단하고, 그렇지 않은 경우 lval을 사용하여 이를 저장하고, 그렇지 않은 경우 zval을 사용합니다. dval을 사용하여 표현합니다(zval IS_FLOAT).
가장 큰 정수 값보다 큰 값을 사용하면 정확도가 떨어질 수 있으므로 주의해야 합니다.
<?php $a = 9223372036854775807; $b = 9223372036854775808; var_dump($a === ($b - 1));출력이 거짓입니다.
이제 시작 부분에 대한 논의를 계속하자면 앞서 언급한 것처럼 PHP의 정수는 32비트일 수도 있고 64비트일 수도 있으므로 64비트에서 정상적으로 실행될 수 있는 일부 코드는 보이지 않는 유형 변환 원인으로 인해 실패할 수도 있다고 판단됩니다. 정밀도 손실로 인해 32비트 시스템에서 코드가 제대로 실행되지 않습니다.
그래서 우리는 이 중요한 값에 주의해야 합니다. 다행히도 이 중요한 값은 PHP에 정의되어 있습니다.
<?php echo PHP_INT_MAX; ?>물론 안전을 위해 문자열을 사용하여 큰 정수를 저장하고 bcmath와 같은 수학 함수 라이브러리를 사용하여 계산을 수행해야 합니다.
또한 우리를 혼란스럽게 할 또 다른 주요 구성이 있습니다. 이 구성은 PHP가 부동 소수점 값을 출력할 때 출력하는 유효 자릿수를 결정합니다.
마지막으로 위에서 제기한 질문, 즉 float로 변환했다가 다시 long으로 변환한 후 정밀도가 손실되지 않도록 하기 위한 long 정수의 최대값은 무엇인지 다시 살펴보겠습니다.
예를 들어 정수의 경우 이진 표현이 101이라는 것을 알고 있습니다. 이제 두 비트를 오른쪽으로 이동하여 1.01이 되도록 하고 상위 비트의 암시적 유효 비트 1을 버리고 다음과 같은 이진 표현을 얻습니다. 5가 double로 저장됩니다. 값은 다음과 같습니다.
0/*부호 비트*/ 10000000001/*지수 비트*/ 01000000000000000000000000000000000000000000000000
5의 이진 표현은 손실 없이 가수 부분에 저장됩니다. 이 경우 double back에서 long으로 변환할 때 정밀도 손실이 없습니다.2^53 - 1 == 9007199254740991; // 명심하세요. 이제 길이는 64비트라고 가정합니다.
그러면 이 정수는 long->double->long 값 변환이 발생할 때 정밀도를 잃지 않습니다.부동 소수점 숫자와 관련하여 또 다른 점이 있는데, 이는 다음과 같은 일반적인 질문에 대한 답변입니다.
왜 출력이 57인가요? PHP 버그인가요?
bugs.php.net에 자주 질문하는 것은 물론, 비슷한 질문을 하는 분들이 많아서 많은 학생들이 이런 질문을 했을 거라 믿습니다...
이 이유를 이해하려면 먼저 부동 소수점 숫자(IEEE 754)의 표현을 알아야 합니다.
예를 들어 64비트 길이(이중 정밀도)를 사용하는 부동 소수점 숫자는 1개의 부호 비트(E), 11개의 지수 비트(Q) 및 52비트 가수(M)로 표시됩니다(총 64비트).
부호 비트: 가장 높은 비트는 데이터의 부호를 나타내며, 0은 양수, 1은 음수를 나타냅니다.
지수 비트 : 2진수로 거듭제곱한 데이터를 나타내며, 지수는 오프셋 코드로 표현됩니다.
가수 : 데이터의 소수점 이하 유효숫자를 나타냅니다.
여기서 핵심은 십진수를 이진수로 표현하는 것입니다. 십진수를 이진수로 표현하는 방법은 Baidu에서 검색할 수 있습니다. 여기서는 이진수에 대해 자세히 설명하지 않겠습니다. 표현, 0.58은 무한합니다. 긴 값(아래 숫자는 암시적 1을 생략함)..
0.58의 이진 표현은 기본적으로(52비트)입니다: 0010100011110101110000101000111101011100001010001111
0.57의 이진 표현은 기본적으로(52비트)입니다: 0010001111010111000010100011110101110000101000111101
이 52비트를 통해서만 계산할 경우 둘의 이진수는 다음과 같습니다.
0.58 -> 0.579999999999999996
0.57 -> 0.56999999999999995
0.58*100의 구체적인 부동소수점 곱셈은 자세히 다루지 않겠습니다. 관심있는 분들은 보시면 됩니다(부동소수점). 암산을 통해 막연하게 살펴보겠습니다... 0.58 * 100 = 57.999999999
그럼 인테이크하면 자연스럽게 57이 되겠죠…
이 문제의 핵심은 "유한해 보이는 소수는 컴퓨터의 이진 표현에서 실제로는 무한하다"는 점임을 알 수 있습니다.
이것이 PHP 버그라고 생각하지 마세요. 이것이 바로...