Home  >  Article  >  Backend Development  >  php程序员学c遇到的一些疑问

php程序员学c遇到的一些疑问

WBOY
WBOYOriginal
2016-06-06 20:27:501257browse

1.php有zend引擎去编译php,那c呢?是操作系统在编译他吗?
2.很多年以前就知道计算机只认识01代码,但今天脑袋瓜就想,计算机的那一部分只认识01,我理解的是cpu只认识01对吗?
3.c和操作系统的关系是什么?比如我在windows下用c编译的东西能在linux下用吗,我感觉是不行的,那是不是我同样的代码,要想在linux用的话,那就必须copy一份到linux下在编译。
4,我发现曾经用过很多东西,感觉真的是在用人家的东西,不管学js也好php也好,html,人家到底底层咋实层的,他和计算机整个的更深一层是怎么交互的,完全不知道啊。学起c来感觉自己更像一个菜鸟。

真是个菜鸟,问了很多小白的问题,但我真的是不知道。先谢谢segmentfault的朋友了。

回复内容:

1.php有zend引擎去编译php,那c呢?是操作系统在编译他吗?
2.很多年以前就知道计算机只认识01代码,但今天脑袋瓜就想,计算机的那一部分只认识01,我理解的是cpu只认识01对吗?
3.c和操作系统的关系是什么?比如我在windows下用c编译的东西能在linux下用吗,我感觉是不行的,那是不是我同样的代码,要想在linux用的话,那就必须copy一份到linux下在编译。
4,我发现曾经用过很多东西,感觉真的是在用人家的东西,不管学js也好php也好,html,人家到底底层咋实层的,他和计算机整个的更深一层是怎么交互的,完全不知道啊。学起c来感觉自己更像一个菜鸟。

真是个菜鸟,问了很多小白的问题,但我真的是不知道。先谢谢segmentfault的朋友了。

你问了很多计算机体系结构的事情,其实学习c语言也不需要知道这么多,但是你是一个有好奇心的人,且逻辑思维也算清楚。
01这东西不是软件关心的,是硬件关心,在数字逻辑中,我们称其为高低电平,电流经过一个元器件,如果电压为高电压记为0,低电压记为1。将一个逻辑经过运算之后,结合元器件的特性,我们就可以通过元器件的组合来将这个逻辑运算表达出来。刚开始肯定是简单的二极管之类的,发展到现在就是你看到的cpu了,里面的晶体管小到可以用纳米计算。计算机中的计算任务最终交给cpu,当然上层操作系统上的一个随随便便的命令,cpu是不认识的,你在操作系统中的一个命令要被拆分成若干指令,而每个指令去实现的时候又被分配到不同的电路单元中进行处理。这些指令的处理过程在电路中其实是一连串的01运算。这些指令(全部由二进制代码组成)就是传说中的机器码,由于机器码对于人来说阅读太困难,所以前辈们将其转成了汇编语言,汇编语言的开发速度和学习成本还是不理想,所以才有了高级语言的诞生。
c语言其实最终还是要转化成机器码。比如说int a = 1;在编译是,要被先翻译成好几句汇编,然后这些汇编再转成机器码。所以,说白了编译就是将c变成汇编再变成机器码的过程,编译之后生成的可执行程序又可以愉快的向cpu发指令了。
跟c语言不通,php是解析型语言,他不需要直接编译成可执行程序,他的代码使用zend引擎来做解析。zend引擎可以理解为一个可执行程序,当他通过词法、语法解析知道你要干什么后,就直接调用程序内置的一个函数交给你一个处理结果。
至于你说的linux程序和windows程序不兼容的问题,是因为这操作系统生成可执行程序的二进制格式不一样,操作系统根本就彼此不识别。
c语言的学习关键是理解语法,先学会使用,推荐看《c专家编程》、《c和指针》

  1. gcc vc clang icc 都是c语言的编译器。

  2. 是的。cpu只认机器码,助记符是人类为了便于写汇编发明的抽象。

  3. 操作系统大部分是拿c写的。windows和linux虽然都跑x86的程序,但是由于可执行文件格式不同,不能直接兼容。现在好像有应用级虚拟机能实现这一点。

  4. js、php、py等脚本语言的解释器是用c实现的,c语言负责和系统打交道,脚本语言的库中有一部分调用系统api来和系统打交道。学c的时候再关心底层交互,学其他高级语言的时候主要应该关心业务逻辑。

哥们应该不是科班出身吧,你这些疑问其实看看计算机原理一类的书,很快就会明白的。
这里写一些简陋的介绍,计算机系统本身是个层层抽象的过程。

  1. 最底层当然是晶体管电路,通过电路抽象成各种数字逻辑,我们可以实现算术运算(比如加减),逻辑运算(转移复制)之类的操作。

  2. 然后是指令系统,指机器指令的集合(上一条对电路的抽象称为“微指令”),又是抽象,把逻辑电路的基本功能包装成加减乘除、浮点运算、字符串处理等等。所谓“机器语言”就是一串指令代码。

  3. 再然后汇编语言,因为 0101 对人实在没意义,于是起了个代号,就是汇编语言,比如用ADD(加)代表001,这样小小的抽象就有语义了。而运行汇编语言写出来的程序,就是再翻译成原来的二进制数机器语言。

  4. 最后就是高级语言,比如C,因为汇编语言的抽象程度太低,还是很麻烦,才出现高级语言。C语言更接近自然语言了。而 C 需要编译(这就是编译器的作用),在没有 OS(操作系统)时,同样也只是翻译成机器语言,而在有操作系统时,因为需要 OS 确定怎么使用这个程序,编译出的可执行文件就不光是机器指令了,还得有一定格式,加个文件头之类的,不同 OS 要求的格式不一样。

    这里就可以回答LZ一个问题,编译出来的可执行文件为什么不能跨平台(扯了半天才回答一个问题)

    <code>   第一 程序面向的硬件如cpu可能不一样,硬件不同当然指令就不同了,所需要的机器语言当然也不同
       第二 不同 OS 编译的可执行文件程序格式不一样,其他 OS 识别不了
       第二 不同 OS 的程序中往往会调用操作系统的api(如图形界面api),api都不一样当然不能跨平台
       </code>

    写着写着都不想写了,非常简陋,很多重要的地方都略过去,大概看看吧,也算是自己对以前知识的一个回顾

php程序员这个得定义好.

程序员: 计算机基础良好,对编译原理有了解,知道一门语言是如何编译成目标代码的.图形学,大致知道矩阵变化,向量,欧拉角,四元数的基础知识.

php:你在程序员的基础之上对PHP这门语言比较感兴趣,能通过编译原理的基础了解这门语言的编译方式.知道 PHP为什么以fastcgi的方式运行能将你编写代码的生命周期缩短,让编程的业务逻辑降到最小.

你觉得你是PHP程序员吗?

1、gcc编译器
2、是,以前是用电子管,发展到现在的晶体管,超大规模电路集成,现在已经不止是数以千万计的了。
3、是不行的,linux和windows内核是完全不同的,可以通过其它办法实现linux下运行。
4、学习本来就是如此,你越追究越底层,就像你学其它比较高级的编程语言时,你会发现C更底层了,你发现能对指针操作,你学了C你会发现汇编更底层了,你会发现在死绕弯子,他更难用了。当然还有更底层的,我听我老师说他老师,学的是汇编,用的是打孔技术,我也没接触过,不过我知道是把汇编程序源代码写在专用的纸袋上,也没有调试这种说法,只有靠自己,可以用贴纸物品贴掉孔,但是这基本用于误打或者打错,程序错了基本上很难纠正,然后按照代码的每一行对应的机械码,好像是无孔为0,无孔为1。
你想学到底层,那么你首先要站的是程序员的位置,从程序员的角度上学下去,你会发现你又接触了另一门学科。如果是想简单的去了解和涉及底层,玩玩嵌入式也是可以的。嵌入式也是现在流行的,智能家居正是产物。

1.gcc,clang等编译器
2.计算机任何硬件部分都只懂1和0
3.c是一种编程语言,操作系统是用一种编程语言写出来的一组程序。包括不限于内存管理,任务调度,磁盘管理,系统调用等等。把硬件进行有效管理并抽象成一套统一的API供应用程序调用。各个系统之间的程序不通用,因为他们所应用的系统调用是不一样的。一个printf函数在不同平台的C库中实现肯定是不一样的。

  1. C库也打包隐藏了很多底层细节,编译器也帮助我们做了很多。比如main函数默认会与一些程序运行相关的函数,应用程序的ELF/PE格式封装等等。学了x86汇编表示其实底层下面还有更低层 XD

看《深入理解计算机系统》

建议题主在网上下一本《C Primer Plus》,只看第一章概览就可以解答你现在大部分问题。

不同操作系统的二进制可执行文件的格式是不一样的,比如Linux上是ELF,Windows上是PE。比如Linux上可以用readelf -a /bin/cat查看程序cat的ELF信息,比如可以看到该程序的入口点地址0x402602,以及程序依赖的共享库等信息。

Linux执行程序,就是根据二进制可执行文件的ELF信息创建内存布局,比如 cat /proc/self/maps 查看cat加载表(内存布局):

<code>00400000-0040b000 r-xp 00000000 08:06 4198651   /bin/cat (text段)
0060a000-0060b000 r--p 0000a000 08:06 4198651   /bin/cat (data段)
0060b000-0060c000 rw-p 0000b000 08:06 4198651   /bin/cat (bss段)
016be000-016df000 rw-p 00000000 00:00 0         [heap] (下面省略程序依赖的各个共享库地址)
7fff31d00000-7fff31d21000 rw-p 00000000 00:00 0 [stack] (下面省略vdso和vsyscall)</code>

其中的text段(代码段)存放的就是ELF文件包含的程序执行代码,即CPU的机器指令。
内存布局创建完成后,跳到程序的第一条机器指令,开始执行。

同一段C代码,在同一个机器、同一个操作系统上使用不同的编译器(如GCC、Clang/LLVM)生成的二进制文件包含的机器指令,不一定完全相同,因为不同编译器可能有自己不同的优化实现,比如Intel的编译器ICC编译的程序对同为x86架构的AMD处理器支持就不好,应该是Intel使用了自己CPU独有的特性。

在同一个机器,不同操作系统编译生成的二进制文件包含的机器指令,区别可能就更大了,虽然这些机器指令都能被当前机器(CPU)识别和执行。

不同的CPU架构有不同的指令集,能识别的机器指令自然也是不同的,所以x86上的二进制程序,不能直接运行于ARM上,不过可以使用交叉编译器比如arm-none-linux-gnueabi或者Android NDK,在Linux x86上生成ARM的二进制文件(机器码)。

拿PHP来说,我们编写的代码是交给Zend Engine来运行的,而不是直接交给CPU运行,所以只要保证Zend Engine跨平台,我们的PHP代码就能跨平台。PHP的opcode之于Zend Engine,类似于机器码之于CPU,我们可以使用PECL扩展vld查看PHP程序的操作码opcode。

我不是科班的,但我有我的理解
比如要建一个房子,我们用砖头,水泥,钢筋等,不同的房子用不同的材料,比如用木头也能盖一个房子。这就好比用高级语言写一个程序。可以用不同的语言来实现。但是砖头,水泥,钢筋等材料是别人造好的,如果所有都要我们自己造,那几乎不可能,底层就是如何制造这些基础的材料,对于建筑工人我们需要了解这些材料的特性,这样我们才能有机组合建造最理想的大楼,我们需要关注我们建造工艺本身,至于材料可以交给专门造这些的人去研究,这样大家才能各自发挥自己的力量,程序员也一样。

Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn