search

Home  >  Q&A  >  body text

php程序员学c遇到的一些疑问

1.php有zend引擎去编译php,那c呢?是操作系统在编译他吗?
2.很多年以前就知道计算机只认识01代码,但今天脑袋瓜就想,计算机的那一部分只认识01,我理解的是cpu只认识01对吗?
3.c和操作系统的关系是什么?比如我在windows下用c编译的东西能在linux下用吗,我感觉是不行的,那是不是我同样的代码,要想在linux用的话,那就必须copy一份到linux下在编译。
4,我发现曾经用过很多东西,感觉真的是在用人家的东西,不管学js也好php也好,html,人家到底底层咋实层的,他和计算机整个的更深一层是怎么交互的,完全不知道啊。学起c来感觉自己更像一个菜鸟。

真是个菜鸟,问了很多小白的问题,但我真的是不知道。先谢谢segmentfault的朋友了。

PHP中文网PHP中文网2819 days ago766

reply all(10)I'll reply

  • ringa_lee

    ringa_lee2017-04-10 16:05:59

    你问了很多计算机体系结构的事情,其实学习c语言也不需要知道这么多,但是你是一个有好奇心的人,且逻辑思维也算清楚。
    01这东西不是软件关心的,是硬件关心,在数字逻辑中,我们称其为高低电平,电流经过一个元器件,如果电压为高电压记为0,低电压记为1。将一个逻辑经过运算之后,结合元器件的特性,我们就可以通过元器件的组合来将这个逻辑运算表达出来。刚开始肯定是简单的二极管之类的,发展到现在就是你看到的cpu了,里面的晶体管小到可以用纳米计算。计算机中的计算任务最终交给cpu,当然上层操作系统上的一个随随便便的命令,cpu是不认识的,你在操作系统中的一个命令要被拆分成若干指令,而每个指令去实现的时候又被分配到不同的电路单元中进行处理。这些指令的处理过程在电路中其实是一连串的01运算。这些指令(全部由二进制代码组成)就是传说中的机器码,由于机器码对于人来说阅读太困难,所以前辈们将其转成了汇编语言,汇编语言的开发速度和学习成本还是不理想,所以才有了高级语言的诞生。
    c语言其实最终还是要转化成机器码。比如说int a = 1;在编译是,要被先翻译成好几句汇编,然后这些汇编再转成机器码。所以,说白了编译就是将c变成汇编再变成机器码的过程,编译之后生成的可执行程序又可以愉快的向cpu发指令了。
    跟c语言不通,php是解析型语言,他不需要直接编译成可执行程序,他的代码使用zend引擎来做解析。zend引擎可以理解为一个可执行程序,当他通过词法、语法解析知道你要干什么后,就直接调用程序内置的一个函数交给你一个处理结果。
    至于你说的linux程序和windows程序不兼容的问题,是因为这操作系统生成可执行程序的二进制格式不一样,操作系统根本就彼此不识别。
    c语言的学习关键是理解语法,先学会使用,推荐看《c专家编程》、《c和指针》

    reply
    0
  • 天蓬老师

    天蓬老师2017-04-10 16:05:59

    1. gcc vc clang icc 都是c语言的编译器。

    2. 是的。cpu只认机器码,助记符是人类为了便于写汇编发明的抽象。

    3. 操作系统大部分是拿c写的。windows和linux虽然都跑x86的程序,但是由于可执行文件格式不同,不能直接兼容。现在好像有应用级虚拟机能实现这一点。

    4. js、php、py等脚本语言的解释器是用c实现的,c语言负责和系统打交道,脚本语言的库中有一部分调用系统api来和系统打交道。学c的时候再关心底层交互,学其他高级语言的时候主要应该关心业务逻辑。

    reply
    0
  • PHP中文网

    PHP中文网2017-04-10 16:05:59

    哥们应该不是科班出身吧,你这些疑问其实看看计算机原理一类的书,很快就会明白的。
    这里写一些简陋的介绍,计算机系统本身是个层层抽象的过程。

    1. 最底层当然是晶体管电路,通过电路抽象成各种数字逻辑,我们可以实现算术运算(比如加减),逻辑运算(转移复制)之类的操作。

    2. 然后是指令系统,指机器指令的集合(上一条对电路的抽象称为“微指令”),又是抽象,把逻辑电路的基本功能包装成加减乘除、浮点运算、字符串处理等等。所谓“机器语言”就是一串指令代码。

    3. 再然后汇编语言,因为 0101 对人实在没意义,于是起了个代号,就是汇编语言,比如用ADD(加)代表001,这样小小的抽象就有语义了。而运行汇编语言写出来的程序,就是再翻译成原来的二进制数机器语言。

    4. 最后就是高级语言,比如C,因为汇编语言的抽象程度太低,还是很麻烦,才出现高级语言。C语言更接近自然语言了。而 C 需要编译(这就是编译器的作用),在没有 OS(操作系统)时,同样也只是翻译成机器语言,而在有操作系统时,因为需要 OS 确定怎么使用这个程序,编译出的可执行文件就不光是机器指令了,还得有一定格式,加个文件头之类的,不同 OS 要求的格式不一样。

      这里就可以回答LZ一个问题,编译出来的可执行文件为什么不能跨平台(扯了半天才回答一个问题)

         第一 程序面向的硬件如cpu可能不一样,硬件不同当然指令就不同了,所需要的机器语言当然也不同
         第二 不同 OS 编译的可执行文件程序格式不一样,其他 OS 识别不了
         第二 不同 OS 的程序中往往会调用操作系统的api(如图形界面api),api都不一样当然不能跨平台
         

      写着写着都不想写了,非常简陋,很多重要的地方都略过去,大概看看吧,也算是自己对以前知识的一个回顾

    reply
    0
  • 黄舟

    黄舟2017-04-10 16:05:59

    php程序员这个得定义好.

    程序员: 计算机基础良好,对编译原理有了解,知道一门语言是如何编译成目标代码的.图形学,大致知道矩阵变化,向量,欧拉角,四元数的基础知识.

    php:你在程序员的基础之上对PHP这门语言比较感兴趣,能通过编译原理的基础了解这门语言的编译方式.知道 PHP为什么以fastcgi的方式运行能将你编写代码的生命周期缩短,让编程的业务逻辑降到最小.

    你觉得你是PHP程序员吗?

    reply
    0
  • 天蓬老师

    天蓬老师2017-04-10 16:05:59

    1、gcc编译器
    2、是,以前是用电子管,发展到现在的晶体管,超大规模电路集成,现在已经不止是数以千万计的了。
    3、是不行的,linux和windows内核是完全不同的,可以通过其它办法实现linux下运行。
    4、学习本来就是如此,你越追究越底层,就像你学其它比较高级的编程语言时,你会发现C更底层了,你发现能对指针操作,你学了C你会发现汇编更底层了,你会发现在死绕弯子,他更难用了。当然还有更底层的,我听我老师说他老师,学的是汇编,用的是打孔技术,我也没接触过,不过我知道是把汇编程序源代码写在专用的纸袋上,也没有调试这种说法,只有靠自己,可以用贴纸物品贴掉孔,但是这基本用于误打或者打错,程序错了基本上很难纠正,然后按照代码的每一行对应的机械码,好像是无孔为0,无孔为1。
    你想学到底层,那么你首先要站的是程序员的位置,从程序员的角度上学下去,你会发现你又接触了另一门学科。如果是想简单的去了解和涉及底层,玩玩嵌入式也是可以的。嵌入式也是现在流行的,智能家居正是产物。

    reply
    0
  • ringa_lee

    ringa_lee2017-04-10 16:05:59

    1.gcc,clang等编译器
    2.计算机任何硬件部分都只懂1和0
    3.c是一种编程语言,操作系统是用一种编程语言写出来的一组程序。包括不限于内存管理,任务调度,磁盘管理,系统调用等等。把硬件进行有效管理并抽象成一套统一的API供应用程序调用。各个系统之间的程序不通用,因为他们所应用的系统调用是不一样的。一个printf函数在不同平台的C库中实现肯定是不一样的。

    1. C库也打包隐藏了很多底层细节,编译器也帮助我们做了很多。比如main函数默认会与一些程序运行相关的函数,应用程序的ELF/PE格式封装等等。学了x86汇编表示其实底层下面还有更低层 XD

    reply
    0
  • 迷茫

    迷茫2017-04-10 16:05:59

    看《深入理解计算机系统》

    reply
    0
  • PHP中文网

    PHP中文网2017-04-10 16:05:59

    建议题主在网上下一本《C Primer Plus》,只看第一章概览就可以解答你现在大部分问题。

    reply
    0
  • ringa_lee

    ringa_lee2017-04-10 16:05:59

    不同操作系统的二进制可执行文件的格式是不一样的,比如Linux上是ELF,Windows上是PE。比如Linux上可以用readelf -a /bin/cat查看程序cat的ELF信息,比如可以看到该程序的入口点地址0x402602,以及程序依赖的共享库等信息。

    Linux执行程序,就是根据二进制可执行文件的ELF信息创建内存布局,比如 cat /proc/self/maps 查看cat加载表(内存布局):

    00400000-0040b000 r-xp 00000000 08:06 4198651   /bin/cat (text段)
    0060a000-0060b000 r--p 0000a000 08:06 4198651   /bin/cat (data段)
    0060b000-0060c000 rw-p 0000b000 08:06 4198651   /bin/cat (bss段)
    016be000-016df000 rw-p 00000000 00:00 0         [heap] (下面省略程序依赖的各个共享库地址)
    7fff31d00000-7fff31d21000 rw-p 00000000 00:00 0 [stack] (下面省略vdso和vsyscall)

    其中的text段(代码段)存放的就是ELF文件包含的程序执行代码,即CPU的机器指令。
    内存布局创建完成后,跳到程序的第一条机器指令,开始执行。

    同一段C代码,在同一个机器、同一个操作系统上使用不同的编译器(如GCC、Clang/LLVM)生成的二进制文件包含的机器指令,不一定完全相同,因为不同编译器可能有自己不同的优化实现,比如Intel的编译器ICC编译的程序对同为x86架构的AMD处理器支持就不好,应该是Intel使用了自己CPU独有的特性。

    在同一个机器,不同操作系统编译生成的二进制文件包含的机器指令,区别可能就更大了,虽然这些机器指令都能被当前机器(CPU)识别和执行。

    不同的CPU架构有不同的指令集,能识别的机器指令自然也是不同的,所以x86上的二进制程序,不能直接运行于ARM上,不过可以使用交叉编译器比如arm-none-linux-gnueabi或者Android NDK,在Linux x86上生成ARM的二进制文件(机器码)。

    拿PHP来说,我们编写的代码是交给Zend Engine来运行的,而不是直接交给CPU运行,所以只要保证Zend Engine跨平台,我们的PHP代码就能跨平台。PHP的opcode之于Zend Engine,类似于机器码之于CPU,我们可以使用PECL扩展vld查看PHP程序的操作码opcode。

    reply
    0
  • PHPz

    PHPz2017-04-10 16:05:59

    我不是科班的,但我有我的理解
    比如要建一个房子,我们用砖头,水泥,钢筋等,不同的房子用不同的材料,比如用木头也能盖一个房子。这就好比用高级语言写一个程序。可以用不同的语言来实现。但是砖头,水泥,钢筋等材料是别人造好的,如果所有都要我们自己造,那几乎不可能,底层就是如何制造这些基础的材料,对于建筑工人我们需要了解这些材料的特性,这样我们才能有机组合建造最理想的大楼,我们需要关注我们建造工艺本身,至于材料可以交给专门造这些的人去研究,这样大家才能各自发挥自己的力量,程序员也一样。

    reply
    0
  • Cancelreply