Home  >  Article  >  Backend Development  >  PHP的一些知识点研究(一)

PHP的一些知识点研究(一)

WBOY
WBOYOriginal
2016-06-23 13:41:521037browse

一、基于PHP实现的webshell攻击

在乌云上看到一个基于php的webshell攻击。

高度隐蔽的webshell,使用普通的php代码将真正的shell内容经过层层加密处理之后保存到图片当中,只留下一个url,并且url还是经过加密处理的,所以对外看没有任何特征可寻,使其很难被发现,当打开上述url时,,显示的是404,而这个404页面就是伪装为404的木马,只是把标题改为了404 Not Found。

二、不用或少用else语句

对于if else 有人追求结构的完整,有if必有else,这看起来或许是不错,不过有时会带来代码的繁琐,而且可能会导致逻辑的混乱;可以以一种结果为基准,当发生其他情况时做if判断;即默认A,有异常则为B;如下面右图所示:

 

三、单页面结构(Single-page application)

单页面就是一切操作和布局都是在一个页面下进行,不需要页面跳转,根据不同的用户请求加载不同的内容。

优点:页面结构简单,数据量小,节省带宽,响应快,体验好,易于开发、维护以及优化;

缺点:使用ajax技术,导致不利于seo。

四、让搜索引擎抓取ajax的内容

主要针对上一案例的单页面结构,程序通过#结构url控制页面内容,但不会被搜索引擎抓取。

方法一:twitter使用"井号+感叹号"的结构,但体验不好而且繁琐;

方法二:使用History API;在不刷新页面的情况下,改变浏览器地址栏显示的地址。步骤如下:

A、用History API替代井号结构,让每个#号都变成正常路径的URL,这样搜索引擎就会抓取每一个网页。

B、定义一个JavaScript函数,处理Ajax部分,根据网址抓取内容。

C、定义鼠标的click事件,使用History对象的popstate事件处理浏览器的"前进 / 后退"按钮。

D、设置服务器端。

五、CURL_MULTI_INIT()

以前一直使用curl_init(),最近看到有curl_multi_init();本以为会带来更高效的代码,看了下curl_multi的步骤,感觉相当繁琐,而且curl_multi可能会造成cpu过高、网页假死等现象;同时对比了curl_init和curl_multi_init,多线程在速度上不一定优于单线程,多线程只是能在同时处理多任务,时间成本不一定低。附上curl_multi的使用步骤:

第一步:调用curl_multi_init;

第二步:循环调用curl_multi_add_handle;

这一步需要注意的是,curl_multi_add_handle的第二个参数是由curl_init而来的子handle;

第三步:持续调用curl_multi_exec;

第四步:根据需要循环调用curl_multi_getcontent获取结果;

第五步:调用curl_multi_remove_handle,并为每个字handle调用curl_close;

第六步:调用curl_multi_close。

六、PHP strstr()函数

strstr(string,search)搜索一个字符串在另一个字符串中的第一次出现。返回字符串的其余部分(从匹配点)。如果未找到所搜索的字符串,则返回 false。


search 必需。规定所搜索的字符串。如果该参数是数字,则搜索匹配数字 ASCII 值的字符。

参考:http://www.w3cschool.cn/func_string_strstr.html。所以,在给第二个参数时,如果需要匹配数字,建议加上引号。

七、论规范化的重要性

家附近的一条久治不下的道路,通过划分出人行通道、非机动车道、机动车道,使得问题一下子等到了解决。有时候灵活导致选择过多,问题也会很多;程序亦如此,用户输入的灵活看起来很不错,其实在后台处理时是需要更多的成本,何不在前期就进行规范化,bug止于源头,而不是亡羊补牢。规范化使一切流程变得简单高效。

八、HHVM

HHVM (HipHop Virtual Machine)会将PHP代码转换成高级别的字节码(通常称为中间语言)。然后在运行时通过即时(JIT)编译器将这些字节码转换为x64的机器码。

从各项数据表明,和Zend相比,HHVM变得更高效,CPU负载降低,平均页面加载时间也缩短。HHVM的存在是为了优化PHP运行性能,和php5相比,确实存在一些优势,还是坐等php7吧。

九、PHP源码签名收集器

当学习新的、不熟悉的源码时,对代码结构获取直观的感受是很重要的。可以通过从每个源文件中逐行获取标点进行总结,即文件签名。这可以帮助考量代码的复杂度。其实也就是提取代码文件中固定的符号呈现文件的结构。

参考:http://c2.com/doc/SignatureSurvey/

十、协同过滤推荐算法

1、基于内容的推荐算法的前提假设是:如果用户喜欢物品a,那么用户也应该会喜欢与a类似的物品。基本思想是拆分内容属性,提取相同属性的内容进行推荐。

2、协同过滤推荐算法的前提假设是:如果用户a与用户b均对一系列相同的物品表示喜欢,那么a极有可能也喜欢b用户喜欢的其他物品。基本过程是用户首先为每个item进行评价打分,通过计算不同用户评分之间的相似程度,可以找到最近邻居,根据最近邻居的评价,产生推荐。

上述算法都是运用了矩阵建模,使用到余弦相似度、皮尔逊相似度等公式。使用中可将二者合二为一推荐。


Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn