0x00 简介
这篇文章主要分析 php 使用 GD 库的 imagecreatefrompng() 函数重建 png 图片可能导致的本地文件包含漏洞。
当系统存在文件包含的点,能包含图片文件; 另外系统存在图片上传,上传的图片使用 imagecreatefrompng() 函数重建图片并保存在本地,则很可能出现文件包含的漏洞。
通常,系统在实现图片上传功能时,为了防范用户上传含有恶意 php 代码的图片,可采用 gd 库重建图片,gd 库重建图片的一系列函数 imagecreatefrom*,会检查图片规范,验证图片合法性,以此抵御图片中含有恶意 php 代码的攻击。
那么, imagecreatefrom* 系列函数是否能完全抵御图片中插入 php 代码的攻击呢,本文以 imagecreatefrompng() 函数作为研究对象,探讨实现重建 png 格式的图片中包含恶意 php 代码的可能性,以及所需要满足的条件。
png 文件格式, imagecreatefrompng 函数解析, 修改图片, 上传, 文件包含 ...
0x01 png 图片格式
要实现重建的 png 图片中仍包含有恶意的 php 代码, 首先要对 png 图片格式有基本的了解。png 支持三种图像类型:索引彩色图像(index-color images),灰度图像(grayscale images),真彩色图像(true-color images), 其中索引彩色图像也称为基于调色板图像(Palette-based images)。
标准的 png 文件结构由一个 png 标识头连接多个 png 数据块组成,如: png signature | png chunk | png chunk | ... | png chunk .
png 标识
png 标识作为 png 图片的头部,为固定的 8 字节,如下
89 50 4E 47 OD 0A 1A 0A
png 数据块
png 定义了两种类型的数据块,一种是称为关键数据块(critical chunk),标准的数据块; 另一种叫做辅助数据块(ancillary chunks),可选的数据块。关键数据块定义了3个标准数据块,每个 png 文件都必须包含它们。3个标准数据块为: IHDR, IDAT, IEND .
这里介绍4个数据块: IHDR, PLTE, IDAT, IEND
png 数据块结构
png 文件中,每个数据块由4个部分组成 length | type(name) | data | CRC , 说明如下
length: 4 bytes, just length of the data, not include type and CRC type: 4 bytes, ASCII letters([A-Z,a-z])CRC: 4bytes
CRC(cyclic redundancy check)域中的值是对Chunk Type Code域和Chunk Data域中的数据进行计算得到的。CRC具体算法定义在ISO 3309和ITU-T V.42中,其值按下面的CRC码生成多项式进行计算: x 32 +x 26 +x 23 +x 22 +x 16 +x 12 +x 11 +x 10 +x 8 +x 7 +x 5 +x 4 +x 2 +x+1
- IHDR
文件头数据块IHDR(header chunk):它包含有PNG文件中存储的图像数据的基本信息,并要作为第一个数据块出现在PNG数据流中,而且一个PNG数据流中只能有一个文件头数据块。
文件头数据块由13字节组成,它的如下所示
域的名称 | 字节数 | 说明 |
---|---|---|
Width | 4 bytes | 图像宽度,以像素为单位 |
Height | 4 bytes | 图像高度,以像素为单位 |
Bit depth | 1 byte | 图像深度.索引彩色图像: 1,2,4或8灰度图像: 1,2,4,8或16真彩色图像: 8或16 |
ColorType | 1 byte | 颜色类型.0:灰度图像, 1,2,4,8或162:真彩色图像,8或163:索引彩色图像,1,2,4或84:带α通道数据的灰度图像,8或166:带α通道数据的真彩色图像,8或16 |
Compression method | 1 byte | 压缩方法(LZ77派生算法) |
Filter method | 1 byte | 滤波器方法 |
Interlace method | 1 byte | 隔行扫描方法.0:非隔行扫描1: Adam7(由Adam M. Costello开发的7遍隔行扫描方法) |
- PLTE
调色板数据块PLTE(palette chunk)包含有与索引彩色图像(indexed-color image)相关的彩色变换数据,它仅与索引彩色图像有关,而且要放在图像数据块(image data chunk)之前。
PLTE数据块是定义图像的调色板信息,PLTE可以包含1~256个调色板信息,每一个调色板信息由3个字节组成:
颜色 | 字节 | 意义 |
---|---|---|
Red | 1 byte | 0 = 黑色, 255 = 红 |
Green | 1 byte | 0 = 黑色, 255 = 绿色 |
Blue | 1 byte | 0 = 黑色, 255 = 蓝色 |
因此,调色板的长度应该是3的倍数,否则,这将是一个非法的调色板。 颜色数 = length/3
对于索引图像,调色板信息是必须的,调色板的颜色索引从0开始编号,然后是1、2……,调色板的颜色数不能超过色深中规定的颜色数(如图像色深为4的时候,调色板中的颜色数不可以超过2^4=16),否则,这将导致PNG图像不合法。
- IDAT
图像数据块IDAT(image data chunk):它存储实际的数据,在数据流中可包含多个连续顺序的图像数据块。IDAT存放着图像真正的数据信息
- IEND
图像结束数据IEND(image trailer chunk):它用来标记PNG文件或者数据流已经结束,并且必须要放在文件的尾部。
正常情况下, png 文件的结尾为如下12个字符:
00 00 00 00 49 45 4E 44 AE 42 60 82
由于数据块结构的定义,IEND数据块的长度总是0(00 00 00 00,除非人为加入信息),数据标识总是IEND(49 45 4E 44),因此,CRC码也总是AE 42 60 82
0x02 php imagecreatefrompng() 函数
有了对 png 图片格式的基本了解,可以帮助我们更好的理解 imagecreatefrompng() 函数的底层实现。分析 php 源码(php 5.6.20)可知, php imagecreatefrompng() 函数实现重建图片,核心是 gd 库的 gdImageCreateFromPngCtx() 函数。
分析 gd 库中的 gdImageCreateFromPngCtx() 函数可知,函数首先会检测 png signature, 不合法则返回NULL。然后会读原始的 png 图片文件给 png_ptr, 再从 png_ptr 中读图片信息到 info_ptr,再之后就是获取 IHDR 信息,读 IDAT 数据等,这里不一一讨论。这里仅讨论 png_read_info() 函数中对读 PLTE 数据库的验证处理。
#!cgd_png.c/gdImageCreateFromPngCtx{...if (png_sig_cmp(sig, 0, 8) != 0) { /* bad signature */ return NULL; /* bad signature */} ... png_set_read_fn (png_ptr, (void *) infile, gdPngReadData);png_read_info (png_ptr, info_ptr); /* read all PNG info up to image data */...}
要了解 png_read_info() 的内部实现,可以通过读 libpng 的源码(libpng 1.6.21)进行了解。当图片类型是索引图像时,png_read_info() 读到 PLTE chunk 时会调用 png_handle_PLTE 函数进行 CRC 校验
#!cpngread.c/png_read_info{...else if (chunk_name == png_PLTE) png_handle_PLTE(png_ptr, info_ptr, length);...} pngrutil.c/png_handle_PLTE {...#ifndef PNG_READ_OPT_PLTE_SUPPORTED if (png_ptr->color_type == PNG_COLOR_TYPE_PALETTE)#endif { png_crc_finish(png_ptr, (int) length - num * 3); }...}
分析底层源码可知, png signature 是不可能插入 php 代码的; IHDR 存储的是 png 的图片信息,有固定的长度和格式,程序会提取图片信息数据进行验证,很难插入 php 代码;而 PLTE 主要进行了 CRC 校验和颜色数合法性校验等简单的校验,那么很可能在 data 域插入 php 代码。
从对 PLTE chunk 验证的分析可知, 当原始图片格式给索引图片时,PLTE 数据块在满足 png 格式规范的情况下,程序还会进行 CRC 校验。因此,要将 PHP 代码写入 PLTE 数据块,不仅要修改 data 域的内容为php代码,然后修改 CRC 为正确的 CRC 校验值,当要填充的代码过长时,可以改变 length 域的数值,满足 length 为3的倍数, 且颜色数不超过色深中规定的颜色数。例如: IHDR 数据块中 Bit depth 为 08, 则最大的颜色数为 2^8=256, 那么 PLTE 数据块 data 的长度不超过 3*256=0x300。 这个长度对写入 php 一句话木马或者创建后门文件足够了。
那么是不是所有 png 图片都可以在 PLTE 数据块插入 php 代码呢?下面通过实验予以说明。
0x03 实验验证
png 支持索引彩色图像(index-color images),灰度图像(grayscale images),真彩色图像(true-color images)三种类型的图片,而 PLTE 数据块是索引图像所必须的,因此索引图像极有可能在 PLTE 数据块插入 php 代码。
下面摘录 gd 库中 gdImageCreateFromPng() 函数的一段说明
If the PNG image being loaded is a truecolor image, the resultinggdImagePtr will refer to a truecolor image. If the PNG image beingloaded is a palette or grayscale image, the resulting gdImagePtrwill refer to a palette image.
函数将索引彩色图像和灰度图像转换为索引彩色图像, 将真彩色图像转换为真彩色图像。下面分别转换这三种类型的图片,测试图片地址: 图片 . php代码如下
#!php<?php$pngfile = 'test.png';$newpngfile = 'new.png';$im = imagecreatefrompng($pngfile);imagepng($im,$newpngfile);?>
- 索引图像
读 IHDR 数据块信息,色深为8bits, color type=0x03, 为索引图像类型,改变其 PLTE 数据块如下,修改数据为
计算 CRC 过程如下
imagecreatefrompng() 重建的图片如下
可以看出重建的图片中 PLTE 数据块保留了 php 代码,重建也增加了 pHYs 数据块,对我们所关心的结果并没有影响。说明插入 php 代码成功。
- 灰度图像
原始图像, 不含 PLTE 数据块, 如下所示
插入 PLTE 数据块,并写入 php 代码
重建后的图片如下
可以看出重建的图片转换为 索引图像类型,并且重写了 PLTE 数据块,写入 php 代码失败
- 真彩色图像
原始图像, 不含 PLTE 数据块, 如下所示
插入 PLTE 数据块,并写入 php 代码
重建后的图片如下
可以看出真彩色类型图片重建后的图片不含 PLTE 数据块,写入 php 代码失败
0x04 总结
通过以上分析和实验可知, imagecreatefrompng() 函数并不能完全防止图片中插入 php 代码, 当图片类型为索引图像时, 在 PLTE chunk 可以成功插入 php 代码, 而另外其他类型的图片并不能实现 PLTE chunk 中插入 php 代码。最后, 一并感谢下面参考资料对我研究的帮助。
附,修改索引图像插入 php 代码的地址 github
所附代码实现了当 payload 长度大于 PLTE 数据长度时, 会重写 PLTE 数据块。然而 在实验过程中发现,imagecreatepng()函数重建的图片 PLTE 数据块的长度仍为原始的长度,即并不能随意扩充 PLTE 数据块的长度,具体原因还需深入分析源码, 也就是说要加载的 payload 不能超过 PLTE 数据块所给的长度。
通常情况下, PLTE 数据块所给的长度可以满足我们插入基本的 php 后门代码,存在了那么一个点,是不是可以撬动地球了呢
当然本文还有许多不足之处,望大家批评指正
0x05 资料参考
1. github libgd
2. gd2.0.33 manual
3. libgd home
4. png book
5. png chunk
6. png 文件格式解析

PHP在现代编程中仍然是一个强大且广泛使用的工具,尤其在web开发领域。1)PHP易用且与数据库集成无缝,是许多开发者的首选。2)它支持动态内容生成和面向对象编程,适合快速创建和维护网站。3)PHP的性能可以通过缓存和优化数据库查询来提升,其广泛的社区和丰富生态系统使其在当今技术栈中仍具重要地位。

在PHP中,弱引用是通过WeakReference类实现的,不会阻止垃圾回收器回收对象。弱引用适用于缓存系统和事件监听器等场景,需注意其不能保证对象存活,且垃圾回收可能延迟。

\_\_invoke方法允许对象像函数一样被调用。1.定义\_\_invoke方法使对象可被调用。2.使用$obj(...)语法时,PHP会执行\_\_invoke方法。3.适用于日志记录和计算器等场景,提高代码灵活性和可读性。

Fibers在PHP8.1中引入,提升了并发处理能力。1)Fibers是一种轻量级的并发模型,类似于协程。2)它们允许开发者手动控制任务的执行流,适合处理I/O密集型任务。3)使用Fibers可以编写更高效、响应性更强的代码。

PHP社区提供了丰富的资源和支持,帮助开发者成长。1)资源包括官方文档、教程、博客和开源项目如Laravel和Symfony。2)支持可以通过StackOverflow、Reddit和Slack频道获得。3)开发动态可以通过关注RFC了解。4)融入社区可以通过积极参与、贡献代码和学习分享来实现。

PHP和Python各有优势,选择应基于项目需求。1.PHP适合web开发,语法简单,执行效率高。2.Python适用于数据科学和机器学习,语法简洁,库丰富。

PHP不是在消亡,而是在不断适应和进化。1)PHP从1994年起经历多次版本迭代,适应新技术趋势。2)目前广泛应用于电子商务、内容管理系统等领域。3)PHP8引入JIT编译器等功能,提升性能和现代化。4)使用OPcache和遵循PSR-12标准可优化性能和代码质量。

PHP的未来将通过适应新技术趋势和引入创新特性来实现:1)适应云计算、容器化和微服务架构,支持Docker和Kubernetes;2)引入JIT编译器和枚举类型,提升性能和数据处理效率;3)持续优化性能和推广最佳实践。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

SublimeText3 Linux新版
SublimeText3 Linux最新版

mPDF
mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

Atom编辑器mac版下载
最流行的的开源编辑器

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

VSCode Windows 64位 下载
微软推出的免费、功能强大的一款IDE编辑器