搜索
首页后端开发php教程基于PHP与XML的PDF文档生成技术(摘要)_PHP

PDF

P>全文见:http://www22.brinkster.com/cymanhome/show.asp?id=85

摘要

本论文简要介绍了PHP、XML、PDF等技术的原理以及它们的应用情况。力图运用PHP面向对象的特性,构建出一套基于PHP和XML的在线PDF文档生成系统。文中详细探讨了整个系统的组成部分以及各自的实现过程。并在最后给出一个运用这套系统实现的动态创建报表的实例。

Abstract
This article introduced the fundamentls of PHP,XML and PDF and their application situation at present,expecting to build a PHP&XML-based dynamic PDF documents creating system through the PHP’s OO features. Furthermore,we discussed in detail on the components of the whole system and their respective realizing methods. Finally,we represented an example of creating reports dynamically using this system.

 

关键词

PHP      XML       XSLT       DTD      PDF   

 

 

1.       引言

 

        在信息技术飞速发展的时代,无论政府、企业还是个人,他们对如何通过信息技术提高自身工作效率,节省开支具有浓厚的兴趣。他们急切要找到一种优秀的技术,可以把传统上以纸张为媒介的文件、报表、票单据、手册、申请书等等等等转化为一种可以非常方便的在互联网以及内部网络自动生成、传播、下载、浏览、打印的电子文档。而如今最为热门的“无纸化办公”、“电子商务”等等都将以此为基础。

 

        这种文档格式就Adobe公司的PDF(可移植文档格式),它已是全世界电子版文档分发的公开实用标准 。   任何浏览器只要安装Acrobat reader 5.0 的插件,便可以自由浏览、下载、打印PDF文档。PDF无疑具有其它电子文档格式不可比拟的优越性。

      

我们知道B/S系统作为当前以及将来最流行的一种软件架构,可以很好的实现各种基于浏览器的Web应用程序,而PHP作为一种优秀的Web编程语言,特别适合开发用于处理用户表单输入,查询数据库等针对浏览器用户的前端应用程序。由于PHP是开放源码的,这使得它的使用比其它同类的Web脚本语言更为广泛,它的功能也在不断的扩充和完善之中。现在最新的PHP版本已经可以很好的支持PDF,XML等。通过系统提供的API,我们能非常快捷的生成PDF文档,而最具魅力的是,我们可以通过PHP,查询数据库或XML数据文件并将结果插入所生成的PDF文档之中,形成各种具有绝佳的浏览和打印效果的报表、单据、手册等。

        

不难看出,结合PHP、XML、PDF三项技术,构造出一种可以在线动态生成PDF文档的系统是极具现实意义的,其主要表现在:

 

    ·文档可以在网络上生成,并通过网络分发。节省大量的人力物力。具有精确美观的打印效果,真正实现了无纸化办公。

    ·电子商务交易过程中的各种票据、 凭证都可以通过PHP脚本程序在线生成,并转为PDF格式发送给客户。

   ·企业MIS系统中各种面向打印的报表的生成,并可直接通过浏览器获得,无须安装任客户端,使用极为方便。

·以前文件流转是"先打印,后分发",每年花在印刷上的费用是政府、企业沉重的负担。而PDF文档"先散发,后打印",接件人可以在浏览后,再按需要打印。印刷的费用大大减少。而且,很有利于环保事业。

 

2.       课题简介

 

        在某些软件项目的开发过程中,我们遇到一个很关键的问题就是大量面向打印的报表、单据的生成。我们知道,HTML适合浏览,但不适合格式规范的打印。因此必需找到一种可以由PHP动态生成,且具有良好的打印效果的文档格式。而这正是我研究这个课题的最直接的需求。 明白了这一点,我们就很自然的想到了PDF以及PHP的PDF支持库PDFLib。通过PDFLib提供的一套API,我们可以很容易在PHP脚本动态创建PDF文档。但是这只是一套非常基本的函数,只能进行一些简单的输出,如线条、文本、矩形框等,而且每输出一个对象之前,都要为其指定坐标。如果直接使用来这套函数来做一些实际的应用,比如复杂的报表的生成,其困难程度是难以想象的。我们不可能为创建这样一个报表,而事先算好各个元素的坐标,并把单元格用矩形框一个一个的画出来。

       

所以,我们第一步要做的就是利用PHP面向对象的编程方法将这套基本的API进行封装,以产生多个实用的具有独立功能的对象模块(如page对象、table对象、text对象等)。应该说,这一块是此项目最基本,也是最重要的部分。我参考并部分采用

了国外一些类似的开放源码的程序,在此基础上开发出了一套功能较为强大的类库。大大简化了PDF文档的生成,特别是其中的table对象,可以象HTML中的TABLE标记一样任意嵌套,轻松快捷的实现各种复杂的表格的绘制(这对动态生成报表是非常有用的)。

 

        生成PDF的问题解决以后,我们面临了新的问题,举个例子来说,数据库查询页面如何将包含大量信息的结果集以及其它信息传给PDF生成页面? 最初我们想到的方法是通过文本文件传递,即在数据库查询页面将数据写到一个文本文件当中,并对其

中不同类别的数据定义一套区分的标记,PDF生成页面读取此文件,将内容插入到PDF中。 但是这样做,并不可靠。因为在这个文本文件中,我们采用特定的字符(或空格)来分离数据,如果恰好有用数据中也包含同样的字符或空格呢?可见,以这种方式传递数据是有隐患的。其实上面我们提到在文本文件中用不同的标记区分不同类别的数据。而这正是XML技术的思想。何不一步到为采用XML来作为数据传递的手段呢? 况且PHP对XML和XSLT具有很好的支持,通过expat解析器,我们可以任意提取XML文档中的数据,也可以通过PHP的XSLT引擎Sablotron对XML文档进行任意转换。

 

首先由“XML生成器”将数据(来自数据库或用户输入等)放到一个符合事先定义好的DTD的XML文档中,此文档对其中的数据内容进行描述,不包含任何格式信息。 然后由“XML转换器”将这个XML文档转换成包含显示样式信息的另一个XML文档。 最后由“PDF生成器”读取这个文档,根据其中的内容和显示样式生成相应的PDF文档。在这一个过程中,我要做的是再次运用 PHP的面向对象特性,构建出可重用的类:XMLWriter(生成XML文件)、XMLParser(解析XML文件)以及XMLTransformer(对XSLT函数的封装)。

    

系统构建成功后,就是具体的应用了。主要是进销存系统中各种报表、单据的动态生成。

 

3.       可行性分析

 

开发一个功能强大、适应性好的PDF文档在线生成系统,必然需要弹性大、灵活性

高的开发模型。我们提出的基于PHP和XML的PDF文档在线生成技术,为各种面向打印的应用,如报表、单票据、手册等提供了新的思路。我们用PHP来查询数据库,处理用户输入,并在此基础上生成原始的XML文档;然后通过XSLT将该XML文档加上显示层信息,生成另外一个新的XML文档。最后利用“PDF生成器”将这个新的XML文档转化为相应格式的PDF文档。对于最初生成的XML文档,我可以做二度利用,因为该文档包含了所有的有用信息,可以非常容易的被其它应用程序处理。如果我们想改变信息在PDF文档显示的样式,可以非常容易的实现。只要专门人员修改相应的XSL样式单文件即可,不需要对其它环节做任何修改,具有非常好的灵活性。除此之外,PHP、XML、PDF三者都具有极好的可移植性,可以跨平台使用。 对该系统的研究并非凭空想象的,它建立在直接的需求之上的。到目前为止,这套技术已经投入实际应用,收到了极为满意的效果。实践证明,运用PHP和XML开发出的一套在线PDF文档生成系统具有广阔和非常实际的应用前景。

 

4 总体设计

 

本课题主要完成四个基础模块的设计及编程实现。这四个类模块分别为PDFCreator、XMLWriter、XMLTransfomer以及XMLParser。它们分布于系统的各个环节之中,具有各自独立的功能和作用,是系统的核心组成部分(见下图)。

 

系统构成图

 

从图中可见,四者在本系统中又是紧密联系的有机整体。XMLWriter作为系统的输

入接口,负责生成原始的XML数据文件。该文件的格式规范(DTD)由我们事先编写好,而XMLWriter按照该DTD生成相应的XML文档。这个XML文档接着交由XMLTransfomer处理,XMLTransfomer其实是对PHP提供的XSLT函数的封装,它一般接受两个参数,其中之一是需要转换的XML文档,另一个是相应的XSL样式单文件。XMLTransfomer正是根据该样式单文件将原始的XML文档转化为符合这个样式单样式的另一个XML文档(包含信息在PDF文档中放置的格式)。然后,这个新的XML文件继续交由“PDF生成器”进行处理。而这个过程有分为两个部分:首先,必需对这个XML文档进行解析,提取其中所需的数据,这一步有XMLParser来完成,XMLParser对此XML文档进行解析,将其转化为一棵对象树,XML文档中每一个节点都是一个对象,每个对象都有各自的属性(即相应节点的所有信息)。这样一来,我们可以非常方便的访问这个XML文档的任意内容。之后,要做的就是将该XML文档中读出的信息(包括格式信息和内容信息)用PDFCreator转化为最终的PDF文档的输出。

 

5.应用示例

  

         在这里,我们运用上面的这套系统创建一个面向打印的报表——“库存历史事

表”。这个报表包含的信息有:报表名称(协和库存历史事务表)、单位、建表日期等,另外就是从数据库中提取的数据了,品名(LLPROD)、批号(LLOC)、等级(LCLS)、仓库(LWHS)、库位(LLOCT)、数量(LNUM)、日期(LDATE)等。假设我们已经用XMLWriter生成了下面的原始XML文档(report.xml):

         

             

                

库存历史事务表

                 平方米

                 20020611

            

            

                 

                           W2308

                           1234

                            a

                            01

                            0001

                            200

                            20020609

                   

                   

                            W2307

                            4321

                            a

                            01

                            0001

                            100

                            20020609

                    

           

 

该文档包含了这张报表的所有有用信息,我们需要用特定的XSL样式单为其加上格式信息。XMLTransformer执行转换的代码如下:

    $xslt = new XMLTransformer ("report.xsl", "report.xml");

    $xslt->apply("pdfreport.xml");

?>

 

转换后生成的新的XML文档如下:

 

 

    

     库存历史事务表

    

     单位:平方米

 

 

 

    

      

       

     

   

    

品名 批号 等级 仓库 库位 数量 日期
W2308 1234 a 01 0001 200 20020609
W2307 4321 a 01 0001 100 20020609

  

  

     

      建表日期:20020611

  

        用XMLParser对该XML文档解析后,得到一个包含所有信息的对象树,我们可以非常方便的访问其中的内容。生成的PDF报表如下图:

 

 

 程序片断如下:

 

   include( "../include/pc_init.inc" );?>

   include( "xmlparser.inc" );

$xmlobject=getRootNode("report.xml");

// get the attrs of root element

$pageSet=$xmlobject->attrs;

// get the report-head

$head=$xmlobject->nodes[0];

// code ignored...

?>

 

  function draw_line(&$parent,$line){

    $line = &pc_create_object( $parent, "line" );

    $line->pc_set_linestyle( $line->attrs["LINETYPE"]);

    $line->pc_set_width( $line->attrs["SIZE"] );

    $line->pc_set_alignment( "center" );

    if($line->attrs["SHOW"]==false){

        $line->pc_set_linecolor( "white" );

    }

        $line->pc_set_margin( array( "top" => $line->attrs["TOP"], "bottom" => $line->attrs["BOTTOM"], "left" => 0, "right" => 0 ) );

   }

 

  function draw_text(&$parent,$text){

    // code ignored...

  }

  function draw_table(&$parent,$table){

       // code ignored...

  }

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
不再担心下班前被领导叫住开小会,AI助手帮你自动生成会议纪要不再担心下班前被领导叫住开小会,AI助手帮你自动生成会议纪要Sep 04, 2023 pm 11:21 PM

讯飞听见升级会议纪要功能,可以将口语表述直接转化为书面稿,AI能够根据录音总结会议纪要。AI能够帮助您完成会议纪要的撰写工作8月31日,讯飞听见网页端进行了版本升级,新增了PC端实时录音功能,能够利用人工智能智能生成会议纪要。这一功能的推出将大大提高用户在会议后整理内容、跟进重点工作事项的效率。对于经常参加会议的人来说,这个功能无疑是一个非常实用的工具,能够节省大量时间和精力该功能的应用场景主要是PC电脑端录音转文字自动生成会议纪要,旨在为用户提供最优质的服务和最先进的技术,快速提升办公效率的产

如何使用PHP生成可刷新的图片验证码如何使用PHP生成可刷新的图片验证码Sep 13, 2023 am 11:54 AM

如何使用PHP生成可刷新的图片验证码随着互联网的发展,为了防止恶意攻击和机器自动操作现象,很多网站都使用了验证码来进行用户验证。其中一种常见的验证码类型就是图片验证码,通过生成一张包含随机字符的图片,要求用户输入正确的字符才能进行后续操作。本文将介绍如何使用PHP生成可刷新的图片验证码,并提供具体的代码示例。步骤一:创建验证码图片首先,我们需要创建一个用于生

如何使用PHP进行基本的自然语言生成如何使用PHP进行基本的自然语言生成Jun 22, 2023 am 11:05 AM

自然语言生成是一种人工智能技术,它能够将数据转换为自然语言文本。在当今的大数据时代,越来越多的业务需要将数据可视化或呈现给用户,而自然语言生成正是一种非常有效的方法。PHP是一种非常流行的服务器端脚本语言,它可以用于开发Web应用程序。本文将简要介绍如何使用PHP进行基本的自然语言生成。引入自然语言生成库PHP自带的函数库并不包括自然语言生成所需的功能,因此

使用Python中的pyWaffle生成一个华夫饼图使用Python中的pyWaffle生成一个华夫饼图Aug 17, 2023 am 11:49 AM

数据可视化对于高效的信息理解和展示至关重要。在众多可用的图表类型中,华夫饼图以方形瓦片在网格状结构中显示数据的新颖方式。强大的Python模块PyWaffle方便了华夫饼图的开发,类似于许多计算和数据分析方法。在本文中,我们将看看如何使用复杂的Python模块PyWaffle创建华夫饼图。让我们安装PyWafle并看看如何使用它来可视化分类数据。在您的cmd中运行以下命令来安装该库,然后将其导入到您的代码中pipinstallpywaffleExample1的中文翻译为:示例1在这个例子中,我们

如何使用PHP生成带有时间限制的二维码?如何使用PHP生成带有时间限制的二维码?Aug 26, 2023 pm 04:34 PM

如何使用PHP生成带有时间限制的二维码?随着移动支付和电子门票的普及,二维码成为了一种常见的技术。在很多场景中,我们可能需要生成一种带有时间限制的二维码,即使在一定时间后,该二维码也将失效。本文将介绍如何使用PHP生成带有时间限制的二维码,并提供代码示例供参考。安装PHPQRCode库要使用PHP生成二维码,我们需要先安装PHPQRCode库。这个库

word目录生成错乱怎么办word目录生成错乱怎么办Feb 20, 2024 am 08:08 AM

word目录生成错乱怎么办随着科技的发展,电子文档已经成为我们日常工作和学习中不可或缺的一部分。而在编辑电子文档时,尤其是长篇文章或论文中,目录的生成是一个非常重要的步骤。目录能够方便读者查找到文章的内容和结构,提高阅读效率。然而,有时候我们在生成目录的过程中会遇到一些问题,比如目录生成出错,顺序混乱等。那么,如果word目录生成错乱,我们应该如何解决呢?首

如何创建mdf文件如何创建mdf文件Feb 18, 2024 pm 01:36 PM

MDF文件是一种常见的数据库文件格式,它是MicrosoftSQLServer数据库的主要文件之一。在数据库管理系统中,MDF文件用于保存数据库的主要数据,包括表、索引、存储过程等。建立MDF文件是创建数据库的关键步骤之一,下面将介绍一些常见的方法。使用SQLServerManagementStudio(SSMS)SQLServerManag

如何生成在在线答题中的错题本如何生成在在线答题中的错题本Sep 25, 2023 am 10:24 AM

如何生成在线答题的错题本在现如今的信息时代,网上答题已经成为了许多学生和教育工作者的常见任务。而错题一直是学习过程中的难题之一,很多人都希望能够方便地生成在线答题的错题本,以便更好地复习和掌握知识。本文将介绍如何通过编程实现在线答题错题本的生成功能,并提供具体的代码示例。第一步:搭建网页界面生成在线答题错题本需要一个网页界面来显示题目和答案。可以使用HTML

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前By尊渡假赌尊渡假赌尊渡假赌
仓库:如何复兴队友
4 周前By尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
3 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器

将Eclipse与SAP NetWeaver应用服务器集成。

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),

Atom编辑器mac版下载

Atom编辑器mac版下载

最流行的的开源编辑器