}
}
// destroy parser
xml_parser_free($xp),
// opening tag handler
function elementBegin($parser, $name, $attributes)
{
global $currentTag, $flag,
// export the name of the current tag to the global scope
$currentTag = $name,
// if within an item block, set a flag
if ($name == "ITEM")
{
$flag = 1,
}
}
// closing tag handler
function elementEnd($parser, $name)
{
global $currentTag, $flag,
$currentTag = "",
// if exiting an item block, print a line and reset the flag
if ($name == "ITEM")
{
echo "
",
$flag = 0,
}
}
// character data handler
function characterData($parser, $data)
{
global $currentTag, $flag,
// if within an item block, print item data
if (($currentTag == "TITLE" || $currentTag == "LINK" ||
$currentTag ==
"DESCRIPTION") && $flag == 1)
{
echo "$currentTag: $data br>",
}
}
?>
看不明白? 别着急,后面将会作出解释。
5)捕获旗标
这段脚本首先要做的是设定一些全局变量:
// XML file
$file = "fm-releases.rdf",
// set up some variables for use by the parser
$currentTag = "",
$flag = "",
$currentTag变量保存是分析器当前处理的元素的名称——你很快就会看到为什么需要它。
因为我的最终目的是显示频道中的每一个单独的条目(item),并且带有链结。另外还要知道分析器什么时候退出了
$flag变量将用于判断分析器是在
下一步要做的是初始化SAX分析器,并开始分析RSS文档。
// create parser
$xp = xml_parser_create(),
// set element handler
xml_set_element_handler($xp, "elementBegin", "elementEnd"),
xml_set_character_data_handler($xp, "characterData"),
xml_parser_set_option($xp, XML_OPTION_CASE_FOLDING, TRUE),
// read XML file
if (!($fp = fopen($file, "r")))
{
die("Could not read $file"),
}
// parse data
while ($xml = fread($fp, 4096))
{
if (!xml_parse($xp, $xml, feof($fp)))
{
die("XML parser error: " .
xml_error_string(xml_get_error_code($xp))),
}
}
// destroy parser
xml_parser_free($xp),
这段代码简单明了,其中的注释已经解释的足够清楚了。xml_parser_create()函数建立一个分析器实例,并将之赋给句柄$xp。接着再创建回调函数处理开标记和闭标记,以及二者之间的字符数据。最后,xml_parse()函数联合多次fread()调用,读取RDF文件并分析它。
在文档中,每次遇到开标记,开标记处理器elementBegin()就会被调用。
// opening tag handler
function elementBegin($parser, $name, $attributes)
{
global $currentTag, $flag,
// export the name of the current tag to the global scope
$currentTag = $name,
// if within an item block, set a flag
if ($name == "ITEM")
{
$flag = 1,
}
}
这个函数以当前标记的名称和属性作为起参数。标记名称被赋值给全局变量$currentTag。如果,这个开标记是
同样,如果遇到闭标记,那么闭标记处理器elementEnd()将被调用。
// closing tag handler
function elementEnd($parser, $name)
{
global $currentTag, $flag,
$currentTag = "",
// if exiting an item block, print a line and reset the flag
if ($name == "ITEM")
{
echo "
",
$flag = 0,
}
}
闭标记处理函数也是以标记名称作为其参数。如果是遇到的是一个为的闭标记,变量$flag的值重置为0,并把变量$currentTag的值清空。
那么,如何处理标记之间的字符数据呢? 这才是我们的兴趣所在。先向字符数据处理器characterData()打个招呼吧。
// character data handler
function characterData($parser, $data)
{
global $currentTag, $flag,
// if within an item block, print item data
if (($currentTag == "TITLE" || $currentTag == "LINK" ||
$currentTag ==
"DESCRIPTION") && $flag == 1)
{
echo "$currentTag: $data br>",
}
}
现在你可以看一下传给这个函数的参数,你会发现它只接收了开标记和闭标记之间的数据,而根本不知道分析器当前正在处理哪个标记。而这正事我们一开始就引入全局变量$currentTag的原因。
如果$flag变量的值为1,也就是说如果分析器当前处于
整个RDF文档就是以这种顺序方式处理,每发现一个
6)筑巢时间(Nesting Time)
前面的例子只是用来说明问题的。如果你真想把RDF内容插入到Web站点当中,就需要把事情做的更好一些。所以把前面的脚本的作了改进,新增了一些东西,从而简化格式化RDF数据的任务。
basefont face="Verdana">
New releases on freshmeat.net today: |

Hot AI Tools

Undresser.AI Undress
AI-powered app for creating realistic nude photos

AI Clothes Remover
Online AI tool for removing clothes from photos.

Undress AI Tool
Undress images for free

Clothoff.io
AI clothes remover

AI Hentai Generator
Generate AI Hentai for free.

Hot Article

Hot Tools

WebStorm Mac version
Useful JavaScript development tools

ZendStudio 13.5.1 Mac
Powerful PHP integrated development environment

Dreamweaver CS6
Visual web development tools

VSCode Windows 64-bit Download
A free and powerful IDE editor launched by Microsoft

SublimeText3 English version
Recommended: Win version, supports code prompts!
