Home  >  Article  >  Backend Development  >  分享链接 php+ajax实现内容获取与动态修改

分享链接 php+ajax实现内容获取与动态修改

WBOY
WBOYOriginal
2016-06-23 14:25:561356browse

本帖最后由 hudie631489527 于 2011-08-16 09:24:20 编辑

还是由于工作上的需要,做了这个分享链接功能
这个功能看起来比较简单,要做好,还真的是要花点时间的
说明一下,由于jquery包实在有点大,大多功能这里用不上,所以就没有用它了
参考网上的JS,简单的写了点JS实现了此功能
三个文件:
parse_share.html 显示页面
parse.js 接收php返回的数据操作
parse.php 远程获取数据,并处理分析,返回json数据格式给js
看demo请到 这里观看

在此也给上源码地址:  分享链接 php+ajax实现内容获取与动态修改(www.onlypo.com)

还是先把源码一个个的列出来:
parse_share.html 此文件没有什么好说的
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"><html><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"><script language="javascript" type="text/javascript" src="/test/parseurl/parse.js"></script><title>分享链接 php+ajax实现内容获取与动态修改</title><style>.float {	float:left;	padding: 5px;}.float2 {	float:left;	padding: 1px 5px;}.float2 span{ }.inputs {	width: 350px;	border:1px solid #C7E0E7;	heigth: 33px;	padding: 8px 5px;	font-size:13px;}.input_small {	width: 240px;}.buttons {	border:medium none;	background-color:green;	height:33px;	width:50px;	cursor:pointer;}.clearboth {	clear:both;	float:left;}.title {	font-size:16px;	width:240px;	line-height:20px;}.content {	font-size:12px;	width:240px;	line-height:16px;}.content1 {	font-size:12px;	width:240px;	line-height:20px;}.clearboth img {	width: 120px;	height: 100px;}.backovercolor {	background-color: #FFFF99;}</style></head><body> <div><div class="float"><input class="inputs" type="text" name="parseurl" id="parseurl" /></div><div class="float"><input class="buttons" type="button" name="parse" id="parse" value="获取" /></div><div id="append"></div></div>  <script type="text/javascript">//给按钮绑定事件addNewThing(document.getElementById('parse'), 'click', parseAsynch);</script></body></html> 


回复讨论(解决方案)

parse.js 此文件内容比较多,涉及到ajax请求,页面元素的动态生成,对于json的数据处理,里面的注释应该可以让大家看懂了
js封装的不太好,对JS比较熟悉精通的朋友可以多给点意见

var parseUrl = '/test/parseurl/parse.php'; //本地的PHP异步解析文件var limitTime = 20;//单位为秒,设置最大的请求时间var clearTo = null;var imgs = [];//图片集var Ajax =   	function(){  	    function request(url,opt){  	        function fn(){}  	        var async   = opt.async !== false,  	            method  = opt.method    || 'GET',  	            data    = opt.data      || null,	            dataType = opt.dataType || 'html',  	            success = opt.success   || fn,  	            failure = opt.failure   || fn;	            method  = method.toUpperCase();	            dataType  = dataType.toUpperCase();  	        if(method == 'GET' && data){  	            url += (url.indexOf('?') == -1 ? '?' : '&') + data;  	            data = null;  	        }  	        var xhr = _createHttpRequest();  	        xhr.onreadystatechange = function(){  	            _onStateChange(xhr,success,failure,dataType);  	        };  	        /*重点,在请求发布后开始设置setTimeout,如果请求状态不成功也就是readyState != 4 那么setTimeout将会在5秒后运行,并弹出信息提示,要是请求成功,将会清除该setTimeout*/	        clearTo = setTimeout(function()  {	        	xhr.abort(); //终止XMLHttpRequest对象	        	alert("系统繁忙,请重刷新页面或稍后再试...");	        },limitTime * 1000);	        xhr.open(method,url,async);  	        if(method == 'POST'){  	            xhr.setRequestHeader('Content-type', 'application/x-www-form-urlencoded;');  	        }	        xhr.send(data);  	        return xhr;   	    }  	    function _createHttpRequest() {	    	var request = false;			if(window.XMLHttpRequest) {				request = new XMLHttpRequest();			} else if(window.ActiveXObject) {				var versions = ['Microsoft.XMLHTTP', 'MSXML.XMLHTTP', 'Microsoft.XMLHTTP', 'Msxml2.XMLHTTP.7.0', 'Msxml2.XMLHTTP.6.0', 'Msxml2.XMLHTTP.5.0', 'Msxml2.XMLHTTP.4.0', 'MSXML2.XMLHTTP.3.0', 'MSXML2.XMLHTTP'];				for(var i=0, icount=versions.length; i<icount; i++) {					try {						request = new ActiveXObject(versions[i]);						if(request) {							return request;						}					} catch(e) {}				}			}			return request;		}	    function _onStateChange(xhr,success,failure,dataType){  	        if(xhr.readyState == 4){  	        	clearTimeout(clearTo);	            var s = xhr.status;  				var resCont = false;	            if(s>= 200 && s < 300){  					if(dataType == 'JSON') {  //尽可能的发送json头信息,更好兼容性的获得json对象						resCont = eval('(' + xhr.responseText + ')'); 					} else if(dataType == 'XML') {  //服务器端一定要指定xml头信息,让所有浏览器知道是xml数据,才能得到xml对象						resCont = xhr.responseXML;					} else						resCont = xhr.responseText;	                success(resCont);  	            }else{  	                failure(xhr.responseText);  	            }  	        }else {}  	    }  	    return {request:request};     	}();	//事件的绑定	function addNewThing(obj, ename, func) {		if(document.addEventListener) {			obj.addEventListener(ename, func, false);		} else {			obj.attachEvent('on'+ename, func);		}	}	function parseAsynch() {		//获取url内容		var newurl = document.getElementById('parseurl').value;		if(newurl.indexOf('http') == -1) return false;		Ajax.request(parseUrl,{			data : 'url='+newurl,			dataType : 'json',			method : 'post',			success : function(data) {				document.getElementById("append").innerHTML = '';//清空数据				imgs = [];//清空数据				//json数据的处理,data为json对象				//显示一张图片在左侧				addNewObj('div', 'append', '', 'clearboth', 'image_display'); //在外层加个DIV 				//显示图片				if(data.pic.length) {					for(var i in data.pic) {						if(i == 0) {							var imgOjb_display = document.getElementById('image_display');							var imgOjb = document.createElement('img');							imgOjb.src = data.pic[i];							imgOjb.id = 'change_pic';							imgOjb_display.appendChild(imgOjb);						}						imgs[i] = data.pic[i];					}				} 				addNewObj('div', 'append', '', 'float2', 'title_display'); //在外层加个DIV				//显示标题				addNewObj('span', 'title_display', data.title, 'clearboth title', 'parse_title');				var titleObj = document.getElementById('parse_title');				titleObj.onclick = function() {					if(!document.getElementById('parse_title_input'))						fromTextToInput(this);				};				titleObj.onmouseover = function(){this.className = 'clearboth title backovercolor'}				titleObj.onmouseout = function(){this.className = 'clearboth title'}				//显示url				addNewObj('span', 'title_display', newurl, 'clearboth content1');				//显示内容				addNewObj('span', 'title_display', data.content, 'clearboth content', 'parse_content');				var contentObj = document.getElementById('parse_content');				contentObj.onclick = function() {					if(!document.getElementById('parse_content_textarea')) {						fromTextToTextarea(this);					}				};				contentObj.onmouseover = function(){this.className = 'clearboth content backovercolor'}				contentObj.onmouseout = function(){this.className = 'clearboth content'}				//如果图片多个则可以进行翻页				if(data.pic.length > 1) {					//显示翻页按钮					var pageContent = "<a href=\"javascript:;\" onclick=\"prevImg();\"><<</a>"					pageContent += " <span id=\"pregnum\">1</span>-<span>"+(parseInt(i)+1)+"</span> ";					pageContent += "<a href=\"javascript:;\" onclick=\"nextImg();\">>></a>";					addNewObj('span', 'title_display', pageContent, 'clearboth content');				} 			}		});	}	function fromTextToInput(obj) {		var val = obj.innerHTML;		newObj = document.createElement('input');		newObj.id = obj.id + '_input';		newObj.type = 'text';		newObj.className = 'input_small';		newObj.onblur = function() {			fromInputToText(this);		}		newObj.value = val;		obj.innerHTML = '';		obj.appendChild(newObj);		newObj.focus();	}	function fromInputToText(obj) {		var val = obj.value;		obj.parentNode.onclick = function() {			if(!document.getElementById('parse_title_input')) {				fromTextToInput(this);			}		}		//去掉input		obj.parentNode.innerHTML = val;	}	function fromTextToTextarea(obj) {		var val = obj.innerHTML;		newObj = document.createElement('textarea');		newObj.id = obj.id + '_textarea';		newObj.rows = 2;		newObj.className = 'input_small';		newObj.onblur = function() {			fromTextareaToText(this);		}		newObj.value = val;		obj.innerHTML = '';		obj.appendChild(newObj);		newObj.focus();	}	function fromTextareaToText(obj) {		var val = obj.value;		obj.parentNode.onclick = function() {			if(!document.getElementById('parse_content_textarea')) {				fromTextToTextarea(this);			}		}		//去掉textarea		obj.parentNode.innerHTML = val;	}	//IE与FF的input标签name属性生成不一样	function addNewObj(newObjTag, parentObjTag, content, classname, idname) {		var appendObjs = document.getElementById(parentObjTag);		var newObj = document.createElement(newObjTag);		if(content) 	newObj.innerHTML = content;		if(classname) 	newObj.className = classname;		if(idname) 		newObj.id = idname;		appendObjs.appendChild(newObj);	}	function prevImg() {		//获取当前图片URL在数且中的位置		var pos = parseInt(document.getElementById('pregnum').innerHTML);		//图片的数量		var picnum = imgs.length;		if(pos <= 1) return false;		//图片对象		var picOjb = document.getElementById('change_pic');		//图片的预加载,只有这样IE6下面才会正常显示图片		var img = new Image();	    img.onload = function() {	    	picOjb.src = imgs[pos-2];	    };	    img.src = imgs[pos-2];		//当前位置改变		document.getElementById('pregnum').innerHTML = pos - 1;	}	function nextImg() {		//获取当前图片URL在数且中的位置		var pos = parseInt(document.getElementById('pregnum').innerHTML);		//图片的数量		var picnum = imgs.length; 		if(pos >= picnum) return false; 		//图片对象		var picOjb = document.getElementById('change_pic');		var img = new Image();	    img.onload = function() {	    	picOjb.src = imgs[pos];	    }	    img.src = imgs[pos];		//当前位置改变		document.getElementById('pregnum').innerHTML = pos + 1;	} 

parse.php 主要是用到curl对页面的请求,这个比file,file_get_contents去获取页面要稳定得多,这得益于它的模拟浏览器功能异常的强大
还有几点:
1.对于抓取回来的页面要进一步的过滤
2.由于抓取回来的页面的编码有些不同,所以这里需要先获取到页面的编码然后在通过iconv来转下编码(在次用的mb_convert_encoding,这是由于公司服务器配置的环境iconv函数用不了)
3.对于获取的图片的路径的补全
好了,源码贴上

<?php //$url = 'http://www.onlypo.com';// url地址$url = addslashes($_POST['url']);//分析url的上级目录,于用图片的路径补全$urlinfo = parse_url($url);if(isset($urlinfo['path'])) {	$dir = substr($url, 0, strrpos($url, "/") + 1);} else	$dir = $url.'/'; //模拟请求头,在FF的firebue里面可以看到这个,尽量逼真点$headers = array(	'User-Agent:Mozilla/5.0 (Windows NT 5.1; rv:5.0) Gecko/20100101 Firefox/5.0',	'Accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',	'Accept-Charset:GB2312,utf-8;q=0.7,*;q=0.7',	'Cache-Control:max-age=0',	'Accept-Language:zh-cn,zh;q=0.5');	//获取页面内容$ch = curl_init();curl_setopt($ch, CURLOPT_URL, $url);curl_setopt($ch, CURLOPT_HTTPHEADER, $headers);curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); $cont = curl_exec($ch); curl_close($ch);   //除去多余的干扰元素$striparr = array(	"/\<script([^>]*?)\>(.*?)\<\/script>/si",  //过滤script	"/\<\!\-\-(.*?)\-\-\>/is",  //过滤注释	"/\<style([^>]*?)\>(.*?)\<\/style>/is",//过滤CSS); $cont = preg_replace($striparr,array('','',''),$cont);  //有的站点不能请求过于太快或过于频繁,不然会返回 不想要的值,如 QQ站点 //获取网页编码$match = array();preg_match("/<meta\s*([^>]*?)\s*content=\"(.*?)(charset=(.*?))(.*?)\"\s*([^>]*?)\s*[\/]{0,1}\>/si", $cont, $match); $charset = $match[5] ? $match[5] : 'utf-8';  //由于服务器上的iconv函数不可用,所以直接用到mb_convert_encoding函数$cont = mb_convert_encoding($cont, 'utf-8', $charset);//获取文章标题,与内容$match = array();preg_match("/<title\>(.*?)\<\/title\>/si", $cont, $match); $title = $match[1];   $match = array();preg_match("/\<body([^>]*?)\>(.*?)\<\/body\>/Usi", $cont, $match); //去掉内容中的html标签和特殊字符$content = str_replace(array("\r\n","\n","\r","\t"),array("","","",""),strip_tags($match[2]));$middlepos = strlen($content) / 2; //utf-8为三个字符为一个汉字,为了避免有乱码出现,在此相应的补成3的倍数//$remainder = $middlepos % 3;//if($remainder) { $middlepos -= $remainder;} //从内容中间开始截取一段文字 $content = mb_strcut($content, $middlepos, 120, 'utf-8');//echo substr($content, $middlepos, 120);//从body中获取文章里面的图片preg_match_all("/<img ([^\ alt="分享链接 php+ajax实现内容获取与动态修改" >]*?)src=\"(.*?)\"([^\>]*?)[\/]{0,1}>/i", $match[2], $matchpics); $piclist = $matchpics[2];//整理图片if(!empty($piclist) && is_array($piclist)) {	foreach($piclist as $k => $v) {		$v = trim($v);		if(empty($v)) unset($piclist[$k]); //去除多余的图片		//如果图片不是完整路径,完善他		if(stripos($v,'http://') === false) {			$piclist[$k] = $dir.ltrim($v, '/');		}	}}echo json_encode(array('title' => $title, 'content' => $content, 'pic' => $piclist)); ?> 

需要这个功能的朋友还是zero

俺看不懂

可以看看演示的效果啊,地址:
http://www.onlypo.com/archives/16

看来大家只比较关心
这种类型的网站了
一忠保洁

不过需要提醒一下,你使用 json 返回数据就称不上是 ajax 了,只能叫 ajaj

AJAX Asynchronous JavaScript and XML
ajaj Asynchronous JavaScript and JSON

我去看了演示地址 怎么什么都获取不到?浏览器问题?

怎??看到想要的,效果,可以?取???中的??否?

我去看了演示地址 怎么什么都获取不到?浏览器问题?
服务器在国外,你打http://www.facebook.com,或是其它站点,好像baidu.com服务器上访问不了
http://www.csdn.net等是可以的

怎??看到想要的,效果,可以?取???中的??否?
那是当然不可能的,只能获取到页面上的数据

不过需要提醒一下,你使用 json 返回数据就称不上是 ajax 了,只能叫 ajaj

AJAX Asynchronous JavaScript and XML
ajaj Asynchronous JavaScript and JSON
嗯,没有注意这点,说的有道理,我是觉得返回一个XML有许多不必要的内容,所以没有返回XML

不错。

不错不错


Ajax实例:获得站点文件内容
http://3aj.cn/article/65.html

Statement:
The content of this article is voluntarily contributed by netizens, and the copyright belongs to the original author. This site does not assume corresponding legal responsibility. If you find any content suspected of plagiarism or infringement, please contact admin@php.cn