PHP文章相似度比较,通过similar_text()比较有点慢,可否有什么好效率?
如果通过将文章内容全部存入文本,遍历拿需要比较的文章内容,
通过similar_text()比较,这样的方法是否可行?
可以用操作系统提供的文件差异命令
可以用操作系统提供的文件差异命令
linux : diff
window : fc
他们都是按行处理的,报告中行数越多,自然相似度越低 具体是怎么实现呢?
比如(window)
system("fc 1.txt 2.txt > 3.txt");readfile('3.txt');
你也可以用 exec 直接返回差异结果数组
exec("fc 1.txt 2.txt", $a);print_r($a);
你也可以用 exec 直接返回差异结果数组
exec("fc 1.txt 2.txt", $a);print_r($a);
exec("fc 1.txt 2.txt", $a);print_r($a);
exec("fc 1.txt 2.txt", $a);print_r($a);
exec("fc 1.txt 2.txt", $a);print_r($a);
exec("fc 1.txt 2.txt", $a);print_r($a);
你也可以用 exec 直接返回差异结果数组
exec("fc 1.txt 2.txt", $a);print_r($a);