php的简单分词类库
<?php header("Content-Type:text/html; charset=utf-8"); define('APP_ROOT', str_replace('\', '/', dirname(__FILE__))); function get_tags_arr($title) { require(APP_ROOT.'/pscws4.class.php'); $pscws = new PSCWS4(); $pscws->set_dict(APP_ROOT.'/scws/dict.utf8.xdb'); $pscws->set_rule(APP_ROOT.'/scws/rules.utf8.ini'); $pscws->set_ignore(true); $pscws->send_text($title); $words = $pscws->get_tops(5); $tags = array(); foreach ($words as $val) { $tags[] = $val['word']; } $pscws->close(); return $tags; } print_r(get_tags_arr($con)); function get_keywords_str($content){ require(APP_ROOT.'/phpanalysis.class.php'); PhpAnalysis::$loadInit = false; $pa = new PhpAnalysis('utf-8', 'utf-8', false); $pa->LoadDict(); $pa->SetSource($content); $pa->StartAnalysis( false ); $tags = $pa->GetFinallyResult(); return $tags; } print(get_keywords_str($con));
不需要安装扩展,自带字典,使用方法简单
采用很多人熟知的scws,另一个是IT柏拉图做的phpanalysis
使用方法请参考index.php文件示例
免责声明
本站所有资源均由网友贡献或各大下载网站转载。请自行检查软件的完整性!本站所有资源仅供学习参考。请不要将它们用于商业目的。否则,一切后果由您负责!如有侵权,请联系我们删除。联系方式:admin@php.cn
相关文章
如何使用 PHP 的 preg_match 将 CamelCase 单词拆分为单词?
24Oct2024
本文提供了一种使用 PHP 的 preg_split 函数将驼峰命名法单词拆分为单个单词的解决方案。讨论的主要挑战是需要将驼峰式单词(例如“oneTwoThreeFour”)拆分为单独的数组
简单分享:NumPy库正确卸载的方法
26Jan2024
如何正确卸载NumPy库:简单教程分享引言:NumPy是Python中一个常用的数值计算库,它提供了大量的数学函数和数组操作工具,被广泛应用于科学计算、数据分析和机器学习等领域。然而,在某些情况下,我们可能需要卸载NumPy库并重新安装或更新它。本文将为大家介绍如何正确卸载NumPy库,并提供具体的代码示例,帮助读者轻松完成此任务。步骤一:确认NumPy库是
Hot Tools
热门文章
Marvel Rivals 的 Unreal 进程崩溃了:快速修复它!
14Dec2024故障排查
《潜行者 2:切尔诺贝利之心》- 所有藏匿地点都在垃圾中
28Nov2024手游攻略
使用Java的'Scanner”时如何避免'NoSuchElementException”?
04Dec2024java教程
如何修复 Windows 中的 WilcomEmul.dll 错误:59 错误?
12Dec2024故障排查
卢马岛:所有职业的解释
28Nov2024手游攻略