>  기사  >  백엔드 개발  >  PHP 분석에서 키워드를 추출하는 방법은 무엇입니까? (암호)

PHP 분석에서 키워드를 추출하는 방법은 무엇입니까? (암호)

不言
不言앞으로
2018-10-12 14:55:254131검색

이 글의 내용은 PHP 분석에서 키워드를 추출하는 방법에 관한 것입니다. (코드), 특정 참고 가치가 있습니다. 도움이 필요한 친구들이 참고할 수 있기를 바랍니다.

최근 디자이너가 기사 관련 푸시에 대한 해당 태그를 생성하도록 제안했습니다. 여기서 구현 프로세스를 공유하겠습니다.

여기에서 PHPAnalytic을 사용해야 합니다. 다음과 같습니다

link : https://pan.baidu.com/s/1GBbAn-LGcNeOgeV62XSUeg
추출 코드: xzmx

키워드 추출 방법은 다음과 같습니다.

<?php/** 
 * 关键字提取方法 
 * 
 * @param $title string 
 *         进行分词的标题 
 * @param $content string 
 *         进行分词的内容 
 * @return array 得到的关键词数组 
 */  function getKeywords($title = "", $content = "") {  
    if (empty ( $title )) {  
        return array ();  
    }  
    if (empty ( $content )) {  
        return array ();  
    }  
    $data = $title . $title . $title . $content; // 为了增加title的权重,这里连接3次  
       
    //这个地方写上phpanalysis对应放置路径  
    require_once &#39;./phpanalysis/phpanalysis.class.php&#39;;  
       
    PhpAnalysis::$loadInit = false;  //初始化类时是否直接加载词典,选是载入速度较慢,但解析较快;选否载入较快,但解析较慢
    $pa = new PhpAnalysis ( &#39;utf-8&#39;, &#39;utf-8&#39;, false );  

    $pa->LoadDict ();  //载入词典
    $pa->SetSource ( $data );  //设置源字符串
    $pa->StartAnalysis ( true );  //是否对结果进行优化
       
    $tags = $pa->GetFinallyKeywords (4); // 获取文章中的五个关键字  
   
    $tagsArr = explode (",",$tags);  
    return $tagsArr;//返回关键字数组  }

다음은 일련의 데이터를 시뮬레이션한 것입니다. 타당성 및 정확성 검증

$title = "最前线丨科技股领跌美股大盘,是否预示着下一轮的经济风暴?";
$content = " 科技股加速下跌,“危机”或许刚刚开始。

周三,美国股市遭遇重挫,纳指收盘大跌逾4%,道指跌超800点。截止收盘,纳斯达克指数大跌4.08%,报7422.05点,创7月3日以来最低,标普500指数下跌3.29%,创2月以来最大跌幅,道琼斯指数下跌3.15%,报25598.74点,创8月16日以来最低。

美股年内表现最好的科技股也普遍跳水,亚马逊跌超6%,单日市值蒸发超500亿美元,苹果、谷歌、Facebook均跌逾4%,奈飞跌超8%。中概股也未能幸免,京东、百度均跌超3%,流利说收跌14.99%,拼多多收跌9%,阿里巴巴收跌5.89%,在最近5个交易日中,阿里巴巴累计跌掉了15%,已经创下2014年纽约上市以来最大5天跌幅。

这轮暴跌早有信号,此前三天内,美股“恐慌指数”VIX大幅增长至58%,隔夜大涨近28%。一般而言,股市上涨时VIX指数倾向于下跌。而市场利空消息或许是美股隔夜巨震的重要原因。

9月26日美联储货币政策公布,决定今年第三次加息25个基点。美联储主席鲍威尔一周内两度公开表态渐进式加息,他认为美国经济表现“相当正面”,没有理由不认为当前的经济扩张“可以延续相当一段时间”。

一边是美联储坚定的加息立场,一边是特朗普的连番指责。周三美股收盘后,特朗普指责美联储“已经疯了”,表示不同意联储现在的行动,等待矫正,并期待已久。

本月9日,国际货币基金组织(IMF)发布最新一期《世界经济展望》报告,下调今明两年世界经济增速至3.7%,这低于7月预测的3.9%。IMF还将2019年美国经济预期增长率由2.7%下调至2.5%,原因之一是美国加征关税措施正在逐步落实,导致全球的贸易摩擦不断升级,《报告》就此发出警告并呼吁各经济体系共同努力,维护世界经济增长。

这一系列的举措和警示已经落实在美国股市,美股在周三大跌之前已经出现疲软,进入9月就有微跌,这次的大跌让美股短期内不被看好板上钉钉。而对于科技股首当其冲领跌大盘的原因,还得结合市场环境和企业自身来看。

今年以来科技巨头在美股市场表现强劲,Netflix涨幅达70%左右,亚马逊股价累计上涨50%,苹果也攀升了近30%。“科技股在2018年迄今已获得巨大涨幅,这意味着其价格有点稍贵,因此很自然会出现回调。此外,科技股都是些面临大量国际风险敞口的跨国公司股票。他们的很大一部分利润来自海外市场,很容易受到国际贸易形势的影响。”E-Trade Financial公司高级副总裁Chris Larkin在上个月就做出预测。

而连日来,部分科技股各自也是烦恼不断,苹果iPhone XS销量不如预期,谷歌母公司盈利不佳,亚马逊将员工最低时薪提升至15美元,塞德勒给客户的研报中称这一举动会给亚马逊第四季度新增3.1亿美元的成本。

股价回调、国际贸易摩擦、企业发展现状及战略等因素致使科技股被同步抛售。以目前美股释放出的信号来看,科技股在大跌中进入了回调期,自然免不了要经历一段暗黑时光,陪跑的还有全球股市。

从数据来看,欧洲三大股指已经集体大跌,英国富时100指数收跌1.27%,法国CAC40指数跌2.11%,德国DAX指数跌2.21%。亚太市场受到强力波及,今日开盘均大跌,日经225指数跌3.1%,跌破22800关口,韩国首尔综指开盘跌2.35%,A股市场大幅低开,沪指盘中跌破“熔断底”,香港恒生指数低开3.1%,下破26000点,创15个月新低。


苏宁金融研究院特约研究员江瀚表示,美国的十年大牛市可能已经处于强弩之末,在这样的情况下,一旦美国股市出现大规模问题,必然会引发其他地区股市的病毒式爆发,这将会引发全球市场的担忧。";
echo "<pre class="brush:php;toolbar:false">";
var_dump(getKeywords($title,$content));die;

위 내용에서 추출된 5개의 키워드는 다음과 같습니다.

개인적으로 추출된 5개의 키워드는 기사 내용과 매우 일치한다고 생각합니다. PHP에 관한 이 기사의 전체 내용 더 흥미로운 정보를 보려면 PHP 중국어 웹사이트의

php 그래픽 튜토리얼

칼럼을 참조하세요! ! !

위 내용은 PHP 분석에서 키워드를 추출하는 방법은 무엇입니까? (암호)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 cnblogs.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제