Rumah > Artikel > pembangunan bahagian belakang > Apakah yang perlu saya lakukan jika php tidak dapat memuatkan scws?
php tidak boleh memuatkan scws kerana ia tidak berjaya dipasang: 1. Cari "scws-1.2.1.tar.bz2"; 2. Pasang melalui "make install"; sambungan; 4. Pasang perpustakaan perbendaharaan kata.
Persekitaran pengendalian artikel ini: sistem Windows 7, PHP versi 5.4, komputer Dell G3.
Apakah yang perlu saya lakukan jika php tidak boleh memuatkan scws Contoh pemasangan dan penggunaan sistem pembahagian perkataan Cina PHP sumber terbuka SCWS
1
SCWS ialah Perkataan Cina Mudah Akronim bagi Segmentasi (iaitu: Sistem pembahagian perkataan Cina Mudah). Ini ialah enjin pembahagian perkataan Cina mekanikal berdasarkan kamus kekerapan perkataan, yang pada asasnya boleh membahagikan seluruh perenggan teks Cina kepada perkataan dengan betul. Perkataan ialah unit morfem terkecil dalam bahasa Cina, tetapi apabila ditulis, perkataan tidak dipisahkan oleh ruang seperti bahasa Inggeris Oleh itu, cara membahagikan perkataan dengan tepat dan cepat sentiasa menjadi masalah yang sukar dalam pembahagian perkataan Cina. SCWS dibangunkan dalam bahasa C tulen dan tidak bergantung pada mana-mana fungsi perpustakaan luaran secara langsung boleh menggunakan perpustakaan pautan dinamik untuk membenamkan aplikasi yang disokong termasuk GBK, UTF-8, dsb. Selain itu, modul sambungan PHP disediakan untuk menggunakan fungsi segmentasi perkataan dengan cepat dan mudah dalam PHP. Tidak banyak elemen inovatif dalam algoritma segmentasi perkataan Ia menggunakan kamus kekerapan perkataan yang dikumpul dengan sendirinya, ditambah dengan nama tertentu, nama orang, nama tempat, zaman digital dan pengiktirafan peraturan lain untuk mencapai asas. pembahagian perkataan. Ketepatan ujian julat adalah antara 90% dan 95%, yang pada asasnya boleh memenuhi keperluan beberapa enjin carian kecil, pengekstrakan kata kunci dan keadaan lain. Versi prototaip pertama dikeluarkan pada akhir tahun 2005. SCWS dibangunkan oleh hightman dan dikeluarkan sebagai sumber terbuka di bawah lesen BSD Kod sumber dihoskan pada github. 2. Kod pemasangan scws adalah seperti berikut:# wget -c http://www.xunsearch.com/scws/down/scws-1.2.1.tar.bz2 # tar jxvf scws-1.2.1.tar.bz2 # cd scws-1.2.1 # ./configure --prefix=/usr/local/scws # make && make install3 scws pemasangan sambungan PHP kodnya adalah seperti berikut:
# cd ./phpext # phpize # ./configure --with-php-config=/usr/local/php5410/bin/php-config # make && make install # echo "[scws]" >> /usr/local/php5410/etc/php.ini # echo "extension = scws.so" >> /usr/local/php5410/etc/php.ini # echo "scws.default.charset = utf-8" >> /usr/local/php5410/etc/php.ini # echo "scws.default.fpath = /usr/local/scws/etc/" >> /usr/local/php5410/etc/php.ini4. Pemasangan Leksikon Kodnya adalah seperti berikut:
# wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2 # tar jxvf scws-dict-chs-utf8.tar.bz2 -C /usr/local/scws/etc/ # chown www:www /usr/local/scws/etc/dict.utf8.xdb5. Anda boleh membaca penerangan API rasmi SCWS secara terperinci Kod adalah seperti berikut:
//实例化分词插件核心类 $so = scws_new(); //设置分词时所用编码 $so->set_charset('utf-8'); //设置分词所用词典(此处使用utf8的词典) $so->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); //设置分词所用规则 $so->set_rule('/usr/local/scws/etc/rules.utf8.ini '); //分词前去掉标点符号 $so->set_ignore(true); //是否复式分割,如“中国人”返回“中国+人+中国人”三个词。 $so->set_multi(true); //设定将文字自动以二字分词法聚合 $so->set_duality(true); //要进行分词的语句 $so->send_text(“欢迎来到火星时代IT开发”); //获取分词结果,如果提取高频词用get_tops方法 while ($tmp = $so->get_result()) { print_r($tmp); } $so->close();Keterangan hasil tatasusunan kembali: Kodnya adalah seperti berikut:
word _string_ 词本身 idf _float_ 逆文本词频 off _int_ 该词在原文本路的位置 attr _string_ 词性Kajian Disyorkan: "
Tutorial Video PHP"
Atas ialah kandungan terperinci Apakah yang perlu saya lakukan jika php tidak dapat memuatkan scws?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!