Rumah >pembangunan bahagian belakang >masalah PHP >Apakah yang perlu saya lakukan jika php tidak dapat memuatkan scws?

Apakah yang perlu saya lakukan jika php tidak dapat memuatkan scws?

藏色散人
藏色散人asal
2021-09-06 09:06:231989semak imbas

php tidak boleh memuatkan scws kerana ia tidak berjaya dipasang: 1. Cari "scws-1.2.1.tar.bz2"; 2. Pasang melalui "make install"; sambungan; 4. Pasang perpustakaan perbendaharaan kata.

Apakah yang perlu saya lakukan jika php tidak dapat memuatkan scws?

Persekitaran pengendalian artikel ini: sistem Windows 7, PHP versi 5.4, komputer Dell G3.

Apakah yang perlu saya lakukan jika php tidak boleh memuatkan scws Contoh pemasangan dan penggunaan sistem pembahagian perkataan Cina PHP sumber terbuka SCWS

1

SCWS ialah Perkataan Cina Mudah Akronim bagi Segmentasi (iaitu: Sistem pembahagian perkataan Cina Mudah).

Ini ialah enjin pembahagian perkataan Cina mekanikal berdasarkan kamus kekerapan perkataan, yang pada asasnya boleh membahagikan seluruh perenggan teks Cina kepada perkataan dengan betul. Perkataan ialah unit morfem terkecil dalam bahasa Cina, tetapi apabila ditulis, perkataan tidak dipisahkan oleh ruang seperti bahasa Inggeris Oleh itu, cara membahagikan perkataan dengan tepat dan cepat sentiasa menjadi masalah yang sukar dalam pembahagian perkataan Cina.

SCWS dibangunkan dalam bahasa C tulen dan tidak bergantung pada mana-mana fungsi perpustakaan luaran secara langsung boleh menggunakan perpustakaan pautan dinamik untuk membenamkan aplikasi yang disokong termasuk GBK, UTF-8, dsb. Selain itu, modul sambungan PHP disediakan untuk menggunakan fungsi segmentasi perkataan dengan cepat dan mudah dalam PHP.

Tidak banyak elemen inovatif dalam algoritma segmentasi perkataan Ia menggunakan kamus kekerapan perkataan yang dikumpul dengan sendirinya, ditambah dengan nama tertentu, nama orang, nama tempat, zaman digital dan pengiktirafan peraturan lain untuk mencapai asas. pembahagian perkataan. Ketepatan ujian julat adalah antara 90% dan 95%, yang pada asasnya boleh memenuhi keperluan beberapa enjin carian kecil, pengekstrakan kata kunci dan keadaan lain. Versi prototaip pertama dikeluarkan pada akhir tahun 2005.

SCWS dibangunkan oleh hightman dan dikeluarkan sebagai sumber terbuka di bawah lesen BSD Kod sumber dihoskan pada github.

2. Kod pemasangan scws

adalah seperti berikut:

# wget -c http://www.xunsearch.com/scws/down/scws-1.2.1.tar.bz2
# tar jxvf scws-1.2.1.tar.bz2
# cd scws-1.2.1
# ./configure --prefix=/usr/local/scws
# make && make install
3 scws pemasangan sambungan PHP

kodnya adalah seperti berikut:

# cd ./phpext
# phpize
# ./configure --with-php-config=/usr/local/php5410/bin/php-config
# make && make install
# echo "[scws]" >> /usr/local/php5410/etc/php.ini
# echo "extension = scws.so" >> /usr/local/php5410/etc/php.ini
# echo "scws.default.charset = utf-8" >> /usr/local/php5410/etc/php.ini
# echo "scws.default.fpath = /usr/local/scws/etc/" >> /usr/local/php5410/etc/php.ini
4. Pemasangan Leksikon

Kodnya adalah seperti berikut:

# wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
# tar jxvf scws-dict-chs-utf8.tar.bz2 -C /usr/local/scws/etc/
# chown www:www /usr/local/scws/etc/dict.utf8.xdb
5. Anda boleh membaca penerangan API rasmi SCWS secara terperinci

Kod adalah seperti berikut:

//实例化分词插件核心类
 $so = scws_new();
 //设置分词时所用编码
 $so->set_charset('utf-8');
 //设置分词所用词典(此处使用utf8的词典)
 $so->set_dict('/usr/local/scws/etc/dict.utf8.xdb');
 //设置分词所用规则
 $so->set_rule('/usr/local/scws/etc/rules.utf8.ini ');
 //分词前去掉标点符号
 $so->set_ignore(true);
 //是否复式分割,如“中国人”返回“中国+人+中国人”三个词。
 $so->set_multi(true);
 //设定将文字自动以二字分词法聚合
 $so->set_duality(true);
 //要进行分词的语句
 $so->send_text(“欢迎来到火星时代IT开发”);
 //获取分词结果,如果提取高频词用get_tops方法
 while ($tmp = $so->get_result())
 {
     print_r($tmp);
 }
 $so->close();
Keterangan hasil tatasusunan kembali:

Kodnya adalah seperti berikut:

word   _string_ 词本身 
idf        _float_ 逆文本词频 
off         _int_ 该词在原文本路的位置 
attr       _string_ 词性
Kajian Disyorkan: "

Tutorial Video PHP"

Atas ialah kandungan terperinci Apakah yang perlu saya lakukan jika php tidak dapat memuatkan scws?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel berkaitan

Lihat lagi