Rumah  >  Artikel  >  Apakah yang termasuk dalam pangkalan data teks penuh?

Apakah yang termasuk dalam pangkalan data teks penuh?

小老鼠
小老鼠asal
2023-06-09 17:21:434460semak imbas

Pangkalan data teks penuh terutamanya termasuk buku elektronik, majalah elektronik, surat khabar elektronik, dsb. Pangkalan data teks penuh menghapuskan keperluan untuk pengindeksan dokumen dan langkah pemprosesan lain, dan mengurangkan faktor manusia dalam organisasi data Oleh itu, data dikemas kini dengan cepat dan ketepatan hasil carian pada masa yang sama, kerana teks penuh adalah disediakan secara langsung, ia menjimatkan masalah mencari teks asal, jadi ia amat digemari oleh pengguna.

Apakah yang termasuk dalam pangkalan data teks penuh?

Sistem pengendalian untuk tutorial ini: Sistem Windows 11, komputer Dell G3.

Pangkalan data teks penuh ialah pangkalan data yang mengandungi teks penuh dokumen asal, terutamanya artikel jurnal, kertas persidangan, penerbitan kerajaan, laporan penyelidikan, peruntukan dan kes undang-undang, maklumat perniagaan, dsb. Pangkalan data teks penuh menghapuskan keperluan untuk pengindeksan dokumen dan langkah pemprosesan lain, dan mengurangkan faktor manusia dalam organisasi data Oleh itu, data dikemas kini dengan cepat dan ketepatan hasil carian pada masa yang sama, kerana teks penuh adalah disediakan secara langsung, ia menjimatkan masalah mencari teks asal, jadi ia amat digemari oleh pengguna. Bilangan pangkalan data teks penuh telah meningkat pada masa ini, nisbah bilangan pangkalan data teks penuh kepada pangkalan data bibliografi telah mencapai kira-kira 2:1, dan bilangannya masih meningkat.

Takrif struktur pangkalan data, kandungan data pangkalan data teks penuh, statistik penggunaan dan pelarasan perbendaharaan kata dan ruang storan yang digunakan dalam sistem teks penuh.

Klasifikasi

Mengikut bentuk persembahan kandungan maklumat dalam pangkalan data teks penuh, jenis utama pangkalan data teks penuh termasuk buku elektronik, majalah elektronik, elektronik surat khabar, dsb.

Versi elektronik buku biasanya diterbitkan selari dengan versi bercetak, dan mempunyai fungsi seperti menyemak imbas, mendapatkan semula, menyusun, mencetak dan menyalin. E-buku boleh diakses dalam talian, yang meningkatkan kecekapan penghantaran dokumen dan ketersediaan dokumen. Kemunculan buku elektronik akan meningkatkan (mengubah) tabiat membaca masyarakat.

Majalah elektronik boleh menggabungkan pengambilan dokumen dengan pemerolehan dokumen asal. Pangkalan data teks penuh mengandungi berbilang jurnal, membolehkan perolehan semula teks penuh merentas disiplin dan jurnal, meluaskan skop sumber untuk mendapatkan maklumat. Rangkaian Jurnal Akademik Cina (http://WWW.cnki.net) dibina oleh majalah elektronik Chinese Academic Journals (versi CD)

dan Tsinghua Tongfang CD-ROM Co., Ltd., dan Cina pangkalan data teks penuh jurnal termasuk Terdapat lebih daripada 3,000 jurnal dan lebih daripada 6 juta dokumen.

Akhbar elektronik menyimpan dan mengurus artikel akhbar dan laporan berita melalui pangkalan data, dan boleh dicari dan ditanya dalam talian. Pangkalan data teks penuh New York Times, Information Bank, merupakan perintis kepada jenis pangkalan data ini dan kemudiannya dimasukkan ke dalam sistem NEXIS di Mead Data Center. Versi CD-ROM bagi "Pangkalan Data Teks Penuh Harian Rakyat" yang dikeluarkan bersama oleh "People's Daily" China dan Beijing Jinpan Electronics Co., Ltd., versi CD-ROM bagi "Pangkalan Data Teks Penuh Harian China" yang dikeluarkan bersama oleh "China Daily" dan China Science and Technology Data Import and Export Corporation, Ia adalah pangkalan data teks penuh pertama akhbar berita di China.

Struktur

Pangkalan data teks penuh mempunyai pelbagai bentuk struktur.

Satu struktur ialah pangkalan data teks penuh terdiri daripada beberapa perpustakaan, setiap perpustakaan dibahagikan kepada beberapa dokumen, dokumen itu terdiri daripada beberapa pembawa maklumat, dan pembawa maklumat dibahagikan kepada beberapa serpihan merujuk kepada perenggan semula jadi yang membentuk teks Setara dengan medan. LEXIS di pusat data Mead di Amerika Syarikat mempunyai struktur ini. Ia adalah sistem dipacu menu Menu peringkat pertama memaparkan direktori perpustakaan, dan menu peringkat kedua memaparkan direktori dokumen Selepas perpustakaan dan dokumen dipilih, sistem mula menerima soalan.

Struktur lain ialah pangkalan data teks penuh terdiri daripada beberapa pangkalan data Tiada struktur peringkat dokumen di bawah pangkalan data, tetapi pembawa maklumat secara langsung dibahagikan kepada medan untuk penyimpanan. WESTLAW of Western Publishing Company of the United States mempunyai struktur ini Sistem ini mempunyai medan mahkamah, medan hakim, dsb., dan boleh menyediakan pelbagai kaedah carian. Struktur pangkalan data teks penuh adalah serupa dengan pangkalan data bibliografi Dokumen utamanya ialah fail teks yang disusun dalam format berjujukan, dan fail terbalik ialah fail indeks yang sepadan dengan medan carian bagi rekod pembawa maklumat. Format pita yang dirakam dalam pangkalan data teks penuh secara amnya dibahagikan kepada bahagian pengepala, direktori dan data Dalam pangkalan data teks penuh sedia ada, kaedah pelaksanaan yang berbeza diguna pakai mengikut situasi berbeza pembawa maklumat domain, pengguna pangkalan data dan peralatan.

Ciri

Berbanding dengan pangkalan data lain, pangkalan data teks penuh mempunyai banyak ciri, prestasi utama adalah seperti berikut.

①Mengandungi keaslian maklumat. Maklumat dalam pangkalan data pada dasarnya adalah dokumen asal yang tidak diproses, jadi ia adalah objektif.

② Ketelitian pencarian maklumat. Sebarang perkataan, ayat atau aksara boleh dicari, dan anda juga mungkin melihat beberapa maklumat kecil.

③Dapatkan semula semula jadi bahasa. Pendapatan semula bahasa semula jadi boleh digunakan, dan pengambilan semula Boolean dan lokasi boleh digunakan, sekali gus melibatkan pemahaman bahasa semula jadi.

④Struktur data pada asasnya tidak berstruktur Kecuali untuk beberapa data yang dinormalkan, sejumlah besar teks tidak berstruktur dan menyusahkan untuk pemprosesan pangkalan data hubungan.

⑤Sistem pangkalan data teks penuh profesional biasanya menggunakan teknologi "segmentasi perkataan automatik"

⑥Pangkalan data teks penuh yang baik juga mempunyai pangkalan pengetahuan, yang boleh mempunyai keupayaan penaakulan dan perolehan semula bersekutu.

⑦ pada dasarnya ditutup, data tidak perlu dikemas kini, dan ia mempunyai kestabilan yang lebih besar.

⑧Pangkalan data teks penuh biasanya menduduki ruang storan yang sangat besar dan memerlukan overhed sistem yang besar Bagaimana untuk meningkatkan kelajuan perolehan adalah masalah besar.

Atas ialah kandungan terperinci Apakah yang termasuk dalam pangkalan data teks penuh?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn