Semantik web
Semantik sesuatu bermakna sesuatu.
Semantik web = maksud Web.
Apakah itu semantik Web?
Apakah semantik? Malah, secara ringkas, ia bermakna mesin boleh membaca kandungannya.
The Beatles ialah kumpulan muzik popular dari Liverpool.
John Lennon ialah ahli The Beatles.
"Hey Jude" ialah karya agung The Beatles.
Kita boleh faham dengan mudah maksud ayat di atas. Tetapi bagaimana dengan ayat-ayat ini? Bagaimana pula dengan difahami oleh komputer?
pernyataan dicipta oleh peraturan tatabahasa. Tatabahasa sesuatu bahasa mentakrifkan peraturan untuk mencipta pernyataan dalam bahasa tersebut. Tetapi bagaimana anda menukar sintaks menjadi semantik?
Web Semantik membolehkan mesin memahami data. Teknologi Web Semantik, yang merangkumi satu set bahasa penerangan dan logik penaakulan. Ia termasuk menerangkan ontologi melalui beberapa format.
Web Semantik bukanlah pautan antara halaman web.
Web Semantik menerangkan perkaitan antara perkara ((seperti A ialah sebahagian daripada B, Y ialah ahli Z)) dan sifat sesuatu (seperti saiz, ketinggian, umur, harga, dsb. .).
< table width="100%">语义网的实现是基于XML(可扩展标记语言eXtensible Markup Langauge)语言和资源描述框架(RDF)来完成的。XML是一种用于定义标记语言的工具,其内容包括XML声明、用以定义语言语法的DTD (document type declaration文档类型定义)、描述标记的详细说明以及文档本身。而文档本身又包含有标记和内容。RDF则用以表达网页的内容。 |
Rangka Kerja Penerangan Sumber
RDF (Rangka Kerja Penerangan Sumber) ialah spesifikasi bahasa yang disyorkan oleh W3C untuk menerangkan sumber maklumat di WWW dan hubungan antara mereka.
RDF(S) ialah bahagian penting Web Semantik Ia menggunakan URI untuk mengenal pasti objek yang berbeza (termasuk nod sumber, kelas atribut atau nilai atribut) dan boleh menyambungkan URI yang berbeza untuk menyatakan hubungan antara objek dengan jelas. perhubungan.
Pelaksanaan
Walaupun Web Semantik adalah rangkaian yang lebih cantik, pelaksanaannya adalah projek yang kompleks dan luas. Seni bina Web Semantik kini sedang dalam pembinaan dan terutamanya memerlukan sokongan daripada dua aspek berikut:
(1) Pelaksanaan rangkaian dataIaitu: melalui satu set yang bersatu dan lengkap piawaian data untuk rangkaian Maklumat ditanda dengan lebih teliti dan terperinci, membolehkan Web Semantik mengenal pasti maklumat dengan tepat dan membezakan peranan dan maknanya. Untuk menjadikan carian Web Semantik lebih tepat dan teliti, menjadikannya lebih mudah untuk menentukan sama ada maklumat adalah benar atau palsu, dan dengan itu mencapai matlamat praktikal, pertama sekali kita perlu membangunkan piawaian yang membolehkan pengguna menambah metadata (iaitu, teg dengan penjelasan terperinci) ke web kandungan dan membolehkan pengguna untuk Tentukan apa yang mereka cari kemudian, cari cara untuk memastikan bahawa program yang berbeza boleh berkongsi kandungan dari tapak yang berbeza dan akhirnya, meminta pengguna untuk menambah fungsi tambahan, seperti menambah aplikasi.
Pelaksanaan Web Semantik adalah berdasarkan bahasa XML (EXtensible Markup Langauge) dan Rangka Kerja Penerangan Sumber (RDF). XML ialah alat yang digunakan untuk mentakrifkan bahasa markup Kandungannya termasuk pengisytiharan XML, DTD (pengisytiharan jenis dokumen) untuk mentakrifkan sintaks bahasa, penerangan terperinci yang menerangkan penanda dan dokumen itu sendiri. Dokumen itu sendiri mengandungi markup dan kandungan. RDF digunakan untuk menyatakan kandungan halaman web.
(2) Enjin carian dengan keupayaan analisis semantikJika rangkaian data dapat direalisasikan melalui ratusan juta individu dalam masa yang singkat, maka kecerdasan semantik rangkaian mesti dicapai melalui usaha kumpulan kecerdasan manusia yang canggih untuk mencapainya. Pembangunan enjin carian maklumat dengan keupayaan analisis semantik akan menjadi langkah paling penting dalam Web Semantik Enjin ini boleh memahami bahasa semula jadi manusia dan mempunyai keupayaan penaakulan dan pertimbangan tertentu.
Enjin carian semantik dan enjin carian yang didayakan secara semantik ialah dua perkara yang berbeza. Yang pertama hanyalah penggunaan rangkaian semantik, cara pencarian maklumat, manakala enjin carian dengan keupayaan analisis semantik adalah sejenis enjin carian yang boleh memahami bahasa semula jadi dan seterusnya memberikan jawapan yang lebih sesuai dengan psikologi pengguna melalui penaakulan komputer.
Prospek
Senibina Web Semantik sedang dalam pembinaan Penyelidikan antarabangsa semasa mengenai seni bina ini belum lagi membentuk penerangan logik dan sistem teori yang memuaskan dan ketat hanya membuat pengenalan ringkas kepada struktur sistem ini berdasarkan penyelidikan asing, dan masih belum membentuk penjelasan yang sistematik.
Pelaksanaan Web Semantik memerlukan sokongan tiga teknologi utama: XML, RDF dan Ontologi.
XML (Bahasa Bertanda eXtensible, iaitu bahasa penanda boleh diperluaskan) membenarkan penyedia maklumat untuk mentakrifkan teg dan nama atribut mengikut keperluan mereka, supaya struktur fail XML boleh menjadi kompleks pada apa-apa tahap.
Ia mempunyai kelebihan dalam format penyimpanan data dan kebolehskalaan yang baik, struktur tinggi dan penghantaran rangkaian yang mudah, ditambah pula dengan mekanisme NS yang unik dan pelbagai jenis data dan mekanisme pengesahan yang disokong oleh Skema XML , menjadikannya salah satu teknologi utama daripada Web Semantik.
Perbincangan semasa mengenai teknologi utama Web Semantik tertumpu terutamanya pada RDF dan Ontologi.
RDF ialah spesifikasi bahasa yang disyorkan oleh organisasi W3C untuk menerangkan sumber dan perhubungan di antara mereka Ia mempunyai ciri-ciri kesederhanaan, pengembangan yang mudah, keterbukaan, pertukaran yang mudah dan sintesis yang mudah.
Perlu diingat bahawa RDF hanya mentakrifkan cara untuk menerangkan sumber, tetapi tidak menentukan data yang digunakan untuk menerangkan sumber. RDF terdiri daripada tiga bahagian: Model Data RDF, Skema RDF dan Sintaks RDF.
Dilampirkan:1 Web Semantik mengembangkan Internet sedia ada dan menambah kandungan yang mewakili maknanya kepada maklumat, membolehkan komputer berfungsi bersama-sama dengan orang secara automatik. Dalam erti kata lain, pelbagai sumber dalam Web Semantik bukan lagi sekadar pelbagai maklumat yang disambungkan, tetapi juga merangkumi maksud sebenar maklumat, dengan itu meningkatkan automasi dan kecerdasan pemprosesan maklumat komputer. Sudah tentu, komputer tidak mempunyai kecerdasan sebenar Penubuhan Web Semantik memerlukan penyelidik untuk mewakili maklumat dengan berkesan dan merumuskan standard bersatu supaya komputer dapat memproses maklumat secara berkesan dan automatik.
(Sumber: "Prinsip dan Kaedah Pengurusan Maklumat" oleh He Bin dan Zhang Lihou, Tsinghua University Press, edisi kedua, Julai 2007)
Senibina Rangkaian Semantik
Lapisan pertama: Unicode dan URI, yang merupakan asas kepada keseluruhan seni bina.
Lapisan kedua: XML+NS+XMLSchema, yang bertanggungjawab untuk mewakili kandungan dan struktur data secara tatabahasa Ia memisahkan bentuk perwakilan, struktur data dan kandungan maklumat rangkaian dengan menggunakan bahasa format standard.
Lapisan ketiga: Skema RDF+RDF, yang menyediakan model semantik untuk menerangkan maklumat dan jenis di Internet. Antaranya, RDF (Resource Description Framework), kerangka penerangan sumber, adalah spesifikasi bahasa yang disyorkan oleh W3C untuk menerangkan sumber maklumat di WWW dan hubungan antara mereka. RDF(S) ialah bahagian penting Web Semantik Ia menggunakan URI untuk mengenal pasti objek yang berbeza (termasuk nod sumber, kelas atribut atau nilai atribut) dan boleh menyambungkan URI yang berbeza untuk menyatakan hubungan antara objek dengan jelas.
Lapisan keempat: lapisan perbendaharaan kata ontologi ialah spesifikasi yang jelas untuk pengkonsepan dan pemformalkan pengetahuan domain. Dalam seni bina web semantik, peranan ontologi terutamanya dicerminkan dalam: (1) Penerangan konsep, iaitu, pengetahuan domain didedahkan melalui penerangan konsep, ontologi mempunyai keupayaan ekspresi yang lebih kuat daripada RDF dan boleh mendedahkan Hubungan semantik yang lebih kaya; (3) Sebagai spesifikasi yang jelas tentang pengetahuan domain, ontologi dapat memastikan konsistensi semantik, dengan itu menyelesaikan sepenuhnya fenomena polisemi, berbilang kata dengan satu makna dan makna yang tidak jelas; Kepastian ontologi dalam huraian konsep dan keupayaan mendedahkan semantiknya yang berkuasa dengan berkesan memastikan keberkesanan penaakulan pada peringkat data.
Lapisan kelima: Lapisan logik, bertanggungjawab untuk menyediakan aksiom dan prinsip penaakulan, menyediakan asas untuk perkhidmatan pintar. Antaranya, logik penerangan (DescriptionLogic) ialah pemformalan perwakilan pengetahuan berasaskan objek Ia menyerap idea utama KL-ONE dan merupakan subset yang boleh ditentukan bagi logik predikat urutan pertama. Ia berbeza daripada logik predikat urutan pertama kerana sistem logik penerangan boleh menyediakan perkhidmatan penaakulan yang boleh diputuskan. Selain perwakilan pengetahuan, logik penerangan juga digunakan dalam banyak bidang lain Ia dianggap sebagai bentuk bahasa perwakilan berpusat objek yang dinormalisasi. Ciri penting bagi logik penerangan ialah keupayaan ekspresif yang kuat dan kebolehputusannya, yang memastikan algoritma inferens sentiasa boleh berhenti dan mengembalikan hasil yang betul. Di antara banyak kaedah perwakilan pengetahuan formal, logik penerangan telah mendapat perhatian khusus selama lebih daripada sepuluh tahun Sebab utamanya ialah: mereka mempunyai mekanisme model-teoretikal yang sangat sesuai untuk mewakili bidang aplikasi melalui taksonomi konsep; Perkhidmatan penaakulan yang sangat berguna.
Lapisan keenam lapisan bukti dan lapisan ketujuh lapisan amanah bertanggungjawab untuk menyediakan mekanisme pengesahan dan kepercayaan.