網站建置指南login
網站建置指南
作者:php.cn  更新時間:2022-04-01 15:26:43

Web 語意化


單字語意化表示了它的意義。

事物的語意化意味著事物。

Web 語意化 = Web的意義。


什麼是 Web 語意化?

什麼是語意化?其實簡單說來就是讓機器可以讀懂內容。

  • 披頭四是一支來自利物浦受歡迎的樂團。

  • 約翰藍儂是披頭四的成員。

  • "Hey Jude"是由披頭四的代表作。

我們可以很容易理解上面的句子的意義。但這些語句怎麼 被電腦理解呢?

語句由語法規則建立。語言的語法定義了創建語言語句的規則。但是要如何讓語法變成語意呢?

語意網路是讓機器可以理解資料。語意網技術,它包括一套描述語言和推理邏輯。它套件透過一些格式對本體(Ontology)進行描述。

語意網路並不是網頁之間的連結。

語意網描述了事物之間的關聯((如A 是B的一部分,Y 是Z 的成員)及事物的屬性(如大小,高度,年齡,價格等)。

The Web

語意網的實作是基於XML(可擴展標記語言eXtensible Markup Langauge)語言和資源描述框架(RDF)來完成的。標記和內容。


資源描述框架

RDF(Resource Description Framework),即資源描述框架,是W3C推薦的用來描述WWW上的資訊資源及其之間關係的語言規範。

RDF(S)是語意網路的重要組成部分,它使用URI來標識不同的物件(包括資源節點、屬性類別或屬性值)並可將不同的URI連接起來,清楚地表達物件間的關係。



實作

語意網雖然是一種更加美好的網絡,但實現起來卻是一項複雜而浩大的工程。 目前語意網的體系結構正在建置中,主要需要以下兩方面的支持:

(1) 資料網路的實現

即:透過一套統一的完善的資料標準對網絡訊息進行更徹底更詳細的標記,使得語意網路能精準的辨識訊息,區分訊息的作用和意義 要使語意網路搜尋更精確徹底,更容易判斷資訊的真假,從而達到實用的目標,首先需要製訂標準,該標準允許用戶為網路內容添加元資料(即解釋詳盡的標記),並能讓用戶精確地指出他們正在尋找什麼;然後,還需要找到一種方法,以確保不同的程式都能分享不同網站的內容;最後,要求用戶可以增加其他功能,例如添加應用軟體等。

語意網的實作是基於XML(可擴展標記語言eXtensible Markup Langauge)語言和資源描述框架(RDF)來完成的。 XML是一種用於定義標記語言的工具,其內容包括XML聲明、以定義語言語法的DTD (document type declaration文件類型定義)、描述標記的詳細說明以及文件本身。而文檔本身又包含有標記和內容。 RDF則用以表達網頁的內容。

(2)具有語意分析能力的搜尋引擎

如果說資料網路能夠短暫透過億萬的個體實現,那麼網路的語意化智慧化就要透過人類尖端智慧群體的努力實現。研發一種具有語意分析能力的資訊搜尋引擎將成為語意網路的最重要一步,這種引擎能夠理解人類的自然語言,並且具有一定的推理和判斷能力。

語意搜尋引擎(semantic search engine)和具有語意分析能力的搜尋引擎(semantically enabled search engine)是兩碼事。前者不過是語意網路的利用,一種資訊搜尋方式,而具有語意分析能力的搜尋引擎則是一種能夠理解自然語言,透過電腦的推理而進一步提供更符合使用者心理的答案。


前景

語意網的體系結構正在建構中,目前國際範圍內對此體系結構的研究還沒有形成一個令人滿意的嚴密的邏輯描述與理論體系,中國學者對此體系結構也只是在國外研究的基礎上做簡要的介紹,還沒有形成系統的闡述。

語意網的實作需要三大關鍵技術的支援:XML、RDF和Ontology。

XML(eXtensible Marked Language,即可擴充標記語言)可以讓資訊提供者根據需要,自行定義標記及屬性名,從而使XML檔案的結構可以複雜到任意程度。

它具有良好的資料儲存格式與可擴充性、高度結構化以及便於網路傳輸等優點,再加上其特有的NS機制及XML Schema所支援的多種資料型別與校驗機制,使其成為語意網的關鍵技術之一。

目前關於語意網關鍵技術的討論主要集中在RDF和Ontology身上。

RDF是W3C組織建議使用的用來描述資源及其之間關係的語言規範,具有簡單、易擴展、開放性、易交換和易綜合等特徵。

值得注意的是,RDF 只定義了資源的描述方式,卻沒有定義用哪些資料來描述資源。 RDF由三個部分組成:RDF Data Model、RDF Schema和RDF Syntax。

附上:

1.語意網路透過擴展現有的互聯網,在資訊中加入表示其意義的內容,使電腦可以自動與人協同工作。也就是說,語意網路中的各種資源不再只是各種相連的訊息,還包括其訊息的真正意義,從而提高電腦處理訊息的自動化和智慧化。當然,計算機並不具有真正的智能,語義網的建立需要研究者們對資訊進行有效的表示,並制定統一的標準,使計算機可以對資訊進行有效的自動處理。

(資料來源:何斌張立厚《資訊管理原理與方法》 清華大學出版社2007年7月第二版)

2e5f2342fce47d514dc298da7f3f484f_m

語義網體系結構

  • 第一層:Unicode與URI,是整個體系結構的基礎。

  • 第二層:XML+NS+XMLSchema,負責語法上表示資料的內容和結構,透過使用標準的格式語言將網路資訊的表現形式、資料結構和內容分離。

  • 第三層:RDF+RDF Schema,它提供語意模型用於描述網路上的資訊和類型。其中,RDF(Resource Description Framework),即資源描述框架,是W3C推薦的用來描述WWW上的資訊資源及其之間關係的語言規範。 RDF(S)是語意網的重要組成部分,它使用URI來標識不同的物件(包括資源節點、屬性類別或屬性值)並可將不同的URI連接起來,清楚地表達物件間的關係。

  • 第四層:本體詞彙層,本體是關於領域知識的概念化、形式化的明確規範。在語意網體系結構中,本體的作用主要表現在:(1).概念描述,即透過概念描述揭示領域知識;(2).語意揭示,本體具有比RDF更強的表達能力,可以揭示更為豐富的語意關係;(3).一致性,本體作為領域知識的明確規範,可以保證語意的一致性,從而徹底解決一詞多義、多詞一義和詞義含糊現象;(4).推理支持,本體在概念描述上的確定性及其強大的語意揭示能力在資料層面有力地保證了推理的有效性。

  • 第五層:邏輯層,負責提供公理和推理原則,為智慧服務提供基礎。其中,描述邏輯(DescriptionLogic)是基於物件的知識表示的形式化,它吸取了KL-ONE的主要思想,是一階謂詞邏輯的一個可判定子集。它與一階謂詞邏輯不同的是,描述邏輯系統能提供可判定的推理服務。除了知識表示以外,描述邏輯也被用在其它許多領域,它被認為是以物件為中心的表示語言的最為重要的歸一形式。描述邏輯的重要特徵是很強的表達能力和可判定性,它能保證推理演算法總是能停止,並且回傳正確的結果。在眾多知識表示的形式化方法中,描述邏輯在十多年來受到人們的特別關注,主要原因在於:它們有清晰的模型-理論機制;很適合於透過概念分類學來表示應用領域;並提供了很有用的推理服務。

  • 第六層證明層和第七層信任層負責提供認證和信任機制。

#