semanticweb_如何理解 web 語義化

1. web2.0是什麼，現在好象很熱的樣子，他和web1.0有什麼區別

要理解WEB2.0，先得看WEB的歷史。 World Wide Web，簡稱WWW，是英國人TimBerners-Lee 1989年在歐洲共同體的一個大型科研機構任職時發明的。通過WEB，互聯網上的資源，可以在一個網頁里比較直觀的表示出來；而且資源之間，在網頁上可以鏈來鏈去。在WEB1.0上做出巨大貢獻的公司有Netscape，Yahoo和Google。 Netscape研發出第一個大規模商用的瀏覽器，Yahoo的楊致遠提出了互聯網黃頁，而Google後來居上，推出了大受歡迎的搜索服務。

搜索最大的貢獻是，把互聯網上海量的信息，用機器初步分了個線索。但是，光知道網頁里有哪些關鍵字，只解決了人瀏覽網頁的需求。所以，Tim-Berners-Lee在提出WWW不久，即開始推崇語義網（Semantic Web）的概念。為什麼呢？因為互聯網上的內容，機器不能理解。他的理想是，網頁製作時和架構資料庫時，大家都用一種語義的方式，將網頁里的內容表述成機器可以理解的格式。這樣，整個互聯網就成了一個結構嚴謹的知識庫。從理想的角度，這是很誘人的，因為科學家和機器都喜歡有次序的東西。Berners-Lee關心的是，互聯網上數據，及能否被其它的互聯網應用所重復引用。舉一個例子說明標准資料庫的魅力。有個產品叫LiberyLink。裝了它後，到Amazon上去瀏覽時，會自動告訴你某一本書在用戶當地的圖書館能否找到，書號是多少等。因為一本書有統一的書號和書名，兩個不同的互聯網服務（Amazon 和當地圖書館資料庫檢索）可以公享數據，給用戶提供全新服務。

但是，語義網提出之後，曲高和寡，響應的人不多。為什麼？因為指望要網頁的製作者提供這么多額外的信息去讓機器理解一個網頁，太難；簡直就是人給機器打工。這違反了人們能偷懶就偷懶的本性。看看Google的成功就知道。 Google有個Page Rank技術，將網頁之間互相鏈接的關系，用來做結果排序的一個依據，變相利用了網頁製作人的判斷力。想一想網頁的製作者們，從數量來說，比純瀏覽者的數量小得多。但Google就這一個革新，用上了網頁的製作者的一部份力量，已將其推上了互聯網的頂峰。

所以互聯網下一步，是要讓所有的人都忙起來，全民織網，然後用軟體，機器的力量使這些信息更容易被需要的人找到和瀏覽。如果說WEB1.0是以數據為核心的網，那我覺得WEB2.0是以人為出發點的互聯網。我們看一看最近的一些WEB2.0產品，就可以理解以上觀點。

Blog：用戶織網，發表新知識，和其他用戶內容鏈接，進而非常自然的組織這些內容。

RSS：用戶產生內容自動分發，定閱

Podcasting：個人視頻/聲頻的發布/定閱

SNS： blog+人和人之間的鏈接

WIKI：用戶共同建設一個大網路全書

從知識生產的角度看，WEB1.0的任務，是將以前沒有放在網上的人類知識，通過商業的力量，放到網上去。WEB2.0的任務是，將這些知識，通過每個用戶的瀏覽求知的力量，協作工作，把知識有機的組織起來，在這個過程中繼續將知識深化，並產生新的思想火花；

從內容產生者角度看，WEB1.0是商業公司為主體把內容往網上搬，而WEB2.0則是以用戶為主，以簡便隨意方式，通過blog/podcasting 方式把新內容往網上搬；

從交互性看，WEB1.0是網站對用戶為主；WEB2.0是以P2P為主。

從技術上看，WEB客戶端化，工作效率越來越高。比如像Ajax技術, GoogleMAP/Gmail裡面用得出神入化。

我們看到，用戶在互聯網上的作用越來越大；他們貢獻內容，傳播內容，而且提供了這些內容之間的鏈接關系和瀏覽路徑。在SNS裡面，內容是以用戶為核心來組織的。WEB2.0是以用戶為核心的互聯網。

那麼，這種意義上的WEB2.0，和Tim Berners-Lee的語義網，有什麼不同呢？語義網的出發點是數據的規整及可重復換�韉饔茫�岢鍪褂糜鏌寤�哪諶莘⒉脊ぞ擼?nbsp;試圖從規則和技術標准上使互聯網更加有序。 Google等搜索引擎，在沒有語義網的情況下，盡可能的給互聯網提供了線索。 WEB2.0則是鼓勵用戶用最方便的辦法發布內容（blog/podcasting），但是通過用戶自發的（blog）或者系統自動以人為核心（SNS）的互相鏈接給這些看似凌亂的內容提供索引。因為這些線索是用戶自己提供，更加符合用戶使用感受。互聯網逐漸從以關鍵字為核心的組織方式和閱讀方式，到以互聯網用戶的個人portal（SNS）為線索，或者以個人的思想脈絡（blog／rss）為線索的閱讀方式。WEB2.0強調用戶之間的協作。WIKI是個典型例子。從這個角度看，互聯網是在變得更有序，每個用戶都在貢獻:要麼貢獻內容,要麼貢獻內容的次序.

對下一代互聯網的看法，還會有很多的討論。有一點可以肯定，WEB2.0是以人為核心線索的網。提供更方便用戶織網的工具，鼓勵提供內容。根據用戶在互聯網上留下的痕跡，組織瀏覽的線索，提供相關的服務，給用戶創造新的價值，給整個互聯網產生新的價值，才是WEB2.0商業之道。（作者為MOP網董事長兼CEO）

WEB2.0將成就新一輪網站創業、變革的狂潮

很感謝web2.0這個概念的誕生，它讓互聯網又煥發了新的活力，並吸引著資本流向web2.0，無數具有創新意義的web2.0網站應運而生，短短的幾個月時間，圈內圈外關於web2.0的爭議、討論已經引起了創業者和投資者的廣泛關注。如果你在IT圈混，而且你想獲得風險投資，你想立即創業致富，那你最好了解web2.0，吃透web2.0，創立web2.0，因為國外投資商已經認定web2.0前途無限。不知道是否新一輪網路泡沫的誕生還是新一輪網路變革的機遇，web2.0反正給我們帶來了激情。

what』s web 2.0？Wikipedia中有相應的描述，不過仍然含糊不清，不能作為web2.0的准確定義。有的說web2.0可定義為「可寫的互聯網」，這也不完全准確。關於web1.0和2.0的區別，我很贊同呂欣欣的一番比較，"web1.0天天談門戶，web2.0談個人化；web1.0談內容，web2.0談應用；web1.0商業模式，web2.0談服務；web1.0談密閉、大而全，web2.0大家談開放、談聯合；web1.0網站中心化，web2.0談個人中心化；web1.0一對一，web2.0談社會性網路；web1.0不知道你是狗，web2.0你去年夏天幹了什麼我一清二楚甚至想要干什麼呢。。。"

我認為的web2.0的典型特徵和表現形式：個人出版和聚合(如blog,rss,atom)、社會協作(wiki,軟體工程協作)、更好的用戶體驗（如簡短的url、ajax技術）、開放APIs(Flickr、del.icio.us、Bloglines)，用戶參與佔主導(sns,blog,社會化書簽,網摘)。除此之外我還認為網路游戲也具有web2.0的性質，因為它講究社會協作、講究用戶參與佔主導，講究給用戶帶來更好的體驗。

新事物新概念的誕生，總是會存在反對意見的，國外的就不說了，國內老冒的"朝web 2.0潑點冷水"、周天舒的"給「所謂的」Web 2.0潑點熱水"，都從技術角度分析認為web2.0是早就已經使用的技術，這有些讓我失望，因為他們的觀點走向了狹隘，沒有看到後面的本質。也許web2.0的幾種表現形式早就有了，例如rss,blog,ajax等等都已經有年頭了，但是真正大規模應用卻是在近期，個體現象的發展與匯合逐漸被提煉成一種模式、理論和概念，這就脫離了其表現形式這一技術外殼所賦予的基本內涵，通俗點說這就是"量變到質變"的一個革命性的過程，這是對表面現象的更深層次的發掘和提煉，帶有更具變革更具創意更具激情的深刻含義。

在如今傳統的互聯網模式越來越單一，並逐漸走向了死胡同，僅靠服務商自身的滑鼠＋水泥來造就龐大的內容平台和用戶數量，這樣的模式如今已經受到嚴峻挑戰。而web2.0的浪潮已經席捲了全球最知名的網路巨頭：yaohoo、msn、google等，國內的門戶網站首當其沖需要進行web2.0變革，而其他網路應用，如求職招聘、同學錄、分類信息、b2b、b2c等各類網站都需要經過web2.0的改造，來面對新的挑戰和沖擊。

普通用戶也許不需要知道sns,web2.0等概念，但作為互聯網的創業者、參與者、投資者，你不能只做旁觀，你需要行動起來，機會就在眼前。

web2.0讓我感受到了互聯網新一輪發展的巨大機遇，也讓我感受到了互聯網尋求突破創新的迫切。當然除了國內國外的常用web2.0模式以外，我也一直在探尋著整合性質的web2.0，傳統應用的web2.0化以及更合適的web2.0的創業模式，歡迎大家有空交流。

全民上網到全民織網 Web 2.0掀起人民戰爭

作者： CNET科技資訊網
CNETNews.com.cn 2005-07-05 09:0 AM

Web 2.0 正在讓互聯網逐漸找回Internet的真正含義：平等、交互，去中心化。你不應該只是互聯網的讀者，你也應該是互聯網的作者；你不該只是在互聯網上沖浪，你本身就是波浪製造者。Web 2.0 之於Web 1.0 ，如同分布式計算之於集中式計算，網格之於大型主機。

CNET科技資訊網7月5日北京報道（文/高飛）當Internet的創立者利克·李德在1963年提出「超銀河網路」（Internet的前身）時，他想的是如何讓計算機和網路幫助人們溝通和思考，如何讓網路「去中心化（Decentralization）」。但在上世紀90年代初雅虎等超級門戶網站出現之後，互聯網的發展卻一度遠離利克。李德的初衷。

雅虎、亞馬遜，和中國網路、搜狐等超級網站憑借強勢的內容，常年駐扎在網民的收藏夾中。網民們美其名曰的「網上沖浪」其實就是圍繞這些網路「恆星」所作的圓周運動，網民僅僅充當互聯網的讀者，而不是作者，這時的互聯網是「只讀」的。但Web 2.0 的出現，結束了了網民周期性趕集運動。

Blog作者Keso說：「在Web 1.0 時代，我們所能做的，就是各處瞎逛，並美其名曰——沖浪（即Web 瀏覽）。Web 2.0 帶給我們的，是一個可以讀寫的互聯網，Blog、Wiki等是其中的代表。」

藉助Web 2.0 ，一個不僅「可讀」，而且「可寫」和「可交互」的互聯網正逐漸浮出水面。利克·李德30多年前的夢想正逐漸被實現。

Blog：個人媒體崛起

在Web 2.0 的世界中，Blog（中文翻譯作「網志」、「博客」）絕對是個「招牌菜」，它已獲得了廣泛的知名度。

「911 事件」是Blog發展史上的里程碑階段。人們發現，恐怖事件現場當事人建立的Blog才是最可能給出第一手和最真實信息的人。一個重要的博客類戰爭Blog（WarBlog ）因此繁榮起來。「對911 事件最真實最生動的描述不在《紐約時報》，而在那些倖存者的Blog中」一位Blog作者寫道。

在中文世界，讓「博客」一舉成名的人當屬「木子美」，她對個人隱私毫不避諱的曝光，完全顛覆了中國人的倫理傳統。網民們蜂擁而至「木子美」的Blog，「木子美」私生活曝光的同時，Blog也走進大眾傳播領域。

Blog並不是一個充滿技術含量的概念，為了便於理解，你甚至可以把它看作以時間為順序更新的個人主頁。Blog的可貴之處在於，它讓世人認識到，寫作並不是媒體的專利，新聞也不是記者的特權。再眼疾手快的記者也不如在現場的人更了解事實。目擊者的Blog比新聞記者擁有更高的權威和更接近事實的判斷。

在亞洲，韓國人Oh Yeon Ho創立的Blog網站已經成為韓國重要的媒體力量，通過發動全社會的力量，無論是韓國總統盧武鉉遭彈劾事件，還是韓國人金善逸在伊拉克遭到綁架並被殺害事件，都走在了韓國各大媒體的前列。這個網站的一條新聞上竟然有85000 條評論，遠超過其他媒體互動水平。

著名矽谷IT專欄作家丹·吉爾默總結說，Blog本身代表著「新聞媒體3.0 」。1. 0 是指傳統媒體或說舊媒體（O l d Media ，如「晚報、CCTV」），2.0 就是人們通常所說的新媒體（New Media ，如網路、雅虎）或者叫跨媒體，3.0 就是以Blog為代表的（We Media）的個人媒體或者叫自媒體。

Blog發展到現在，內容已並不僅局限於文字。圖片、音頻和視頻都是可選項，而音頻B l o g 就有一個自己的名字——Podcast （國內有翻譯為「播客」）。Blog搭起從互聯網閱讀時代到寫錄時代的橋梁。

模糊編輯和讀者的角色

在Blog完成了對Web2.0的啟蒙教育之後，一系列在其框架下的理念紛至沓來，其中較有代表性的是：Wiki（網路大網路全書）、Social Bookmark（社會化書簽）等等。

Wiki是Web 2.0 體系下的又一個概念。Wiki可以簡單地解釋為由網友自發維護的網路大網路全書，這個大網路全書由網友自發編輯並修改內容，每個人既可以是某個詞條的讀者，又可以是這個詞條的編撰者，讀者和編輯的界限在Wiki中被模糊了。首個Wiki網站的創建者Ward Cunningham說：「我創建第一個Wiki的初衷就是要建立一種環境，我們能夠交流彼此的經驗。」社會化書簽則是與Wiki很相似的概念，它可以讓網民互相共享自己的收藏夾，交換資源。

獨立的Blog並不具備商業網站的推廣能力，這一個個以自我為中心的網路節點如何完成互通與共享？在Web 2.0 體系下，Tag （標簽）， RSS （聚合服務）和六度分隔理論起到了黏合劑的作用。

Tag 直譯為標簽，它可以讓你為自己所創造的內容（Blog文字、圖片、音頻等）創建多個用作解釋的關鍵字。比如一副雪景的圖片就可以定義「雪花」、「冬天」、「北極」「風景照片」這幾個Tag.雅虎剛剛收購的圖片共享網站Flickr就對此提供支持。Tag 類似於傳統媒體的「欄目」，它的相對優勢則在於創作者不會因媒體欄目的有限性而無法給作品歸類。

RSS 則是一種更為直接的互動方式，一般翻譯為聚合服務，它彷彿就是為Blog而生的技術，藉助RSS ，網民可以自由訂閱指定Blog（絕大多數的Blog都支持RSS），也就是說讀者可以自定義自己喜歡的內容，而不是象Web 1.0 那樣由網路編輯選出讀者閱讀的內容。

顛覆媒體中心理念

雅虎首席運營官丹尼爾·羅森格告訴記者，「（對傳統媒體的）顛覆倒不敢說，但RSS 重新定義了信息分享的方法，顛覆了未來信息社會必須有一個核心的理念，雖然RSS 眼下並不會為網路廣告帶來什麼幫助，但是卻能讓所有人更好地分享信息。」

傳統媒體也希望藉此把自己的內容互動起來。數字音頻出版商Audible 正計劃發行紐約時報、華爾街日報和其他一些期刊的Podcast ，通過RSS 網路標准進行發行，用戶可以下載到MP3 播放器中收聽。

曾經有人提出疑問，Web 2.0 的互動與傳統BBS 有何不同？一名叫羅皓菱的Blog作者解釋了Blog與BBS 的區別：Blog是集原創文章、鏈接評價、鏈接、網友跟進於一體的，比起BBS 那種口無遮攔、隨心所欲、良莠不齊的情緒化發言，博客製作的日誌更加審慎、仔細和周詳，其單個文本的豐富性、討論脈絡的清晰度、論題的拓展空間都超過了BBS 的網友發言帖子。

Ward Cunningham 也談到過Wiki與BBS 的差別，他認為BBS 沒有上下文的概念，討論經常無法持久地進行。討論組反復圍繞著同一個話題，但是人們經常忘了以前說過什麼。

全民上網到全民織網 Web 2.0掀起人民戰爭（下）
(2005.07.05) 來自：ZDNET

Web 2.0 探索盈利模式

一個新的互動模式，必然伴隨著新的商業模式，或者帶來新的商業機會。

但是因為與Web 1.0 巨大的差異，Web 2.0 在商業模式上現在還處於探索階段。2003年2 月，Google並購了全球最大的博客託管服務網站 Blogger.com 母公司Pyra實驗室。Pyra當時成立僅3 年半，博客注冊用戶已達數百萬、人氣極旺，但由於缺乏收入，三個創始人中的兩個被迫離開公司，如果不是Trellix 公司的CTO Bricklin（也是一個著名博客）出手相助，Pyra早已破產。

不過外界普遍認為，找到Web 2.0 的商業模式應該只是遲早的事情。雅虎、微軟這些傳統互聯網巨頭則並不太在意Web 2.0 當前的商業價值，他們更希望趕快搶占這一陣地。雅虎剛剛推出的Yahoo 360 服務，就是一個包含了圖片上傳、Blog、IM（即時通訊）所有功能在內的個人Web 2.0 平台。微軟也發布了與之類似的MSN Space.微軟非常看好Blog，它甚至僱傭一個Blog團隊來為其MSN 門戶網站製作原創內容。

在中國市場，規模最大的Web 2.0 商業公司是Blog服務託管商（BSP ），其中總部位於杭州的中國博客網目前注冊用戶超過200 萬，並以每月8 到10萬的速度增長。該公司董事長胡之光認為，當用戶數足夠多的時候，博客就能夠通過廣告和無線增值來實現盈利。另外一家BSP 博客中國負責人方興東透露，未來的盈利將來自三個方面：廣告收入、無線增值服務和向博客用戶提供增值服務和應用程序收取的服務費。但是到目前為止，上述兩家都還沒有實現盈利。

不過對一般的企業而言，Web 2.0 的好處則是立竿見影。在企業內部實施Blog和Wiki，可以讓知識輕松共享，一個新員工可以通過內部Wiki 熟悉工作技能，了解企業文化。

Blog作者Keso這樣說：「Web 1.0 提下的HTML、JavaScript等本身是一種語言，它按照某種約定的協議（比如TCP/ IP ）進行對話，但這只是機器與機器的對話，人頂多是讓這場對話存在而已，並未直接參與進來。而Web 2.0 讓人參與到對話中，互聯網一下子就變得生動了起來。

Web 2.0 無疑是一場革命。「

不管Web 2.0 是不是革命，一場以「交互」為核心的互聯網創網路潮已確定無疑的到來。每個人都要在這次互聯網「人民運動」中尋找自己在其中的位置。

Web 2.0 重要名詞解釋

Blog：Blog是個人或群體以時間順序所作的一種記錄，且不斷更新。Blog之間的交流主要是通過反向引用（TrackBack ）和留言/ 評論（Comment ）的方式來進行的。Blog的作者（Blogger ），既是這個Blog的創作人，也是其檔案管理人。

TrackBack ：是一種Blog應用工具，它可以讓Blogger 知道有哪些人看到自己的文章後撰寫了與之有關的內容。這種功能實現了網站之間的互相通告；因此它也可以看作一種提醒功能。

RSS：是一種用於共享新聞和其他Web 內容的數據交換規范。讀者可以通過RSS 訂閱一個Blog，確知該Blog最近的更新。

Wiki：1995年，沃德。坎寧安（Ward Cunningham ）為了方便模式社群的交流創建了全世界第一個w i k i 系統——WikiWikiWeb （http://c2.com/cgi/wiki），並用它建立了波特蘭模式知識庫，在建立過程中，沃德。坎寧安創造了Wiki的概念和名稱，並且實現了支持這些概念的服務系統。

Social Bookmark ：社會化書簽，它可以讓你把喜愛的網站隨時加入自己的網路書簽中；你可以用多個關鍵詞（Tag ）而不是分類來標示和整理你的書簽，並與其他人共享。

六度分隔理論：（Six Degrees of Separation ）。1967年，哈佛大學的心理學教授Stanley Milgram （1933～1984）創立。簡單地說：「你和任何一個陌生人之間所間隔的人不會超過六個，也就是說，最多通過六個人你就能夠認識任何一個陌生人。」六度分隔理論的數學解釋是：如果每個人平均認識260 人，其六度就是2606＝1188137600000.消除一些節點重復，那也幾乎覆蓋了整個地球人口若干多倍。

（名詞解釋的主要內容來自Wiki網路大網路全書）

小資料

SNS 以及六度分隔理論

Social Networking Service （簡稱SNS ，社會化網路軟體）是Web 2.0 體系下的一個技術應用架構。SNS 基於六度分隔理論運作，這個理論的通俗解釋是：「在人脈網路中，要結識任何一位陌生的朋友，中間最多隻要通過六個朋友就可以達到目的。」

我們舉個例子更好地介紹六度分隔理論。一位叫做「FLYPI 」的網友用歌手孫燕姿做起了實驗，如何才能與這個「亞洲小天後」建立聯系呢？他認為以下的鏈條可能行之有效：「我→初中同學Eric→ Eric 在南洋理工大學念書的表哥Michael → Michael的教授，也就是孫燕姿的父親→孫燕姿。」

放在Web 2.0 的背景下，每個用戶都擁有自己的Blog、自己維護的Wiki、社會化書簽或者Podcast.用戶通過Tag 、RSS 或者IM、郵件等方式連接到一起，「按照六度分隔理論，每個個體的社交圈都不斷放大，最後成為一個大型網路，這就是社會化網路（SNS ）。」

Google推出1GB 免費信箱也是一個SNS 應用，通過網友之間的互相邀請，Gmail 在很短的時間內就獲得了巨大的用戶群。

SNS 還處於起步階段，對於它的商業價值和未來的發展方向，現在也沒有一個統一的認識。

|

2. 基於本體的語義web服務組合，這裡面的本體是什麼意思

本體是對相關領域中的概念及概念之間的關系的一種形式化描述，它是從哲學領域中借鑒過來的概念，在語義網中，本體是核心和基礎的東西，當我們把一個領域中的概念用本體來描述後，實際上就形成了一個規范或標准，這樣，不同平台的應用系統就能共同遵從這一規范化的描述，形成對同一概念的語義共識，從而最終達到「機器理解」的目的。
可以看看一些關於語義Web的書籍，裡面一般都有非常詳細的介紹。

3. 如何理解 web 語義化

語義化的HTML結構怎麼理解
關於html結構的面試題，語義化的html占據了很大一部分。那麼為什麼要使用語義化的HTML？語義化的HTML到底有什麼好處呢？

HTML是提供網頁文檔內容的上下文結構和含義；html本身是沒有表現的，我們看到例如<h1>是粗體，字體大小2em，加粗；<strong>是加粗的，不要認為這是html的表現，這些其實html默認的css樣式在起作用，所以首先我們要知道html和頁面的表現是沒有關系的，這些是css的事情。HTML在頁面中的作用就是結構和含義，通俗點說就是劃分內容，這里放什麼，我們放的是什麼。
語義化的HTML結構首先要強調HTML結構
HTML結構是頁面的骨架，一個頁面就好像一幢房子，HTML結構就是鋼精鋼筋混泥土的牆，一幢房子如果沒有鋼精鋼筋混泥土的牆那就是一堆費磚頭，不能住人，不能辦公。css是裝飾材料，是原木地板，是大理石，是油漆，是用來裝飾房子的，CSS的強大就不用多說了，css如果沒有html結構那就是一堆木板，一同油漆，沒有了實際使用價值。CSS完全依靠引用它的(X)HTML文檔。如果你想使CSS的能力充分發揮到極致，提供一個用既干凈又有結構的內容的html是非常必要的，「HTML是在互聯網上發布超文本的通用語，HTML使用標簽來對文本結構化」。
語義化的HTML結構怎麼寫？
HTML是一種對文本內容進行結構和意義（或者說「語義」）進行補充的方法。它會告訴我們說：「這行是一個標題，這幾行組成了一個段落。這些文字是項目列表，這些文字是鏈接到互聯網上另一個文件的超鏈接。」值得注意的是，不應該讓HTML來告訴我們：「這些文字是藍色的，這些文字又是紅色的。這部分內容是最最靠右的一欄，這行內容是斜體字。」這些和表現相關的信息是CSS的工作。在做前端開發的時候要記住：HTML告訴我們一塊內容是什麼（或其意義），而不是它長的什麼樣子。當我們提到「語義標記」的時候，我們所說的HTML應該是完全脫離表現信息的，其中的標簽應該都是語義化地定義了文檔的結構。
語義化的HTML結構其實很簡單，首先掌握html中各個標簽的語義，<div>是一個容器；<strong>是表示強調；<ul><li>是一個無序列表等等…在看到內容的時候想想用什麼標簽能更好的描述它，是什麼就用什麼標簽。

語義化的HTML結構到底有什麼好處？
我們知道HTML5新增的標簽，比如<header>和<footer>，html正在朝著更加健壯的語義化的HTML結構發展，xhtml2在這點上沒html5先進，這也是xhtml2死亡的一個原因，這一點也說明語義化的HTML結構是html的發展趨勢。

1.去掉或樣式丟失的時候能讓頁面呈現清晰的結構：
html本身是沒有表現的，我們看到例如<h1>是粗體，字體大小2em，加粗；<strong>是加粗的，不要認為這是html的表現，這些其實html默認的css樣式在起作用，所以去掉或樣式丟失的時候能讓頁面呈現清晰的結構不是語義化的HTML結構的優點，但是瀏覽器都有有默認樣式，默認樣式的目的也是為了更好的表達html的語義，可以說瀏覽器的默認樣式和語義化的HTML結構是不可分割的。

2.屏幕閱讀器（如果訪客有視障）會完全根據你的標記來「讀」你的網頁.
例如,如果你使用的含語義的標記,屏幕閱讀器就會「逐個拼出」你的單詞,而不是試著去對它完整發音.

3.PDA、手機等設備可能無法像普通電腦的瀏覽器一樣來渲染網頁（通常是因為這些設備對CSS的支持較弱）.

使用語義標記可以確保這些設備以一種有意義的方式來渲染網頁.理想情況下,觀看設備的任務是符合設備本身的條件來渲染網頁.
語義標記為設備提供了所需的相關信息,就省去了你自己去考慮所有可能的顯示情況（包括現有的或者將來新的設備）.例如,一部手機可以選擇使一段標記了標題的文字以粗體顯示.而掌上電腦可能會以比較大的字體來顯示.無論哪種方式一旦你對文本標記為標題,您就可以確信讀取設備將根據其自身的條件來合適地顯示頁面.

4.搜索引擎的爬蟲也依賴於標記來確定上下文和各個關鍵字的權重.
過去你可能還沒有考慮搜索引擎的爬蟲也是網站的「訪客」,但現在它們他們實際上是極其寶貴的用戶.沒有他們的話,搜索引擎將無法索引你的網站,然後一般用戶將很難過來訪問.

5.你的頁面是否對爬蟲容易理解非常重要,因為爬蟲很大程度上會忽略用於表現的標記,而只注重語義標記.
因此,如果頁面文件的標題被標記,而不是,那麼這個頁面在搜索結果的位置可能會比較靠後.除了提升易用性外,語義標記有利於正確使用CSS和JavaScript,因為其本身提供了許多「鉤鉤」來應用頁面的樣式與行為.SEO主要還是靠你網站的內容和外部鏈接的。

6.便於團隊開發和維護
W3C給我們定了一個很好的標准，在團隊中大家都遵循這個標准，可以減少很多差異化的東西，方便開發和維護，提高開發效率，甚至實現模塊化開發。
如有不同觀點，補充，歡迎留言討論。

4. web2.0是什麼意思

Web2.0 是相對於Web1.0的新的時代。

指的是一個利用Web的平台，由用戶主導而生成的內容互聯網產品模式，為了區別傳統由網站雇員主導生成的內容而定義為第二代互聯網，web2.0是一個新的時代。

拋開紛繁蕪雜的Web 2.0現象，進而將其放到科技發展與社會變革的大視野下來看，Web 2.0可以說是信息技術發展引發網路革命所帶來的面向未來、以人為本的創新2.0模式在互聯網領域的典型體現，是由專業人員織網到所有用戶參與織網的創新民主化進程的生動注釋。

Web2.0模式下的互聯網應用具有以下顯著特點：去中心化、開放、共享。

1、用戶分享。在Web2.0模式下，可以不受時間和地域的限制分享各種觀點。用戶可以得到自己需要的信息也可以發布自己的觀點。

2、信息聚合。信息在網路上不斷積累，不會丟失。

3、以興趣為聚合點的社群。在Web2.0模式下，聚集的是對某個或者某些問題感興趣的群體，可以說，在無形中已經產生了細分市場。

4、開放的平台，活躍的用戶。平台對於用戶來說是開放的，而且用戶因為興趣而保持比較高的忠誠度，他們會積極地參與其中。

5. 知識圖譜：方法、實踐與應用筆記-第2章知識圖譜表示與建模

描述邏輯(description logic)是一簇知識表示的語言,其以結構化、形式化的方法來表示特定應用領域的知識.作為一類用於知識表示的形式化工具,描述邏輯在信息系統、軟體工程以及自然語言處理等領域得到了廣泛的應用[1].特別是在第三代Web——語義網(semantic Web)中,描述邏輯更是扮演著關鍵角色,並成為W3C推薦Web本體語言OWL的邏輯基礎。

現代知識圖譜通常是以三元組為基礎進行簡單的知識表示，弱化了對強邏輯表示的要求。

基於向量的知識表示在現代知識圖譜中越來越收到重視，因為基於向量的知識圖譜表示可以使這些數據更易於和深度學習模型集成。

基於向量的知識表示：知識表示學習的定義知識表示學習是將知識庫中的知識表示為低維稠密的實體向量，即Embedding。知識圖譜是由實體和關系組成，通常採用三元組的形式表示，【head(頭實體)，relation(實體的關系)，tail(尾實體)】，簡寫為(h，r，t)。知識表示學習任務就是學習h，r，t的分布式表示（也被叫做知識圖譜的嵌入表示(embedding)）。

一階謂詞邏輯：用變數和謂詞來表示知識。

霍恩子句：帶有最多一個肯定文字的子句。有且只有一個肯定文字的霍恩子句叫做明確子句，沒有任何肯定文字的霍恩子句叫做目標子句

霍恩邏輯

語義網路：三元組（節點1，聯想弧，節點2）

框架：基本單元為類（槽，側面）。基本單元表示一類事物嗎？

描述邏輯：一階邏輯的一個可判定子集，即每個描述邏輯中的命題都可以在有限時間內完成證明或證否，只有極少數的描述邏輯類型被認為是不可判定的。利用一階邏輯對語義網路和框架進行形式化後的產物？描述邏輯方法多數被用到涉及知識分類的應用領域，如數字圖書館和面向萬維網的信息處理。描述邏輯是當前語義網發展中本體的理論基礎。例如， OWL 網際網路本體語言就是一種描述邏輯 SHIOQ (D) 的語法形式。

一個描述邏輯系統中的名字可分為概念（concept），屬性（role）和個體（indivial）。例如，一個用描述邏輯描述的知識庫如下：

男人人（男人是人）

丈夫男人婚配於人（丈夫是婚配於至少一個人的男人）

男人(張三) （張三是一個男人）

其中，「男人」、「人」、「丈夫」是概念，「婚配於」是屬性，「張三」是個體

描述邏輯和一階謂詞邏輯的區別？

RDF/RDFS :DBpedia,Yago,Freebase

統一資源標識符（英語： U niform R esource I dentifier，縮寫： URI ）在電腦術語中是一個用於標識某一互聯網資源名稱的字元串。

該種標識允許用戶對網路中（一般指萬維網）的資源通過特定的協議進行交互操作。URI的最常見的形式是統一資源定位符（URL），經常指定為非正式的網址。更罕見的用法是統一資源名稱（URN），其目的是通過提供一種途徑。用於在特定的名字空間資源的標識，以補充網址。

OWL/OWL2 : 我認為就是在RDF的基礎上再加一些約束。

OWL2QL為查詢設計的；OWL2EL提供多項式推理，專為概念屬於描述，本體的分類推理而設計，廣泛應用於生物醫療領域，如臨床醫療術語本體SNOMED CT;OWL2ET的分類復雜度是Ptime,用於推理（後兩個區別？）

查詢語言SPARQL

語義Markup表示語言：在網頁中嵌入語義Markup的方法和表示語言。主要包括JSON-LD、RDFa和HTML5 MicroData。

Freebase：對象-object、事實-Facts、類型-Types和屬性-Properties.

Wikidata：頁面-Page、實體-Entities、條目-Items、屬性-Properties、陳述-Statements、修飾-Qualifiers、引用-Reference等。

ConceptNet5:概念-Concepts、詞-Words、短語-Phrases、斷言-Assertions、關系-Relations、邊-Edges。包含21種預定義的、多語言通用的關系。

詞的向量表示方法：獨熱編碼、詞袋模型、詞向量

詞向量的產生方法中經典的額開源工具word2vec中包含兩個模型cBoW和Skip-gram。

cBoW和Skip-gram都是用來訓練word embeding的。

cBow和Bow的區別：Bow用於一段文本，是一種思想；cBow是把Bow的思想通過滑動窗口用於此向量的實現。

TransE是一個演算法，用於graph enbeding.

word enbeding是將文本變成向量；graph emdeding是將實體和關系變成向量。

思考如何從word embeding變成graph embeding?

代表性知識圖譜介紹：

1. SNOMED CT

SNOMED CT （ S ystematized No menclature of Med icine -- C linical T erms，醫學系統命名法－臨床術語，醫學術語系統命名法－臨床術語），是一部經過系統組織編排的，便於計算機處理的醫學術語集，涵蓋大多數方面的臨床信息，如疾病、所見、操作、微生物、葯物等。採用該術語集，可以協調一致地在不同的學科、專業和照護地點之間實現對於臨床數據的標引、存儲、檢索和聚合。同時，它還有助於組織病歷內容，減少臨床照護和科學研究工作中數據採集、編碼及使用方式的變異。(From wiki)

SNOMED CT目前包括大約321 900條概念（Concept）、超過80萬條臨床概念相關的描述（Descriptions），和超過700萬條進一步描述概念的關系（Relationships）。

SNOMED CT的主要內容包括概念表、描述表、關系表、歷史表、ICD映射表和LONIC映射表。其中核心構成是：概念表（按層級結構組織的具有臨床含義的概念表）、描述表（用於表達概念的人類自然語言表）和關系表（用來說明的兩個臨床概念之間的關系）。

semanticweb

Web2.0 是相對於Web1.0的新的時代。

與semanticweb相關的內容