semantic-seo

還未懂得 Semantic SEO ? 小心被對手網站拋在後面!

Table of Contents

最近有一個案例可以展示這個概念,查詢者是一位醫生的姐姐,當別人在 Google 搜尋該醫生的名字後,Google 會出現一個討論區的貼,標題內容大概是﹕「xxxx 醫院,垃圾醫生」

不尋常的地方是,整個討論區的貼,不論是標題、內容、貼文、回覆,從來沒有提及這個醫生的名字,英文名字也沒有。為何搜尋結果會出現這個貼呢? 經過仔細調查,最有可能的地方是,這個醫生屬於這間醫院,同時亦是屬於其中一個專科部門。

問題在那裏呢?

原來討論貼所指責的醫生,是一位已經離職的醫生,這個可以說是躺著也中槍,Google 今次錯了!

傳統搜尋引擎優化一向以來是「關鍵字」為單位,就是 Google 透過計算網頁內容的 「關鍵字」數量或出現次數來判斷文章的相關性。因此,早期做 SEO 優化的策略,就是生硬地把「關鍵字」塞入網頁,令 Google 認為該網頁的內容跟「關鍵字」有關。

不難理解的是,這個做法令結果很不理想,於是 Google 不停想方法令搜尋結果質量更好, Google 致力於理解文字中的內容,它想更明白字詞與字詞的關係,進而了解整個內容的意思。

什麼是 Semantic SEO 呢?

Semantic 中文解作語義,為了提高搜尋結果的質素,搜尋引擎需要知道搜尋者 (Context)不同資訊、例如背景、環境、文法、上下文、語境等去充分了解一個搜尋意圖,然後才能顯示出理想的搜尋結果。

我暫未找到一個 Semantic SEO 的一個通常譯法,固且直譯為語義 SEO 吧!

語義 SEO 的操作方法就是在網站內容上提供足夠的資訊 (metadata),包括語義相關的文字、內容、背景等令搜尋引擎更了解網站,提高網站流量。之前的 <<[網站 SEO 邏輯 ] Google 如何用人手判斷它的搜尋結果>>曾經介紹過 Google 如何用人手判斷網站的質素,部份編章提及搜尋意圖,不妨回顧一下。

事實上,Google 最近的 BRET 更新便跟意義有關。Google 利用 NLP (Natural Language Processing) 學習及了解文字及內容,從而提出最理想的搜尋結果。

Google 現在可以觀察一整段文字從而判斷出整個內容是偏向正面、中性還是負面。舉個例子,若發現內容有這些字  “great”, “guru”, “hero”, “outstanding”,Google 很有可能把內容判斷為正面。

而當句子有 “hate”, “weak”, “stubborn”, “boring”, “danger”,則可能會認為內容為負面。(更多關於 NLP 與 BRET 更新,可參考以下文章)

Google 會計算全部不同字眼的數量,然後作出計算﹕

0.25 – 1.0 是正面 -0.25 – 0.25 是中性 -1 – -0.25 則是負面

但這跟你做 SEO 時有什麼關係呢?

最直接的關係就是當你製作內容時,你要首先觀察搜尋結果是偏向正面、中性還是負面。倘若頭10 個搜尋結果都是偏向負面,你的內容是正面的話是很難排上的。

Google 其實已經補捉搜尋者夠竟想要什麼結果,是要長答案還是短答案。你會發現越來越多的搜尋結果都不再只是 10 個藍色的搜尋結果,很多時已經變成一個個框框,例如

當 Google 清楚了解你的內容,並知道你網站提供的資訊充足,你的網站便有機會出現在「Featured snippets」中文翻譯為「精選摘要」。

或者當你向 Google 提出問題時﹕

Google 能夠直接告訴你答案,而你不需要再走進網站慢慢搜尋,它是如何做到呢?

其運作原理就是跟 Semantic Web 有關 – 舉一個例子,「蘋果」這個詞語在不同語境下意思會不同,當你想買新手機時,「蘋果」指的是「蘋果」公司,當你想找富士「蘋果」時,找的是一種水果。因此,Google 要知道你的找的是那一種 「蘋果」,同時亦要知道網站內容指的是那一個 「蘋果」。

你可以想像 Google 像一個小朋友,首先從單字學習,進而學習單字與單字之間的關係。例如學懂單字 Apple 及 Orange,然後開始理解它們都是水果的一種。

Google 就是透過龐大數據,去理解及學習如何把不同的字,演變成內容,然後把不同內容建立關係。這種學習方法有一個術語叫作自然語言處理 (英語:Natural Language Processing,縮寫作 NLP)。

2012 年,奇點大學創辦人及未來學者家 Ray Kurzweii 到 Google 進行一個項目﹕「令搜尋引擎理解人類的語言」。由此時開始,Google 進行了多次演算法更新,包括知名的 Hummingbird 更新。2016 年,Google 發佈了 RankBrain,這是一種機器學習的模式,可幫助識別與用戶查詢字串相關,但實際上可能包括查詢關鍵字的網頁,根據 Google 說法,在 200 多個網頁排名因素當中,RankBrain 的意見是 3 大重要因素之一。(資料來源﹕<<未來地圖>> Tim O’Reilly)

為何語義 SEO 越來越重要?

最直接的原因就是 Google 最終的目的是徹底了解人類搜尋的目的 (搜尋意圖),Google 變得越來越聰明,它再也不只是單憑你網站的關鍵字判斷內容,就像一開始所講的案例,而是研究及理解整個內容脈絡,從而提供最優質的搜尋結果。

曾經在一篇提及未來 SEO 方向的文章中說過,語音搜尋將會變成大趨勢,我們在做語音搜尋這個動作時,很多時是提及一整個問題,而不再單單是一個「關鍵字」,因此,Google 不斷投放更多資源去理解人類說話背後的動機,在理解內容這個能力將會不斷提高。在 2019 年的 SEO 年度大會裏,亦提及語義的理解是 2020 的 SEO 趨勢之一,真的不能忽略。

什麼是知識圖譜 Knowledge Graph ?

這個便是由 Google 知識圖譜提供的資訊

各位有否看過或玩過一個叫 「大電視」的遊戲 ?

玩法是2個人一組,電視會出現一個詞語,一個人給提示,一個人估。給提示的不能提及電視中的文字,但可以提及跟這個文字相關的資訊,例如是否名詞、一個物件、幾時用等。估的人透過連結所有這些提示猜出答案。

其實這個連結關係就像知識圖譜的結構,Google 把這些關係記下並有組織成一幅地圖。機器始終不是人類,沒有一種語言,它靠理解關係去認識或了解一個新的詞語。為了令機器學習得更快,Tim Berners-Lee於2006年就提出了Linked Data,是一種全球資訊網資料上建立語意關聯的方法。

根據維基﹕Google知識圖譜(英語:Google Knowledge Graph,也稱Google知識圖)是Google的一個知識庫,其使用語意檢索從多種來源收集資訊,以提高Google搜尋的品質。

據Google稱,知識圖譜的資訊來自許多來源,包括CIA的世界概況,Freebase和維基百科[1]。其功能與Ask.com和Wolfram Alpha等問題問答系統相似。截至2012年,其語意網絡包含超過570億個物件,超過18億個介紹,這些不同的物件之間有連結關係,用來理解搜尋關鍵詞的含義。

因此,如果你能告訴 Google 你的某部份內容跟這個語意網絡所指的為同一件事情,Google 便可以更了解你的網站內容了

Amazon 知識圖譜

以上是 Amazon 為其 Neptune 資料庫服務繪製的知識圖譜,你可以看到每一個圓型入面都在答一個問題。例如「Mona Lisa 究竟是誰創作的?」,又或「Eiffel Tower 夠竟在那個國家?」,而你可以從每個圓型的圖中找到關係。搜尋引擎 (對,Amazon 在美國人裏其實都已經是一個搜尋引擎) 就是透過理解這些關係去學習。

Semantic Web (語意網絡) 就是一個以關係為基礎的網絡 ,Semantic SEO 即透過用機器能明白的語言 (mark-up)令 Google 把網站的排名提高。

什麼是Entity ?

在語意網絡的世界,Entity 幫助電腦理解關於一個人、一間機構、一個地方的所有資訊。每一個 Entity 都會回應一個問題,例如﹕「誰是 Donald Trump?」,「Donald Trump 住在那裏?」(字典裏有個解釋叫「實體」,但我了解後又覺得不合適,因此用回英文的 Entity)

每一個 Entity 都會連結到另一個 Entity,形成一個關係網。另外……

像上圖 Amazon 的例子,Entity 就是每一個圓形入面的內容……但……

為何 Entities 比起傳統關鍵字更有效呢?

主要原因有 3 個﹕

  • Entities 相互連結
  • 只有一個意思 (關鍵字同時可能有多個意思)
  • 能夠根據語境判斷內容

透過 Entities,你可以產生搜尋引擎可以閱讀、理解及演繹的內容,令搜尋效果更好! 但這些 Entity 怎樣連在一起呢?

什麼是 Schema.org ?

就像每一個英文單字需要文法才能表達一個意思,這些 Entity 的關係亦需要一些像文法般的規則及標準,而被搜尋引擎所採納的規則就是 Schema.org

事實上,網絡世界有多套文法準則,但 Schema.org 是由搜尋引擎製造的,自然對我們來說最為重要。自 2011 年起,世界最大的搜尋引擎包括 (Bing, Yahoo 及 Google) 都開始用 Schema 去理解及描繪網頁內容。

我們做 SEO 的就是要為自己的網站做好這個結構化標記 (Schema Markup),做好這些標記後,搜尋引擎便可以透過這些結構化資料提高使用者體驗,例如在搜尋結果上顯示更多的額外資料﹕

如何製作有利於語義 SEO 的內容?

閱讀了大量資料後,主要有兩個做法,其中一個做法要懂一點電腦語法。

先談簡單一點的方法,傳統的 SEO 寫作方法是先搜尋「關鍵字」,然後跟據關鍵字製作內容,方向比較隨心。Semantic SEO 的內容製作則由主題出發 (不再集中在關鍵字),透過研究及加入主題相關的內容,令搜尋者感覺得到全方位資訊,像是在閱讀維基般。

在開始製作內容時,這裡有兩個方向可以供各位參考﹕

  1. 先觀察搜尋結果的特徵
  2. 準備一系跟你主題相關的問題及關鍵字

國外有些 SEO 公司已經開始不同的統計,例如頭10個搜尋結果出現最多的詞語是那一個? 最需要提及的重點有那些?

先觀察頭 5 個搜尋結果的特徵

你應該寫什麼內容?

其實 Google 的搜尋結果已經告訴了你什麼內容最好,是要長篇內容還是短編容? 是否解決了一些問題等 ?

很多客人寫內容時很隨心,基本上我手寫我心,腦內有什麼就寫什麼,但其實 SEO 一個重要原素就是內容規劃。

因為 Semantic Web 的特性 – 解答問題,因此透過清晰明確的內容、良好的文章結構提供有效的內容。以下是一系列問題可以替你在開始寫作內容時有點頭緒,整理出對 Semantic Web 最有利的內容﹕

開始寫作前的工作

A) 目標清晰 ! 你想說些什麼及為何要說這個?

你可以用以下問題引導自己 (我用這篇文章作為例子)

  1. 這篇文章內容是關於什麼?
    • 這篇文章主要介紹 Google SEO 語意搜尋運作原理及操作手法
  2. 有什麼需要 (NEEDS) 及 問題 (PROBLEMS) 需要被解決?
    • SEO 已經不再只是反向連結及關鍵字,這一套已經慢慢失效
  3. 這篇文章是否有提供一些新主意或解決方法?
    • 透過告訴讀者做好內容規劃,及利用 WordPress 插件做好標記令 Google 更易理解內容
  4. 這篇文章是給誰看的?
    • 對 SEO 有基本認識的網站擁有者,並想在搜尋結果上得到更好排名的人
  5. 閱讀這篇文章的人會得到什麼好處嗎?
    • 節省理解及學習語意的時間
    • 如何在寫文章內容時同時兼顧語意 SEO
  6. 這篇文章有那幾個重點?
    • 解釋什麼是語意 SEO
    • 在網站內容規劃上要注意的地方

現在當我寫文章前,我都會收集一系列與我內容相關的問題,然後因應搜尋意圖安排次序

B) 製作一個 Mindmap,把你腦中想到的內容寫出來,然後想一想怎樣把他們連結起來

  1. 這篇文章,你最主要談及的 3 件事包括  _____________ , _____________ , _____________?
  2. 這 3 件事怎樣連結在一起 ?
  3. 你如何有條理或合邏輯地表達這 3件事以及它們之間的關係?

C) 實際操作時,你可以

  • 找尋在高排名網站頁面上共同出現的詞句
  • 把這些相關詞句加入內容
  • 用這些相關詞句為瞄點關鍵字 (Anchor Text)

結構化資料標記協助工具

結構化資料標記協助工具可協助您為網頁上的元素加上標記,以便 Google 解讀網頁上的資料。一旦 Google 更清楚解讀您的網頁資料,就能在 Google 搜尋中以全新的面貌呈現您的資料,並吸引更多目光。

這個便是由 Google 知識圖譜提供的資訊這個工具可以協助你替自己的網站加上標記,首先你要逐樣資料標記,文章通常會有作者、日期、內容、圖片等,然後工具便會製作一個用 HTML 檔案,你只要把這些編碼加入網站便可以了。

倘若對程式碼不熟悉,可以用回 Google 資料螢光筆

另一個做法則是在網站中建立 Entity,並把 Entity 連結到外部的公開資料庫  (open vocabulary),令 Google 更易了解 Entity 的確實意思。

不用把 Entity 想得太複雜,可以想像你為網站部份特別的字詞建立一個獨立頁面去解釋,並把它定義為其中一種資料類型。Search Engine land 的例子,它為 Knowledge Graph 這個詞語建立了特定頁面解釋﹕

我是透過 WordPress 的付費軟件 Wordlift 完成的。為了更理解什麼是 Semantic SEO,我曾經多次跟 Wordlift 的程式員聯絡,在建立 Entity 的過程中也遇到不少問題,也因此需要更多一點時間才能給予 Wordlift 的評價。

 LSI 關鍵字工具有用嗎?

如果各位曾經做優化,應該見過一個字叫 “LSI Keywords”,LSI 全寫是 Latent Semantic Indexing。

我曾經鼓勵加多些 LSI 關鍵字入自己的文章內,亦鼓勵各位用 LSI 關鍵字工具找出 LSI 關鍵字。令 Google 知道你的網頁跟那一個題目有關,提升排名。但原來 LSI 內的 Semantic 跟 Semantic Web 的定義是不同的。

貝爾實驗室在 1990 年曾經發表 LSI 研究報告,其樣本大小只有少過 10000 份文件,而且這個時候的 LSI 跟關鍵字密度有著更重要關係 (不是語意),我的意思是 LSI 關鍵字對 SEO 有幫,但並不是跟語義 SEO 有直接關係。

什麼是LSI?

舉例來說關鍵字「SEO優化」他的LSI可能有「SEO網站優化」、「SEO優化教學」、「網站SEO優化」,都是和原關鍵字相關。

Google會因為LSI判定你的內容主題都是和SEO優化相關,而不是關鍵字和內容不符,確保受眾能看到他們搜尋之後真的想看到的內容。

以下這個部份有少少離題,但其實 Google 每日都用數據持續調校其演算法,但我發覺很多人把 SEO 想得太複雜,其實有時優化遠比你想像中簡單!

數據如何驅動搜尋引擎?

Google 前設計者,吳軍博士在 <<超級智能時代>>有幾個論點對於理解數據如何令 Google 成為世界第一的搜尋引擎

  1. 機器不懂推理或始終沒有人類那麼好,但對收集數據比人類好
  2. 因此,機器學習主要從大埋數據中找出相關性。書中舉的例子是,零食廣告在電影網站的成效特別好,這個很易理解,看電影吃零食不難明白。但在咖啡評論網站上,放上樓按廣告效果特別好這個就令人摸不著頭腦。
  3. 而以上的觀察全部基於數據,Google 現在擁有的就是全世界最大的數據
  4. 站在搜尋引擎的角度,搜尋品質跟數據數量有極大關係。
  5. 因此搜尋引擎會收集很多使用者的體驗數據,其中﹕

今天,各搜擎引擎都有一個測量使用者,點擊數據和搜尋結果相關性的程式,被稱為點擊程式。隨著數據量的累積,點擊程式對搜尋結果排名的预測越來越準確,重要性也越來越大。

它在搜尋排序中至少占 70 – 80% 的比重,也就是說,搜尋演算中其他所有因素加起來,都不如它重要。

總結

語義 SEO 相對上較少人談論,做法亦要時間研究。雖然反向連結 (Backlink) 及關鍵字仍然是 SEO 的其中一個重要原素,但隨著 Google 變得越來越聰明,關鍵字的重要性的確被調低了一點。

語義 SEO 令你可以更準確地告訴  Google 網站內容,並跟公開的資料庫接軌,不僅搜尋更易理解,對用戶來說,資料會更充足。

當然,像文章開首的例子,Google 還未至完美,但可以肯定的是搜尋結果只會越來越準確,這會是正在急促發生的事,各位要為自己網站做好準備!

如果你想透過 SEO 提高公司網站排名的話

你可以試一試我們好評如潮的 SEO 服務

唔信? 聽下其他人點講 !

1分鐘讓我說服你做 SEO

Estee Lauder 創辦人曾經講過﹕「我人生從來沒有一天工作不做行銷,如果我相信一件事,我會推銷它,而且我會努力推銷。」 我深信 SEO 可以為你公司帶來正回報,一定有把它納入你的行銷策略之一 !

SEO、網店行銷⋯找不到想看的文章?

到我的SEO知識整理目錄看看吧!

與我聯絡