SEO - XML 站點地圖



站點地圖:它是什麼?

一個列出您網站的網頁、影片和其他資源以及它們之間連線的文件。搜尋引擎蜘蛛檢查此檔案以便爬取您的網站。文字、XML 和 RSS 是編寫站點地圖最常用的格式。最流行的格式是 XML。在本章中,我們將學習 XML。

您需要站點地圖嗎?

根據網站的規模和設計而定。如果您的網站有 100 個或更少的 URL,並且這些 URL 都是內部連結的,那麼您通常不需要站點地圖。但是,如果您管理一個擁有數千、數百萬甚至數十億個 URL 的大型網站,那麼站點地圖將非常有用。

<url>
   <loc>https://example.com/blog/sample-blog-article/</loc>
	<xhtml:link rel=alternate" hreflang="en" href="https://example.com/blog/sample-blog-article/"/>
	<xhtml:link rel=alternate" hreflang="de" href="https://example.com/de/blog/sample-blog-article/"/>
	<xhtml:link rel=alternate" hreflang="fr" href="https://example.com/fr/blog/sample-blog-article/"/>
	<xhtml:link rel=alternate" hreflang="es" href="https://example.com/es/blog/sample-blog-article/"/>
	<xhtml:link rel=alternate" hreflang="it" href="https://example.com/it/blog/sample-blog-article/"/>
	<xhtml:link rel=alternate" hreflang="nl" href="https://example.com/nl/blog/sample-blog-article/"/>
</url>	

關於 XML

XML 格式的站點地圖是最靈活的。它易於擴充套件,可用於提供有關您網頁、圖片、影片和新聞專案的本地化版本的其他詳細資訊。

優點

  • 它具有適應性和可擴充套件性。

  • 它可以提供有關您的 URL 的最詳細的資訊。

  • CMS 使用者可以找到用於建立站點地圖的外掛。

缺點

  • 高技能任務。

  • 在 URL 頻繁更改的較大型入口網站或網站上保持地圖更新可能具有挑戰性。

XML 標籤構成了站點地圖協議格式。對於站點地圖中包含的任何資訊或值,都需要實體轉義。

站點地圖具有格式

  • <urlset> 用於開頭,</urlset> 用於結尾。

  • <urlset> 標籤的名稱空間必須定義。

  • 作為父 XML 標籤,為每個 URL 新增一個 <url> 條目。

  • 為每個 <url> 標籤包含一個 <loc> 條目。

其餘標籤是可配置的。搜尋引擎蜘蛛可能會也可能不會適應這些附加標籤。有關每個搜尋引擎相容性的詳細資訊,請閱讀其說明手冊。此外,站點地圖中的每個 URL 都應來自同一主機,例如 www.tutorialspoint.com、guides.tutorialspoint.com 等。

XML 站點地圖

這表示一個示例 XML 站點地圖,它顯示了一個 URL 的位置:

<?xml version="1.0 encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <url>
	   <loc>http://www.example.com/foo.html</loc>
	</url>
</urlset>	

現在,這是一個包含多個 URL 的 XML 站點地圖示例:

XML Sitemap with Multiple URLs

XML 的標籤規範

可用的 XML 標籤如下:

XML 標籤 狀態 定義
<urlset> 必需 它引用當前協議標準並編碼檔案的內容。
<url> 必需 它指的是每個存在的 URL 的父標籤。此標籤的子標籤是其餘的標題。
<loc> 必需 網站的 URL。如果託管網站的伺服器要求,則協議名稱 (HTTP) 必須在此 URL 中首先出現,並在末尾帶有一個斜槓。此值必須小於 2,048 位。
<lastmod> 可選 這表示網站的最近更新日期。此日期必須使用 W3C 日期時間格式。如果需要,您可以使用 YYYY-MM-DD 代替此格式中的時間元件。請記住,日期必須配置為反映連結網站的最後內容編輯時間,而不是開發人員建立站點地圖的時間。
<changefreq> 可選 頁面定期更新的可能性。雖然它可能無法準確地反映搜尋引擎爬取網站的頻率,但此值會向它們提供一個大致的概述。有效程式碼包括:
  • always。

  • hourly。

  • daily。

  • weekly。

  • monthly。

  • yearly。

  • never。

always - 每次訪問時都會更新文件。

never - 需要為存檔 URL 分配此值。

<priority> 可選 此標籤表示 URL 與您網站上其他 URL 相比的重要性。0.0 到 1.0 之間是有效值。此數字告知搜尋引擎您認為哪些頁面對於爬取機制最重要。但是,它不會影響您的網頁與其他網頁上的內容相比的評估方式。預設值 - 0.5

注意

  • 所有標籤值都需要實體轉義,就像所有 XML 檔案一樣。

  • Google 會忽略 <priority> 和 <changefreq> 的值。

  • 如果 <lastmod> 值可以定期且獨立地驗證為準確,則 Google 將使用它。

實體跳脫字元

您的站點地圖檔案需要 UTF-8 編碼。所有 XML 檔案都必須對以下所示的任何字元使用實體轉義值,包括 URL 和任何資訊內容和值以及 URL。

字元 符號 轉義程式碼
和號 & &
單引號 ' '
雙引號 " "
大於號 > >
小於號 < <

站點地圖索引檔案

您提供的每個站點地圖檔案中的 URL 總數限制為 50,000 個,其組合大小不得超過 50MB。如果您想減少所需的頻寬,可以使用 gzip 壓縮站點地圖文件的內容;但是,站點地圖檔案的未壓縮大小不能超過 50MB。您需要建立多個站點地圖檔案才能包含超過五萬個 URL。

如果您的網站擁有大量不同的站點地圖,則應建立一個名為“Sitemap”的目錄檔案,其中列出了所有站點地圖檔案。站點地圖索引檔案的標準包括 50,000 個或更少的站點地圖、最大 50MB 的檔案大小以及壓縮。

站點地圖檔案的 XML 格式及其索引檔案的 XML 格式相同。站點地圖索引模板需要:

  • 開頭處有一個 <sitemapindex> 開啟標籤,結尾處有一個 </sitemapindex> 關閉標籤。

  • 每個站點地圖都應在其父 XML 標籤中具有其條目 <sitemap>。

  • 對於每個 <sitemap> 父標籤,都提供一個子條目 <loc>。

  • 同樣,站點地圖索引檔案支援可選標籤 <lastmod>。

<?xml version="1.0 encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
   <sitemap>
	   <loc>http://wwwtutorialspoint.com/sitemap01.xml.gz</loc>
		<lastmod>2023-06-18T18:21:00+00:00</lastmod>
	</sitemap>
   <sitemap>
      <loc>https://tutorialspoint.tw/sitemap02.xml.gz</loc>
      <lastmod>2023-06-18</lastmod>
	</sitemap>
</sitemapindex>	

上傳 XML 站點地圖

使用 Search Console 將您的 XML 站點地圖上傳到 Google;請按照以下步驟操作:

  • 登入 Google Search Console。

  • 選擇“站點地圖”。

  • 將站點地圖的 URL 新增到網頁頂部的“新增新的站點地圖”部分。

  • 按“提交”,Google 將處理您新建立的 XML 站點地圖。

結論

良好的 XML 站點地圖可以為 Google 指引您網站的關鍵頁面,就像路線圖一樣。無論您網站的內部結構是否可以改進,XML 站點地圖都可能對 SEO 有益,因為它們可以幫助 Google 高效地識別您的關鍵頁面。

廣告