Ngày nay, mọi người sẽ khó khăn khi tìm một địa chỉ mà không cần bản đồ, Google cũng vậy, công cụ tìm kiếm này cũng sẽ khó tìm thấy website của bạn nếu không có XML Sitemap.
Thật may mắn, bởi bây giờ chúng ta có thể tạo và Submit XML Sitemap đến Google một cách nhanh chóng và dễ dàng.
Dưới đây, Webb sẽ hướng dẫn cho bạn từng bước cách thực hiện việc này. Nhưng trước tiên hãy cùng tìm hiểu một số thông tin cơ bản đã nhé!
XML Sitemap là gì?
XML Sitemap (hay còn gọi là sơ đồ website dưới định dạng .XML) là một file XML liệt kê tất cả URL nội dung quan trọng trên website. Bất kỳ trang nội dung hoặc file nào muốn hiển thị trong công cụ tìm kiếm phải có trong XML Sitemap.
Thông tin thú vị về XML Sitemap
Theo Google, 1 file XML Sitemap không thể chứa hơn 50.000 URL và kích thước không được vượt quá 50 MB. Nếu XML Sitemap của một website vượt quá một trong hai điều đó thì cần phải chia ra nhiều file XML Sitemap nhỏ hơn.
Cấu trúc của XML Sitemap
XML Sitemap được tạo ra dành cho các công cụ tìm kiếm chứ không phải cho con người, do vậy nó sẽ hơi khó đọc với những người không chuyên về code.
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="https://webb.com.vn/default.xsl?sitemap=page"?>
<urlset
xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:xhtml="http://www.w3.org/1999/xhtml"
xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"
>
<url>
<loc><![CDATA[https://webb.com.vn/]]></loc>
<lastmod><![CDATA[2023-02-21T04:31:41+00:00]]>
</lastmod>
<changefreq><![CDATA[always]]></changefreq>
<priority><![CDATA[1]]></priority>
<image:image>
<image:loc><![CDATA[https://webb.com.vn/wp-content/uploads/2023/02/logo-home.png]>
</image:loc>
</image:image>
</url>
</urlset>
Cùng Webb phân tích cấu trúc của file XML Sitemap dưới đây:
Khai báo nhận dạng XML
<?xml version="1.0" encoding="UTF-8"?>
Khai báo cho công cụ tìm kiếm biết rằng chúng đang đọc file định dạng XML, bao gồm thông tin về phiên bản XML và mã hóa ký tự đang sử dụng. Ở XML Sitemap này thì phiên bản là 1.0 và mã hóa là UTF-8.
URL
<url>
<loc><![CDATA[https://webb.com.vn/]]></loc>
<lastmod><![CDATA[2023-02-21T04:31:41+00:00]]>
</lastmod>
<changefreq><![CDATA[always]]></changefreq>
<priority><![CDATA[1]]></priority>
<image:image>
<image:loc><![CDATA[https://webb.com.vn/wp-content/uploads/2023/02/logo-home.png]]>
</image:loc>
</image:image>
</url>
- <url></url>: Là thẻ gốc của URL.
- <loc></loc>: Vị trí của URL trong cặp thẻ <loc></loc> lồng với nhau. Điều này rất quan trọng bởi yêu cầu các URL phải chính xác tuyệt đối chứ không mang tính tương đối.
Đây là 2 cặp thẻ bắt buộc kèm theo một số cặp thẻ có thuộc tính tùy chọn (không bắt buộc)!
- <lastmod></lastmod>: Chỉ định ngày được sửa đổi lần cuối cùng của file dưới định dạng W3C Datetime.
- <priority><priority>: Chỉ định mức độ ưu tiên của URL so với tất cả các URL khác trên website. Các giá trị nằm trong khoảng từ 0.0 đến 1.0. Chỉ số càng cao thì càng quan trọng.
- <changefreq></changefreq>: Chỉ định tần suất thay đổi trên trang. Nhiệm vụ của nó là cung cấp cho các công cụ tìm kiếm một số thông tin về tần suất thay đổi khi muốn thu thập lại thông tin URL. Các giá trị ở đây là always, hourly, daily, weekly, monthly, yearly và never.
Những cặp thẻ ở mục tùy chọn nêu trên không quan trọng đối với SEO!
- Đối với <lastmod>: Google tuyên bố rằng họ bỏ qua nó trong hầu hết các trường hợp vì “các quản trị viên web làm cho nó trở nên tệ hơn”. Hầu hết các bước tạo XML Sitemap đều đặt ngày thành ngày hiện tại cho tất cả các trang chứ không phải ngày mà trang nội dung được sửa đổi lần cuối.
- Đối với <priority>: Google cho biết họ cũng bỏ qua thẻ này.
- Đối với <changefreq>: Mức độ ưu tiên và tần suất thay đổi không thực sự đóng nhiều vai trò với XML Sitemap.
Tại sao website cần XML Sitemap?
Google khám phá nội dung mới bằng cách thu thập dữ liệu trên website. Khi thu thập dữ liệu một trang, Google xem xét đến cả các liên kết trong và ngoài trang. Nếu một URL được phát hiện chưa được index (lập chỉ mục) thì sẽ được Google phân tích nội dung của URL đó và index khi thỏa mãn điều kiện. Tuy nhiên, Google không thể tìm thấy tất cả nội dung theo cách này, nếu một website không được liên kết từ các trang đã được index khác thì họ sẽ không tìm thấy trang đó. Đây là lúc XML Sitemap phát huy tác dụng.
XML Sitemap sẽ cho Google và các công cụ tìm kiếm khác biết nơi tìm các trang nội dung (địa chỉ URL) quan trọng nhất trên website để Google có thể thu thập dữ liệu và index các trang đó.
Một nguyên tắc quan trọng của Google đó chính là Google không thể xếp hạng nội dung của website khi nội dung đó chưa được index.
Cách tạo Sitemap XML
Tạo XML Sitemap tự động trên các CMS
Một số hệ thống quản trị nội dung (CMS) được lập trình sẵn chức năng tạo XML Sitemap tự động. File XML Sitemap sẽ được cập nhật tự động mỗi khi website có thêm các trang nội dung mới hoặc xóa ra khỏi XML Sitemap khi nội dung đó bị loại bỏ trên website.
Nếu CMS chưa có chức năng này thì bạn cần phải yêu cầu đội ngũ lập trình viên website thêm nó.
Đối với một số CMS khác như WordPress có luôn sẵn một số plugin để thực hiện.
Tạo Sitemap trên WordPress
Mặc dù tỷ lệ mã nguồn WordPress được sử dụng lên đến 34,5%/tổng số website trên thế giới nhưng chức năng mặc định của mã nguồn này không cho phép tự động tạo XML Sitemap, bạn cần cài đặt một plugin giống như All in One SEO, Rankmath hoặc Yoast SEO để nó có thể tạo XML Sitemap giúp bạn.
Tạo sitemap trên Wix
Wix có thể tự động tạo XML Sitemap cho website, bạn có thể xem nó tại đường dẫn: duongdanwixsite.com/sitemap.xml.
Tạo sitemap trên Squarespace
Squarespace cũng có chức năng tự động tạo sitemap, bạn có thể kiểm tra nó tại đường dẫn: duongdansquarespacesite.com/sitemap.xml.
Tạo sitemap trên Shopify
Tương tự, Shopify cũng có chức năng tự động tạo XML Sitemap, bạn có thể dễ dàng xem nó tại: duongdancuahangshopify.com/sitemap.xml.
Tạo XML Sitemap trên các website khác
– Nếu trên website có ít hơn 300 trang nội dung, bạn có thể cài đặt phiên bản miễn phí của Screaming Frog:
- Sau khi cài đặt, chọn Mode > Spider.
- Dán URL trang chủ website vào: Enter URL to spider > Start.
– Nếu website có số trang nội dung dưới 500:
- Chọn Sitemaps > XML sitemap.
- Nhấn Next và lưu sitemap > Done.
– Nếu số trang nội dung trên 500, bạn có thể sử dụng một số công cụ tạo XML Sitemap miễn phí khác, những công cụ này được chia sẻ rất nhiều, ví dụ:
Tạo XML Sitemap thủ công với Ahrefs Site Audit
Bạn có thể đăng ký tài khoản miễn phí trên Ahrefs và sử dụng chức năng miễn phí này tại chức năng Site Audit.
Sau khi add website và tiến trình thu thập dữ liệu của Ahrefs hoàn tất, đến mục Page Explorer và thêm các bộ lọc (Advanced filter).
- Nhấn Export > Export to CSV.
- Mở file Excel, copy và dán tất cả các URL từ cột URL vào công cụ này.
- Nhấn Add to sitemap, sau đó chọn Export as XML.
Tệp này XML Sitemap sẽ được xuất ra và bạn hoàn toàn có thể sử dụng cho website.
Cách submit XML Sitemap đến Google
Với các nền tảng CMS mà Webb đã chia sẻ ở trên, địa chỉ sitemap thường được sử dụng sẽ là: domain.com/sitemap.xml.
Đặt tên XML Sitemap
Nếu thực hiện theo cách tạo XML Sitemap thủ công, hãy đặt tên file là sitemap.xml và tải lên root folder của website. Sau đó, kiểm tra tại địa chỉ: domain.com/sitemap.xml.
Có thể đặt bất kỳ tên nào cho file XML Sitemap, nhưng tốt nhất nên sử dụng tên kiểu định dạng chuẩn như sitemap.xml, đặt tên với các file XML Sitemap chia nhỏ như sitemap_post.xml, sitemap_page.xml…
Submit XML Sitemap đến Google
- Bước 1: Upload file Sitemap.xml lên hosting (folder root của mã nguồn website)
- Bước 2: Đăng nhập vào Google Search Console tại địa chỉ: https://search.google.com/search-console/
- Bước 3: Chọn menu Sitemaps phí bên trái màn hình
- Bước 4: Gõ tên file Sitemap.xml mà bạn đã thêm lên hosting và click Submit
Với website có nhiều file XML Sitemap, bạn chỉ cần thực hiện tương tự như trên, chú ý gõ đúng tên file XML Sitemap khi thêm vào.
Những lỗi hay xảy ra liên quan đến XML Sitemap
Google Search Console sẽ cho biết hầu hết tình trạng lỗi liên quan đến XML Sitemap, bạn có thể tham khảo dưới đây.
Trang nội dung chất lượng thấp trên XML Sitemap
Một số nội dung được Google nhận dạng trên XML Sitemap và tiến hành index là các nội dung chất lượng thấp hoặc không có giá trị với người dùng, do vậy bạn cần tìm kiếm và remove nội dung các trang đó ra khỏi website, XML Sitemap và kết quả tìm kiếm.
Bạn có thể sử dụng chức năng Duplicate Content trong Ahrefs để kiểm tra.
- Bước 1: Đăng nhập vào Ahrefs.com
- Bước 2: Vào menu Site Audit > Report > Duplicates
- Bước 3: Xem xét từng trang nội dung màu cam trước khi remove khỏi website, XML Sitemap và kết quả tìm kiếm.
Tại sao cần bỏ những trang nội dung chất lượng thấp?
- Lãng phí thời gian và tài nguyên: Website chứa nhiều trang nội dung thấp sẽ khiến các công cụ tìm kiếm lãng phí thời gian và tài nguyên để thu thập dữ liệu, hãy để thời gian đó để họ thu thập các trang nội dung tốt hơn trên website.
- Chất lượng liên kết nội bộ thấp: Tất nhiên rồi, các liên kết nội bộ đến các trang chất lượng thấp hoặc ngược lại khiến website giảm độ trust trong mắt Google.
- Trải nghiệm người dùng kém: Không ai thích truy cập một website có các trang nội dung không có giá trị, người dùng sẽ dễ dàng thoát khỏi website một cách nhanh chóng.
Cách xóa bỏ trang nội dung chất lượng thấp trên website
- Xóa bỏ hoàn toàn nội dung chất lượng thấp đang có trên website
- Xóa bỏ URL đó ra khỏi XML Sitemap
- Tiến hành khai báo lại XML Sitemap với Google
- Xóa bỏ URL đó khỏi Google với chức năng Xóa URL trong Google Search Console.
Lưu ý các trang nội dung sẽ bị loại trừ khi tạo XML Sitemap
- Các trang nội dung có thẻ meta noindex
- Các trang nội dung không có thẻ canonical.
Tạo XML Sitemap cho các website thương mại điện tử
Việc tạo XML Sitemap cho các website điện tử cũng thực hiện tương tự như các website khác, tuy nhiên lưu ý các vấn đề sau:
- Số lượng URL tối đa trong 1 file XML Sitemap là 50.000
- Kích thước file XML Sitemap phải dưới 50 MB.
- Chia nhỏ file XML Sitemap nếu rơi vào 1 trong 2 tình trạng trên bằng các file chuyên biệt cho các nhóm nội dung, ví dụ: Post (Sitemap-post.xml), Page (Sitemap-page.xml), Sản phẩm (Sitemap-sanpham.xml), Tin tức (Sitemap-tintuc.xml)…
Tổng kết
Tạo và Submit XML Sitemap là bước cơ bản nhưng rất quan trọng khi thực hiện SEO website. Hi vọng với nội dung chia sẻ khá chi tiết ở trên, bạn có thể thực hiện tốt công việc trong quá trình tối ưu hóa website của mình.
Nếu có câu hỏi nào cần gửi đến Webb, bạn có thể để lại liên hệ tại đây.