Phân tích sơ đồ trang web để tìm lỗi. Sử dụng tệp Sơ đồ trang web. Tần số thay đổi cho biết tần suất thay đổi trang

Google không thể xem các địa chỉ trong sơ đồ trang web.

  1. Hãy đảm bảo tệp nằm chính xác ở vị trí được ghi.
  2. Sử dụng công cụ kiểm tra tệp robots.txt để tìm hiểu chính xác cách chặn quyền truy cập.
  3. Sử dụng Thu thập thông tin trang web của Google để xác định xem tính năng chặn trang có được định cấu hình trong tệp robots.txt của bạn hay không.
  4. Nếu URL từ Sơ đồ trang web của bạn đã được thu thập thông tin, hãy kiểm tra xem có bất kỳ lỗi nào trong địa chỉ không.

URL không thành công

Thông thường chỉ ra rằng Googlebot không thể mở một số URL khi xử lý Sơ đồ trang web vì chúng nhận được quá nhiều chuyển hướng. Thay đổi URL chuyển hướng trong sơ đồ trang web và thay thế chúng bằng URL đích (mục tiêu chuyển hướng).

Dưới đây là mô tả lý do tại sao lỗi này có thể xảy ra và cách khắc phục.

  • Kiểm tra trang web bằng trình duyệt văn bản (chẳng hạn như Lynx), vì hầu hết các công cụ tìm kiếm đều xem trang web này giống hệt như Lynx. Nếu bạn không thể xem toàn bộ trang web bằng trình duyệt văn bản do các yếu tố như JavaScript, cookie, ID phiên, khung, DHTML hoặc Flash thì trình thu thập thông tin của công cụ tìm kiếm cũng có thể gặp khó khăn khi xử lý trang web đó.

  • Nếu bạn luôn chuyển hướng từ trang này sang trang khác, hãy sử dụng chuyển hướng vĩnh viễn. Chúng tôi khuyên bạn nên chọn không tham gia chuyển hướng bằng JavaScript hoặc thẻ meta làm mới.
  • Bất cứ khi nào có thể, hãy sử dụng liên kết tuyệt đối thay vì liên kết tương đối. Ví dụ: khi liên kết đến một trang khác trên trang web của bạn, hãy sử dụng URL https://www.example.com/moya-stranitsa.html thay vì chỉ moya-stranitsa.html.

URL không hợp lệ

Một số URL ở cấp cao hơn sơ đồ trang web hoặc trên một miền khác.

Mức cao hơn: Nếu tệp có trên http://www.example.com/moy_sait/sitemap.xml thì các URL sau không hợp lệ cho tệp đó:

  • http://www.example.com/ – ở cấp cao hơn tệp Sơ đồ trang web;
  • http://www.example.com/yoursite/ – nằm trong thư mục song song với vị trí hiện tại của tệp Sơ đồ trang web.

Tên miền khác: Đảm bảo tất cả các URL đều bắt đầu bằng tên miền nơi Sơ đồ trang web của bạn được lưu trữ. Ví dụ: nếu tệp nằm trên trang http://www.example.com/sitemap.xml thì các URL sau không hợp lệ cho tệp đó:

  • http://example.com/ – thiếu www ở đầu.
  • www.example.com/ – không có tiền tố giao thức (http).
  • https://www.example.com/ – giao thức là https thay vì http.

Lỗi nén

Lỗi khi cố giải nén tệp Sơ đồ trang web đã nén. Nén lại (ví dụ: sử dụng gzip), sau đó tải nó lên trang web của bạn và gửi lại cho Google.

Sơ đồ trang web trống

Sơ đồ trang web thiếu URL. Hãy chắc chắn rằng nó không trống. Nếu tệp sử dụng giao thức Sơ đồ trang web, hãy kiểm tra xem các thẻ trong URL có chính xác không.

Lỗi kích thước tệp sơ đồ trang web: Đã vượt quá kích thước tệp sơ đồ trang web tối đa được phép

Kích thước tệp Sơ đồ trang web không nén vượt quá 50 MB. Chia nó thành nhiều tệp và lập chỉ mục cho chúng, sau đó gửi riêng từng tệp cho chúng tôi.

Giá trị thuộc tính không hợp lệ

Thuộc tính được liên kết với một trong các thẻ XML trong sơ đồ trang web có giá trị không hợp lệ. Xem lại Sơ đồ trang web để đảm bảo rằng tất cả thuộc tính được sử dụng theo thông số kỹ thuật của sơ đồ trang web. Kiểm tra lỗi chính tả trong các giá trị thuộc tính.

Ngày không hợp lệ

Một hoặc nhiều ngày trong sơ đồ trang web có định dạng hoặc giá trị không chính xác. Ngày phải ở định dạng mã hóa ngày giờ W3C. Thời gian có thể không được chỉ định. Đảm bảo rằng tất cả các ngày đều được ghi bằng một trong các định dạng mã hóa W3C hợp lệ.


21-02-2005 2005-02-21T18:00:15+00:00

Không cần đặt thời gian (mặc định là 00:00:00Z), nhưng nếu có, hãy nhớ chỉ định múi giờ.

Giá trị thẻ không hợp lệ

Sơ đồ trang web chứa một hoặc nhiều thẻ có giá trị không hợp lệ. Tất cả chúng sẽ được liệt kê trong thông báo lỗi. Kiểm tra thông số kỹ thuật của loại tệp sơ đồ trang web thích hợp (chỉ mục, tiêu chuẩn, video, v.v.).

URL không hợp lệ

Sơ đồ trang web chứa URL không hợp lệ. Nó có thể chứa các ký tự không hợp lệ (dấu cách, dấu ngoặc kép, v.v.) hoặc các lỗi định dạng khác, chẳng hạn như có tiền tố htp:// thay vì http:// . Kiểm tra việc thoát và mã hóa URL được cung cấp trong Sơ đồ trang web. Kiểm tra các ký tự không hợp lệ như dấu cách và dấu ngoặc kép. Bạn cũng có thể dán URL vào trình duyệt của mình và xem liệu chương trình có thể nhận ra nó và tải trang hay không.

URL không hợp lệ trong tệp chỉ mục sơ đồ trang web: URL không đầy đủ

Một số Sơ đồ trang web được liệt kê trong tệp chỉ mục Sơ đồ trang web không có URL đầy đủ được liệt kê. Google tìm kiếm các tệp Sơ đồ trang web trong cùng thư mục với tệp chỉ mục. Ví dụ: nếu chỉ mục được đặt tại http://www.example.com/folder1/sitemap_index.xml và địa chỉ tệp sơ đồ trang web trong đó được chỉ định là sitemap.xml thì robot của chúng tôi sẽ cố tải nó tại http:// www.example.com /folder1/sitemap.xml. Nếu Googlebot không tìm thấy sơ đồ trang web cho địa chỉ đó thì nỗ lực sẽ thất bại.


Cập nhật tệp chỉ mục Sơ đồ trang web để bao gồm URL đầy đủ của tất cả Sơ đồ trang web được liệt kê và sau đó gửi lại tệp.

XML không hợp lệ: Quá nhiều thẻ

Có các thẻ trùng lặp trong tệp Sơ đồ trang web. Ví dụ: mục sau đây sẽ gây ra lỗi vì thẻ https://viws.ru/vi/ Nó được lặp lại hai lần:

http://www.example.com/ http://www.example.com/stranitsa1.html 2005-01-01 monthly 0.8

Thông báo lỗi cho biết thẻ và số dòng chứa thẻ đó. Hãy xóa thẻ trùng lặp và gửi lại Sơ đồ trang web.

Thiếu thuộc tính XML

Một trong các thẻ trong sơ đồ trang web thiếu thuộc tính bắt buộc. Xem lại sơ đồ trang web của bạn để đảm bảo tất cả các thuộc tính bắt buộc đều có sẵn. Sửa mọi lỗi được tìm thấy trong giá trị thuộc tính và gửi lại tệp Sơ đồ trang web.

Thiếu thẻ XML

Một hoặc nhiều mục trong sơ đồ trang web của bạn thiếu thẻ bắt buộc. Thông báo lỗi cho biết số dòng. Để biết thông tin về các thẻ bắt buộc, hãy xem bài viết về Sơ đồ trang web.

Thiếu URL biểu tượng video

Một hoặc nhiều bài đăng video thiếu liên kết tới biểu tượng video. Đảm bảo các thẻ URL của tất cả các biểu tượng như vậy được chỉ định.

Tiêu đề video bị thiếu

Một số mục video bị thiếu tiêu đề. Đảm bảo các thẻ Tên của tất cả các video được chỉ định.

Định dạng chỉ mục Sơ đồ trang web không chính xác: Tệp con chỉ mục Sơ đồ trang web

Một hoặc nhiều mục nhập tệp chỉ mục Sơ đồ trang web chứa URL riêng của nó hoặc URL của tệp chỉ mục Sơ đồ trang web khác.

Xóa các mục nhập trỏ đến tệp chỉ mục Sơ đồ trang web và gửi lại Sơ đồ trang web tới Google.

Lỗi phân tích cú pháp

Google không thể phân tích nội dung XML trong sơ đồ trang web của bạn.

Điều này thường xảy ra do các ký tự không thoát trong một trong các URL. Giống như các tệp XML, mọi giá trị dữ liệu (bao gồm cả URL) đều phải sử dụng mã thoát cho một số ký tự nhất định, chẳng hạn như & ‘ »< >. Kiểm tra xem tính năng thoát URL có được định cấu hình chính xác hay không.

Lỗi tạm thời

Không thể xử lý tệp sơ đồ trang web do lỗi hệ thống tạm thời. Thông thường, nếu xảy ra lỗi này thì không cần phải gửi lại file. Googlebot sẽ cố gắng truy xuất nó sau. Nếu thông báo lỗi này tiếp tục xuất hiện sau vài giờ, vui lòng gửi lại Sơ đồ trang web.

Quá nhiều sơ đồ trang web trong tệp chỉ mục

Có hơn 50.000 Sơ đồ trang web trong tệp chỉ mục. Chia nó thành nhiều phần và đảm bảo rằng mỗi phần chứa không quá 50.000 Sơ đồ trang web.

Quá nhiều URL trong sơ đồ trang web

Có hơn 50.000 URL trong Sơ đồ trang web. Chia nó thành nhiều phần, mỗi phần chứa tới 50.000 địa chỉ. Để quản lý chúng, bạn có thể tạo tệp chỉ mục Sơ đồ trang web.

Định dạng tập tin không được hỗ trợ

Bạn đã tạo một tập tin không chính xác. Nó phải ở định dạng XML và chứa tiêu đề chính xác.

Các lỗi XML phổ biến:

  • Sơ đồ trang web phải có tiêu đề chính xác. Ví dụ: nếu nội dung tệp thể hiện thông tin về video thì tiêu đề phải như sau:
  • Không gian tên trong tiêu đề sẽ trông giống như http://www.sitemaps.org/schemas/sitemap/0.9(Không .9 ).
  • Tất cả các thuộc tính XML phải được đặt trong dấu ngoặc đơn (') hoặc dấu ngoặc kép ("), chỉ được là dấu ngoặc kép thẳng. Chú ý! Các trình soạn thảo văn bản như Microsoft Word có thể tự động thay đổi chúng thành dạng cong.

Đường dẫn không hợp lệ: thiếu tiền tố www

Đường dẫn tệp sơ đồ trang web không chứa tiền tố www (ví dụ: http://example.com/sitemap.xml), nhưng tất cả các URL được liệt kê trong đó đều có (ví dụ: http://www.example.com/myfile. html
).

Nếu bạn muốn xóa tiền tố www khỏi sơ đồ trang web nhưng vẫn giữ nó trong các URL được chỉ định trong tệp, hãy chọn tùy chọn sử dụng tiền tố làm tên miền chính.

Nếu không, hãy chỉnh sửa sơ đồ trang web của bạn để xóa tiền tố www khỏi tất cả các URL.

Đường dẫn không hợp lệ: có tiền tố www

Đường dẫn tệp sơ đồ trang web chứa tiền tố www (ví dụ: http://www.example.com/sitemap.xml), nhưng các URL được liệt kê trong đó thì không (ví dụ: http://example.com/myfile.xml ).

Nếu không, hãy chỉnh sửa sơ đồ trang web của bạn để thêm tiền tố www vào tất cả các URL.

Không gian tên được chỉ định không chính xác

Phần tử gốc của tệp Sơ đồ trang web có vùng tên không chính xác hoặc bị thiếu, lỗi chính tả hoặc URL không chính xác.

Đảm bảo không gian tên được đặt chính xác dựa trên loại tệp. Ví dụ:

  • Tệp sơ đồ trang web: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Sơ đồ trang web dành cho Video: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Tài liệu mục lục Sơ đồ trang web:
  • Các loại tệp sơ đồ trang web khác...

Tệp sơ đồ trang web bắt đầu bằng dấu cách

Tệp Sơ đồ trang web của bạn bắt đầu bằng khoảng trắng chứ không phải vùng tên. Các tệp XML phải bắt đầu bằng một khai báo XML chỉ định phiên bản XML sẽ sử dụng.


Lỗi này sẽ không ngăn Google xử lý Sơ đồ trang web của bạn nhưng tốt nhất bạn nên xóa khoảng trống để tệp tuân thủ các tiêu chuẩn XML và thông báo lỗi này sẽ không còn xuất hiện.

Lỗi HTTP ( mã cụ thể)

Đã xảy ra lỗi HTTP khi cố tải xuống Sơ đồ trang web. Thông báo về nó sẽ cho biết mã trạng thái (ví dụ: 404). Đảm bảo URL Sơ đồ trang web chính xác và tệp nằm ở vị trí được chỉ định. Sau đó gửi lại cho Google.

Biểu tượng video quá lớn

Biểu tượng video được cung cấp trong sơ đồ trang web quá lớn. Thay đổi kích thước của nó thành 160 x 120 pixel. Nếu cần, hãy cập nhật sơ đồ trang web của bạn và gửi lại cho Google. Tìm hiểu thêm về cách thêm thông tin video vào sơ đồ trang web của bạn.

Biểu tượng video quá nhỏ

Biểu tượng video được cung cấp trong sơ đồ trang web quá nhỏ. Thay đổi kích thước của nó thành 160 x 120 pixel. Cập nhật Sơ đồ trang web nếu cần thiết.

Vị trí trang phát lại và video giống nhau

URL của trang phát lại và video không được giống nhau. Nếu cả hai thẻ được sử dụng ( ), các URL phải khác nhau.

URL vị trí video trỏ đến trang phát lại

URL
trong sơ đồ trang web dành cho video, trỏ tới trang chứa trình phát.

Tệp sơ đồ trang web chứa các URL bị chặn trong tệp robots.txt

Googlebot không thể xử lý Sơ đồ trang web vì quyền truy cập vào Sơ đồ trang web hoặc nội dung của Sơ đồ trang web đã bị chặn trong tệp robots.txt. Sử dụng công cụ kiểm tra tệp robots.txt để tìm hiểu chính xác cách chặn quyền truy cập và thực hiện các thay đổi để cho phép thu thập thông tin.

hỗ trợ.google.com

Cài đặt sơ đồ trang web bằng cách sử dụng plugin Sơ đồ trang web Google XML từ phiên bản 4.0

Trong bài viết trước “Xây dựng bản đồ xml bằng cách sử dụng plugin Google Sitemaps” tôi đã nói về cách tạo ra loại bản đồ này và có lẽ những người đã quen làm mọi thứ theo cách cũ sẽ tìm thấy thông tin hữu ích ở đó, nhưng hầu hết người dùng vẫn quyết định làm như vậy. chuyển sang phiên bản mới của plugin và Để thực hiện việc này, bạn sẽ phải thực hiện một số thao tác.

Những người chưa sử dụng plugin này sẽ phải tải xuống từ trang web WordPress chính thức bằng liên kết này; kể từ ngày bài viết này được viết, phiên bản 4.0.7 đã có sẵn.

Đối với những người có phiên bản cũ hơn, dưới 4.0, bạn sẽ phải cập nhật nó từ bảng quản trị WordPress.


Bây giờ là một điểm rất quan trọng, vì để phiên bản trước của bản đồ hoạt động, cần phải đặt các tệp vào thư mục gốc của trang web sơ đồ trang web.xmlsơ đồ trang web.xml.gz, sau khi cập nhật chúng sẽ không còn cần thiết nữa nên phải xóa chúng đi.

Nếu bạn đi tới cài đặt plugin, nó sẽ tự động loại bỏ các phần tử không cần thiết.

Nếu ai đó làm mọi thứ theo cách thủ công sẽ thuận tiện hơn thì hãy chuyển đến thư mục cuối của trang web, tôi sử dụng ứng dụng khách FTP cho việc này và xóa các tệp trên ở đó.

Bây giờ nếu bạn nhìn vào sơ đồ trang web xml của mình, bạn sẽ hơi ngạc nhiên vì các nhà phát triển mô-đun đã quyết định chuyển sang định dạng mới để lưu trữ thông tin về các trang của trang web.

Thiết lập plugin Sơ đồ trang web Google XML

Bây giờ chúng ta hãy xem qua tất cả các cài đặt của plugin đã cập nhật. Vì lý do nào đó, phiên bản mới không dịch đầy đủ các yếu tố cài đặt sang tiếng Nga, mặc dù mọi thứ đều rõ ràng nhưng tốt hơn hết bạn nên sử dụng trình dịch trực tuyến được tích hợp trong trình duyệt.

Ở đây tôi để lại các hộp kiểm đầu tiên để các công cụ tìm kiếm Google và Bing được thông báo về những thay đổi trên trang web.

Vì tôi đã có URL tới sơ đồ trang web xml được ghi trong tệp robots.txt của mình nên chúng tôi bỏ chọn hộp thứ ba.

Dòng áp chót có nhiệm vụ hiển thị bản đồ qua link http://your-site/sitemap.xml, tuy nhiên, nếu tôi xóa nó thì không có thay đổi nào xảy ra với tôi.

Trên trang web thử nghiệm của tôi, tất cả các bài viết đều có mức độ ưu tiên như nhau nên tôi đã tắt tùy chọn này.

Chúng tôi đánh dấu các trang sẽ được tải vào sơ đồ trang web và cũng đánh dấu điểm cuối cùng "Bao gồm thời gian sửa đổi cuối cùng"để giúp các công cụ tìm kiếm xác định khi nào nội dung trang web đã thay đổi.

Plugin cung cấp để chỉ định thời gian tần suất các công cụ tìm kiếm nên lập chỉ mục các trang. Cá nhân tôi cho rằng yếu tố này vô dụng vì robot PS vẫn không tuân theo các hướng dẫn này.

Chúng tôi ưu tiên tầm quan trọng cho các trang blog.

Tôi đã nói chi tiết về cách cài đặt và định cấu hình sơ đồ trang web ở định dạng XML bằng cách sử dụng plugin Sơ đồ trang web Google XML trong video. Thích xem.

Kiểm tra việc lập chỉ mục bản đồ XML trong Yandex và Google

Tiếp theo, bạn cần gửi lại tệp sitemap.xml để xác minh trong bảng Quản trị trang web từ Google. Với Yandex, mọi thứ đơn giản hơn nhiều vì chính công cụ tìm kiếm của Nga sẽ nhận tất cả các thay đổi trong một vài bản cập nhật, miễn là bạn đã kiểm tra. tập tin này ở đó trước đó.

Xác minh cho Yandex

Sau đó, chúng tôi chỉ ra địa chỉ HTML đầy đủ của sitemap.xml của bản đồ và nhấp vào kiểm tra.

Bạn sẽ được chuyển hướng đến một trang xác thực để kiểm tra lỗi trong tệp sơ đồ trang web.

Kiểm tra Google

Đối với Google, mọi thứ phức tạp hơn một chút vì bạn sẽ phải gửi lại tệp bản đồ đã cập nhật để kiểm tra lại. Để thực hiện việc này, trong bảng quản trị trang web của Google, hãy chuyển đến tab “Thu thập thông tin” - “Tệp sơ đồ trang web”

Một thông báo sẽ xuất hiện cho biết tệp đã được gửi và bạn có thể làm mới trang. Sau đó, một bảng sẽ xuất hiện với ngày và giờ xử lý thẻ mới và bên dưới bạn sẽ thấy trạng thái lập chỉ mục của từng phần tử của tệp xml.

Sau vài phút hoặc có thể vài giờ, tùy thuộc vào kích thước của tệp, Google sẽ quét toàn bộ nội dung của tệp, chỉ cần đảm bảo có dấu gạch ngang trong cột “Sự cố”.

Tạo sơ đồ trang web xml bằng cách sử dụng plugin gói All in One Seo

Ở trên, chúng tôi đã xem xét tùy chọn xây dựng sơ đồ trang web có cấu trúc ở định dạng xml bằng cách sử dụng một plugin đặc biệt, nhưng không phải tất cả mọi người, kể cả tôi, đều chia sẻ phương pháp này:

— Một số người sợ hãi trước vẻ ngoài kỳ lạ của nó, vì thay vì các liên kết thông thường đến các bài viết, bạn sẽ thấy một cái gì đó tương tự như sơ đồ trang web-pt-page-2013-03.xml, tức là danh sách liên kết thông thường sẽ được chia thành nhiều bản đồ con riêng biệt.

— Những người khác đã tìm ra cách loại bỏ mô-đun bổ sung bằng cách xây dựng bản đồ bằng cách sử dụng plugin gói All in One Seo.

Vì vậy, hãy bắt đầu…

Đầu tiên. Đầu tiên, chúng tôi loại bỏ plugin Sơ đồ trang web Google XML; để thực hiện việc này, hãy tắt nó trong bảng quản trị và tận hưởng tốc độ tăng tốc nhẹ của trang web.

Thứ hai. Vào thư mục gốc và xóa các tập tin cũ sơ đồ trang web.xmlsơ đồ trang web.xml.gz, nhưng tôi vẫn khuyên bạn nên giữ một bản sao lưu của chúng ở đâu đó trên máy tính của bạn.

Ngày thứ ba. Chuyển đến tab plugin gói All in One Seo “Công cụ SEO” - “Các mô-đun khác” và kích hoạt mô-đun “Sơ đồ trang web”.

Trong cài đặt chính, chúng tôi chỉ định tiền tố tệp tiêu chuẩn và đánh dấu công cụ tìm kiếm nào sẽ được thông báo nếu bạn thay đổi nội dung của nó.

Tiếp theo, chúng tôi cho biết sơ đồ trang web của trang web sẽ bao gồm những yếu tố nào, tôi chỉ để lại các bài đăng và trang, đồng thời cũng kiểm tra mục cuối cùng để plugin sẽ tự động tạo bản đồ mới khi các liên kết mới được thêm vào.

Tại đây bạn có thể loại trừ các danh mục, trang và bài đăng không cần thiết khỏi xml.

Chúng tôi đặt mức độ ưu tiên cho các trang của trang web.

Chúng tôi cho biết tần suất các công cụ tìm kiếm cần lập chỉ mục các trang. Hai tham số cuối cùng không có vai trò quan trọng.

Và tất nhiên, đừng quên kiểm tra chức năng của bản đồ mới tại http://seoslim.ru/sitemap.xml.

Nhìn như vậy là được rồi. Đây là nơi tôi kết thúc bài viết; tôi muốn chia nó thành hai bài riêng biệt, nhưng đến phút cuối tôi đã thay đổi ý định.

seoslim.ru

Tệp sitemap.xml có ảnh hưởng đến việc quảng bá trang web không?

Nếu bạn không có sơ đồ trang web, điều này không có nghĩa là các công cụ tìm kiếm sẽ không lập chỉ mục tài nguyên. Robot tìm kiếm thường quét các trang web khá tốt nếu không có tính năng này và đưa chúng vào tìm kiếm. Nhưng đôi khi có thể xảy ra trục trặc, do đó đôi khi không thể tìm thấy tất cả tài liệu trên web. Những lý do chính là:

  1. Các phần của trang web chỉ có thể truy cập được bằng cách thực hiện một chuỗi chuyển đổi dài;
  2. URL động.

Tạo một sitemap.xml giúp giải quyết vấn đề này.

Sitemap.xml ảnh hưởng gián tiếp đến SEO: bằng cách tạo điều kiện và tăng tốc độ lập chỉ mục các trang.

Sơ đồ trang web Sơ đồ trang web ở định dạng HTML

Sơ đồ trang web được chia thành 2 loại hoặc định dạng chính: sơ đồ trang web html và một tệp xml sơ đồ trang web. Sơ đồ trang web HTML là một trang web, trong đó liệt kê các liên kết. Thông thường đây là các liên kết đến các phần và trang quan trọng nhất của trang web. Sơ đồ trang web HTML được thiết kế nhiều hơn cho mọi người thay vì robot và giúp bạn nhanh chóng điều hướng các phần chính của trang web. Đối với sơ đồ trang web ở dạng trang HTML, có những hạn chế nghiêm trọng về số lượng liên kết trên một trang. Nếu có quá nhiều liên kết trên một trang, không phải tất cả các liên kết đều có thể được lập chỉ mục hoặc trang sơ đồ trang web thậm chí có thể bị loại khỏi các tìm kiếm vì có quá nhiều liên kết, thậm chí cả liên kết nội bộ.

Để sơ đồ trang web html được lập chỉ mục chính xác và được khách truy cập cảm nhận đầy đủ, bạn không nên đặt quá 100 liên kết trên trang. Điều này là quá đủ để đặt trên trang tất cả các phần và phần phụ không vừa với menu chính.

Thường xuyên, tệp sơ đồ trang web ở định dạng HTML có cấu trúc cây, trong đó các phần và phần phụ mở rộng được chỉ định. Các bản đồ trang web HTML cồng kềnh không cần thiết thường được thiết kế với các yếu tố đồ họa, kiểu CSS và được bổ sung bằng tập lệnh Java. Tuy nhiên, sơ đồ trang web html ít có giá trị đối với các công cụ tìm kiếm.

Sơ đồ trang web HTML không phải là sơ đồ trang web đầy đủ. Phải làm gì nếu trang web có hàng trăm, hàng nghìn, hàng chục nghìn trang? Để thực hiện việc này, bạn cần đặt liên kết đến tất cả các trang trong sơ đồ trang web ở định dạng xml.

Sơ đồ trang web sitemap.txt

Một cách khác để tạo sơ đồ trang web ở dạng tệp có thể là sơ đồ trang web ở định dạng txt:

1. http://site.ru/ 2. http://site.ru/page/ 3. http://site.ru/page1/

Nó đơn giản. Tệp sitemap.txt liệt kê tất cả các liên kết cần thiết theo từng dòng. Sơ đồ trang web ở định dạng txt là “tùy chọn dành cho người lười biếng”. Giới hạn xml của sơ đồ trang web tương tự là 50.000 liên kết hoạt động ở đây. Tuy nhiên, sơ đồ trang web TXT không có khả năng chỉ ra ngày sửa đổi cuối cùng và mức độ ưu tiên của trang.

Sơ đồ trang web XML

Sơ đồ trang web XML là một tệp ở định dạng xml, như sitemap.xml, thường nằm ở thư mục gốc của trang web. Sơ đồ trang web ở định dạng xml có nhiều ưu điểm so với sơ đồ trang web html:

  • Sơ đồ trang web xml là một định dạng sơ đồ trang web đặc biệt, được xác định bởi tất cả các công cụ tìm kiếm phổ biến, chẳng hạn như Google và Yandex.
  • Bạn có thể chỉ định tối đa 50.000 liên kết trong sơ đồ trang web xml.
  • Trong sơ đồ trang web xml, bạn có thể chỉ định mức độ ưu tiên tương đối và tần suất cập nhật trang.

Nội dung của bản đồ trang web chỉ là đề xuất cho robot tìm kiếm. Ví dụ: nếu bạn đặt tần suất cập nhật hàng năm cho một trang trên trang web, rô-bốt tìm kiếm sẽ vẫn truy cập thường xuyên hơn. Và nếu bạn đặt tốc độ làm mới trang là hàng giờ, điều này không có nghĩa là robot sẽ lập chỉ mục trang mỗi giờ.

Cách tạo đúng sitemap.xml

Hãy xem cách tạo một bản đồ xml thích hợp. Các yêu cầu sau phải được đáp ứng:

  1. Kích thước tệp không được quá 10 MB;
  2. Bản đồ không được chứa quá 50.000 liên kết. Trong trường hợp có nhiều liên kết hơn, bạn có thể tạo một số bản đồ và đưa chúng vào bản đồ xml chính;
  3. Địa chỉ sơ đồ trang web phải được nhập vào robots.txt;
  4. Đồng thời tải sơ đồ trang web lên Yandex và Google (cách thêm tệp được mô tả bên dưới);
  5. Công cụ tìm kiếm phải có quyền truy cập vào bản đồ. Cần sử dụng các thẻ đặc biệt để công cụ tìm kiếm hiểu rằng đây là bản đồ chứ không phải thứ gì khác;
  6. Sơ đồ trang web phải có mã hóa UTF-8.

Nội dung của tệp sitemap.xml trông như sau:

http://site.ru/ 2015-10-18T18:54:13+04:00 always 1.0 http://site.ru/category/ 2015-10-18T18:57:09+04:00 hourly 0.8 http://site.ru/page/ 2015-10-18T18:59:37+04:00 daily 0.6

Trường hợp sử dụng các thẻ bắt buộc sau:

  • - thẻ cha, nó chứa tất cả các URL;
  • - тег, в котором указываются сведения о конкретном url-адресе;
  • https://viws.ru/vi/ - в данном теге указывается непосредственно url.
  • - этот тег заключает в себе дату последнего изменения страницы;
  • - тег используется, чтобы указать насколько часто изменяется страница: always, hourly, daily, weekly, monthly, yearly, never;
  • Указывает приоритет определенной страницы, относительно других страниц сайта от 0,1 – низкий приоритет, до 1 – высокий приоритет.

Changefreq указывает на частоту изменений страницы:

  1. Hourly – обновление ежечасно;
  2. Always – всегда обновляется;
  3. Weekly – обновляется раз в неделю;
  4. Daily – обновления происходят ежедневно;
  5. Monthly – обновления происходят раз в месяц;
  6. Yearly – один раз в год;
  7. Never – не обновляется (такое значение лучше не использовать).

Priority сообщает поисковикам о степени важности страницы, по сравнению с другими. Приоритет можно выставлять от 0,1 (низкий) до 1 (высокий).

Файл sitemap.xml должен содержать указание на пространство имен языка XML:

Xmlns=

Если файл карты сайта включает более 50 тысяч ссылок или размер sitemap.xml превышает 10 мб, рекомендуется разделить карту сайта на несколько файлов. В таком случае, в карте сайта необходимо указать несколько ссылок на разные файлы карт.

http://site.ru/sitemaps/sitemap01.xml 2015-10-18T18:54:13+04:00 http://site.ru/sitemaps/sitemap02.xml 2015-10-18T18:54:13+04:00

Здесь используются уже знакомые нам теги https://viws.ru/vi/ и , а также обязательные теги:

  • - родительский тег, в который заключаются адреса всех карт сайта;
  • - тег, в котором заключается параметры для каждой карты сайта.

Как создать Sitemap.xml

Создание карты сайта важный процесс, в котором необходимо четко указать, какие страницы сайта нужно индексировать и как лучше их индексировать. В зависимости от того о каком типе карты сайта идет речь, используются различные способы создания карты сайта . Как создать html карту сайта обсуждать отдельно смысла нет. Рассмотрим как сделать карту карта в формате xml файла. Существует несколько основных способов создания карты сайта, но все их объединяет то, где находится карта сайта и как файл sitemap определяется поисковыми системами.

Как уже было написано выше - файл карты сайта размещается в корне сайта . Поисковые системы способны самостоятельно обнаружить файл карты сайта. Но существует несколько способов указания прямой ссылки на файл(ы) карты сайта(ов) для более скорого обнаружения поисковыми системами. Самый простой способ указать место расположения файла карты сайта - это непосредственное указание ссылки или нескольких ссылок на файлы карт сайта в инструментах для вебмастеров от Yandex и Google. Там же можно проверить карту сайта , провести анализ карты сайта на корректность , соответствие того, какие страницы из карты сайта найдены поисковой системой и сколько из них находится в индексации.

Второй способ указать поисковым системам на расположение файла карты сайта - это директива Sitemap файла robots.txt.

Sitemap: http://site.ru/sitemap.xml

В robots.txt можно указать несколько файлов sitemap, после чего, он автоматически будут добавлены в инструменты для вебмастеров. Как найти карту сайта мы рассмотрели, теперь перейдем к тому, как создать карту сайта.

Основные способы создания карты сайта

  1. Генерация карты сайта силами системы управления сайта, если CMS имеет подобную встроенную возможность.
  2. Скачать карту сайта со стороннего онлайн сервиса. Существует множество online генераторов карт сайта с различным возможностями и ограничениями. Наверное, один из самых известных онлайн генераторов карты сайта - это Sitemap Generator. Он обладает достаточно большим функционалом и позволит вам бесплатно генерировать сайтмап на 1500 страниц, что достаточно много. Еще есть xml-sitemaps.com обладает возможностью настройки параметров карты сайта, но имеет ограничение по количеству ссылок в файле sitemap.xml в 500 штук.
  3. Скачать генератор карты сайта . Подобные программы генераторы обычно платные, но при их помощи можно можно регулярно генерить sitemap xml для одного или нескольких сайтов. Вот пара примеров подобных программ-генераторов: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generatior.
  4. Автоматическое создание sitemap карты сайта в Joomla (Джумла), WordPress (Вордпресс), Bitrix (Битрикс), ModX.
  5. Создание карты сайта вручную .

Sitemap WordPress

Создать карту сайта для WordPress можно будет с помощью плагина Google XML Sitemaps. Для нее вы сможете произвести множество настроек, которые позволят исключить часть материалов вашего сайта, а также можете задать предполагаемую частоту обновления. Кроме создания карты, плагин Google XML Sitemaps при публикации новых материалов на вашем блоге уведомляет об этом многие поисковые системы, приглашая их побыстрее провести индексацию.

Путь до файла сайтмап можете задать сами в настройках плагина и даже можете дать ему название отличное от классического sitemap.xml.

Sitemap Joomla

Создать карту сайта для Joomla можно с помощью компонента Xmap.

Проверить Sitemap на битые ссылки

Чтобы не обманывать поискового робота sitemap.xml должна быть настроена без ошибок. Поэтому после каждого обновления файла нужно проверить sitemap на битые ссылки.

Зайдите в Яндекс Вебмастер — раздел «Инструменты» — «Анализ файлов Sitemap».

Выберите один из способов загрузки файла:

  • скопировать текст sitmepa.xml;
  • отправить URL карты сайта;
  • загрузить xml файл в сервис.

Проверка sitemap.xml в Яндекс Вебмастер

Зайдите в Google Search Console — раздел «Сканирование» — «Файлы Sitemap».

Анализ Sitemap.xml от PixelPlus

Инструмент от pixelplus.ru — Анализ XML-карты сайта. Он простой, крутой и понятный.

  1. Указываем карту сайта (URL) или загружаем XML-файл.

    Выбираем, требуется ли проверка кода ответа сервера для каждого URL в ней.

Инструмент позволит проверить корректность карты сайта (файла формата *.xml), а также найти:

    Ошибки валидности файла.

    Те URL, которые отдают код ответа не 200 OK.

    Прочие ошибки (указание на URL с другого домена, избыточный размер файла или числа URL в нём и так далее).

Напомним, что число допустимых URL в одном файле - 50 000 штук, а размер файла не должен превышать 10 МБайт.

Если будут найдены ошибки (такое случается часто), то сервис подскажет, какие URL отдают некорректный ответ (удалены, лишние и так далее).

Sitemap.xml — важный инструмент

Карта сайта - один из важный инструмент SEO-продвижения сайта. Не важно, как будет создана карта сайта. Важно - какие ссылки будут перечислены в карте сайта и как часто она будет обновляться. Иногда, в карту сайта выгружается все подряд и даже те ссылки, которые запрещены в robots.txt или неканонические ссылки. А обновление карты сайта происходит раз в месяц или реже. Подобное отношение к карте сайта может не просто сделать ее бесполезной, но того хуже - запутать поискового робота, что негативно отразится на индексации и позициях сайта в поиске.

Создайте карту сайта для своего ресурса. Но будьте внимательны и хорошо подумайте, что выгружать в sitemap, а что нет.

webmaster-seo.ru

Как часто после создания нового сайта для него создается карта сайта? Судя по нашей статистике вновь прибывших проектов, как минимум 50-60% сайтов создаются без генерации карты в формате sitemap.xml. Да, можно аргументировать тем, что дело разработчика – это создать сайт. Как он будет индексироваться и нас колько быстро попадет в индекс поисковых систем - это дело владельца сайта. В принципе, тоже верно, но создать Sitemap.XML и тем самым сделать как минимум приятный бонус для клиента – это вопрос нескольких минут.

Итак, что есть Sitemap.XML и чем может бать полезен? Расскажу об этом далее.

Sitemaps-XML-файл с информацией о страницах сайта для поисковых систем. Данный файл оказывает помощь поисковым системам в сканировании и индексировании страниц сайта. Стоит отметить, что данный файл не является директивой, а всего лишь своеобразным предложением к сканированию и индексации необходимых страниц сайта. Создавая такой файл для своего нового сайта, тем самым вы облегчаете (читайте, ускоряете) работу поисковых систем по сканированию и индексации сайта.

Пример Sitemap .xml

Привожу пример того как может выглядеть Sitemap в формате xml. (в нем описана только одна страница сайта)

http://www.site.com.ua/

2010-16-07

daily

1.0/priority>

Как создать Sitemap.xml

Для автоматизированного создания карты сайта есть достаточно много онлайн сервисов. Например: раз, два.

Как использовать Sitemap.xml

Как правило, файл располагают в корневой директории сайта, чтобы он был доступен по адресу http://www.site.com.ua/sitemap.xml.

В файле должно быть не более 50 000 URL и размер его не должен превышать 10 МБ. Если требуется указать более 50 000 URL, создаем несколько файлов Sitemap.

Проверка корректности созданного файла Sitemap

Для определения элементов и атрибутов, которые могут появляться в файлах Sitemap, используются следующие XML-схемы:

  • Для файлов Sitemap
  • Для файлов индекса Sitemap

Оповещение поисковых систем о файле карты сайта

После создания файла карты сайта и его размещения, требуется оповестить создан и размещен на веб-сервере, необходимо оповестить поисковые системы о его местонахождени.

Данную операцию можно сделать несколькими методами:

  • с помощью панели вебмастера поисковой системы
  • указав местоположение файла в файле robots.txt
  • с помошью специального запроса к поисковой системе (как создать запрос описано ниже)

В таблице приведены запросы к некоторым поисковым системам

Эпилог

Стоит отметить, что создание таких файлов как sitemap.xml и robots.txt являются одними из первых «джентльменских» действий после создания нового сайта.

blog.aweb.ua

С помощью «проверки XML-карты сайта» можно диагностировать и проблемы индексации. Для удобства выводится не только число найденных URL, но число документов в индексе Яндекса и Google для домена и их можно сравнить.

Потенциальные проблемы с индексацией, которые можно выявить:

    Число документов в индексе какой-то из поисковых систем — сильно меньше найденного в файле. Проблемы индексации, которые требуется решить для роста поискового трафика.

    В индексе сильно больше документов, чем в карте сайта. Дубли? Или в файл попали не все нужные URL.

Доступна и история проведенных проверок.

Удачи в работе!

tools.pixelplus.ru

Зачем нужен файл Sitemap?

В большинстве случаев грамотной внешней и внутренней перелинковки страниц достаточно, чтобы поисковые роботы узнали о всем содержимом сайта. Вместе с тем использование Карты сайта может заметно ускорить процесс полной индексации, особенно если:

  • Интернет-ресурс создан относительно недавно и пока не может похвастаться богатым профилем внешних ссылок;
  • в структуре сайта присутствуют многочисленные архивы веб-документов, не связанных между собой;
  • проект располагает большим количеством страниц, разделов, подразделов;
  • в структуре ресурса преобладают динамические страницы.

Во всех этих случаях всеобъемлющая индексация сайта поисковыми системами может оказаться под вопросом, если своевременно не позаботиться о файле Sitemap.

Базовые критерии создания файла Sitemap

К созданию Карты сайта выдвигается несколько основных требований, о которых веб-мастер должен всегда помнить.

Во-первых , количество URL-адресов в файле Sitemap не должно превышать 50 тысяч единиц. Если их больше, то необходимо создать несколько отдельных Карт сайта, которые прописываются в файле индекса Sitemap.

Во-вторых , максимальный размер файла – 10 Мб. Если несжатый файл превышает этот размер, его можно уменьшить при помощи архиватора gzip .

В-третьих , файл Sitemap должен находиться на том же домене, что и веб-сайт, для которого он создан.

В-четвертых , составление Карты сайта предполагает использование кодировки UTF-8, а также латинских букв и цифр.

В-пятых , ответом сервера на обращение к файлу Sitemap должен быть HTTP-статус с кодом 200 OK.

Допустимые форматы Карты сайта

Особое требование предъявляется к формату файла Sitemap. Так, Карта сайта может быть создана в виде XML-файла, текстового файла или посредством RSS, mRSS и Atom 1.0. При этом наиболее распространенным форматом, который распознают все поисковые системы, считается XML-файл. С его помощью поисковикам можно сообщить не только о правильном местоположение страницы в иерархии сайта, но и:

  • о частоте обновления веб-документа в принципе (атрибут – changefreq );
  • о дате последнего обновления на странице (атрибут – lastmod );
  • о разной важности тех или иных страниц ресурса (атрибут – priority ).

Пример Карты сайта в формате XML для PR-CY.ru, если бы он состоял из одной страницы и содержал упомянутые теги, мог бы выглядеть так:

http://www.pr-cy.ru/ 2016-03-21 daily 0.8

Làm cách nào để tạo và đặt tệp Sơ đồ trang web ở đâu?

Nếu muốn, bạn có thể tự tạo Sơ đồ trang web (thủ công), tuy nhiên, công việc này có vẻ tốn rất nhiều công sức. Do đó, tốt hơn hết bạn nên tạo tệp Sơ đồ trang web một cách tự động bằng cách sử dụng các dịch vụ trực tuyến miễn phí như dịch vụ này hoặc dịch vụ này.

Sau khi Sơ đồ trang web sẵn sàng, tệp phải được đặt vào thư mục gốc. Trong trường hợp này, liên kết chỉ đường dẫn đến tệp Sơ đồ trang web tới các công cụ tìm kiếm có thể như sau: http://www.pr-cy.ru/sitemap.xml

pr-cy.ru

Đối với tiêu đề sau, tôi gặp hai lỗi tương tự trên tất cả sơ đồ trang web của mình. Điều này thật khó hiểu vì nếu Google không thể đọc sơ đồ trang web của tôi thì làm sao họ có thể biết rằng mọi URL đều có mức độ ưu tiên như nhau? Tiêu đề sáng lên ở dòng thứ 2 sau phần khai báo XML. Google tuyên bố đã lập chỉ mục khoảng 2% URL từ bản đồ. Hãy giúp tôi.

CẬP NHẬT: Tôi nghĩ vấn đề là tôi không biết cách xác thực lược đồ. Làm thế nào để làm nó?

"http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xsi = xsi:schemaLocation => ==Lỗi phân tích cú pháp Chúng tôi không thể đọc Sơ đồ trang web của bạn. Nó có thể chứa một mục mà chúng tôi không thể nhận ra. Vui lòng xác thực Sơ đồ trang web của bạn trước khi gửi lại. ==Lưu ý Tất cả các URL trong Sơ đồ trang web của bạn đều có cùng mức độ ưu tiên...

CẬP NHẬT. Hãy kiên nhẫn khi kiểm tra XML lần đầu tiên. Tôi không hiểu các lỗi.

Lỗi trong tài liệu XML: 4: 80 SchemaLocation: SchemaLocation value = "http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" must have even number of URI"s. 4: 80 cvc-elt.1: Cannot find the declaration of element "urlset". XML document: 1 !} 2 "http://www.sitemaps.org/schemas/sitemap/0.9" 3 xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance" 4 xsi:sơ đồLocation = "http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"> 5 6 https://viws.ru/vi/ http://nutrograph.com/1-butter-salted 7 monthly 8 0.8 9 10 11 https://viws.ru/vi/ http://nutrograph.com/2-butter-whipped-with-salt 12 monthly 13 0.8 14 15

code-example.net

Cấu trúc của Sitemap.xml

Tệp được đánh dấu bằng thẻ XML, các thẻ chính cho biết:

  • Tầm quan trọng của trang nằm trong khoảng từ 0,1 đến 1,0 (với 0,1 là mức thấp nhất và 1,0 là mức ưu tiên cao nhất).
  • Tần suất cập nhật (mỗi giờ một lần, mỗi ngày một lần, mỗi tuần một lần, mỗi tháng một lần, mỗi năm một lần, không bao giờ hoặc luôn luôn).
  • Mô tả trang và phần đầu của trang (đây là thành phần bắt buộc của sơ đồ trang web).
  • Địa chỉ trang web (đây cũng là thành phần bắt buộc của sơ đồ trang web).
  • Ngày trang được sửa đổi lần cuối (đây là thành phần tùy chọn).

Vị trí của Sitemap.xml

Có các quy tắc về vị trí của tệp Sitemap.xml, việc tuân thủ các quy tắc này sẽ cho phép bạn đạt được kết quả tốt nhất trong việc quảng bá tài nguyên.

  • Bạn nên đặt tài liệu Sitemap.xml vào thư mục gốc của trang web.
  • Tất cả các liên kết trên trang web phải được đặt trên cùng một tên miền với tệp Sitemap.xml.
  • Các liên kết có trong tài liệu Sitemap.xml phải sử dụng cùng giao thức như các liên kết được đặt trên trang web (http hoặc https, có hoặc không có www.).
  • Trong tệp Robots.txt, bạn phải chỉ định đường dẫn đến sơ đồ trang web.

Sơ đồ trang web

Nó được phép đăng không chỉ tài liệu Sitemap.xml chính mà còn cả các tệp bổ sung tương tự như tài liệu chính. Mỗi tệp này không được chứa quá 50 nghìn liên kết và tổng kích thước của tài liệu không được quá 10 MB. Nếu cần, Sitemap.xml có thể được nén bằng trình lưu trữ tiêu chuẩn. Các tệp bổ sung được sử dụng nếu vượt quá kích thước của tệp chính. Mỗi tệp bổ sung được liệt kê trong chỉ mục và định dạng của nó giống hệt với tệp gốc.

Sử dụng Sitemap.xml

Tài liệu Sitemap.xml được sử dụng để quảng cáo trên công cụ tìm kiếm và đặc biệt quan trọng nếu:

  • Trang web còn tương đối trẻ và có quá ít liên kết dẫn đến nó từ các nguồn khác để quảng bá hiệu quả.
  • Trang web chứa một số lượng lớn các trang không được kết nối với nhau bằng các liên kết điều hướng.
  • Trang web chứa dữ liệu đa phương tiện không được bot lập chỉ mục.
  • Nội dung của các trang web được cập nhật liên tục.

Sơ đồ trang web dành cho Google.News

Khi quảng cáo một trang web tin tức trong công cụ tổng hợp tin tức của Google Tin tức, bạn phải tạo một tệp Sơ đồ trang web riêng để lập chỉ mục được cải thiện.

Tạo bản đồ trang web (Sitemap)

Hầu hết các CMS phổ biến đều cung cấp khả năng tạo sơ đồ trang web tự động. Nếu trang web của bạn không có cơ hội như vậy thì bạn có thể sử dụng dịch vụ: https://www.xml-sitemaps.com.

Bài viết về chủ đề: Cách tạo và định cấu hình sơ đồ trang web bằng XML và HTML.

Kiểm tra tính hợp lệ của sơ đồ trang web

Cách dễ nhất để kiểm tra tính hợp lệ của tệp sơ đồ trang web là thêm tệp đó vào quản trị viên web của công cụ tìm kiếm và nếu có vấn đề hoặc lỗi, bạn sẽ thấy chúng trong bảng điều khiển.

Với Báo cáo sơ đồ trang web, bạn có thể gửi sơ đồ trang web của mình tới Google, xem lịch sử gửi sơ đồ trang web và bất kỳ lỗi nào mà hệ thống của chúng tôi gặp phải khi phân tích cú pháp sơ đồ trang web của bạn.

Tệp Sơ đồ trang web là gì? Tôi có cần loại báo cáo này không?

Tệp sơ đồ trang webđược đặt trên trang web của bạn và chứa thông tin về tất cả các trang web mới và đã thay đổi. Nếu tài nguyên của bạn nhỏ (dưới 100 trang), bạn có thể thấy dễ dàng hơn khi yêu cầu lập chỉ mục trang chính, miễn là nó (hoặc một trong các trang mà nó liên kết trực tiếp đến hoặc thông qua các trang khác) có liên kết đến tất cả các trang khác.

Quản lý sơ đồ trang web

Cách gửi sơ đồ trang web

Thực hiện theo các bước sau:

  1. Đặt Sơ đồ trang web trên trang web của bạn. Yêu cầu:
    • Tệp sơ đồ trang web phải ở định dạng .
    • Tệp sơ đồ trang web phải có thể truy cập được đối với Googlebot.
  2. Bạn phải có sự cho phép của chủ sở hữu. Nếu nó không tồn tại, bạn có thể thêm liên kết đến nó trong tệp robots.txt thay vì gửi tệp.
  3. Cung cấp URL tương đối của tệp trên trang báo cáo Sơ đồ trang web và nhấp vào Gửi.
  4. Quá trình xử lý tệp Sơ đồ trang web sẽ bắt đầu ngay lập tức. Xin lưu ý rằng có thể mất một chút thời gian để thu thập thông tin các URL được liệt kê ở đó. Đôi khi không phải tất cả các URL đều có thể được quét (điều này phụ thuộc vào kích thước của trang web, lưu lượng truy cập và các yếu tố khác).

Chú ý!

Nếu bạn đã gửi cho chúng tôi Sơ đồ trang web, bạn không cần gửi lại nó, ngay cả khi bạn đã thực hiện các thay đổi đối với Sơ đồ trang web đó (chúng tôi sẽ nhận thấy chúng vào lần tiếp theo khi chúng tôi thu thập dữ liệu trang web của bạn).

Cách xóa sơ đồ trang web

Nếu bạn xóa Sơ đồ trang web, Sơ đồ trang web đó sẽ bị xóa khỏi báo cáo tương ứng nhưng sẽ vẫn còn trong Google cùng với bất kỳ URL nào có trong đó. Nếu bạn muốn robot Google ngừng truy cập các trang web của bạn, hãy thêm quy tắc vào tệp robots.txt của bạn.

Để xóa tệp sơ đồ trang web, hãy làm theo các bước sau:

Cách diễn giải báo cáo

  • Báo cáo chỉ hiển thị Sơ đồ trang web được gửi bằng cách sử dụng nó chứ không hiển thị các Sơ đồ trang web được phát hiện thông qua các liên kết trong tệp robots.txt hoặc các phương tiện khác. Tuy nhiên, nếu chúng tôi đã nhận được Sơ đồ trang web của bạn từ một nguồn khác, bạn vẫn có thể gửi sơ đồ trang web đó cho chúng tôi thông qua báo cáo này để chúng tôi có thể xác minh tính chính xác của dữ liệu và xác định tỷ lệ lỗi.
  • Báo cáo chỉ hiển thị Sơ đồ trang web có liên quan đến thuộc tính hiện tại.
  • Bạn có thể bao gồm URL cho hình ảnh, video và tin tức trong Sơ đồ trang web của mình. Tuy nhiên, báo cáo hiện không hiển thị thông tin về các loại địa chỉ này.

Thông tin sau được cung cấp cho mỗi tệp Sơ đồ trang web:

URL sơ đồ trang webĐịa chỉ nơi đặt tệp, liên quan đến thư mục gốc của tài nguyên. Kiểu Loại tệp sơ đồ trang web. Những giá trị khả thi:
  • Sơ đồ trang web– một tệp XML thông thường hoặc tệp văn bản Sơ đồ trang web.
  • Tệp chỉ mục sơ đồ trang web– tệp Sơ đồ trang web có thông tin về các tệp Sơ đồ trang web khác.
  • RSS– Tệp sơ đồ trang web ở định dạng nguồn cấp dữ liệu RSS.
  • nguyên tử– Tệp sơ đồ trang web ở định dạng nguồn cấp dữ liệu Atom.
  • không xác định– tệp có định dạng không xác định hoặc chưa được xử lý.
Đã gửi Ngày sơ đồ trang web được gửi lần cuối cho Google. Ngày xử lý cuối cùng Ngày sơ đồ trang web được các công cụ của Google xử lý lần cuối. Trạng thái Trạng thái gửi hoặc quét. Những giá trị khả thi: Số lượng URL được xác định Số lượng URL được liệt kê trong sơ đồ trang web. Nếu đây là tệp sơ đồ trang web chỉ mục, điều này sẽ cho biết tổng số URL trong tất cả các tệp có trong đó. URL trùng lặp chỉ được tính một lần. Nhấp vào biểu tượng này sẽ mở ra thông tin chi tiết về mức độ phù hợp cho tất cả các URL trong báo cáo. Trong trường hợp chỉ mục Sơ đồ trang web, tất cả các URL được liệt kê trong Sơ đồ trang web con của nó đều được liệt kê.

Sơ đồ trang web của tôi không được liệt kê

Dưới đây là một số lý do khiến sơ đồ trang web có thể bị thiếu trong báo cáo:

  • Nó thuộc về một tài nguyên khác. Sơ đồ trang web được liên kết với một thuộc tính không có sẵn cho những thuộc tính khác. Ví dụ: các tệp trong miền http://example.com sẽ không được báo cáo cho các miền http://m.example.com hoặc https://example.com. Để giải quyết vấn đề này, hãy đảm bảo bạn thêm tất cả các phiên bản URL tài nguyên của mình.
  • Bạn đã không gửi sơ đồ trang web tới Google bằng báo cáo. Nếu bạn gửi Sơ đồ trang web bằng phương pháp khác, chúng sẽ không được liệt kê, ngay cả khi Google có thể tìm và sử dụng chúng.

Lỗi trong Sơ đồ trang web

Các lỗi sau có thể xuất hiện trong báo cáo Sơ đồ trang web:

URL không thành công

Google không thể thu thập dữ liệu tất cả các URL được liệt kê trong sơ đồ trang web. Lý do có thể:

  • Có quá nhiều chuyển hướng đến URL. Chúng tôi khuyên bạn nên thay thế các URL đó bằng các địa chỉ có thể được thu thập thông tin trực tiếp.
    • Nếu bạn liên tục chuyển hướng từ trang này sang trang khác, hãy sử dụng chuyển hướng cuối cùng.
    • Chúng tôi khuyên bạn nên chọn không tham gia chuyển hướng bằng JavaScript hoặc thẻ meta làm mới.
  • Googlebots không thể thu thập dữ liệu các URL tương đối trong sơ đồ trang web của bạn. Bất cứ khi nào có thể, hãy sử dụng liên kết tuyệt đối thay vì liên kết tương đối. Ví dụ: khi liên kết đến một trang khác trên trang web của bạn, hãy sử dụng URL https://www.example.com/moya-stranitsa.html thay vì chỉ moya-stranitsa.html.

URL không hợp lệ

Một số URL ở cấp cao hơn sơ đồ trang web hoặc trên một miền khác.

Mức cao hơn. Nếu tệp nằm trên http://www.example.com/mysite/sitemap.xml thì các URL sau không hợp lệ cho tệp đó:

  • http://www.example.com/ – ở cấp cao hơn tệp Sơ đồ trang web;
  • http://www.example.com/yoursite/ – nằm trong thư mục con của tệp Sơ đồ trang web (bạn cần chuyển lên cấp cao hơn rồi xuống cấp thấp hơn).

Một tên miền khác.Đảm bảo tất cả các URL đều bắt đầu bằng tên miền nơi lưu trữ sơ đồ trang web của bạn. Ví dụ: nếu tệp nằm trên trang http://www.example.com/sitemap.xml thì các URL sau không hợp lệ cho tệp đó:

  • http://example.com/ – thiếu www ở đầu.
  • www.example.com/ – không có tiền tố giao thức (http).
  • https://www.example.com/ – giao thức là https thay vì http.

Lỗi nén

Lỗi khi cố giải nén tệp Sơ đồ trang web đã nén. Thực hiện nén lại (ví dụ: sử dụng gzip), sau đó tải nó lên trang web của bạn và gửi lại cho Google.

Sơ đồ trang web trống

Sơ đồ trang web thiếu URL. Hãy chắc chắn rằng nó không trống.

Đã vượt quá kích thước tệp sơ đồ trang web tối đa được phép

Kích thước tệp Sơ đồ trang web không nén vượt quá 50 MB. Chia nó thành nhiều tệp và lập chỉ mục cho chúng, sau đó gửi riêng từng tệp cho chúng tôi.

Giá trị thuộc tính không hợp lệ

Thuộc tính được liên kết với một trong các thẻ XML trong sơ đồ trang web có giá trị không hợp lệ. Xem lại Sơ đồ trang web để đảm bảo rằng tất cả thuộc tính được sử dụng theo thông số kỹ thuật của sơ đồ trang web. Kiểm tra lỗi chính tả trong các giá trị thuộc tính.

Ngày không hợp lệ

Một hoặc nhiều ngày trong sơ đồ trang web có định dạng hoặc giá trị không chính xác. Ngày phải ở định dạng mã hóa ngày giờ W3C. Thời gian có thể không được chỉ định. Đảm bảo rằng tất cả các ngày đều được ghi bằng một trong các định dạng mã hóa W3C hợp lệ.

21-02-2005 2005-02-21T18:00:15+00:00

Không cần đặt thời gian (mặc định là 00:00:00Z), nhưng nếu có, hãy nhớ chỉ định múi giờ.

Giá trị thẻ không hợp lệ

Sơ đồ trang web chứa một hoặc nhiều thẻ có giá trị không hợp lệ. Kiểm tra thông số kỹ thuật của loại tệp sơ đồ trang web thích hợp (chỉ mục, tiêu chuẩn, video, v.v.).

URL không hợp lệ

Sơ đồ trang web chứa URL không hợp lệ. Nó có thể chứa các ký tự không hợp lệ (dấu cách, dấu ngoặc kép, v.v.) hoặc các lỗi định dạng khác, chẳng hạn như có tiền tố htp:// thay vì http:// .

Thiếu URL biểu tượng video

Một hoặc nhiều bài đăng video thiếu liên kết tới biểu tượng video. Đảm bảo các thẻ URL của tất cả các biểu tượng như vậy được chỉ định.

Tiêu đề video bị thiếu

Một số mục video bị thiếu tiêu đề. Đảm bảo các thẻ Tên của tất cả các video được chỉ định.

Định dạng chỉ mục Sơ đồ trang web không chính xác: Tệp con chỉ mục Sơ đồ trang web

Một hoặc nhiều mục nhập tệp chỉ mục Sơ đồ trang web chứa URL riêng của nó hoặc URL của tệp chỉ mục Sơ đồ trang web khác. Tệp chỉ mục Sơ đồ trang web chỉ có thể chứa các liên kết đến Sơ đồ trang web thông thường chứ không phải chỉ mục.

Xóa các mục trỏ đến chỉ mục sơ đồ trang web và gửi lại tệp.

Lỗi phân tích cú pháp

Google không thể phân tích nội dung XML trong sơ đồ trang web của bạn.

Điều này thường xảy ra do các ký tự không thoát trong một trong các URL. Giống như các tệp XML, mọi giá trị dữ liệu (bao gồm cả URL) đều phải sử dụng mã thoát cho một số ký tự nhất định, chẳng hạn như & " "< >. Kiểm tra xem tính năng thoát URL có được định cấu hình chính xác hay không.

Lỗi tạm thời

Không thể xử lý tệp sơ đồ trang web do lỗi hệ thống tạm thời. Thông thường, nếu xảy ra lỗi này thì không cần phải gửi lại file. Googlebot sẽ cố gắng truy xuất nó sau. Nếu thông báo lỗi này tiếp tục xuất hiện sau vài giờ, vui lòng gửi lại Sơ đồ trang web.

Quá nhiều sơ đồ trang web trong tệp chỉ mục

Có hơn 50.000 Sơ đồ trang web trong tệp chỉ mục. Chia nó thành nhiều phần và đảm bảo rằng mỗi phần chứa không quá 50.000 Sơ đồ trang web.

Quá nhiều URL trong sơ đồ trang web

Có hơn 50.000 URL trong Sơ đồ trang web. Chia nó thành nhiều phần, mỗi phần chứa tới 50.000 địa chỉ. Để thuận tiện, bạn có thể tạo tệp chỉ mục Sơ đồ trang web.

Định dạng tập tin không được hỗ trợ

Bạn đã tạo một tập tin không chính xác.

Để tránh các lỗi XML phổ biến nhất, hãy kiểm tra những điều sau:

  • Sơ đồ trang web phải có tiêu đề chính xác. Ví dụ: nếu nội dung tệp thể hiện thông tin về video thì tiêu đề phải như sau:
  • Không gian tên trong tiêu đề sẽ trông giống như http://www.sitemaps.org/schemas/sitemap/0.9(Không .9 ).
  • Tất cả các thuộc tính XML phải được đặt trong dấu ngoặc đơn (“”) hoặc dấu ngoặc kép (“”), chỉ được là dấu ngoặc kép thẳng. Chú ý! Các trình soạn thảo văn bản như Microsoft Word có thể tự động thay đổi chúng thành dạng cong.

Đường dẫn không hợp lệ: thiếu tiền tố www

Đường dẫn tệp sơ đồ trang web không chứa tiền tố www (ví dụ: http://example.com/sitemap.xml), nhưng tất cả các URL được liệt kê trong tệp đều có tiền tố này (ví dụ: http://www.example. com/myfile.html ).

Chỉnh sửa sơ đồ trang web của bạn để xóa tiền tố www khỏi tất cả các URL.

Đường dẫn không hợp lệ: có tiền tố www

Đường dẫn tệp sơ đồ trang web chứa tiền tố www (ví dụ: http://www.example.com/sitemap.xml), nhưng tiền tố này không có trong tất cả các URL được liệt kê trong tệp (ví dụ: http:// example.com/myfile.xml).

Chỉnh sửa sơ đồ trang web của bạn để thêm tiền tố www vào tất cả các URL.

Không gian tên được chỉ định không chính xác

Phần tử gốc của tệp Sơ đồ trang web có vùng tên không chính xác hoặc bị thiếu, lỗi chính tả hoặc URL không chính xác.

Đảm bảo không gian tên được đặt chính xác dựa trên loại tệp. Ví dụ:

  • Tệp sơ đồ trang web: xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
  • Sơ đồ trang web dành cho Video: xmlns:video="http://www.google.com/schemas/sitemap-video/1.1"
  • Tài liệu mục lục Sơ đồ trang web:

Tệp sơ đồ trang web bắt đầu bằng dấu cách

Tệp Sơ đồ trang web của bạn bắt đầu bằng khoảng trắng chứ không phải vùng tên. Các tệp XML phải bắt đầu bằng một khai báo XML chỉ định phiên bản XML sẽ sử dụng.

Lỗi này sẽ không ngăn Google xử lý Sơ đồ trang web của bạn nhưng tốt nhất bạn nên xóa khoảng trống để tệp tuân thủ các tiêu chuẩn XML và thông báo lỗi này sẽ không còn xuất hiện.

Lỗi HTTP ( mã cụ thể)

Đã xảy ra lỗi HTTP khi cố tải xuống Sơ đồ trang web. Thông báo về nó sẽ cho biết mã trạng thái (ví dụ: 404). Đảm bảo URL Sơ đồ trang web chính xác và tệp nằm ở vị trí được chỉ định. Sau đó gửi lại cho Google.

Biểu tượng video quá lớn

Biểu tượng video được cung cấp trong sơ đồ trang web quá lớn. Thay đổi kích thước của nó thành 160 x 120 pixel. Nếu cần, hãy cập nhật sơ đồ trang web của bạn và gửi lại cho Google.

Biểu tượng video quá nhỏ

Biểu tượng video được cung cấp trong sơ đồ trang web quá nhỏ. Thay đổi kích thước của nó thành 160 x 120 pixel. Cập nhật Sơ đồ trang web nếu cần thiết.

Vị trí trang phát lại và video giống nhau

URL video và trang phát lại được chỉ định trong tệp Sơ đồ trang web không được giống nhau. Nếu cả hai thẻ được sử dụng ( ), các URL phải khác nhau.

URL vị trí video trỏ đến trang phát lại

Tệp sơ đồ trang web chứa các URL bị chặn trong tệp robots.txt

Googlebot không thể xử lý sơ đồ trang web vì quyền truy cập vào sơ đồ hoặc nội dung của sơ đồ bị cấm trong tệp robots.txt. Sử dụng công cụ kiểm tra URL để tìm ra tệp nào đang gây ra sự cố và thực hiện các thay đổi cần thiết đối với robots.txt.

Thông tin này có hữu ích không?

Làm thế nào bài viết này có thể được cải thiện?

Sơ đồ trang web là một trang html của một trang web hoặc một tệp xml đặc biệt, hiển thị liên kết đến tất cả các trang quan trọng của trang web. Để hiểu sơ đồ trang web là gì, chỉ cần tưởng tượng mục lục của một cuốn sách và nó sẽ rõ ràng ngay lập tức. tại sao bạn cần bản đồ trang web. Sơ đồ trang web giúp khách truy cập, có thể là người hoặc robot tìm kiếm, nhanh chóng tìm thấy bất kỳ trang nào trên trang web, thực hiện số lần chuyển đổi tối thiểu. Trên các trang web đơn giản, nhỏ, tất cả các trang có thể được truy cập trong vòng 1-2 lần nhấp chuột từ trang chính, nhưng nếu trang web lớn và cấu trúc của nó phức tạp thì sao? Một trang web như vậy sẽ không chỉ gây bất tiện cho khách truy cập mà còn không rõ ràng đối với các công cụ tìm kiếm.

Có những loại bản đồ trang web nào?

Công cụ tìm kiếm lập chỉ mục trang web dần dần, theo cấp độ, bắt đầu từ trang chính. Nếu trang web có nhiều cấp độ lồng trang thì sẽ mất nhiều tháng để tất cả các trang của trang web được lập chỉ mục. Vì vậy nó là cần thiết tạo bản đồ trang web, trên đó sẽ có tất cả các liên kết đến tất cả các trang của trang web cùng một lúc, để robot không lãng phí thời gian điều hướng qua các cấp độ lồng nhau, phải không? Có và không. Câu trả lời phụ thuộc vào lý do bản đồ được tạo ra và nó sẽ như thế nào. Chúng ta hãy xem các loại sơ đồ trang web là gì?.

Sơ đồ trang web HTML Sơ đồ trang web

Sơ đồ trang web được chia thành 2 loại hoặc định dạng chính: sơ đồ trang web html và một tệp xml sơ đồ trang web. Sơ đồ trang web HTML là một trang web, trong đó liệt kê các liên kết. Thông thường đây là các liên kết đến các phần và trang quan trọng nhất của trang web. Sơ đồ trang web HTML được thiết kế nhiều hơn cho mọi người thay vì robot và giúp bạn nhanh chóng điều hướng các phần chính của trang web. Đối với sơ đồ trang web ở dạng trang HTML, có những hạn chế nghiêm trọng về số lượng liên kết trên một trang. Nếu có quá nhiều liên kết trên một trang, không phải tất cả các liên kết đều có thể được lập chỉ mục hoặc trang sơ đồ trang web thậm chí có thể bị loại khỏi các tìm kiếm vì có quá nhiều liên kết, thậm chí .

Để sơ đồ trang web html được lập chỉ mục chính xác và được khách truy cập cảm nhận đầy đủ, bạn không nên đặt quá 100 liên kết trên trang. Điều này là quá đủ để đặt trên trang tất cả các phần và phần phụ không vừa với menu chính.

Thường xuyên, sơ đồ trang web ở định dạng HTML có cấu trúc cây, trong đó các phần và phần phụ mở rộng được chỉ định. Các bản đồ trang web HTML cồng kềnh không cần thiết thường được thiết kế với các yếu tố đồ họa, kiểu CSS và được bổ sung bằng tập lệnh Java. Tuy nhiên, sơ đồ trang web html ít có giá trị đối với các công cụ tìm kiếm.

Sơ đồ trang web HTML không phải là sơ đồ trang web đầy đủ. Phải làm gì nếu trang web có hàng trăm, hàng nghìn, hàng chục nghìn trang? Để thực hiện việc này, bạn cần đặt liên kết đến tất cả các trang trong sơ đồ trang web ở định dạng xml.

Sơ đồ trang web XML

Sơ đồ trang web XML là một tệp ở định dạng xml, như sitemap.xml, thường nằm ở thư mục gốc của trang web. Sơ đồ trang web ở định dạng xml có nhiều ưu điểm hơn sơ đồ trang web html. Sơ đồ trang web xml là một định dạng sơ đồ trang web đặc biệt, được xác định bởi tất cả các công cụ tìm kiếm phổ biến, chẳng hạn như Google và Yandex. Bạn có thể chỉ định tối đa 50.000 liên kết trong sơ đồ trang web xml. Hơn nữa, trong sơ đồ trang web xml, bạn có thể chỉ định mức độ ưu tiên tương đối và tần suất cập nhật trang.

Điều đáng nói là nội dung của bản đồ trang web chỉ mang tính chất đề xuất cho robot tìm kiếm. Ví dụ: nếu bạn đặt tần suất cập nhật hàng năm cho một trang trên trang web, rô-bốt tìm kiếm sẽ vẫn truy cập thường xuyên hơn. Và nếu bạn đặt tốc độ làm mới trang là hàng giờ, điều này không có nghĩa là robot sẽ lập chỉ mục trang mỗi giờ.

Sơ đồ trang web xml có cú pháp cụ thể, chúng ta hãy xem cấu trúc của sơ đồ trang web xml chi tiết hơn.

Tệp sơ đồ trang web mẫu sitemap.xml

Sitemap.xml chính xác phải được mã hóa UTF8. Nội dung của tệp sitemap.xml trông như thế này:

http://mysite.ru/ 2014-09-18T18:54:13+04:00 always 1.0 http://mysite.ru/category/ 2014-09-18T18:57:09+04:00 hourly 0.8 http://mysite.ru/page/ 2014-09-18T18:59:37+04:00 daily 0.6

Trường hợp sử dụng các thẻ bắt buộc sau:

  • — thẻ cha, nó chứa tất cả các URL;
  • — thẻ chứa thông tin về một URL cụ thể;
  • https://viws.ru/vi/— trong thẻ này url được chỉ định trực tiếp.
  • — thẻ này chứa ngày sửa đổi lần cuối của trang;
  • — thẻ được sử dụng để cho biết tần suất trang thay đổi: luôn luôn, hàng giờ, hàng ngày, hàng tuần, hàng tháng, hàng năm, không bao giờ;
  • — cho biết mức độ ưu tiên của một trang cụ thể so với các trang khác của trang web từ 0,1 – mức độ ưu tiên thấp đến 1 – mức độ ưu tiên cao.

Ngoài ra, tệp sơ đồ trang web ở định dạng xml phải chứa dấu hiệu về không gian tên ngôn ngữ XML:

Xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

Nếu tệp sơ đồ trang web bao gồm hơn 50 nghìn liên kết hoặc kích thước của sitemap.xml vượt quá 10 MB, bạn nên chia sơ đồ trang web thành nhiều tệp. Trong trường hợp này, trong sơ đồ trang web, bạn cần chỉ ra một số liên kết đến các tệp bản đồ khác nhau.

http://mysite.ru/sitemaps/sitemap01.xml 2014-09-18T18:54:13+04:00 http://mysite.ru/sitemaps/sitemap02.xml 2014-09-18T18:54:13+04:00

Các thẻ đã quen thuộc với chúng ta được sử dụng ở đây , cũng như các thẻ bắt buộc:

  • — thẻ gốc, chứa địa chỉ của tất cả các bản đồ trang web;
  • — thẻ chứa thông số cho từng sơ đồ trang web.

Tệp sơ đồ trang web mẫu sitemap.txt

Một cách khác để tạo sơ đồ trang web ở dạng tệp có thể là sơ đồ trang web ở định dạng txt:

1. http://mysite.ru/ 2. http://mysite.ru/page/ 3. http://mysite.ru/page1/

Nó đơn giản. Tệp sitemap.txt liệt kê tất cả các liên kết cần thiết theo từng dòng. Sơ đồ trang web ở định dạng txt là “tùy chọn dành cho người lười biếng”. Giới hạn xml của sơ đồ trang web tương tự là 50.000 liên kết hoạt động ở đây. Tuy nhiên, sơ đồ trang web TXT không có khả năng chỉ ra ngày sửa đổi cuối cùng và mức độ ưu tiên của trang.

Cách tạo sơ đồ trang web

Tạo bản đồ trang web một quá trình quan trọng trong đó cần chỉ rõ những trang nào của trang web cần được lập chỉ mục và cách tốt nhất để lập chỉ mục chúng. Tùy thuộc vào loại bản đồ trang web mà chúng ta đang nói đến, khác nhau cách tạo bản đồ trang web. Không có ích gì khi thảo luận về cách tạo sơ đồ trang web html riêng biệt. Hãy xem cách tạo bản đồ ở định dạng tệp xml. Có một số cách cơ bản để tạo sơ đồ trang web, nhưng điểm chung của chúng là vị trí của sơ đồ trang web và cách công cụ tìm kiếm xác định sơ đồ trang web.

Như đã viết ở trên - Tệp sơ đồ trang web nằm ở thư mục gốc của trang web. Công cụ tìm kiếm có thể phát hiện độc lập tệp sơ đồ trang web. Nhưng có một số cách để cung cấp liên kết trực tiếp đến (các) tệp sơ đồ trang web để các công cụ tìm kiếm khám phá nhanh hơn. Cách dễ nhất để chỉ định vị trí của tệp sơ đồ trang web là chỉ định trực tiếp một liên kết hoặc một số liên kết đến tệp sơ đồ trang web trong các công cụ quản trị trang web từ Yandex và Google. Ở đó bạn có thể kiểm tra sơ đồ trang web, chỉ đạo phân tích bản đồ trang web cho chính xác, sự tương ứng về những trang nào trong bản đồ trang web được công cụ tìm kiếm tìm thấy và số lượng trang trong số đó được lập chỉ mục.

Cách thứ hai để trỏ công cụ tìm kiếm đến vị trí của tệp sơ đồ trang web là .

Sơ đồ trang web: http://mysite.ru/sitemap.xml

Bạn có thể chỉ định một số tệp sơ đồ trang web trong robots.txt, sau đó nó sẽ tự động được thêm vào các công cụ quản trị trang web. Chúng ta đã xem cách tìm sơ đồ trang web, bây giờ hãy chuyển sang cách tạo sơ đồ trang web.

Những cách cơ bản để tạo sơ đồ trang web

  1. Tạo bản đồ trang web bởi hệ thống quản lý trang web, nếu CMS có khả năng tích hợp như vậy.
  2. Tải xuống bản đồ trang web từ dịch vụ trực tuyến của bên thứ ba. Có nhiều trình tạo sơ đồ trang web trực tuyến với các khả năng và hạn chế khác nhau. Ví dụ: xml-sitemaps.com có ​​khả năng định cấu hình các tham số sơ đồ trang web, nhưng có giới hạn về số lượng liên kết trong tệp sitemap.xml là 500 phần.
  3. Tải xuống chương trình tạo bản đồ trang web. Các chương trình tạo như vậy thường phải trả phí, nhưng với sự trợ giúp của chúng, bạn có thể thường xuyên tạo sơ đồ trang web xml cho một hoặc một số trang web. Dưới đây là một số ví dụ về các chương trình tạo như vậy: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generator.
  4. Tự động tạo sơ đồ trang web trong Joomla (Jumla), WordPress (Wordpress), Bitrix (Bitrix).
  5. Tạo sơ đồ trang web theo cách thủ công.

Sơ đồ trang web là một trong những công cụ quan trọng nhất. Việc tạo sơ đồ trang web như thế nào không quan trọng. Điều quan trọng là những liên kết nào sẽ được liệt kê trong sơ đồ trang web và tần suất nó được cập nhật. Đôi khi, mọi thứ đều được tải lên sơ đồ trang web, ngay cả những liên kết bị cấm trong robots.txt hoặc . Và sơ đồ trang web được cập nhật mỗi tháng một lần hoặc ít hơn. Thái độ như vậy đối với bản đồ trang web không chỉ có thể khiến nó trở nên vô dụng mà thậm chí còn tệ hơn - khiến robot tìm kiếm nhầm lẫn, điều này sẽ ảnh hưởng tiêu cực đến việc lập chỉ mục và vị trí của trang web trong tìm kiếm.

Tạo sơ đồ trang web cho tài nguyên của bạn. Nhưng hãy cẩn thận và suy nghĩ kỹ về những gì cần tải lên sơ đồ trang web và những gì không.

Sơ đồ trang web là một tệp có liên kết đến các trang web thông báo cho công cụ tìm kiếm về cấu trúc hiện tại của trang web. Yandex hỗ trợ các định dạng XML và TXT. Định dạng XML cho phép truyền tải thông tin bổ sung.

Ghi chú. Yandex không đảm bảo rằng tất cả các URL được chỉ định trong tệp sẽ xuất hiện trong kết quả tìm kiếm.

  1. Yêu cầu về tập tin
  2. Câu hỏi và câu trả lời

Khi nào cần có Sơ đồ trang web?

Yandex đang phát triển các thuật toán đặc biệt để robot lập chỉ mục tìm hiểu về trang web. Ví dụ, sử dụng Một liên kết liên kết các trang trên cùng một trang. Các trang có thể\n được đặt trong các thư mục khác nhau của cùng một tên miền hoặc trên các tên miền phụ.

"}}">nội bộMột liên kết nằm trên một trang web khác."))"> bên ngoài liên kết - di chuyển từ trang này sang trang khác. Đôi khi robot có thể bỏ qua các trang. Sử dụng Sơ đồ trang web nếu trang web của bạn:

    một số lượng lớn các trang;

    các trang riêng lẻ không có liên kết điều hướng;

    làm tổ sâu.

Các định dạng được Yandex hỗ trợ

Hạn chế. Yandex Search không hỗ trợ truyền nguồn cấp dữ liệu RSS và Atom bằng tệp Sơ đồ trang web.

Yêu cầu về tập tin

    Kích thước tệp không nén tối đa là 50 MB.

    Đặt tệp trên cùng một miền với trang web được biên dịch.

    Khi truy cập một tệp, máy chủ phải trả về mã HTTP 200.

Cách tạo tệp và báo cáo cho Yandex

Nếu cần, bạn có thể xóa thông tin Sơ đồ trang web.

Câu hỏi và câu trả lời

Sơ đồ trang web được hiển thị trong dịch vụ dưới dạng một trang bị loại trừ với trạng thái “Định dạng tài liệu không hợp lệ”

Việc hiển thị Sơ đồ trang web (cũng như các tệp XML khác) dưới dạng các trang bị loại trừ chỉ nhằm mục đích cung cấp thông tin và không ảnh hưởng đến việc lập chỉ mục trang web hoặc xử lý Sơ đồ trang web theo bất kỳ cách nào.

Tệp Sơ đồ trang web có thể được hiển thị trong một nhóm các trang bị loại trừ do robot đã cố lập chỉ mục nó như một trang thông thường, trong khi các tệp XML không được lập chỉ mục trong công cụ tìm kiếm Yandex và không tham gia vào kết quả tìm kiếm.

Đã xảy ra lỗi "Thẻ không xác định" khi xử lý Sơ đồ trang web

Tệp Sơ đồ trang web chỉ có thể chứa một số phần tử XML nhất định. Nếu Quản trị viên web phát hiện các thành phần khác trong tệp (ví dụ: dấu hiệu của phiên bản dành cho thiết bị di động hoặc đa ngôn ngữ, địa chỉ của hình ảnh), lỗi “Thẻ không xác định” sẽ xuất hiện trong Quản trị viên web. Các phần tử không được hỗ trợ sẽ bị robot bỏ qua khi xử lý Sơ đồ trang web, trong khi dữ liệu từ các phần tử được hỗ trợ sẽ được tính đến. Vì vậy, không cần thiết phải thay đổi tệp Sơ đồ trang web.

Nếu nội dung của tập tin bị thay đổi, sẽ mất tới hai tuần để cập nhật thông tin trong Webmaster.

Tệp Sơ đồ trang web ở trạng thái "Không được lập chỉ mục"

Tệp Sơ đồ trang web có thể không được lập chỉ mục vì một số lý do:

    Robot gần đây đã thu thập dữ liệu Sơ đồ trang web và chưa xử lý nó. Đợi hai tuần. Nếu bạn đang sử dụng tệp chỉ mục Sơ đồ trang web có nhiều tệp, chúng có thể mất nhiều thời gian để xử lý hơn so với một tệp Sơ đồ trang web.

    Trang web này trước đây không khả dụng đối với robot lập chỉ mục. Bạn phải đợi cho đến khi robot tiếp theo ghé thăm trang web.

Xin chào các bạn thân mến trên các trang của trang web! Hôm nay tôi sẽ trình bày cách thêm Sitemap.xml vào Google và Yandex. Hãy để tôi nhắc bạn rằng tệp Sơ đồ trang web là một bản đồ trang web ở định dạng XML dành cho các công cụ tìm kiếm, không hiển thị cho khách truy cập blog. Nó chứa danh sách các trang của trang web cần được lập chỉ mục bởi robot tìm kiếm, thông tin về tầm quan trọng và tần suất cập nhật của chúng. Tạo một sơ đồ trang web như vậy giúp cải thiện tối ưu hóa SEO trên trang của trang web.

Cách thêm sơ đồ trang web Sitemap.xml trong bảng quản trị trang web Yandex và Google

Để thêm tệp Sơ đồ trang web vào Google và Yandex, trước tiên bạn phải tạo tệp đó. Tiếp theo, chúng tôi thêm trang web vào bảng quản trị trang web Yandex và Google và xác nhận quyền đối với trang web. Nếu bạn chưa làm điều này, tôi đã viết trước đó, và.

Bây giờ hãy chuyển sang thêm bản đồ trang web vào công cụ tìm kiếm. Có hai cách để thông báo cho công cụ tìm kiếm về sự hiện diện của Sơ đồ trang web:

  • Thêm chỉ thị Sơ đồ trang web vào tệp robots.txt. Đọc thêm về điều này trong bài viết ““.
  • Thêm tệp Sơ đồ trang web vào công cụ tìm kiếm trong Yandex.Webmaster và Google Webmaster Tools.

Ngay cả khi bạn đã chỉ định đường dẫn đến sơ đồ trang web trong robots.txt, việc thực hiện phương pháp thứ hai sẽ không thừa.

Chúng tôi truy cập bảng điều khiển Yandex.Webmaster bằng liên kết http://webmaster.yandex.ua/, sau khi đã đăng nhập trước đó. Trong danh sách các trang web đã thêm, hãy chọn trang web có tệp Sơ đồ trang web mà chúng tôi muốn thêm vào Yandex. Ở menu bên trái “ thông tin chung"chọn mục" Thiết lập lập chỉ mục” – “ Tệp sơ đồ trang web “. Trên trang mở ra, hãy nhập đường dẫn đầy đủ đến bản đồ trang web vào trường đặc biệt và nhấp vào nút “Thêm”.

Bây giờ sơ đồ trang web XML đã được thêm vào công cụ tìm kiếm Yandex và tệp Sơ đồ trang web sẽ được xử lý trong khoảng hai tuần.

Nếu mọi thứ được thực hiện chính xác, sau một thời gian bạn sẽ thấy hình ảnh sau:

Như bạn có thể thấy, tôi đã thêm hai tệp vào Yandex: Sitemap.xml và Sitemap.xml.gz. Thứ hai là tệp XML nén được tạo bởi plugin Google XML Sitemaps WordPress. Tôi nghĩ không cần thiết phải thêm tệp Sơ đồ trang web nén vào Yandex, vì khi bạn nhấp vào bất kỳ nút “Chi tiết khác” nào, bạn có thể thấy chính xác thông tin tương tự.

Tôi đã thêm cả hai tệp Sơ đồ trang web vì blog được lập chỉ mục mà không gặp vấn đề gì và tôi thấy không có lý do gì để thay đổi bất cứ điều gì.

Nếu bạn cần xóa sơ đồ trang web, hãy nhấp vào dấu thập bên cạnh tên tệp (xem hình trước).

Cách thêm Sơ đồ trang web vào Google

Ở đây chúng tôi làm mọi thứ theo cùng một cách. Đăng nhập vào Google và truy cập Công cụ quản trị trang web bằng liên kết https://www.google.com/webmasters/tools/. Chọn trang web mong muốn từ danh sách và chọn mục “ Cấu hình trang web” – “ Tệp sơ đồ trang web “. Nhấn nút " Thêm/Xác minh tệp Sơ đồ trang web“.

Một cửa sổ bật lên sẽ xuất hiện nơi chúng tôi nhập địa chỉ sơ đồ trang web và nhấp vào “ Gửi sơ đồ trang web“. Xin lưu ý rằng địa chỉ http://site/ đã được điền tự động và bạn chỉ cần thêm phần còn thiếu.

Như chúng ta thấy, thêm Sitemap.xml vào Google và bạn có thể nhận thông tin về nó nhanh hơn trong Yandex.

Theo cách tương tự, nếu cần, tệp Sơ đồ trang web sẽ được kiểm tra trong Google. Tất cả những gì bạn phải làm là nhấn nút “ Kiểm tra sơ đồ trang web” trong cửa sổ bật lên.

Nếu bạn gặp lỗi khi thêm tệp XML vào Google, hãy xóa tệp khỏi danh sách (xem hình trên) và thử tải chúng lên lại.

Thêm Sitemap.xml vào Yandex và Google bạn cần nó một lần. Giờ đây, khi các bài viết mới xuất hiện trên blog, các công cụ tìm kiếm chắc chắn sẽ không bỏ sót chúng trong quá trình lập chỉ mục và quá trình này sẽ diễn ra nhanh hơn. Sơ đồ trang web được tự động cập nhật trong bảng quản trị trang web Yandex và Google. Do đó, không cần phải thêm tệp Sơ đồ trang web mới mỗi lần.

Như bạn có thể thấy, không có gì phức tạp. Tuy nhiên, nhiều người quên thêm sơ đồ trang XML vào công cụ tìm kiếm. Nhắc nhở họ bằng cách gửi liên kết tới bài viết này trên mạng xã hội (các nút bên dưới).