Sơ đồ trang web tàn nhẫn html. Sử dụng nhiều thẻ. Sơ đồ trang web có ảnh hưởng đến quảng cáo không?

Tệp sitemap.xml là một công cụ cho phép quản trị viên web thông báo cho các công cụ tìm kiếm về các trang có sẵn để lập chỉ mục. Ngoài ra, trong bản đồ XML, bạn có thể chỉ định các tham số trang bổ sung: ngày cập nhật cuối cùng, tần suất cập nhật và mức độ ưu tiên so với các trang khác. Thông tin trong sitemap.xml có thể ảnh hưởng đến hoạt động của trình thu thập thông tin tìm kiếm và nói chung là quá trình lập chỉ mục các tài liệu mới. Sơ đồ trang web chứa các chỉ thị để đưa các trang vào hàng đợi để thu thập thông tin và bổ sung cho robots.txt, chứa các chỉ thị để loại trừ các trang.

Trong hướng dẫn này, bạn sẽ tìm thấy câu trả lời cho tất cả các câu hỏi liên quan đến việc sử dụng sitemap.xml.

Tôi có cần sitemap.xml không

Công cụ tìm kiếm sử dụng sơ đồ trang web để tìm tài liệu mới trên trang web (đây có thể là tài liệu html hoặc nội dung đa phương tiện) không thể truy cập được thông qua điều hướng nhưng cần được thu thập thông tin. Việc có một liên kết đến một tài liệu trong sitemap.xml không đảm bảo rằng nó sẽ được thu thập thông tin hoặc lập chỉ mục, nhưng hầu hết các tệp sẽ giúp các trang web lớn được lập chỉ mục tốt hơn. Ngoài ra, dữ liệu từ Bản đồ XMLđược sử dụng trong việc xác định trang chuẩn, trừ khi được quy định cụ thể trong thẻ rel=canonical.

Sitemap.xml rất quan trọng đối với các trang web:

  • Một số phần không thể truy cập được thông qua menu điều hướng.
  • Có nhiều trang bị cô lập hoặc các trang có kết nối kém.
  • Các công nghệ được công cụ tìm kiếm hỗ trợ kém sẽ được sử dụng (ví dụ: Ajax, Flash hoặc Silverlight).
  • Có rất nhiều trang và có khả năng trình thu thập thông tin tìm kiếm sẽ bỏ lỡ nội dung mới.

Nếu đây không phải là trường hợp của bạn thì rất có thể bạn không cần sitemap.xml. Đối với các trang web mà mọi trang quan trọng để lập chỉ mục đều có sẵn trong vòng 2 lần nhấp chuột, nơi công nghệ JavaScript hoặc Flash không được sử dụng để hiển thị nội dung, nơi sử dụng thẻ chuẩn và thẻ khu vực nếu cần thiết và nội dung mới xuất hiện không thường xuyên hơn thời gian robot truy cập trang web, trong file sitemap.xml là không cần thiết.

Đối với các dự án nhỏ, nếu chỉ có vấn đề với mức độ lồng tài liệu lớn thì có thể dễ dàng giải quyết bằng sử dụng HTML sơ đồ trang web mà không cần dùng đến sử dụng XML thẻ. Nhưng nếu bạn quyết định rằng bạn vẫn cần sitemap.xml thì hãy đọc toàn bộ hướng dẫn này.

Thông tin kĩ thuật

  • Sơ đồ trang web.xml là tập tin văn bảnđịnh dạng XML. Tuy nhiên, các công cụ tìm kiếm cũng hỗ trợ định dạng văn bản(xem phần tiếp theo).
  • Mỗi sơ đồ trang web có thể chứa tối đa 50.000 địa chỉ và không còn cân nặng nữa 50 MB(10 MB cho Yandex).
  • Bạn có thể sử dụng tính năng nén gzip để giảm kích thước của tệp sitemap.xml và tăng tốc độ truyền của nó. Trong trường hợp này, hãy sử dụng phần mở rộng gz (sitemap.xml.gz). Đồng thời, hạn chế về trọng lượng vẫn áp dụng cho sơ đồ trang web không nén.
  • Vị trí của Sơ đồ trang web xác định tập hợp các URL có thể được đưa vào Sơ đồ trang web. Bản đồ chứa địa chỉ các trang của toàn bộ trang web phải được đặt ở thư mục gốc. Nếu sơ đồ trang web nằm trong một thư mục thì tất cả các URL trong sơ đồ trang web này phải nằm trong thư mục này hoặc sâu hơn ().
  • Địa chỉ trong sitemap.xml phải tuyệt đối.
  • Độ dài URL tối đa là 2048 ký tự (1024 ký tự cho Yandex).
  • Các ký tự đặc biệt trong URL (chẳng hạn như ký hiệu và "&" hoặc dấu ngoặc kép) phải được ẩn trong thực thể HTML.
  • Các trang được chỉ định trong bản đồ phải hiển thị mã trạng thái 200 http.
  • Các địa chỉ được liệt kê trên bản đồ không được đóng trong tệp robots.txt hoặc trong meta-robot.
  • Sơ đồ trang web không được đóng trong robots.txt, nếu không công cụ tìm kiếm sẽ không thu thập dữ liệu sơ đồ trang web đó. Bản thân tập tin có thể nằm trong chỉ mục, điều này là bình thường.

Các định dạng bản đồ XML

Công cụ tìm kiếm hỗ trợ định dạng sơ đồ trang web văn bản đơn giản, chỉ liệt kê các URL của các trang mà không cần thông số bổ sung. Trong trường hợp này, tệp phải được mã hóa UTF-8 và có phần mở rộng .txt.

Các công cụ tìm kiếm cũng hỗ trợ giao thức XML tiêu chuẩn. Google còn hỗ trợ thêm sơ đồ trang web cho hình ảnh, video và tin tức.

Một sơ đồ trang web mẫu chỉ chứa một địa chỉ.

https://сайт/ 2018-06-14 daily 0.9

Thẻ XML
bộ url
địa chỉ(bắt buộc) - Thẻ gốc cho mỗi URL.
lộc(bắt buộc) - URL tài liệu, phải tuyệt đối.
mod cuối cùng- ngày thay đổi cuối cùng tài liệu ở định dạng Ngày giờ.
tần số thay đổi- tần suất thay đổi trang (luôn luôn, hàng giờ, hàng ngày, hàng tuần, hàng tháng, hàng năm, không bao giờ). Ý nghĩa của thẻ này là một khuyến nghị công cụ tìm kiếm, không phải với tư cách là một đội.
sự ưu tiên- Ưu tiên URL so với các địa chỉ khác (từ 0 đến 1) theo thứ tự quét. Nếu không được chỉ định, mặc định là 0,5.

Bản đồ XML cho hình ảnh

Một số trình tối ưu hóa chèn liên kết đến hình ảnh vào sitemap.xml giống như cách chèn liên kết đến tài liệu HTML. Việc này có thể làm được nhưng Google nên sử dụng tiện ích mở rộng sẽ tốt hơn giao thức chuẩn và gửi cùng với các URL Thông tin thêm về hình ảnh. Việc tạo bản đồ hình ảnh XML rất hữu ích nếu hình ảnh cần được quét và lập chỉ mục, đồng thời, bot không thể truy cập trực tiếp vào chúng (ví dụ: sử dụng JavaScript).

Ví dụ về sơ đồ trang web chứa một trang và các hình ảnh liên quan đến trang đó

http://example.com/primer.html http://example.com/kartinka.jpg http://example.com/photo.jpg Вид на Балаклаву Севастополь, Крым http://creativecommons.org/licenses/by-nd/3.0/legalcode

Thẻ XML
hình ảnh:hình ảnh(bắt buộc) - thông tin về một hình ảnh. Có thể sử dụng tối đa 1000 hình ảnh.
hình ảnh:loc(bắt buộc) - đường dẫn tới file ảnh. Nếu CDN được sử dụng thì có thể chấp nhận liên kết đến một tên miền khác nếu nó được xác minh trong bảng quản trị trang web.
chú thích hình ảnh- chú thích cho hình ảnh (có thể chứa văn bản dài).
hình ảnh:tiêu đề- hình ảnh tiêu đề (thường là văn bản ngắn).
hình ảnh:geo_location- nơi chụp.
hình ảnh:giấy phép- URL giấy phép hình ảnh. Được sử dụng để tìm kiếm hình ảnh nâng cao.

Bản đồ XML cho video

Tương tự như bản đồ hình ảnh, Google cũng có tiện ích mở rộng sơ đồ trang web dành cho video nơi bạn có thể chỉ định thông tin chi tiết về nội dung video, điều này ảnh hưởng đến hiển thị trong tìm kiếm video. Sơ đồ trang web dành cho video là cần thiết khi trang web sử dụng các video được lưu trữ cục bộ và khi lập chỉ mục những video này gặp khó khăn do công nghệ được sử dụng. Nếu bạn đang nhúng video từ YouTube vào trang web của mình thì không cần sơ đồ trang web dành cho video ở đây.

Sơ đồ trang web Tin tức

Nếu có nội dung tin tức trên trang web và tham gia Google Tin tức Việc sử dụng Sơ đồ trang web cho tin tức sẽ rất hữu ích, vì vậy Google sẽ nhanh chóng tìm thấy các tài liệu mới nhất của bạn và lập chỉ mục tất cả các bài viết tin tức. Trong trường hợp này, Sơ đồ trang web chỉ được chứa địa chỉ của các trang được xuất bản trong 2 ngày qua và chứa không quá 1000 URL.

Sử dụng nhiều thẻ

Nếu cần, bạn có thể sử dụng một số sơ đồ trang web, kết hợp chúng thành một sơ đồ trang web chỉ mục. Nhiều sitemap.xml được sử dụng trong trường hợp:

  • Trang web sử dụng một số công cụ (CMS).
  • Trang web có hơn 50.000 trang.
  • Cần thiết lập theo dõi lỗi thuận tiện theo từng phần.

Trong trường hợp sau, mọi người phần lớn trang web có sitemap.xml riêng và tất cả chúng đều được thêm vào bảng điều khiển dành cho quản trị viên web, nơi thuận tiện để xem phần nào có nhiều lỗi nhất (xem phần tìm lỗi trong sơ đồ trang web).

Nếu bạn có 2 sơ đồ trang web trở lên, chúng cần được kết hợp thành một sơ đồ trang web chỉ mục, trông giống như sơ đồ trang web thông thường (ngoại trừ sự hiện diện của các thẻ sơ đồ trang web và sơ đồ trang web thay vì urlset và url), có các hạn chế tương tự và chỉ có thể liên kết sang bản đồ XML thông thường (không phải bản đồ chỉ mục).

Chỉ mục sơ đồ trang web mẫu:

http://www.example.com/sitemap-blog.xml.gz 2004-10-01T18:23:17+00:00 http://www.example.com/sitemap-webinars.xml.gz 2005-01-01

chỉ mục sơ đồ trang web(bắt buộc) - chỉ định tiêu chuẩn giao thức hiện tại.
sơ đồ trang web(bắt buộc) - chứa thông tin về một sơ đồ trang web riêng biệt.
lộc(bắt buộc) - vị trí sơ đồ trang web (trong định dạng xml, txt hoặc rss cho Google).
mod cuối cùng- thời gian thay đổi sơ đồ trang web. Cho phép các công cụ tìm kiếm nhanh chóng khám phá các URL mới trên các trang web lớn.

Cách tạo sitemap.xml

Phương pháp tạo Sơ đồ trang web XML:

  • Công cụ CMS nội bộ. Nhiều CMS đã hỗ trợ tạo sơ đồ trang web. Để tìm hiểu, hãy đọc tài liệu dành cho CMS của bạn, xem các mục menu trong bảng quản trị hoặc liên hệ với bộ phận hỗ trợ kỹ thuật của công cụ. Tải tệp https://yoursite.com/sitemap.xml lên trang web của bạn; tệp này có thể đã tồn tại và đang được tạo động.
  • Các plugin bên ngoài. Nếu CMS không có chức năng tạo sơ đồ trang web và nó hỗ trợ plugin, Google sẽ xem plugin nào sẽ trả lời câu hỏi về sitemap.xml cho công cụ của bạn và cài đặt nó. Trong một số trường hợp, bạn cần liên hệ với lập trình viên để viết plugin tương tự cho bạn.
  • Tập lệnh riêng biệt trên trang web. Biết giao thức thẻ XML và hạn chế kỹ thuật, bạn có thể tự tạo sitemap.xml bằng cách thêm tập lệnh thế hệ vào CRON. Nếu bạn không phải là lập trình viên, hãy sử dụng các mục khác trong danh sách này.
  • Trình tạo sơ đồ trang web. Có nhiều trình tạo sitemap.xml quét trang web của bạn và cung cấp cho bạn bản đồ tạo sẵn để tải xuống. Điểm bất lợi ở đây là mỗi khi trang web được cập nhật, bạn cần tạo sơ đồ trang web theo cách thủ công.
  • Trình phân tích cú pháp. Các chương trình máy tính để bàn được thiết kế để phân tích kỹ thuật của một trang web thường cung cấp cơ hội tải xuống sitemap.xml, được tạo dựa trên các trang được thu thập thông tin. Nó hoạt động tương tự như trình tạo sơ đồ trang web, chỉ có điều nó chạy cục bộ trên máy của bạn.

Trình tạo sơ đồ trang web trực tuyến phổ biến

XML-Sitemaps.com

Cho phép bạn lấy sitemap.xml chỉ sau vài cú nhấp chuột. Hỗ trợ các định dạng XML, HTML, TXT và GZ. Thuận tiện sử dụng cho các trang web nhỏ (tối đa 500 trang).

Một trình tạo tương tự, nhưng có nhiều cài đặt hơn một chút và cho phép bạn tạo bản đồ lên tới 2000 trang miễn phí.

Có nhiều cài đặt, cho phép bạn nhập URL từ tệp CSV. Quét tới 500 URL miễn phí.

Không có giới hạn về số lượng trang cần quét. Nhưng đối với các trang web lớn, quá trình tạo có thể bị treo trong vài chục phút.

Các chương trình cục bộ để tạo Sơ đồ trang web XML

Trình tạo sơ đồ trang web G-Mapper

Phiên bản máy tính để bàn miễn phí của trình tạo sơ đồ trang web dành cho Windows.

Nhện kêu Ếch SEO

Công cụ tạo sơ đồ trang web linh hoạt với nhiều cài đặt. Thuận tiện nếu bạn đã sử dụng ếch hét cho các tác vụ SEO khác. Sau khi quét trang web, hãy sử dụng mục menu Sơ đồ trang web -> Tạo Sơ đồ trang web XML.

Nhện Netpeak

Một giải pháp kém linh hoạt hơn nhưng cũng thuận tiện để tạo nhanh sitemap.xml. Sau khi quét trang web, bạn cần sử dụng mục menu Công cụ -> Tạo Sơ đồ trang web.

Sơ đồ trang web là gì

Nội dung của bất kỳ tài nguyên web nào sớm hay muộn cũng sẽ được các công cụ tìm kiếm lập chỉ mục. Làm thế nào chúng ta có thể làm cho quá trình này diễn ra nhanh hơn?

Một trong những điều nhất cách hiệu quả– sử dụng cái gọi là bản đồ trang web ( Sơ đồ trang web).

Bản đồ địa điểm ( Sơ đồ trang web) - Cái này xml- một tệp chứa thông tin dành cho các công cụ tìm kiếm về các trang của tài nguyên web phải được lập chỉ mục. Sơ đồ trang web giúp các công cụ tìm kiếm xác định vị trí của các đối tượng tài nguyên web, thời gian cập nhật lần cuối, tần suất cập nhật và mức độ ưu tiên của chúng.

Định dạng giao thức Sơ đồ trang web bao gồm XML-thẻ.

Tệp phải sử dụng mã hóa UTF-8.

Thuộc tính XML-thẻ Sơ đồ trang web

thuộc tính bắt buộc. Đóng gói tệp này và chỉ định tiêu chuẩn giao thức hiện tại;

– обязательный атрибут. Родительский тег для каждой записи URL . Остальные теги являются дочерними для этого тега;

https://viws.ru/vi/ – обязательный атрибут. URL страницы; должен начинаться с префикса (например, http:// ) и заканчиваться косой чертой, если ваш веб-сервер требует этого. Длина этого значения не должна превышать 2048 символов;

– необязательный атрибут. Дата последнего изменения файла; должна быть в формате W3C Datetime . Этот формат позволяет при необходимости опустить сегмент времени и использовать формат ГГГГ-ММ-ДД;

– необязательный атрибут. Вероятная частота изменения этой страницы. Это значение предоставляет общую информацию для поисковых систем и может не соответствовать частоте сканирования этой страницы. Допустимые значения: always , hourly , daily , weekly , monthly , yearly , never ;

– необязательный атрибут. Приоритетность URL относительно других URL на вашем сайте. Допустимый диапазон значений – от 0,0 до 1,0. Это значение не влияет на процедуру сравнения ваших страниц со страницами на других сайтах – оно только позволяет указать поисковым системам, какие страницы, по вашему мнению, более важны для сканеров (приоритет, который вы назначили странице, не влияет на положение ваших URL на страницах результатов той или иной поисковой системы). Приоритет страницы по умолчанию – 0,5.

Пример XML -файла Sitemap

(необязательные теги выделены ):

http://сайт/!}

2010-04-19

daily

0.8


http://сайт/aldan.htm
2009-10-03
monthly

0.5

http://сайт/aldan-weather.htm

2010-04-15

weekly

0.5

Nếu trang web của bạn chứa nhiều trang web, bạn có thể bỏ qua các thuộc tính tùy chọn (điều này sẽ làm giảm đáng kể kích thước tệp Sơ đồ trang web):

http://сайт/

http://сайт/aldan.htm

http://сайт/aldan-weather.htm

Sử dụng tệp chỉ mục Sơ đồ trang web

Tài liệu Sơ đồ trang web phải chứa không quá 50.000 URL và kích thước của nó không được vượt quá 10 MB.

Nếu cần tập tin Sơ đồ trang web có thể được nén bằng bộ lưu trữ gzip nhằm giảm bớt các yêu cầu về băng thông kênh.

Nếu bạn cần chuyển trên 50.000 URL, bạn nên tạo một số tập tin Sơ đồ trang web. Bạn sẽ cần liệt kê từng tệp này trong tệp chỉ mục. Sơ đồ trang web. Trong tệp chỉ mục Sơ đồ trang web tối đa 50.000 tệp có thể được liệt kê Sơ đồ trang web. Kích thước của tập tin này không được vượt quá 10 MB.

Cách tạo sơ đồ trang web

Để tạo sơ đồ trang web, bạn có thể sử dụng cái gọi là trình tạo Sơ đồ trang web, hoặc bạn có thể tự mình làm mọi việc:

- mở Sổ tay;

– tuân theo các quy tắc của giao thức Sơ đồ trang web, điền vào tập tin Sơ đồ trang web ;

– nhập tên tệp vào trường văn bản thích hợp (ví dụ: sơ đồ trang web.xml);

– trong danh sách thả xuống Loại tệp lựa chọn Tất cả các tệp (*.*);

– trong danh sách thả xuống Mã hóa lựa chọn UTF-8, nhấn Cứu;

- tải lên Sơ đồ trang web vào thư mục gốc của trang web của bạn.

Thông báo cho máy quét của công cụ tìm kiếm về sự hiện diện và vị trí của tệp Sơ đồ trang web

Sau tập tin Sơ đồ trang webđược tạo và lưu trữ trên máy chủ web, vị trí của nó phải được báo cáo cho các công cụ tìm kiếm hỗ trợ giao thức này. Nó có thể được thực hiện theo những cách sau:

Tải lên Sơ đồ trang web bằng Giao diện Web của Công cụ Tìm kiếm

Để gửi một tập tin Sơ đồ trang web trực tiếp đến công cụ tìm kiếm, cung cấp khả năng lấy thông tin về trạng thái xử lý và lỗi, liên hệ hệ thống trợ giúp máy tìm kiếm.

Ví dụ, chuyển

Bạn đã nghĩ đến việc tạo một “Sơ đồ trang web” chưa? Chúng ta hãy cố gắng tìm ra cách để làm điều đó một cách chính xác.

Sơ đồ trang web là gì?

Sơ đồ trang web- đây là một trang riêng liệt kê tất cả các mục, tiểu mục, bài viết. Đây giống như một thư mục trong đó tất cả các bài viết trên trang web được ghi lại cùng với các liên kết đến các bài viết tương tự.

Tại sao bạn cần một bản đồ trang web? XML hoặc HTML: bản đồ nào tốt hơn?

Cần có sơ đồ trang web ở định dạng html cho khách truy cập - để giúp họ tìm kiếm dễ dàng hơn thông tin cần thiết. Bản đồ như vậy phải có trên các trang web lớn có hơn 30 trang.

Sơ đồ trang web ở định dạng xml đơn giản là cần thiết cho các công cụ tìm kiếm - để robot tìm kiếm có thể nhìn thấy tất cả các liên kết trên trang web và lập chỉ mục chính trang web đó tốt hơn.

Tổng cộng, tốt hơn hết bạn nên tạo 2 sơ đồ trang web riêng biệt: sitemap.XML cho robot và .HTML cho khách truy cập.

Bằng cách sử dụng tệp Sơ đồ trang web, bạn có thể cho Yandex biết trang nào trên trang web của bạn cần được lập chỉ mục, tần suất thông tin trên trang web được cập nhật và trang nào quan trọng nhất để lập chỉ mục. Sẽ rất hữu ích khi xem bản đồ của các trang web lớn hoặc các trang web tốt về chủ đề của bạn nằm trong TOP.

Chúng ta sẽ xem xét định dạng xml sau, trước tiên hãy thử tìm ra định dạng html, tức là. với một bản đồ quen thuộc với chúng ta mà chúng ta thấy trên hầu hết mọi cổng thông tin.

Sơ đồ trang web HTML - 7 quy tắc sắt

    Đăng nó lên trang riêng, có thể được truy cập từ menu chính. Nghĩa là, liên kết tới bản đồ trang web sẽ hiển thị từ bất kỳ trang nào của trang web.

    Cấu trúc của bản đồ phải phản ánh thứ bậc của các trang trên trang web; cấu trúc phải chỉ rõ vị trí của các phần chính và vị trí của các phần phụ.

    Sẽ thật tốt nếu nó được đặt ở đầu bản đồ trang web Mô tả ngắn chính trang web đó, để người truy cập có thể nhanh chóng biết mình đang truy cập trang web nào.

    Đừng làm quá tải bản đồ trang web với những hình ảnh không cần thiết, tốt hơn hết bạn nên làm mà không có chúng.

    Cố gắng tuân thủ quy tắc trong phần mô tả: sự ngắn gọn là em gái của tài năng. Tiêu đề các phần phải ngắn gọn, rõ ràng và dễ hiểu. Bạn có thể thêm mô tả ngắn về phần này, ví dụ:

    «- Về công ty
    Phần này mô tả ngắn gọn các nguyên tắc hoạt động chính của công ty chúng tôi, lịch sử hình thành và phát triển cũng như những nguyện vọng và khát vọng lâu dài của chúng tôi.»

    Đảm bảo bản đồ trang web của bạn được cập nhật. Nếu một số trang bị xóa khỏi cấu trúc hoặc ngược lại, những trang mới được thêm vào, đừng quên phản ánh điều này trên bản đồ.

Thực hiện theo 7 quy tắc này và sơ đồ trang web của bạn sẽ trở thành công cụ điều hướng tuyệt vời cho khách truy cập.

Sơ đồ trang web sitemap.xml: tại sao bạn cần nó và cách tự tạo nó

Sơ đồ trang web XML- đây là một tệp nằm trong thư mục gốc của trang web, chứa thông tin dành cho các công cụ tìm kiếm (chẳng hạn như Yandex, Google, Rambler, Bing và các công cụ khác) về các trang trên trang web của bạn. Tệp này là cần thiết để giúp các công cụ tìm kiếm lập chỉ mục trang web của bạn dễ dàng hơn.

Sitemap.xml hoạt động như thế nào?

Khi truy cập một trang web, trước hết robot tìm kiếm sẽ đọc hướng dẫn trong tệp robots.txt về cách lập chỉ mục trang web. Và nếu bạn cho biết trong đó có sitemap.xml thì robot sẽ đi tới địa chỉ được chỉ định, liệt kê các URL của các trang quan trọng nhất của trang web phải được lập chỉ mục bắt buộc.

Do đó, đừng quên rằng tệp sitemap.xml không chỉ được đặt trên trang web của bạn mà còn phải chỉ ra đường dẫn đến nó trong robots.txt trong chỉ thị sơ đồ trang web.

Tác nhân người dùng: Yandex
Cho phép: /
Sơ đồ trang web: http://mysite.ru/site_structure/my_sitemaps.xml

Đây là cách sơ đồ trang web. Sơ đồ trang web XML sẽ giúp công cụ tìm kiếm hoạt động dễ dàng hơn và cung cấp khả năng lập chỉ mục chất lượng cao cho trang web của bạn.

Sơ đồ trang web sitemap.xml cho Yandex

Yandex hỗ trợ giao thức Sơ đồ trang web. Để truyền tải thông tin, hãy sử dụng các yếu tố sau:

  • loc - địa chỉ trang;
  • Làm cách nào để tự tạo sơ đồ trang web.XML và miễn phí?

    Nó không khó. Có một số trên web chương trình miễn phí và các trang web sẽ tự động tạo bản đồ như vậy cho bạn. Dưới đây là một số trong số đó: sitemapgenerator.ru, xml-sitemaps.com, cy-pr.com/tools/sitemap/

Bạn chỉ là một kẻ ngu ngốc nếu không dành thời gian để tạo sơ đồ trang web sự quan tâm đúng đắn. Chỉ cần hiểu vấn đề một lần và tránh nó trong tương lai là đủ. số lượng lớn sai lầm, vì vậy chúng ta hãy làm điều đó ngay bây giờ.

Người hầu khiêm tốn của bạn cũng từng là một kẻ ngu ngốc trong những năm còn trẻ khi anh ta mới bắt đầu quảng cáo các trang web trong một văn phòng. Vào thời điểm đó, tôi tình cờ thấy một trang web quảng cáo, có thể nói là trang web đó thật vớ vẩn. Và cái thứ chết tiệt này có vấn đề với việc lập chỉ mục. Đương nhiên, nếu trang web có đủ chất lượng, cả hai công cụ tìm kiếm sẽ lập chỉ mục cho nó bất kể vấn đề gì, nhưng chủ sở hữu dựa vào một nhà thiết kế, nhà thiết kế bố cục và lập trình viên bình thường, và trong trường hợp này, chuyên gia SEO chỉ có thể, có thể nói, mở chai bằng kéo. Tôi đã thử mọi thứ trên đó - cài đặt được sửa đổi lần cuối, tăng tốc độ lập chỉ mục bằng cách sử dụng fastbot đang là mốt vào thời điểm đó và mua liên kết. Và chỉ sau đó hóa ra vấn đề là sơ đồ trang web không được cập nhật tự động! Khi tôi cập nhật nó, tất cả các trang đều được đưa vào chỉ mục.

Sơ đồ trang web là gì và tại sao cần thiết?

Sơ đồ trang web là gì? Đây là một tập tin có thông tin về các trang của trang web cần được lập chỉ mục. Thông thường, một sơ đồ trang web được tạo cho Yandex và Google để thông báo cho robot tìm kiếm về các trang cần được đưa vào chỉ mục. Bằng cách sử dụng sơ đồ trang web, bạn cũng có thể kiểm tra tần suất cập nhật diễn ra và tài liệu web nào quan trọng nhất để lập chỉ mục. Nói chung, họ đã nói rất rõ về nó tại Yandex Webmaster:

Việc có sơ đồ trang web có ảnh hưởng đến việc quảng cáo không?

Nếu bạn không có sơ đồ trang web, điều này không có nghĩa là các công cụ tìm kiếm sẽ không lập chỉ mục tài nguyên. Robot tìm kiếm thường quét các trang web khá tốt nếu không có tính năng này và đưa chúng vào tìm kiếm. Nhưng đôi khi có thể xảy ra trục trặc, do đó đôi khi không thể tìm thấy tất cả tài liệu trên web. Những lý do chính là:

  1. Các phần của trang web chỉ có thể truy cập được bằng cách thực hiện một chuỗi chuyển đổi dài;
  2. URL động.

Vì vậy, việc tạo sitemap.xml giúp giải quyết vấn đề này về nhiều mặt. Tệp này chỉ ảnh hưởng đến SEO trong chừng mực nó tạo điều kiện/tăng tốc việc lập chỉ mục các trang. Nó cũng làm tăng khả năng các trang web sẽ được lập chỉ mục trước khi đối thủ cạnh tranh của bạn có thể sao chép nội dung và xuất bản nó trên trang web của họ.

Sơ đồ trang web có định dạng nào khác và tại sao nó được tạo ở định dạng XML?

Tại sao bạn cần một bản đồ trang web, chúng tôi đã tìm ra nó. Bây giờ hãy xem nó có thể được tạo ở định dạng nào:

  1. Ở định dạng html. Nó được tạo dưới dạng một trang thông thường với các địa chỉ dẫn đến các phần chính của tài nguyên. Loại bản đồ này giúp bạn nhanh chóng tìm đường và được thiết kế cho con người nhiều hơn là cho robot tìm kiếm. Bạn có thể đặt sơ đồ trang web bằng HTML số lượng giới hạn liên kết (không quá 100), vì nếu có nhiều liên kết hơn, không phải tất cả chúng sẽ được đưa vào chỉ mục. Hoặc robot tìm kiếm Họ có thể loại trừ hoàn toàn một trang như vậy khỏi tìm kiếm do có quá nhiều URL, thậm chí cả các URL nội bộ.
  2. Sự sáng tạo tệp sơ đồ trang web xml. Không có hạn chế quá quan trọng nào về số lượng liên kết và các công cụ tìm kiếm lập chỉ mục nó tốt hơn vì tệp xml sơ đồ trang web chứa đầy đủ thông tin dưới dạng mà robot có thể hiểu được. Điều này đặc biệt quan trọng đối với các dự án có hàng trăm, hàng nghìn tài liệu có tầm quan trọng như nhau và việc đặt tất cả các liên kết đến chúng là cần thiết. Loại sơ đồ trang web này có khả năng đặt tới 50 nghìn URL và ngoài ra, bạn có thể đặt tần suất cập nhật và mức độ ưu tiên (ưu tiên) gần đúng, điều này không thể nói về bản đồ ở định dạng HTML. Chính vì những lý do này mà sơ đồ trang web hầu như luôn được tạo ở dạng xml.

Dưới đây là thông tin thêm về tập tin này:

Cách tạo sơ đồ trang web phù hợp

Hãy xem cách tạo một bản đồ xml thích hợp. Các yêu cầu sau phải được đáp ứng:

  1. Kích thước tệp không được quá 10 MB;
  2. Bản đồ không được chứa quá 50.000 liên kết. Trong trường hợp có nhiều liên kết hơn, bạn có thể tạo một số bản đồ và đưa chúng vào bản đồ xml chính;
  3. Địa chỉ sơ đồ trang web phải được nhập vào robots.txt;
  4. Đồng thời tải sơ đồ trang web lên Yandex và Google (cách thêm tệp được mô tả bên dưới);
  5. Công cụ tìm kiếm phải có quyền truy cập vào bản đồ. Cần sử dụng các thẻ đặc biệt để công cụ tìm kiếm hiểu rằng đây là bản đồ chứ không phải thứ gì khác;
  6. Sơ đồ trang web phải có mã hóa UTF-8.

Hãy để tôi cho bạn một ví dụ đơn giản về bản đồ:

http://site.ru/ 2016-11-20T19:45:08+03:00 always 0,9 http://site.ru/category/ 2016-11-20T19:46:38+03:00 monthly 0,6 http://site.ru/page/ 2016-11-20T19:48:41+03:00 yearly 0.4

< url >

< loc >http : //site.ru/

< lastmod >2016 - 11 - 20T19: 45: 08 + 03: 00< / lastmod >

< changefreq >luôn luôn< / changefreq >

< priority > 0 , 9 < / priority >

< / url >

< url >

< loc >http : //site.ru/category/

< lastmod >2016 - 11 - 20T19: 46: 38 + 03: 00< / lastmod >

< changefreq >hàng tháng< / changefreq >

< priority > 0 , 6 < / priority >

< / url >

< url >

< loc >http : //site.ru/page/

< lastmod >2016 - 11 - 20T19: 48: 41 + 03: 00< / lastmod >

< changefreq >hàng năm< / changefreq >

< priority > 0.4 < / priority >

< / url >

Các thẻ url và loc là bắt buộc. Đầu tiên chứa tất cả thông tin về một URL cụ thể. Cái thứ hai chứa chính địa chỉ đó.

Các thẻ Lastmod, Changefreq, Priority không bắt buộc nhưng vẫn nên sử dụng chúng.

Lastmod trong sơ đồ trang web chịu trách nhiệm về ngày cập nhật cuối cùng.

Changefreq cho biết tần suất thay đổi trang. Các giá trị có thể như sau:

  1. Hàng giờ – cập nhật hàng giờ;
  2. Luôn luôn – luôn được cập nhật;
  3. Hàng tuần – cập nhật mỗi tuần một lần;
  4. Hàng ngày – cập nhật diễn ra hàng ngày;
  5. Hàng tháng – cập nhật diễn ra mỗi tháng một lần;
  6. Hàng năm – mỗi năm một lần;
  7. Không bao giờ – không được cập nhật (tốt hơn là không sử dụng giá trị này).

Mức độ ưu tiên cho công cụ tìm kiếm biết tầm quan trọng của một trang so với các trang khác. Mức độ ưu tiên có thể được đặt từ 0,1 (thấp) đến 1 (cao).

Đây chỉ là bản đồ ví dụ, bạn không cần chỉ định các giá trị chính xác này. Nói chung, nên đặt mức độ ưu tiên như sau: tối đa cho trang chủ(1), đối với tiêu đề là mức trung bình (0,6) và đối với các mục - tối thiểu (0,4).

Bây giờ hãy xem một ví dụ có hơn 50 nghìn liên kết. Trong trường hợp này, tệp bao gồm các bản đồ khác:

http://site.ru/sitemaps/sitemap01.xml 2016-11-20T21:37:28+03:00 http://site.ru/sitemaps/sitemap02.xml 2016-11-20T21:37:29+03:00

< sitemap >

< loc >http: //site.ru/sitemaps/sitemap01.xml

< lastmod >2016 - 11 - 20T21: 37: 28 + 03: 00< / lastmod >

< / sitemap >

< sitemap >

< loc >http: //site.ru/sitemaps/sitemap02.xml

< lastmod >2016 - 11 - 20T21: 37: 29 + 03: 00< / lastmod >

< / sitemap >

Cách tạo sơ đồ trang web

Có một số cách để tạo bản đồ xml, hãy xem chúng:

  1. Tải xuống bản đồ bằng cách sử dụng máy phát điện trực tuyến từ một nguồn khác;
  2. Tạo bằng cách sử dụng chương trình đặc biệt. Nhưng điều đáng lưu ý là các chương trình loại này chủ yếu được trả tiền. Một ví dụ về trình tạo như vậy: Wonder WebWare SiteMap Generator. Screaming Frog cũng có tính năng này;
  3. Tạo sơ đồ trang web theo cách thủ công;
  4. Tự động tạo bản đồ bằng CMS (ví dụ: chức năng như vậy có sẵn trên WordPress).

Đây là một tùy chọn về cách tạo sơ đồ trang web mà không cần sự trợ giúp của plugin:

Các plugin tạo sơ đồ trang web trên WordPress

Bạn có thể tạo sơ đồ trang web trong WordPress bằng plugin đặc biệt có tên Google Sơ đồ trang web XML. Mọi thứ ở đây đều đơn giản: tải xuống plugin, cài đặt nó, sau đó bắt đầu tạo tệp. Để thực hiện việc này, hãy mở Cài đặt bảng điều khiển và chọn Sơ đồ trang web XML. Tiếp theo chúng ta thiết lập các cài đặt. Chúng tôi để mức độ ưu tiên như mặc định.

    Chọn một trang web từ danh sách.

    Trong trường này, hãy nhập URL nơi có tệp. Ví dụ, https://example.com/sitemap.xml.

    Nhấp vào nút Thêm.

Sau khi thêm tệp, nó sẽ được xếp hàng để xử lý. Robot sẽ tải nó xuống trong vòng hai tuần. Mỗi tệp được thêm vào, bao gồm cả những tệp được đính kèm với tệp chỉ mục Sơ đồ trang web, đều được robot xử lý riêng biệt.

Sau khi tải xuống, bên cạnh mỗi tệp bạn sẽ thấy một trong các trạng thái:

Trạng thái Sự miêu tả Ghi chú
"ĐƯỢC RỒI"
"Chuyển hướng" Xóa chuyển hướng và thông báo cho robot về bản cập nhật
"Lỗi" Tệp không được định dạng chính xác thông báo cho robot về bản cập nhật
"Không được lập chỉ mục"

Kiểm tra phản hồi của máy chủ

Không cho phép thông báo cho robot về bản cập nhật
Trạng thái Sự miêu tả Ghi chú
"ĐƯỢC RỒI" Tệp được định dạng chính xác và được tải vào cơ sở dữ liệu robot

Ngày tải xuống cuối cùng sẽ được hiển thị bên cạnh tệp.

Các trang được lập chỉ mục sẽ xuất hiện trong kết quả tìm kiếm trong vòng hai tuần

"Chuyển hướng" URL được chỉ định chuyển hướng đến một địa chỉ khác Xóa chuyển hướng và thông báo cho robot về bản cập nhật
"Lỗi" Tệp không được định dạng chính xác Nhấp vào liên kết Lỗi để biết chi tiết. Sau khi thực hiện thay đổi đối với tệp, hãy thông báo cho robot về bản cập nhật
"Không được lập chỉ mục" Khi truy cập Sơ đồ trang web, máy chủ trả về mã HTTP khác 200

Kiểm tra xem robot có thể truy cập được tệp hay không bằng cách sử dụng công cụ Kiểm tra phản hồi của máy chủ bằng cách chỉ định đường dẫn đầy đủ đến tệp.

Nếu tệp không có sẵn, hãy liên hệ với quản trị viên của trang web hoặc máy chủ chứa tệp đó.

Quyền truy cập vào tệp bị từ chối trong robots.txt bằng lệnh Disallow Cho phép truy cập vào Sơ đồ trang web và thông báo cho robot về bản cập nhật

Cập nhật sơ đồ trang web

Nếu bạn đã thay đổi tệp Sơ đồ trang web được thêm vào Yandex.Webmaster, bạn không cần phải xóa tệp đó và tải lên lại - robot thường xuyên kiểm tra tệp để tìm các bản cập nhật và lỗi.

Để tăng tốc độ thu thập thông tin tệp, hãy nhấp vào biểu tượng. Nếu bạn đang sử dụng tệp chỉ mục Sơ đồ trang web, bạn có thể bắt đầu xử lý từng tệp được liệt kê trong đó. Robot sẽ tải dữ liệu xuống trong vòng ba ngày. Bạn có thể sử dụng chức năng này tối đa 10 lần cho một máy chủ.

Khi bạn đã sử dụng hết tất cả các lần thử, lần tiếp theo sẽ có sau lần thử đầu tiên 30 ngày. Ngày chính xác hiển thị trong giao diện Webmaster.

Xóa sơ đồ trang web

Trong giao diện Yandex.Webmaster, bạn có thể xóa những tệp đã được thêm trên trang Tệp Sơ đồ trang web: Nếu một lệnh đã được thêm cho Sơ đồ trang web trong tệp robots.txt, hãy xóa nó. Sau khi thực hiện thay đổi, thông tin về Sơ đồ trang web sẽ biến mất khỏi robot và cơ sở dữ liệu Yandex.Webmaster trong vòng vài tuần.