Thư rác tìm kiếm (spamdexing) là gì? Thư rác của công cụ tìm kiếm: nó là gì, các loại chính và phương pháp phát hiện

Khi thực hiện công việc tối ưu hóa trang web, nhiều chuyên gia SEO “quá khích” và biến tối ưu hóa nội bộ thành spam tìm kiếm hoàn toàn với các thẻ html, từ khóa, danh sách truy vấn tìm kiếm dư thừa, v.v. Dưới đây chúng tôi trình bày các dấu hiệu chính của spam công cụ tìm kiếm đối với một tài liệu thông thường trên một trang web thương mại. Những yếu tố này đáng được chú ý khi thực hiện công việc tối ưu hóa.

Khi nào một tài liệu có thể bị coi là thư rác?

Thẻ tiêu đề và thẻ meta

1. Tiêu đề văn bản dài hơn 12 từ hoặc 120 ký tự.

2. Meta name="description" dài hơn 40 từ hoặc 250 ký tự.

3. Meta name="keywords" dài hơn 40 từ hoặc 250 ký tự.

Văn bản, nội dung tài liệu

4. Mật độ xuất hiện của bất kỳ từ nào vượt quá 3-4%, với khối lượng văn bản trên 1.000 ký tự (đối với văn bản nhỏ hơn - 4-5%).

5. Trang này chứa danh sách các truy vấn tìm kiếm và liệt kê các cụm từ được sử dụng để truy cập tài liệu này.

6. Tài liệu thể hiện kết quả tìm kiếm trang web.

7. Tài liệu này sao chép (phần lớn) nội dung của tài liệu khác, nhằm thu hút lưu lượng tìm kiếm mà không có giá trị bổ sung cho người dùng.

8. Có sự lạm dụng các thẻ phân bổ logic/vật lý. Ví dụ về các thẻ tương tự: , , , , ,

-
và những người khác.

9. Trang này không cung cấp bất kỳ thông tin hữu ích nào. Ví dụ: Thông báo “Không tìm thấy mục trong thư mục” hiển thị với mã phản hồi của máy chủ là 200 OK.

10. Nội dung và tiêu đề của tài liệu gây hiểu lầm cho người tham quan. Giả sử tiêu đề cho biết rằng trang chứa “ảnh và video” nhưng nội dung thì không.

11. Trang này được đăng trên trang web của một công ty giả, tức là một trang web giả vờ là một tổ chức thực sự nhưng thực chất không phải là một tổ chức (không có liên hệ thực sự, chất lượng toàn bộ tài nguyên và thiết kế nói riêng) thấp .

12. Văn bản trên trang được coi là được tạo bởi chương trình/robot và/hoặc đơn giản là có chất lượng rất thấp và không có bất kỳ thông tin nào có giá trị cho khách truy cập.

Chuyển hướng

13. Tài liệu thực hiện chuyển hướng (chuyển hướng dưới bất kỳ hình thức nào) nhằm mục đích đánh lừa người dùng hoặc công cụ tìm kiếm.

14. Tài liệu không có giá trị độc lập và được tạo ra nhằm mục đích phân phối lại lưu lượng truy cập đến các trang/tài nguyên của bên thứ ba.

Mã nguồn và liên kết

15. Trong mã nguồn của tài liệu có nhiều lần xuất hiện của cụm từ khóa (hơn 15-20), bao gồm các thuộc tính “alt”, “title” cho hình ảnh, “Hint”, “ToolTip” và bất kỳ lần xuất hiện nào khác.

16. Mã chứa văn bản không được hiển thị trên trang hoặc được hiển thị bất tiện cho việc đọc. Đây có thể chỉ đơn giản là văn bản ẩn hoặc các phương pháp ẩn một phần - cuộn, chuyển tab bất tiện và các phương pháp khác.

17. Tài liệu liên kết đến các trang/trang web có nội dung sai lệch/spam có chủ ý. Đây có thể là các dịch vụ lưu trữ tệp lừa đảo hoặc các trang web lừa đảo khác.

Câu hỏi thường gặp

MỘT. " Các tiêu chí tương tự có áp dụng cho tất cả các trang web không?»

Chúng ta có thể nói không. Nhiều thuật toán của công cụ tìm kiếm được chuẩn hóa thành các chỉ báo trang web chung (yếu tố máy chủ), vì vậy nếu đối với một trang web, một sự kết hợp nhất định sẽ dẫn đến giảm mức độ liên quan, thì đối với một trang khác có thể không có vấn đề gì. Như bạn đã biết, các dự án trẻ có lưu lượng truy cập và tỷ lệ trích dẫn thấp dễ bị xử phạt nhất.

b. " Điều này có nghĩa là nếu một trang có Tiêu đề từ 13-18 từ thì bị công cụ tìm kiếm coi là spam?»

Không nhất thiết, vấn đề là mỗi yếu tố chỉ đóng góp một phần vào việc phân loại cuối cùng và các quyết định được đưa ra dựa trên sự kết hợp của nhiều yếu tố.

V. " Hóa ra trong mọi trường hợp, thẻ Tiêu đề và thẻ meta không được phép dài hơn các giá trị đã chỉ định?»

Không hoàn toàn đúng, có sự đối đầu giữa mức độ liên quan và thuật toán chống thư rác. Đôi khi, Tiêu đề dài 13-20 từ sẽ mang lại khả năng hiển thị tài liệu tốt hơn Tiêu đề dài 12 từ trở xuống, do xếp hạng tốt hơn cho các truy vấn tần suất thấp. Quyết định trong những trường hợp này nên được thực hiện riêng lẻ.

Đối với thẻ meta mô tả và từ khóa, khả năng bị trừng phạt đối với nội dung spam của chúng là rất ít, cũng như lợi ích có thể có từ việc này.

G. " Còn việc đặt văn bản vào cuộn thì sao, đó có phải là thư rác 100% không?»

Các hình phạt đối với việc đặt văn bản trong tình trạng cuộn và/hoặc chuyển tab bất tiện là khá hiếm và thường được áp dụng trên cơ sở cá nhân. Ở đây, trước hết, người ta nên bắt đầu từ việc đọc văn bản này một cách dễ dàng; nếu văn bản có thể được đọc một cách bình tĩnh thì các biện pháp trừng phạt khó có thể tuân theo;

đ. " Văn bản được viết bởi con người (người viết quảng cáo) có thể được công nhận là do robot tạo ra không?»

Đúng, những tình huống như vậy xảy ra, đặc biệt là khi người viết quảng cáo tạo ra văn bản có chất lượng rất thấp hoặc tài liệu quá bão hòa với các truy vấn tìm kiếm “qua mái nhà”.

đ. " Trong trường hợp nào công cụ tìm kiếm cho rằng trang chứa danh sách các truy vấn tìm kiếm?»

Thông thường, đây là những danh sách rõ ràng có dạng: “Chúng tôi được tìm thấy theo truy vấn” hoặc “Trang được truy cập theo cụm từ”, nhưng đôi khi, đặc điểm này có thể được quy cho đơn giản là do các văn bản được tối ưu hóa quá mức.

Tìm kiếm thư rác là một trong những phương pháp mà bạn có thể nhanh chóng quảng bá một trang web trong kết quả tìm kiếm cho một truy vấn cụ thể, nhưng đồng thời, có nguy cơ trang web đó có thể nằm trong một số bộ lọc của công cụ tìm kiếm cùng một lúc và bị cấm tạm thời hoặc vĩnh viễn.

Quảng cáo trên công cụ tìm kiếm của các trang web có thể được chia thành hai loại - quảng cáo “trắng” và quảng cáo “đen”.

Khuyến mãi trang web trắng liên quan đến việc sử dụng các công cụ tối ưu hóa tiêu chuẩn - nội dung, tối ưu hóa trang của trang web cho các truy vấn tìm kiếm được quảng cáo, tạo khả năng sử dụng trên trang web, tăng các yếu tố hành vi với sự trợ giúp của khả năng sử dụng, tăng khối lượng liên kết tự nhiên.

khuyến mãi đen ngụ ý việc nhanh chóng nâng trang web lên TOP kết quả tìm kiếm và nhanh chóng bị mất khỏi cơ sở dữ liệu chỉ mục. Theo quy định, quảng cáo tìm kiếm đen vi phạm các quy tắc sử dụng công cụ tìm kiếm và sử dụng nhiều phương pháp spam tìm kiếm. Hãy xem xét các loại thư rác tìm kiếm chính.

  1. « bơm ", hoặc trang web có quá nhiều từ khóa. Spam là khi một trang web chứa một lượng lớn đề cập đến một từ khóa. Đối với Yandex, mật độ từ khóa trên tài liệu không được vượt quá 4%. Việc tăng cường một trang với từ khóa vượt quá con số này, đôi khi nhiều lần.
  2. Văn bản vô hình . Robot tìm kiếm không gặp vấn đề gì khi tìm văn bản ẩn từ người dùng trên một trang của trang web, đặc biệt nếu văn bản này chứa các từ khóa mà trang được quảng cáo. Mọi thứ được thực hiện rất đơn giản, nếu các từ ẩn khớp với thẻ tiêu đề trên trang của trang web thì đây là những từ khóa, có nghĩa là nó đang bão hòa trang web bằng các phím và cả việc sử dụng văn bản vô hình.
  3. cửa ra vào – đây là những trang, bản chất của nó là thu hút người dùng công cụ tìm kiếm bằng bất kỳ phương tiện nào và chuyển hướng anh ta đến một nơi nào đó, theo quy luật, đến một tài nguyên được quảng cáo. Các ô cửa chất lượng cao tiếp nhận khách truy cập dựa trên các từ khóa theo chủ đề được sử dụng để quảng bá tài nguyên chính. Do đó, tỷ lệ chuyển đổi của khách truy cập vào trang web chính tăng lên.
  4. che giấu – hiển thị các thông tin khác nhau trên trang web. Tách thông tin cho robot tìm kiếm, tách thông tin cho khách truy cập. Theo quy định, phương pháp này tích cực “cộng tác” với các ô cửa, giúp tăng tốc đáng kể quá trình “tối ưu hóa” trang web.
  5. Nhân bản các trang hoặc trang – quảng cáo đồng thời một số trang web cung cấp cùng hàng hóa hoặc dịch vụ.
  6. Liên kết thư rác – xây dựng liên kết lớn hoặc trao đổi liên kết với các tài nguyên không có chủ đề.

Chúng tôi đã phát hành một cuốn sách mới, Tiếp thị nội dung trên mạng xã hội: Cách thu hút người theo dõi và khiến họ yêu thích thương hiệu của bạn.

Đặt mua

Spam tìm kiếm – lừa dối người dùng

Spam tìm kiếm là gì và làm thế nào để nhận biết nó? Theo quan điểm của một người bình thường, thư rác là quảng cáo xâm nhập xuất hiện thay vì thông tin mà người dùng đang cố gắng tìm kiếm. Về cốt lõi, spam công cụ tìm kiếm hoặc webspam là một nỗ lực nhằm thao túng kết quả của các kết quả tìm kiếm được tạo ra nhằm quảng bá các trang web chất lượng thấp lên TOP 10. Nội dung của chúng thường không có nhiều thông tin hoặc không đáp ứng được nhu cầu của người dùng.

Các video khác trên kênh của chúng tôi - tìm hiểu tiếp thị qua internet với SEMANTICA

Các loại thư rác tìm kiếm là gì?

Có một sự phân loại nhất định của các công cụ tìm kiếm liên quan đến thư rác. Cả Yandex và Google đều kêu gọi quản trị viên web và người tối ưu hóa hạn chế sử dụng các phương pháp quảng cáo được liệt kê bên dưới.

1. Quá nhiều cụm từ khóa trong văn bản. Đây là một nỗ lực nhằm “tăng cường” văn bản với nhiều từ khóa nhất có thể nhằm nâng cao vị trí của nó trong tìm kiếm. Làm thế nào để nhận biết loại thư rác này? Điều này có thể được thực hiện dựa trên một số dấu hiệu:

  • sự hiện diện của văn bản được tạo tự động;
  • lặp đi lặp lại các cụm từ nhất định;
  • làm nổi bật các phím bằng thẻ , ;
  • sự hiện diện của văn bản ẩn hòa vào nền của trang.

2. . Thuật ngữ này đề cập đến các trang web trung gian chuyển hướng khách truy cập đến một trang web khác. Thông thường, ô cửa là trang web một trang được tối ưu hóa cho danh sách các cụm từ khóa. Các ô cửa được tạo bằng các công cụ như DMI, SEODOR.

3. Liên kết thư rác. Để tăng cân, quản trị viên web có thể cố gắng sử dụng spam liên kết, bao gồm:

  • mua lại hàng loạt siêu liên kết từ trao đổi tự động;
  • liên kết spam nhận được từ blog, diễn đàn, sách của khách;
  • tạo ra một mạng lưới nhỏ.

Thư rác của công cụ tìm kiếm và hậu quả của nó

Các công cụ tìm kiếm đang cải tiến thuật toán của họ theo cách loại trừ các tài nguyên Internet spam khỏi kết quả tìm kiếm bất cứ khi nào có thể. Các phương pháp bi quan được áp dụng cho các quản trị viên web vô đạo đức tùy thuộc vào loại vi phạm. Ví dụ: việc tập trung quá nhiều từ khóa trong văn bản sẽ dẫn đến giảm kết quả ban hành một tài liệu. Tuy nhiên, phần còn lại của trang web vẫn tiếp tục hoạt động bình thường.

Các ô cửa được công cụ tìm kiếm phát hiện sẽ bị cấm. Số phận của các trang web vệ tinh được phát triển để quảng bá tài nguyên Internet chính phụ thuộc vào chất lượng của chúng. Nếu quản trị viên web đã tạo một vệ tinh bằng cách sử dụng các văn bản độc đáo và ít nhiều có chất lượng cao thì trang web đó có thể vẫn được tìm kiếm.

Việc mua quá nhiều liên kết có nguy cơ làm bi quan tài nguyên web được quảng cáo. Để chống lại các nỗ lực thao túng kết quả tìm kiếm, Yandex đã đưa ra thuật toán “Minusinsk” vào tháng 5 năm 2015.

Thư rác SEO

Các công cụ tìm kiếm được biết là không thích bất kỳ nỗ lực nào nhằm tác động đến thuật toán của họ. Đồng thời, chẳng hạn, chính Yandex, trong hướng dẫn dành cho quản trị viên web, mô tả các cách để cải thiện thứ hạng trang web. Không thể nói rằng những phương pháp này dẫn đến việc thao túng kết quả tìm kiếm. Nhưng nếu mỗi cái trong số chúng được tăng cường một chút, thì cái gọi là tìm kiếm thư rác, hoặc spamdex.

Trong phần Tôi đã đề cập đến một số khoảnh khắc “đen tối” của việc tối ưu hóa công cụ tìm kiếm, điều này trước tiên dẫn đến sự phát triển của trang web, sau đó dẫn đến sự suy giảm mạnh hoặc thậm chí biến mất.

Với thư rác tìm kiếm thì điều này cũng tương tự, nhưng nó không thể được quy cụ thể cho SEO mũ đen, bởi vì một số phương pháp của ông chỉ dẫn đến sự bi quan (suy giảm thứ hạng) của trang web chứ không dẫn đến sự chết hoàn toàn của trang web. Ngoài ra, nhiều quản trị viên web và cái gọi là. Người làm SEO sử dụng spamdexing một cách vô thức (do thiếu kinh nghiệm hoặc do sử dụng quá nhiều kinh nghiệm).

Thư rác trên Internet

Có lẽ đáng để mở rộng khái niệm này một chút thư rácở tất cả. Ban đầu, từ tiếng Anh "" có nghĩa là nhận những bức thư không mong muốn gửi đến email của bạn. Theo quy định, nội dung của những bức thư như vậy mang tính chất thương mại với lời đề nghị gia nhập một số công ty. Hoặc một ví dụ kinh điển - “Hãy cung cấp cho chúng tôi dữ liệu cá nhân của bạn để chúng tôi có thể gửi cho bạn 1.000.000 USD.”

Chà, theo thời gian, tất cả các tin nhắn không mong muốn và không tự nhiên (ví dụ: trong các cộng đồng và diễn đàn trên mạng xã hội) bắt đầu bị phân loại là thư rác. Nói cách khác, đây là những tin nhắn với mong muốn lừa đảo, trục lợi.

Thư rác tìm kiếm là gì

Điều hợp lý là spamdexing là một nỗ lực nhằm đánh lừa các công cụ tìm kiếm. Giấy phép sử dụng công cụ tìm kiếm Yandex cho biết:

Định nghĩa Yandex về thư rác

Những phương pháp như vậy có thể được xếp vào loại rất khó, từ lĩnh vực SEO đen - tạo ô cửa, che giấu, ẩn văn bản và các phương pháp nhẹ nhàng hơn:

  • Bao gồm trong từ khóa và thẻ meta mô tả một số lượng lớn các từ khóa và, hoặc các từ nói chung Không liên quan đến nội dung của trang (nhưng rất phổ biến cho các truy vấn tìm kiếm). Nhân tiện, đó là lý do tại sao nó mất đi ý nghĩa. Có lẽ, hiện tại, việc sử dụng sai Từ khóa sẽ không gây ra những hậu quả tiêu cực cho trang web nhưng bạn cần phải cẩn thận hơn.
  • Văn bản quá bão hòa bài viết. Điều này gợi ý rõ ràng cho các công cụ tìm kiếm về sự hiện diện của thư rác tìm kiếm.
  • Tương tự như đoạn trước + “đẩy” tất cả các từ và cụm từ này vào thẻ nhấn (in đậm, in nghiêng). Trực tiếp thông báo cho công cụ tìm kiếm về spamdexing.
  • Liên kết thư rác. Mọi thứ ở đây đều đơn giản và rõ ràng - nhận được các liên kết không tự nhiên đến tài nguyên của bạn. Một liên kết tốt, từ quan điểm của công cụ tìm kiếm, nên là một đề xuất để truy cập trang web này hoặc trang web đó. Và nếu bản thân trang web này cố gắng kiếm tiền cho chính mình và không phải lúc nào cũng theo những cách “tốt đẹp”, thì đó là gửi thư rác. Tất nhiên, thực tế là không thể đẩy lên TOP (có thể, nhưng sẽ mất nhiều thời gian) nếu không có liên kết bên ngoài, vì vậy phải có được liên kết bên ngoài một cách khôn ngoan.
  • Một xu hướng mới trong thư rác tìm kiếm - sự va chạm. Điều này được thực hiện theo nhiều cách: 1) Sử dụng các chương trình mô phỏng hành vi của người dùng trong kết quả tìm kiếm 2) Thu hút người dùng để họ, với một khoản phí, sẽ thể hiện sự quan tâm đến một trang web với tên miền .

Xin chào tất cả mọi người!

Mỗi chúng ta đều quen thuộc với từ SPAM. Hơn nữa, mọi người đều đã gặp phải nó và nhìn thấy nó là gì. Ví dụ: trong email của bạn, trong tin nhắn SMS và hầu hết mọi nơi. Khái niệm này cũng áp dụng cho kết quả tìm kiếm của Yandex, Google và các hệ thống khác.

Spam tìm kiếm là các trang hoặc trang được tạo ra nhằm mục đích thao túng kết quả tìm kiếm. Và kết quả là đánh lừa người dùng và công cụ tìm kiếm.

Do thứ hạng của các trang trong kết quả tìm kiếm bị ảnh hưởng bởi nhiều yếu tố nên biểu hiện spam tìm kiếm “gây áp lực” lên chúng và tài nguyên web nhanh chóng chiếm vị trí cao. Nói cách khác, tối ưu hóa lại đơn giản.

Về cơ bản, trên những tài nguyên như vậy, không thể tìm thấy câu trả lời cho truy vấn tìm kiếm hoặc có thể, nhưng khó nhưng rất dễ nhiễm vi-rút hoặc “vô tình” cài đặt, chẳng hạn như Amigo 😀

Các loại thư rác tìm kiếm

Có một số biểu hiện rõ ràng của spam tìm kiếm:

  • Quá bão hòa nội dung văn bản với từ khóa;
  • Tham khảo "vụ nổ". Số lượng liên kết bên ngoài tới tài nguyên tăng mạnh;
  • Tối ưu lại thẻ meta, ALT của hình ảnh;
  • Một lượng lớn nội dung vô dụng;
  • Sao chép 100% nội dung từ các trang khác;
  • Khuyến khích bởi các yếu tố hành vi.

Mỗi người trong chúng ta có thể “tội lỗi” một chút và tối ưu hóa quá mức hoặc đơn giản là đột nhiên mua một số lượng lớn liên kết bên ngoài. Tất cả những điều trên đều bị các công cụ tìm kiếm trừng phạt, thường là bằng cách loại khỏi chỉ mục hoặc buộc phải hạ hạng trong kết quả tìm kiếm. Vì vậy hãy cực kỳ cẩn thận khi quảng bá tài nguyên của bạn.

Bạn có thể đọc thông tin chi tiết hơn về các hình phạt đối với một vi phạm cụ thể trong Yandex.

Những người đặc biệt có trách nhiệm theo dõi các hành động được liệt kê ở trên. Ví dụ: nếu bạn mắc sai lầm khi hình thành một khối liên kết, thì bằng chính đôi tay của mình, bạn sẽ tăng cơ hội vào được Minusinsk. Ví dụ, nó có trách nhiệm gửi thư rác.

Một khi bạn rơi vào bộ lọc, bạn sẽ rất khó lấy lại niềm tin của các công cụ tìm kiếm - bạn có thể mất rất nhiều thời gian cho việc này: từ một tháng đến vài năm. Hơn nữa, thường không thể quay lại vị trí cũ trong kết quả tìm kiếm.

Để tránh rơi vào bộ lọc, bạn chỉ cần tuân theo một số yêu cầu nhất định:

  1. Chỉ liên kết đến các tài nguyên chất lượng cao mà khách truy cập của bạn thấy thú vị;
  2. Đừng lạm dụng quá nhiều quảng cáo. Ngoài ra, bạn không thể đặt quảng cáo “gây sốc”;
  3. Sử dụng các liên kết bên ngoài một cách tiết kiệm. Chi tiết ;
  4. Và cuối cùng, đừng lừa dối khách truy cập của bạn.

Các loại thư rác tìm kiếm khác

Có các loại thư rác tìm kiếm khác mà bạn có thể đã gặp phải:

  • Các trang Doorway là các tài nguyên web được quảng bá tích cực trong công cụ tìm kiếm nhằm tự động chuyển hướng lưu lượng truy cập đến trang quảng cáo của một trang web khác;
  • Kỹ thuật che giấu là các trang và trang web cung cấp nội dung khác nhau cho người dùng và robot công cụ tìm kiếm nhằm tác động đến thứ hạng của công cụ tìm kiếm. Nói tóm lại, robot nhìn thấy một thứ và bạn thấy một thứ hoàn toàn khác;
  • Văn bản bị ẩn. Tạo nội dung văn bản mà khách truy cập không thể nhìn thấy, giàu từ khóa;
  • Clickjacking là việc đặt các phần tử vô hình trên một trang web, khi nhấp vào sẽ xảy ra một số hành động;
  • Nội dung của phần mềm độc hại, virus. Một trường hợp khá phổ biến - một người bước vào , ví dụ, yêu cầu tải driver cho modem wifi và kết thúc ở một trang web nào đó nơi anh ta được yêu cầu tải xuống chính trình điều khiển này. Nhưng thay vì những gì anh ta đang tìm kiếm, một loại virus hoặc một loại chương trình độc hại nào đó lại xuất hiện trên máy tính.

Tất cả những hành vi trên đều bị trừng phạt nghiêm khắc. Nếu bạn gặp phải các biểu hiện tương tự của thư rác tìm kiếm, vui lòng viết đơn khiếu nại tới Yandex hoặc bộ phận hỗ trợ kỹ thuật của Google - hành động này sẽ không được chú ý.