Tên bạn url http xa. URL có hoặc không có dấu gạch chéo - tại sao điều này đúng? Tầm quan trọng của URL trong quảng bá SEO

Theo nhiều nguồn khác nhau, từ 50 đến 95% tổng số email trên thế giới là thư rác từ những kẻ lừa đảo trên mạng. Mục tiêu của việc gửi những bức thư như vậy rất đơn giản: lây nhiễm vi-rút vào máy tính của người nhận, đánh cắp mật khẩu người dùng, buộc một người chuyển tiền “làm từ thiện”, nhập chi tiết thẻ ngân hàng của họ hoặc gửi bản quét tài liệu.

Thư rác thường gây khó chịu ngay từ cái nhìn đầu tiên: bố cục quanh co, văn bản được dịch tự động, các biểu mẫu nhập mật khẩu ngay trong dòng chủ đề. Nhưng có những bức thư ác ý trông có vẻ tử tế, khéo léo đánh vào cảm xúc của một người và không gây nghi ngờ về tính xác thực của chúng.

Bài viết sẽ nói về 4 kiểu thư lừa đảo mà người Nga hay mắc phải nhất.

1. Thư từ “tổ chức chính phủ”

Những kẻ lừa đảo có thể giả danh cơ quan thuế, Quỹ hưu trí, Rospotrebnadzor, trạm vệ sinh và dịch tễ học và các tổ chức chính phủ khác. Để đảm bảo độ tin cậy, hình mờ, bản quét con dấu và biểu tượng trạng thái được chèn vào thư. Thông thường, nhiệm vụ của bọn tội phạm là hù dọa một người và thuyết phục anh ta mở một tập tin có đính kèm virus.

Thông thường, đây là bộ mã hóa hoặc trình chặn Windows giúp vô hiệu hóa máy tính và yêu cầu bạn gửi SMS trả phí để tiếp tục hoạt động. Một tập tin độc hại có thể được ngụy trang dưới dạng lệnh của tòa án hoặc lệnh triệu tập để xuất hiện trước người đứng đầu tổ chức.

Sự sợ hãi và tò mò làm tắt đi ý thức của người dùng. Các diễn đàn kế toán mô tả các trường hợp nhân viên của các tổ chức mang các tập tin có vi-rút vào máy tính ở nhà của họ vì họ không thể mở chúng ở văn phòng do phần mềm chống vi-rút.

Đôi khi những kẻ lừa đảo yêu cầu bạn gửi tài liệu để phản hồi một lá thư nhằm thu thập thông tin về công ty, điều này sẽ hữu ích cho các âm mưu lừa đảo khác. Năm ngoái, một nhóm lừa đảo đã lừa được nhiều người bằng thủ thuật đánh lạc hướng "yêu cầu fax giấy tờ".

Kế toán hay quản lý đọc đến đây liền chửi cơ quan thuế: “Có voi ma mút ngồi đó, trời ơi!” và chuyển suy nghĩ của mình từ chính bức thư sang giải quyết các vấn đề kỹ thuật khi gửi đi.

2. Thư từ “ngân hàng”

Các trình chặn Windows và ransomware có thể ẩn náu trong các bức thư giả không chỉ từ các tổ chức chính phủ mà còn từ các ngân hàng. Thông báo “Khoản vay đã được đứng tên bạn, vui lòng đọc đơn kiện” có thể thực sự đáng sợ và khiến bạn muốn mở hồ sơ ra.

Một người cũng có thể bị thuyết phục đăng nhập vào tài khoản cá nhân giả mạo, đề nghị xem tiền thưởng tích lũy hoặc nhận giải thưởng mà anh ta giành được trong Xổ số Sberbank.

Ít thường xuyên hơn, những kẻ lừa đảo gửi hóa đơn thanh toán phí dịch vụ và tiền lãi bổ sung cho khoản vay, với giá 50-200 rúp, điều này dễ trả hơn là dễ hiểu.

3. Thư từ “đồng nghiệp”/“đối tác”

Một số người nhận được hàng chục lá thư kinh doanh kèm theo tài liệu trong ngày làm việc. Với tải trọng như vậy, bạn có thể dễ dàng rơi vào thẻ “Re:” trong chủ đề của bức thư và quên rằng bạn vẫn chưa trao đổi thư từ với người này.

Đặc biệt nếu trường đầu độc chỉ ra “Alexander Ivanov”, “Ekaterina Smirnova” hoặc bất kỳ cái tên tiếng Nga đơn giản nào, những cái tên này hoàn toàn không đọng lại trong ký ức của một người thường xuyên làm việc với mọi người.

Nếu mục tiêu của những kẻ lừa đảo không phải là thu các khoản thanh toán SMS để mở khóa Windows mà là gây hại cho một công ty cụ thể, thì những bức thư có vi-rút và liên kết lừa đảo có thể được gửi thay mặt cho nhân viên thực sự. Danh sách nhân viên có thể được thu thập trên mạng xã hội hoặc xem trên trang web của công ty.

Nếu một người nhìn thấy một lá thư trong hộp thư từ một người ở bộ phận lân cận, thì anh ta không xem xét kỹ hơn, thậm chí có thể bỏ qua các cảnh báo chống vi-rút và mở tệp bất kể thế nào.

4. Thư từ “Google/Yandex/Mail”

Google đôi khi gửi email đến chủ sở hữu tài khoản Gmail để thông báo rằng ai đó đã cố đăng nhập vào tài khoản của bạn hoặc Google Drive đã hết dung lượng. Những kẻ lừa đảo sao chép thành công chúng và buộc người dùng nhập mật khẩu trên các trang giả mạo.

Người dùng Yandex.Mail, Mail.ru và các dịch vụ thư khác cũng nhận được thư giả từ “quản trị dịch vụ”. Các chú thích tiêu chuẩn là: “địa chỉ của bạn đã được thêm vào danh sách đen”, “mật khẩu của bạn đã hết hạn”, “tất cả email từ địa chỉ của bạn sẽ được thêm vào thư mục thư rác”, “xem danh sách các email chưa được gửi”. Như ba điểm trước, vũ khí chính của tội phạm là sự sợ hãi và tò mò của người dùng.

Làm thế nào để bảo vệ chính mình?

Cài đặt phần mềm chống vi-rút trên tất cả các thiết bị của bạn để nó tự động chặn các tệp độc hại. Nếu vì lý do nào đó bạn không muốn sử dụng nó, hãy kiểm tra tất cả các tệp đính kèm email thậm chí hơi đáng ngờ để tìm virustotal.com

Không bao giờ nhập mật khẩu theo cách thủ công. Sử dụng trình quản lý mật khẩu trên tất cả các thiết bị. Họ sẽ không bao giờ cung cấp cho bạn các tùy chọn mật khẩu để nhập vào các trang web giả mạo. Nếu vì lý do nào đó mà bạn không muốn sử dụng chúng, hãy nhập thủ công URL của trang mà bạn định nhập mật khẩu. Điều này áp dụng cho tất cả các hệ điều hành.

Bất cứ khi nào có thể, hãy bật xác nhận mật khẩu qua SMS hoặc nhận dạng hai yếu tố. Và tất nhiên, cần nhớ rằng bạn không thể gửi bản scan tài liệu, dữ liệu hộ chiếu hoặc chuyển tiền cho người lạ.

Có lẽ nhiều độc giả khi nhìn vào ảnh chụp màn hình của những bức thư đã nghĩ: “Tôi có phải là kẻ ngốc khi mở tập tin từ những bức thư như vậy không? Bạn có thể thấy từ cách xa một km rằng đây là một sự sắp đặt. Tôi sẽ không bận tâm đến trình quản lý mật khẩu và xác thực hai yếu tố. Tôi sẽ chỉ cẩn thận thôi."

Có, hầu hết các email lừa đảo đều có thể được phát hiện bằng mắt. Nhưng điều này không áp dụng cho những trường hợp cuộc tấn công nhắm cụ thể vào bạn.

Thư rác nguy hiểm nhất là thư rác cá nhân


Nếu một người vợ ghen tuông muốn đọc thư của chồng, Google sẽ cung cấp cho cô ấy hàng chục trang web cung cấp dịch vụ “Hack thư và hồ sơ mạng xã hội mà không cần trả trước”.

Kế hoạch công việc của họ rất đơn giản: họ gửi cho một người những bức thư lừa đảo chất lượng cao được soạn cẩn thận, trình bày gọn gàng và có tính đến đặc điểm cá nhân của người đó. Những kẻ lừa đảo như vậy chân thành cố gắng móc nối một nạn nhân cụ thể. Họ tìm hiểu từ khách hàng về mối quan hệ xã hội, sở thích và điểm yếu của cô ấy. Có thể mất một giờ hoặc hơn để phát triển cuộc tấn công vào một người cụ thể, nhưng nỗ lực sẽ được đền đáp.

Nếu nạn nhân bị bắt, họ sẽ gửi cho khách hàng ảnh chụp màn hình hộp thư và yêu cầu họ thanh toán (giá trung bình khoảng 100 USD) cho dịch vụ của họ. Sau khi nhận được tiền, họ sẽ gửi cho bạn mật khẩu hộp thư hoặc kho lưu trữ có tất cả các chữ cái.

Điều thường xảy ra là khi một người nhận được một lá thư có liên kết đến tập tin “Bằng chứng xâm phạm video về Tanya Kotova” (keylogger ẩn) từ anh trai mình, anh ta vô cùng tò mò. Nếu bức thư được cung cấp văn bản chứa các chi tiết mà một nhóm người hạn chế biết được, thì người đó ngay lập tức phủ nhận khả năng anh trai mình có thể đã bị hack hoặc ai đó khác đang giả danh anh ta. Nạn nhân thư giãn và tắt phần mềm diệt virus để mở tập tin.

Không chỉ những người vợ ghen tuông mà cả những đối thủ cạnh tranh vô đạo đức cũng có thể tìm đến những dịch vụ như vậy. Trong những trường hợp như vậy, giá sẽ cao hơn và các phương pháp sẽ tinh tế hơn.

Bạn không nên dựa vào sự chú ý và ý thức chung của mình. Hãy để một trình quản lý mật khẩu và chống virus vô cảm bảo vệ bạn, đề phòng.

tái bút Tại sao những kẻ gửi thư rác lại viết những bức thư “ngu ngốc” như vậy?


Các email lừa đảo được tạo ra một cách cẩn thận là tương đối hiếm. Nếu bạn vào thư mục thư rác, bạn có thể có rất nhiều niềm vui. Những kẻ lừa đảo nghĩ ra loại nhân vật nào để tống tiền: giám đốc FBI, nữ anh hùng của loạt phim “Trò chơi vương quyền”, một nhà thấu thị được các quyền lực cao hơn cử đến gặp bạn và muốn nói cho bạn biết bí mật về tương lai của bạn với giá 15 đô la, một kẻ giết người được lệnh phải trả nợ cho bạn, nhưng anh ta chân thành đề nghị trả nợ .

Vô số dấu chấm than, nút bấm trong nội dung bức thư, địa chỉ người gửi lạ, lời chào không tên, bản dịch tự động, lỗi nghiêm trọng trong văn bản, sự sáng tạo quá mức rõ ràng - những lá thư trong thư mục thư rác chỉ đơn giản là “hét lên” về bóng tối của chúng nguồn gốc.

Tại sao những kẻ lừa đảo gửi tin nhắn của họ tới hàng triệu người nhận không muốn dành vài giờ để soạn một lá thư gọn gàng và chi 20 đô la cho người dịch để tăng phản hồi của khán giả?

Trong một nghiên cứu của Microsoft Tại sao những kẻ lừa đảo Nigeria nói rằng họ đến từ Nigeria? Câu hỏi “Tại sao những kẻ lừa đảo tiếp tục gửi thư thay mặt cho các tỷ phú đến từ Nigeria khi công chúng đã biết về “những bức thư Nigeria” trong 20 năm” được phân tích sâu sắc. Theo thống kê, hơn 99,99% người nhận bỏ qua những thư rác như vậy.

Người dùng thường có câu hỏi về URL của tệp (trang web) là gì, làm cách nào để tìm ra nó và giá trị của các chi tiết đó là gì. Bài viết của chúng tôi sẽ cung cấp những câu trả lời cần thiết.

URL là gì

Bộ định vị tài nguyên thống nhất là viết tắt của “bộ định vị vị trí trang web”. Mã định danh URL bao gồm tên miền và đường dẫn đến một trang cụ thể cùng với tên tệp của nó. Người phát minh ra URL là Tim Berners-Lee, thành viên của cuộc họp của Hội đồng Chiến tranh Hạt nhân Châu Âu tại Geneva. Vào thời điểm được tạo ra vào năm 1990, URL của trang web chỉ đơn giản là địa chỉ trong hệ thống nơi chứa tệp. Để tìm ra URL của trang web, chỉ cần nhìn vào thanh địa chỉ và để xác định địa chỉ tệp, bạn cần vào menu ngữ cảnh bằng cách nhấp chuột phải vào đối tượng tương ứng. Có nhiều ưu điểm, đặc biệt là khả năng truy cập điều hướng trên Web, một địa chỉ như vậy cũng có một nhược điểm - khả năng hoạt động độc quyền với bảng chữ cái Latinh, một số ký hiệu và số. Nếu cần sử dụng bảng chữ cái Cyrillic, việc chuyển đổi đặc biệt sẽ được thực hiện.

Các loại URL

    Tĩnh - không liên quan đến những thay đổi trên trang.

    URL động - nó là gì, bạn có thể hiểu nếu bạn tưởng tượng một biểu mẫu tìm kiếm hoặc công cụ điều hướng khác trong đó thông tin được tạo ra tùy thuộc vào các yêu cầu đến.

    Địa chỉ có ID phiên được thêm vào mỗi lần người dùng truy cập trang.

Tầm quan trọng của URL trong quảng bá SEO

    Công cụ tìm kiếm tính đến các khóa có trong URL. Từ khóa trong tên miền và tên miền phụ có tác động lớn nhất đến việc quảng bá trên công cụ tìm kiếm.

    Nếu địa chỉ trang web có nhiều thông tin, điều này cũng làm tăng thứ hạng. Một robot tìm kiếm rất có thể sẽ trả lại nó để đáp lại một truy vấn chuyên đề.

    URL phù hợp với truy vấn sẽ được in đậm trong kết quả tìm kiếm, thu hút thêm sự chú ý và tăng tỷ lệ nhấp chuột.

Bạn có thể bị lạc không chỉ trong rừng mà còn trên mạng. Và điều này có thể là do đường dẫn hoặc địa chỉ dẫn đến tài nguyên không chính xác. Bạn không biết URL là gì? Sau đó, trước khi bắt đầu một cuộc hành trình xa hơn qua không gian ảo, hãy cùng tìm hiểu hệ thống địa chỉ email.

URL là gì

URL là tiêu chuẩn được chấp nhận chung để ghi lại địa chỉ và chỉ ra vị trí của tài nguyên trên Internet. Từ tiếng Anh tên của nó ( Đồng phục nhân viên) được dịch là bộ định vị tài nguyên thống nhất. Bạn có thể tìm thấy cách giải mã trước đó của từ viết tắt URL - Bộ định vị tài nguyên chung (định vị tài nguyên phổ quát). Nhưng cả hai ý nghĩa đều bổ sung cho khái niệm URL hơn là mâu thuẫn với nhau.

Định dạng cơ bản để viết cấu trúc URL trông như thế này:
://:@:/?#
- thông thường chúng tôi muốn nói đến giao thức.
đăng nhập - thông tin đăng nhập của người dùng được sử dụng để ủy quyền trên tài nguyên.
mật khẩu - mật khẩu người dùng để ủy quyền.
máy chủ – tên miền của máy chủ.
port – cổng máy chủ được sử dụng trong quá trình kết nối.
URL là đường dẫn chứa tài nguyên được yêu cầu trên máy chủ.
thông số và neo– giá trị của các biến và mã định danh trên một tài nguyên cụ thể.

Chỉ có thể truyền các giá trị biến trong chuỗi truy vấn bằng phương thức GET.

Hãy xem định dạng URL của trang tài nguyên được yêu cầu bằng các ví dụ thực tế. Về phía máy khách, URL được hiển thị trên thanh địa chỉ của trình duyệt:

Các tùy chọn phổ biến nhất là:

  • http://ru.wikipedia.org/wiki/Main_page– HTTP được sử dụng để truyền yêu cầu ( giao thức truyền siêu văn bản);
  • https://ru.wikipedia.org/wiki/Home_page— https được sử dụng làm phương thức truyền tải. Là một dạng bảo mật của giao thức http sử dụng mã hóa (SSL hoặc TLS);
  • fttp://wikipedia.org/wiki/file.txt– giao thức truyền file fttp;
  • http://mail.ru/script.php?num=10&type=new&v=text– truyền các giá trị biến trong chuỗi truy vấn bằng phương thức GET.

Bất kỳ định dạng URL nào chủ yếu là một chuỗi ký tự. Nó có thể bao gồm:
2; Bức thư.
2; Số Ả Rập (0-9).
2; Các ký tự dành riêng (“+”, “=”, “!” và các ký tự khác).
2; Các ký tự đặc biệt – chúng ta sẽ xem xét chúng chi tiết hơn.

Sử dụng các ký tự đặc biệt trong URL

Tất nhiên, những ký tự quá “đặc biệt” như vậy không được sử dụng trong URL. Nhưng có một số:

  • ? – dùng để phân tách một khối với các tham số được truyền trong dòng yêu cầu;
  • & - tách các tham số được truyền với nhau;
  • = - tách một biến trong tham số khỏi giá trị của nó;
  • : - dùng để tách giao thức khỏi phần còn lại của URL;
  • # - ký hiệu được sử dụng ở phần cục bộ của địa chỉ. Cho phép bạn truy cập một phần cụ thể của trang được yêu cầu;
  • @ - được chỉ định trong dữ liệu đăng ký người dùng và khi truyền dữ liệu bằng giao thức mailto.

Nhưng tất cả điều này chỉ là một lý thuyết. Vì vậy, trước khi tìm hiểu phần còn lại, chúng ta hãy xem một ví dụ thực tế nhỏ.

Một ví dụ tốt

Để rõ ràng, chúng ta hãy lấy mẫu đăng ký đơn giản này:

Đây là mã của nó:

Mẫu đăng ký


Nhập biệt hiệu của bạn:

Nhập tuổi của bạn:


Trong dòng đầu tiên ở đầu biểu mẫu, chúng tôi đã chỉ định tệp xử lý (php) cho nó và phương thức truyền dữ liệu qua URL máy chủ:

Bây giờ đây là mã cho tệp xử lý (1.php):

Nick của bạn:".$_GET["nick"]."

"; tiếng vang"

Tuổi của bạn:".$_GET["tuổi"]."

"; ?>

Chúng tôi sẽ nhập dữ liệu vào biểu mẫu và gửi đến máy chủ để xử lý. Đây là những gì chúng tôi nhận được cuối cùng:

Hãy chú ý đến định dạng URL trên thanh địa chỉ trong ảnh chụp màn hình đầu tiên. Sau khi nhập dữ liệu và nhấp vào nút “Gửi dữ liệu”, giá trị của tất cả các trường sẽ được gửi đến máy chủ để xử lý. Và chúng tôi được chuyển hướng đến trang 1.php, nơi chứa mã xử lý.

Trước khi xem kết quả xử lý, hãy nhìn vào thanh địa chỉ trong hình thứ hai. Nó hiển thị giá trị của các trường được chuyển để xử lý bằng phương thức GET.

Để ẩn dữ liệu được gửi đến máy chủ, phương thức POST được sử dụng. Sau đó, URL trên sẽ trông như thế này:

http://localhost/home/1.php.

Định dạng địa chỉ URL trên trang web

Thông thường, các trang web sử dụng hệ thống URL dựa trên cây. Nghĩa là, URL chính xác bao gồm một số phần tử lồng nhau, phần tử cuối cùng là trang web mong muốn.

Để rõ ràng, hãy lấy một URL cụ thể, một trong những nhánh của địa chỉ trang web của chúng tôi:

https://www..html

Hãy chia nhỏ nó ra từng phần một:

  • www.site – phần này là tên miền của trang web. Nếu bạn nhập nó vào thanh địa chỉ của trình duyệt, nó sẽ đưa bạn đến trang chính của trang web. Trong hầu hết các trường hợp, đây là chỉ mục. html ;
  • mẫu – phần này của địa chỉ trỏ đến một phần cụ thể của trang web. Trong trường hợp của chúng tôi, đây là phần mẫu;
  • page_2.html – là thành phần cuối cùng của URL dẫn đến trang web thuộc phần chủ đề của tài nguyên.

Thông thường, URL của các phần chính hiển thị đầy đủ bản đồ trang web. Nhưng không phải mọi thứ đều đơn giản như vậy với việc chuyển hướng trên các trang web được triển khai trên cơ sở các công cụ phổ biến (CMS).

Tính năng xây dựng URL trong WordPress

Trong WordPress, giống như bất kỳ công cụ nào được xây dựng trên PHP, tất cả các trang của trang web đều được tạo động. Nghĩa là, một phần được lấy từ một mẫu, phần còn lại được tạo "nhanh chóng" dựa trên một số... Nhưng sự biến động như vậy có một nhược điểm đáng kể - sự hiện diện của các phần tham số được truyền trong URL.

Hơn nữa, điều này không chỉ vi phạm thành phần thẩm mỹ của việc hiển thị địa chỉ mà còn bị các công cụ tìm kiếm cảm nhận một cách mơ hồ. Và điều này có thể ảnh hưởng tiêu cực đến việc quảng bá trang web:

Vì vậy, tốt hơn hết bạn nên sử dụng URL sạch trên trang web của mình. Nhưng bạn có thể lấy chúng ở đâu nếu hệ thống CMS không cung cấp khả năng chỉnh sửa chúng?

URL sạch là các địa chỉ không chứa các tham số đã truyền (trong trường hợp WordPress là các thành phần truy vấn cơ sở dữ liệu) mà chỉ có đường dẫn đến tài liệu. Nghĩa là, https://www..html là một ví dụ về URL sạch.

Cách dễ nhất để tùy chỉnh hiển thị URL trong WordPress là sử dụng các plugin chuyên dụng.

: Tôi luôn muốn hiểu điều này, nhưng tầm quan trọng của nó quá nhỏ nên luôn có lý do để không làm điều đó :)

Có bao giờ bạn tự hỏi: URL - nó là gì?

Tôi luôn bắt gặp điều này, nhưng cho đến bây giờ tôi không muốn hiểu sự khác biệt giữa các thuật ngữ URI, URL, URN và sau đó đột nhiên là một bài đăng (không may là nó đã chìm vào quên lãng), tôi quyết định - tôi' Tôi sẽ tự đọc nó và nói với người khác, mặc dù, như đã nói ở trên, sẽ không có gì thay đổi so với điều này, nhưng đôi khi tôi thích dịch theo nghĩa đen, vì vậy hãy đọc bản dịch hợp lý:

Bạn đã bao giờ nhận thấy thanh địa chỉ trong trình duyệt của mình chưa? Cái này là cái gì? URI, URL hoặc URN? Nhiều người trong chúng ta không phân biệt được URI, URL, URN, thậm chí có người còn chưa từng nghe tới thuật ngữ URI và URN, mọi người chỉ sử dụng thuật ngữ URL. Chúng ta hãy cố gắng tìm ra điều này cùng nhau.

Giải mã chữ viết tắt

URI - Mã định danh tài nguyên thống nhất định danh nguồn)
URL - Bộ định vị tài nguyên thống nhất (thống nhất định vị vị trí nguồn)
URN - Tên tài nguyên thống nhất Tên nguồn)

Chú ý, ở đây sự thật được ẩn giấu trong các chi tiết, nhưng cho đến nay vẫn chưa có gì rõ ràng, đó là một mớ hỗn độn. Tiếp tục nào.

Sự định nghĩa

URI: Biểu thị tên và địa chỉ của tài nguyên trên mạng. Theo quy định, nó được chia thành URL và URN, vì vậy URL và URN là các thành phần của URI.
URL: Địa chỉ của một số tài nguyên trên web. URL xác định vị trí của tài nguyên và cách truy cập tài nguyên đó.
URN: Tên của một số tài nguyên trên web. Ý nghĩa của URN là nó chỉ xác định tên của một mục cụ thể, có thể đặt ở nhiều vị trí cụ thể.

Không có gì tốt hơn một ví dụ cụ thể

URI = http://site/2009/09/uri-url-urn.html
URL = http://trang web
URN = /2009/09/uri-url-urn.html

Hãy tóm tắt lại

URI là khái niệm về mã định danh trừu tượng, trong khi URL và URN là cách triển khai cụ thể của địa chỉ và tên.
Tôi hy vọng mọi thứ đều rõ ràng với mọi người. Hãy biết chữ!

Nhận thức của mỗi chúng ta là cá nhân nên hãy tranh luận và đọc những phần thảo luận ở phần bình luận của bài viết, ở đó có rất nhiều điều thú vị.

Tranh chấp về vấn đề này - làm thế nào để viết URL chính xác, có hoặc không có dấu gạch chéo ở cuối? - đã và sẽ có. Các lập luận rất đa dạng và thường mâu thuẫn. Và hình phạt cho việc ghi sai bộ định vị tài nguyên chung (URL) được cho là có hai loại. Về phía các công cụ tìm kiếm, đây được coi là hình phạt đối với các trang trùng lặp. Từ quan điểm hiệu suất, đây được cho là một chuyển hướng không cần thiết đến đúng trang bài đăng, được máy chủ tự động tạo ra.

Tuy nhiên, khi phân tích các thông số kỹ thuật của tiêu chuẩn Internet, đặc biệt là tài liệu “RFC 1738 - Bộ định vị tài nguyên thống nhất (URL)”, chúng ta phải thừa nhận rằng cả hai phương án ghi địa chỉ của một tài nguyên web đều đúng về mặt hình thức và việc xử phạt đối với sử dụng tùy chọn này hay tùy chọn khác không gì khác hơn là một công cụ tìm kiếm kỳ quặc hoặc những câu chuyện về những người SEO giả.

Từ quan điểm ngắn gọn, tùy chọn không có dấu gạch chéo ở cuối có vẻ đúng hơn, bất kể liên kết của bạn đề cập đến một “tệp” trên máy chủ hay một “thư mục”, bằng chứng gián tiếp về điều đó sẽ được trình bày bên dưới. Nhưng không có một tuyên bố nào trong tài liệu rằng tùy chọn khác không chính xác hoặc đề cập đến một tài nguyên hoàn toàn khác.

Tôi sẽ không làm bạn nhàm chán với bản dịch nhiều trang của RFC được đề cập, vì trước hết, mục đích của câu hỏi là dấu gạch chéo ở cuối URL và thứ hai, ấn phẩm này nhắm đến người dùng công cụ thông thường, bao gồm cả những người không quan tâm đến tất cả các chi tiết đang chờ đợi những lời giải thích ngắn gọn và bằng chứng xác thực. Theo đó, tôi sẽ trích dẫn những đoạn trích từ tài liệu này để làm bằng chứng và giải thích. Ai không quan tâm đến vấn đề này có thể xem ngay phần kết ở cuối bài viết.

Cú pháp URL chung

Trước hết, tôi sẽ thu hút sự chú ý của bạn đến một đoạn trích ở đoạn 2. Cú pháp URL chung (cú pháp URL chung). Trong mỗi trường hợp, tôi sẽ cung cấp một đoạn văn bản bằng ngôn ngữ gốc và sau đó là bản dịch sang tiếng Nga.

URL được sử dụng để "định vị" tài nguyên bằng cách cung cấp nhận dạng trừu tượng về vị trí tài nguyên. URL được sử dụng để "định vị" tài nguyên bằng cách cung cấp nhận dạng trừu tượng về vị trí tài nguyên.

Nghĩa là, bản thân URL là một sự trừu tượng thuần túy. Thực tế là bên ngoài nó có vẻ giống với tên của một tệp hoặc thư mục hoàn toàn không có nghĩa là nó là một tham chiếu vật lý đến một tệp như vậy chứ không phải một tệp nào khác trong không gian tệp của máy chủ. Điều này sẽ được nêu rõ ràng dưới đây trong tài liệu.

Ghi chú Nói chung, đối với các liên kết http, về cơ bản là không chính xác khi nói rằng, ví dụ:

  • http://domain.com/path/subpath/filename.txt- được cho là trỏ đến một tập tin
  • http://domain.com/path/subpath/- được cho là trỏ đến một thư mục
  • http://domain.com/path - được cho là trỏ sai tới một thư mục

Chúng ta thường nói điều này vì việc liên kết các liên kết với các tập tin trên trang web rất thuận tiện. Trên thực tế, tất cả các liên kết này đều trỏ đến một loại tài nguyên nào đó mà không hề chỉ ra loại tài nguyên đó. Điều gì ẩn đằng sau mỗi tài nguyên, tức là loại tệp hoặc thư mục thực nào và loại nội dung nào sẽ được cung cấp qua liên kết đó, đã được xác định bởi cấu hình máy chủ.

Điều quan trọng là phải hiểu rằng trong các liên kết không có những thứ như “tệp”, “thư mục”, “thư mục con”, “văn bản”, “hình ảnh”, “html”, “tập lệnh”, “biểu định kiểu”, v.v. Không có dấu gạch chéo ở cuối hoặc sự vắng mặt của nó hoàn toàn không có ý nghĩa gì cho đến khi liên kết trải qua quá trình chuyển đổi bên trong máy chủ và nó quyết định liên kết thực sự trỏ đến đâu và loại nội dung nào được ẩn đằng sau nó. Chỉ quyết định này liên quan đến kiến ​​trúc bên trong của máy chủ.

Sơ đồ phân cấp

Sau đây là đoạn trích từ đoạn 2.3 Sơ đồ phân cấp và các liên kết tương đối.

Một số lược đồ URL (chẳng hạn như lược đồ ftp, http và tệp) chứa các tên có thể được coi là có thứ bậc; các thành phần của hệ thống phân cấp được phân tách bằng dấu "/". Một số lược đồ URL (chẳng hạn như ftp, http và tệp) chứa các tên có thể được coi là có thứ bậc; Các phần tử phân cấp được phân tách bằng ký tự "/".

Đó là, người ta lập luận rằng trong một số sơ đồ địa chỉ nhất định, nội dung của bộ định vị tài nguyên không bị cấm được ngụ ý là có thứ bậc và vẫn chưa quy định rằng thứ bậc đó tương đương với bất kỳ dạng nào, chẳng hạn như một tệp.

Cú pháp sơ đồ mạng chung

Sau đây là đoạn trích từ đoạn 3.1. Cú pháp lược đồ Internet chung (cú pháp lược đồ mạng chung).

//:@:/Một số hoặc tất cả các bộ phận" :@", ":", ":", Và "/ " có thể bị loại trừ. Một số hoặc tất cả các phần " :@", ":", ":" Và "/ "có thể được loại trừ.

Ghi chú Nhân tiện, đây là câu trả lời cho một câu hỏi bắt nguồn từ câu hỏi mà chúng ta đang xem xét. Thường có một cuộc tranh luận về vấn đề này: cách chính xác để cung cấp liên kết đến một tên miền (máy chủ) - không có dấu gạch chéo ở cuối hoặc có dấu gạch chéo?

Làm thế nào để làm điều đó đúng http://domain.com/ hoặc http://domain.com ?

Và như vậy và như vậy là đúng. Chỉ là dấu gạch chéo đầu tiên sau tên máy chủ nhằm mục đích tách tên đường dẫn khỏi tên máy chủ. Đoạn văn tương tự của tài liệu báo cáo điều này như sau:

Đường dẫn url Phần còn lại của bộ định vị bao gồm dữ liệu cụ thể cho lược đồ và được gọi là "đường dẫn url". Nó cung cấp chi tiết về cách truy cập tài nguyên được chỉ định. Lưu ý rằng "/" giữa máy chủ (hoặc cổng) và đường dẫn url KHÔNG phải là một phần của đường dẫn url. Phần còn lại của bộ định vị bao gồm dữ liệu dành riêng cho lược đồ và được gọi là "đường dẫn url". Nó cung cấp chi tiết về cách truy cập tài nguyên được chỉ định. Lưu ý rằng ký tự "/" giữa máy chủ (hoặc cổng) và đường dẫn URL không phải là một phần của đường dẫn url.

Không có từ nào bắt buộc bạn phải đặt ký tự cuối này hoặc không đặt nó khi đường dẫn url bằng chuỗi trống (như nhiều người trong chúng ta sẽ nói, khi URL liên kết đến thư mục gốc của trang web). Không ai có quyền áp dụng hình phạt đối với bạn “đối với hai lần chụp trang chính”, bởi vì theo đặc điểm kỹ thuật, trong cả hai trường hợp, bạn đều liên kết URL với cùng một tài nguyên.

Tiếp tục đi một đoạn trích khác từ cùng một đoạn.

Cú pháp đường dẫn url phụ thuộc vào lược đồ đang được sử dụng, cũng như cách diễn giải nó. Cú pháp đường dẫn url phụ thuộc vào lược đồ được sử dụng cũng như cách nó được diễn giải.

Đây là sự xác nhận thêm rằng mỗi sơ đồ định vị có khái niệm riêng về “hệ thống phân cấp” và cách diễn giải nó.

Hệ thống cấp bậc

Đối với một số hệ thống tệp, "/" được sử dụng để biểu thị cấu trúc phân cấp của URL tương ứng với dấu phân cách được sử dụng để xây dựng hệ thống phân cấp tên tệp và do đó, tên tệp sẽ trông giống với đường dẫn URL. Điều này KHÔNG có nghĩa là URL đó là tên tệp Unix. Ký tự "/" được sử dụng để biểu thị cấu trúc phân cấp của URL, tương ứng với dấu phân cách được sử dụng để xây dựng cấu trúc phân cấp tên tệp và do đó trên một số hệ thống tệp, tên tệp xuất hiện tương tự như đường dẫn URL. Nhưng điều đó không có nghĩa là URL là tên tệp giống Unix.

Mặc dù thực tế là đoạn này áp dụng cho sơ đồ ftp, nhưng các tuyên bố của nó vẫn áp dụng cho các sơ đồ khác (http, gopher, thịnh vượng, v.v.). Ví dụ: chỉ trong sơ đồ tệp, ký hiệu gạch chéo có ý nghĩa tương tự như trong tên tệp tập tin: //server_or_device/path/subpath/filename.txt.

http

Một URL HTTP có dạng: http:// :/?Ở đâu Như được mô tả trong Phần 3.1. Nếu như: Bị bỏ qua, cổng mặc định là 80. Không cho phép tên người dùng hoặc mật khẩu. Là bộ chọn HTTP và là một chuỗi truy vấn. Các Là tùy chọn, cũng như và trước nó là "?". Nếu không Cũng không có mặt thì dấu "/" cũng có thể bị bỏ qua. Trong các thành phần, "/", ";", "?" được bảo lưu. Ký tự "/" có thể được sử dụng trong HTTP để chỉ định cấu trúc phân cấp. URL lược đồ http có dạng: http:// :/?Ở đâu Tương tự như mô tả ở đoạn 3.1. Nếu như: Bị bỏ qua, cổng mặc định được coi là 80. Tên người dùng hoặc mật khẩu không hợp lệ. Đây là bộ chọn HTTP và - chuỗi truy vấn. Là tùy chọn, như là cùng với ký tự "?" trước đó. Nếu không Không không có mặt, ký tự "/" cũng có thể bị bỏ qua. Trong các phần tử nhân vật "/", ";", "?" được bảo lưu. Ký tự "/" có thể được sử dụng trong HTTP để xác định cấu trúc phân cấp.

Ghi chú Nó cũng nói rằng bạn có thể chỉ định một liên kết mà không có dấu gạch chéo ở cuối. Trong trường hợp này, chúng ta đang nói về tình huống đường dẫn liên kết trống - nó trỏ đến thư mục gốc của máy chủ.

nhập cảnh chính thức

Và cuối cùng, một đoạn trích từ đoạn 5. BNF cho các lược đồ URL cụ thể (ký hiệu chính thức cho các lược đồ URL cụ thể).

Các phần tùy chọn được chỉ định ở đây trong dấu ngoặc vuông. Dấu hoa thị trước dấu ngoặc đơn biểu thị 0 hoặc nhiều lần lặp lại của đoạn như được chỉ ra trong dấu ngoặc đơn. Thanh dọc nên được hiểu là OR.

Hostport = máy chủ [ :// port ] ... ... httpurl = "http://" Hostport [ "/" hpath [ "? tìm kiếm ]] đường dẫn= hsegment *[ "/" hsegment ] hsegment = *[ uchar | ";" | ://| "@" | "&" | "=" ] tìm kiếm = *[ uchar | ";" | ://| "@" | "&" | "=" ] ... ... lowalpha = "a" | "b" | "c" | "d" | "e" | "f" | "g" | "h" | "tôi" | "j" | "k" | "tôi" | "m" | "n" | "Ồ" | "p" | "q" | "r" | "s" | "t" | "bạn" | "v" | "w" | "x" | "y" | "z" hialpha = "A" | "B" | "C" | "D" | "E" | "F" | "G" | "H" | "Tôi" | "J" | "K" | "L" | "M" | "N" | "Ồ" | "P" | "Q" | "R" | "S" | "T" | "Bạn" | "V" | "W" | "X" | "Y" | "Z" alpha = lowalpha | chữ số hialpha = "0" | "1" | "2" | "3" | "4" | "5" | "6" | "7" | "8" | "9" an toàn = "$" | "-" | "_" | "." | "+" thêm = "!" | "*" | """ | "(" | ")" | "," hex = chữ số | "A" | "B" | "C" | "D" | "E" | "F" | "a" | "b" | "c" | "d" | "e" | "f" thoát = "%" hex hex không được bảo vệ = alpha | chữ số | an toàn | thêm uchar = không được bảo vệ | thoát

Xin lưu ý phần tử hpath - đường dẫn liên kết - được hình thành chính xác như thế nào theo quy tắc. Các phần tử của đường dẫn hsegment - các đoạn - được phân tách bằng dấu gạch chéo. Như thể gợi ý ý quan trọng là dấu gạch chéo chia đường dẫn thành các phần có thứ bậc và luôn nằm ở bên trong. Về nguyên tắc, có thể phần tử hsegment cuối cùng có thể là một chuỗi trống (điều này tuân theo định nghĩa của nó) và sau đó dấu gạch chéo đóng vô tình xuất hiện ở cuối URL.

Phần kết luận

Việc chia đường dẫn thành các đoạn bằng ký tự gạch chéo ngụ ý sự hiện diện của các tên không trống cho các đoạn này. Theo đó, một liên kết có dấu gạch chéo ở cuối có vẻ phi logic (mặc dù không bị cấm) theo nghĩa là nó dường như trỏ đến một đoạn cuối cùng nào đó của đường dẫn, nhưng không đặt tên cho đoạn này theo bất kỳ cách nào. Giống như link phi logic (nhưng cũng không bị cấm) http://domain.com/level1////levelX, không đặt tên cho các đoạn đường dẫn trung gian nếu đường dẫn được coi không phải là một tập hợp các tham số mà là một cấu trúc phân cấp.

Trong ngôn ngữ thông tục, nội dung ngữ nghĩa của hai liên kết có thể được giải thích như sau:

  • - địa chỉ đến điểm bắt đầu mặc định của cấp thứ hai của hệ thống phân cấp
  • - địa chỉ đến một điểm không xác định trong cấp độ thứ hai của hệ thống phân cấp, nghĩa là, như thể máy chủ được giao nhiệm vụ “chúng tôi đang giải quyết cấp độ thứ hai của hệ thống phân cấp và chính bạn xác định điểm nào trong cấp độ này mà bạn được coi là cái mặc định ban đầu.”

Từ tất cả những gì đã nói ở trên, nó theo sau, tương tự như các liên kết

  • http://domain.com
  • http://domain.com/

hướng khách truy cập vào thư mục gốc của trang web và các liên kết ví dụ

  • http://domain.com/level1/level2
  • http://domain.com/level1/level2/

hướng khách truy cập đến cấp độ thứ hai của hệ thống phân cấp tài nguyên. Và thực tế là một máy chủ nhất định có thể diễn giải dấu gạch chéo ở cuối theo cách riêng của nó và bắt đầu chuyển hướng nội bộ đến điểm bắt đầu mặc định của cấp độ - chẳng hạn như đối với tệp index.html, đây đã là một trường hợp đặc biệt của một trường hợp cụ thể cấu hình. Giống như khi triển khai hệ thống URL mà con người có thể đọc được, tất cả các bản ghi chuyển hướng sử dụng mô-đun máy chủ mod_rewrite đều xác định khái niệm riêng (vốn có trong một công cụ cụ thể) của cấu trúc URL phân cấp, trong đó các phần tử đường dẫn có thể được coi là tham số truy vấn và không có điểm chung nào với cấu trúc tệp của trang web (ví dụ cổ điển: http://domain.com/ru/path, phần tử ru là tham số của ngôn ngữ hiện tại, không phải thư mục trên trang web).

Tôi đặc biệt muốn nhấn mạnh rằng đây là kiến ​​thức nội bộ của máy chủ, được xác định bởi cấu hình của nó cũng như công cụ được cài đặt trên trang web. Một dịch vụ bên ngoài, chẳng hạn như cùng một công cụ tìm kiếm, không thể đưa ra phỏng đoán và không biết liệu các liên kết có và không có dấu gạch chéo có khác nhau hay không và như thế nào, trừ khi máy chủ của trang web được cấu hình đặc biệt để các liên kết đó cung cấp nội dung khác nhau.

Để biết thông tin của bạn

Ở cấp độ triển khai, vấn đề gạch chéo ở cuối không có tầm quan trọng cơ bản, điều này đã được nhiều cổng nổi tiếng xác nhận. Trên một số, tất cả các liên kết đều kết thúc bằng dấu gạch chéo, trên một số khác - không có dấu gạch chéo. Điều chính là nội dung trên các liên kết không khác nhau và đối với Yandex, bạn cần đăng ký chuyển hướng thứ 301 từ những liên kết mà bạn không sử dụng (giả sử kết thúc bằng dấu gạch chéo) đến những liên kết bạn sử dụng. Thực tế là, theo các tuyên bố chưa được xác nhận của dịch vụ hỗ trợ Yandex, công cụ tìm kiếm này có thể bị cáo buộc mắc lỗi và không "dán" (ghi nhớ kiến ​​​​thức của nó) hoặc bằng một số độ trễ nào đó, dán các địa chỉ gạch chéo không gạch chéo thành một.

Đây là một ví dụ về việc triển khai chuyển hướng như vậy bằng cách sử dụng tệp .htaccess gốc:

# nếu url đầu vào kết thúc bằng dấu gạch chéo (em, ami), # đặt chuyển hướng thứ 301 tới một trang không có dấu gạch chéo RewriteCond %(REQUEST_URI) ^/.+/$ RewriteRule ^(.*?)/+$ http:/ /%(HTTP_HOST )/$1

Đối với Google (một lần nữa, theo thông tin chưa được xác nhận bằng thử nghiệm), những chuyển hướng này không quan trọng, vì nó được cho là biết cách dán các địa chỉ đó một cách chính xác và không có chuyển hướng.

Nhớ Có rất nhiều người tự coi mình là chuyên gia SEO. Nhưng không phải ai trong số họ cũng như vậy. Hơn nữa, chủ đề SEO thường được đồn đoán không có kiến ​​thức và căn cứ xác đáng, đơn giản với niềm tin rằng bạn cũng dốt về lĩnh vực này nên sẽ dễ tin vào bất cứ “mì” nào. Khi bạn được thông báo rằng một trong các trang của bạn đã "ra khỏi chỉ mục", hãy sử dụng một đề xuất rất hữu ích từ Yandex: Bạn có thể tìm hiểu về các lỗi lập chỉ mục, nếu có, trong dịch vụ Yandex.Webmaster. Trong dịch vụ này, bạn luôn có thể xem danh sách các trang đang được tìm kiếm và danh sách các trang bị loại khỏi tìm kiếm vì lý do nào đó. Google cũng có dịch vụ tương tự. Hãy tin tưởng vào kiến ​​​​thức này chứ không phải ý kiến ​​​​của những chuyên gia giả hiệu, những người ở đâu đó đã nghe thấy điều gì đó từ khóe tai của họ và trên cơ sở đó khuyên bạn nên làm những gì mà họ cho là điều đúng đắn duy nhất.

Đây Một ấn phẩm rất thú vị, Sự kiện SEO ít được biết đến, được xuất bản vào tháng 4 năm 2017. Nó trình bày một nghiên cứu lớn với nhiều ảnh chụp màn hình, bắt đầu với mục tiêu kiểm tra tính hợp lệ của một số nhận định phổ biến trong lĩnh vực quảng bá công cụ tìm kiếm và sử dụng các ví dụ rõ ràng để truyền đạt kết quả đến chủ sở hữu trang web bình thường. Nghiên cứu tương tự đồng thời chứng minh cho độc giả trẻ một số tính năng rõ ràng, bình thường và khá kín đáo nhưng vẫn đáng kinh ngạc về kết quả tìm kiếm không phải trả tiền trong các tìm kiếm của Google và Yandex.

Đây Mặc dù link sau hầu như không liên quan gì đến SEO nhưng nó vẫn sẽ có sức hấp dẫn đối với các cao thủ SEO hiện đang tìm kiếm thêm đơn hàng. Một lời đề nghị thương mại được đăng dưới liên kết; các chàng trai đã tìm ra một cách thú vị để sử dụng trang web. Các doanh nghiệp tư nhân được đề nghị tạo một bảng quảng cáo trực tuyến dựa trên một số chủ đề đặc biệt, dưới sự kiểm soát của trang web, hay đúng hơn là màn hình đầu tiên của nó, trông giống như một biểu ngữ trải dài trên các bảng quảng cáo ngoài trời. Trên điện thoại thông minh, tôi xoay màn hình, đoạn kéo dài trở thành dọc và chiếm toàn bộ diện tích màn hình, quay lại, nó trở thành ngang và lại lấp đầy toàn bộ màn hình. Và bên dưới màn hình đầu tiên có một phần phụ văn bản, nơi người dùng thường không cuộn, nhưng công cụ tìm kiếm sẽ thấy rõ văn bản này. Vì vậy, những pinocchios thông minh nhất trong kinh doanh trong khu vực mua những bảng quảng cáo trực tuyến rẻ tiền này như một giải pháp thay thế có lợi cho quảng cáo theo ngữ cảnh và các mạng truyền thông ngữ cảnh Yandex và Google. Và để có được mức độ hiển thị tối đa trong chỉ mục tìm kiếm địa phương, họ sẵn sàng chi tiền cho một loạt văn bản SEO cùng một lúc để quảng cáo bảng quảng cáo của họ, điều này có vẻ khá tốn tiền. Đánh giá theo tin đồn, các đơn đặt hàng 30 kg rúp đang dần được thực hiện và vì các đối tác SEO giao chúng cho họ, nên tại đây bạn có thể xây dựng cầu nối quan hệ đối tác và có thêm thu nhập tốt.