Nghệ thuật chẩn đoán mạng cục bộ. Phần mềm chẩn đoán mạng

Nghệ thuật chẩn đoán mạng cục bộ

Nếu các chương trình định kỳ chạy chậm, máy tính bị treo hoặc ngắt kết nối khỏi máy chủ và các lập trình viên nói rằng mạng là nguyên nhân gây ra mọi thứ và quản trị viên mạng nói rằng các chương trình là nguyên nhân gây ra mọi thứ, thì bài viết này dành riêng cho bạn.

Trước khi bắt đầu mô tả phương pháp xác định “khiếm khuyết tiềm ẩn”, chúng tôi muốn xác định các thuật ngữ: trên thực tế, mạng cục bộ nghĩa là gì, chẩn đoán mạng cục bộ và loại mạng nào nên được coi là “tốt”. .”

Thông thường, chẩn đoán mạng cục bộ có nghĩa là chỉ kiểm tra hệ thống cáp của nó. Điều này không hoàn toàn đúng. Hệ thống cáp là một trong những thành phần quan trọng nhất của mạng cục bộ, nhưng nó không phải là thành phần duy nhất và không khó nhất theo quan điểm chẩn đoán. Ngoài tình trạng của hệ thống cáp, chất lượng vận hành mạng còn bị ảnh hưởng đáng kể bởi tình trạng của các thiết bị đang hoạt động (card mạng, hub, switch), chất lượng của thiết bị máy chủ và các cài đặt của hệ điều hành mạng. Ngoài ra, hoạt động của mạng phụ thuộc đáng kể vào thuật toán vận hành của phần mềm ứng dụng được sử dụng trong đó.

Với thuật ngữ “mạng cục bộ”, chúng ta sẽ hiểu toàn bộ tổ hợp phần cứng và phần mềm trên; và thuật ngữ “chẩn đoán mạng cục bộ” là quá trình xác định nguyên nhân khiến phần mềm ứng dụng trên mạng hoạt động không đạt yêu cầu. Chất lượng của phần mềm ứng dụng trên mạng có tính chất quyết định theo quan điểm của người dùng. Tất cả các tiêu chí khác, chẳng hạn như số lỗi truyền dữ liệu, mức độ tắc nghẽn tài nguyên mạng, hiệu suất thiết bị, v.v., chỉ là thứ yếu. “Mạng tốt” là mạng mà người dùng không nhận thấy nó hoạt động như thế nào.

Có thể có một số lý do chính dẫn đến hoạt động không đạt yêu cầu của phần mềm ứng dụng trên mạng: hệ thống cáp bị hỏng, lỗi thiết bị hoạt động, quá tải tài nguyên mạng (kênh liên lạc và máy chủ), lỗi trong chính phần mềm ứng dụng. Thông thường một số lỗi mạng che giấu những lỗi khác. Do đó, để xác định một cách đáng tin cậy nguyên nhân khiến phần mềm ứng dụng hoạt động không đạt yêu cầu, mạng cục bộ phải được chẩn đoán toàn diện. Chẩn đoán toàn diện liên quan đến việc thực hiện các công việc (giai đoạn) sau đây.

  • Phát hiện các khiếm khuyết ở lớp vật lý của mạng: hệ thống cáp, hệ thống cấp điện của các thiết bị đang hoạt động; sự hiện diện của tiếng ồn từ các nguồn bên ngoài.
  • Đo tải hiện tại của kênh liên lạc mạng và xác định ảnh hưởng của giá trị tải của kênh liên lạc đến thời gian phản hồi của phần mềm ứng dụng.
  • Đo lường số lượng xung đột trong mạng và tìm ra nguyên nhân xảy ra chúng.
  • Đo số lượng lỗi truyền dữ liệu ở cấp độ kênh liên lạc và xác định nguyên nhân xảy ra chúng.
  • Xác định các khiếm khuyết kiến ​​trúc mạng.
  • Đo tải máy chủ hiện tại và xác định tác động của tải của nó đến thời gian phản hồi của phần mềm ứng dụng.
  • Xác định các lỗi phần mềm ứng dụng dẫn đến việc sử dụng băng thông mạng và máy chủ không hiệu quả.

Trong bài viết này, chúng tôi sẽ xem xét bốn giai đoạn đầu tiên của quá trình chẩn đoán phức tạp của mạng cục bộ, cụ thể là: chẩn đoán cấp độ liên kết mạng.

Chúng tôi sẽ không mô tả chi tiết phương pháp thử nghiệm hệ thống cáp mạng. Bất chấp tầm quan trọng của vấn đề này, giải pháp của nó rất tầm thường và rõ ràng: một hệ thống cáp hoàn chỉnh chỉ có thể được kiểm tra bằng một thiết bị đặc biệt - máy quét cáp. Không có cách nào khác. Sẽ chẳng ích gì khi thực hiện quy trình tốn nhiều công sức để xác định các lỗi mạng nếu chúng có thể được bản địa hóa bằng một lần nhấn phím AUTOTEST trên máy quét cáp. Trong trường hợp này, thiết bị sẽ thực hiện đầy đủ các thử nghiệm để đảm bảo hệ thống cáp mạng tuân thủ tiêu chuẩn đã chọn.

Tôi muốn bạn chú ý đến hai điểm, đặc biệt là vì chúng thường bị bỏ quên khi kiểm tra hệ thống cáp mạng bằng máy quét.

Chế độ AUTOTEST không cho phép bạn kiểm tra độ ồn do nguồn bên ngoài trong cáp tạo ra. Đây có thể là tiếng ồn từ đèn huỳnh quang, dây điện, điện thoại di động, máy sao chép mạnh mẽ, v.v. Máy quét cáp thường có chức năng đặc biệt để xác định mức độ tiếng ồn. Do hệ thống cáp mạng chỉ được kiểm tra đầy đủ ở giai đoạn cài đặt và nhiễu trong cáp có thể xảy ra ngoài dự đoán nên không có gì đảm bảo hoàn toàn rằng nhiễu sẽ xuất hiện trong quá trình kiểm tra mạng toàn diện ở giai đoạn cài đặt.

Khi kiểm tra mạng bằng máy quét cáp, thay vì thiết bị hoạt động, một đầu máy quét được kết nối với cáp và đầu kia là đầu phun. Sau khi kiểm tra cáp, máy quét và đầu phun sẽ tắt và thiết bị hoạt động được kết nối: card mạng, hub, switch. Tuy nhiên, không có gì đảm bảo hoàn toàn rằng sự tiếp xúc giữa thiết bị đang hoạt động và cáp sẽ tốt như giữa thiết bị quét và cáp. Chúng tôi đã nhiều lần gặp phải trường hợp lỗi nhỏ ở phích cắm RJ-45 không xuất hiện khi kiểm tra hệ thống cáp bằng máy quét nhưng được phát hiện khi chẩn đoán mạng bằng máy phân tích giao thức.

Trong khuôn khổ phương pháp luận được đề xuất, chúng tôi sẽ không xem xét phương pháp chẩn đoán mạng chủ động trong sách giáo khoa hiện nay (xem thanh bên “Phương pháp chẩn đoán mạng chủ động”). Không đặt câu hỏi về tầm quan trọng của việc chẩn đoán chủ động, chúng tôi chỉ lưu ý rằng trong thực tế nó hiếm khi được sử dụng. Thông thường (mặc dù điều này không chính xác), mạng chỉ được phân tích trong những khoảng thời gian hoạt động không đạt yêu cầu. Trong những trường hợp như vậy, các lỗi mạng hiện có cần được bản địa hóa và sửa chữa nhanh chóng. Kỹ thuật chúng tôi đề xuất nên được coi là trường hợp đặc biệt của kỹ thuật chẩn đoán mạng chủ động.
Tổ chức quá trình chẩn đoán mạng

Bất kỳ kỹ thuật kiểm tra mạng nào đều phụ thuộc đáng kể vào các công cụ có sẵn của quản trị viên hệ thống. Theo chúng tôi, trong hầu hết các trường hợp, công cụ cần và đủ để phát hiện lỗi mạng (ngoại trừ máy quét cáp) là máy phân tích giao thức mạng. Nó phải kết nối với miền xung đột nơi quan sát thấy lỗi, ở khoảng cách tối đa với các trạm hoặc máy chủ đáng ngờ nhất (xem Quy tắc #3.3).

Nếu mạng có kiến ​​trúc đường trục bị thu gọn và một bộ chuyển mạch được sử dụng làm đường trục thì máy phân tích phải được kết nối với các cổng chuyển mạch mà lưu lượng được phân tích đi qua. Một số chương trình có các tác nhân hoặc đầu dò đặc biệt được cài đặt trên các máy tính được kết nối với các cổng chuyển mạch từ xa. Thông thường, tác nhân (không nên nhầm lẫn với tác nhân SNMP) là một dịch vụ hoặc tác vụ chạy ở chế độ nền trên máy tính của người dùng. Theo quy định, các tác nhân tiêu thụ ít tài nguyên máy tính và không can thiệp vào công việc của người dùng có máy tính được cài đặt. Máy phân tích và tác nhân có thể được kết nối với bộ chuyển mạch theo hai cách.

Trong phương pháp đầu tiên (xem Hình 1a), máy phân tích được kết nối với một cổng đặc biệt (cổng giám sát hoặc cổng gương) của bộ chuyển mạch, nếu có và lưu lượng truy cập từ tất cả các cổng chuyển mạch quan tâm sẽ lần lượt được gửi đến nó.

Hình 1a. Lưu lượng phản chiếu từ tất cả các cổng chuyển mạch lần lượt được gửi đến cổng chuyển mạch mà bộ phân tích giao thức được kết nối.

Nếu bộ chuyển mạch không có cổng đặc biệt thì máy phân tích (hoặc tác nhân) phải được kết nối với các cổng của miền mạng quan tâm ở mức gần nhất với các trạm hoặc máy chủ đáng ngờ nhất (xem Hình 1b). Đôi khi điều này có thể yêu cầu sử dụng một trung tâm bổ sung. Theo Quy tắc #3.3, phương pháp này thích hợp hơn phương pháp đầu tiên. Ngoại lệ là khi một trong các cổng chuyển mạch hoạt động ở chế độ song công hoàn toàn. Nếu đúng như vậy thì trước tiên cổng phải được chuyển sang chế độ bán song công.

Hình 1b. Bộ phân tích giao thức và các tác nhân từ xa giám sát các miền mạng chính. Một trung tâm bổ sung được sử dụng để chẩn đoán miền máy chủ.

Có rất nhiều máy phân tích giao thức khác nhau trên thị trường - từ phần mềm thuần túy đến phần sụn. Mặc dù hầu hết các máy phân tích giao thức đều có đặc điểm nhận dạng chức năng nhưng mỗi máy đều có những ưu điểm và nhược điểm nhất định. Về vấn đề này, chúng tôi muốn thu hút sự chú ý đến hai chức năng quan trọng, nếu không có chức năng này thì sẽ khó tiến hành chẩn đoán mạng hiệu quả.

Đầu tiên, bộ phân tích giao thức phải có chức năng tạo lưu lượng truy cập tích hợp (xem Quy tắc #3.4). Thứ hai, bộ phân tích giao thức phải có khả năng “làm mỏng” các khung nhận được, tức là không nhận tất cả các khung liên tiếp, mà, chẳng hạn, cứ một phần năm hoặc một phần mười với kết quả thu được gần đúng bắt buộc sau đó. Nếu chức năng này bị thiếu thì khi mạng bị tải nặng, cho dù máy tính có cài đặt máy phân tích mạnh đến đâu, máy tính sau sẽ bị treo và/hoặc mất khung. Điều này đặc biệt quan trọng khi chẩn đoán các mạng nhanh như Fast Ethernet và FDDI.

Chúng tôi sẽ minh họa phương pháp được đề xuất bằng cách sử dụng ví dụ về việc sử dụng bộ phân tích giao thức phần mềm thuần túy, Observer, của Network Instruments, chạy trong Windows 95 và Windows NT. Theo quan điểm của chúng tôi, sản phẩm này có tất cả các chức năng cần thiết để chẩn đoán mạng hiệu quả.

Vì vậy, giả sử phần mềm ứng dụng trên mạng Ethernet của bạn trở nên chậm và bạn cần nhanh chóng cách ly và loại bỏ lỗi.
Giai đoạn đầu
Đo lường việc sử dụng mạng và thiết lập mối tương quan giữa tốc độ chậm của mạng và tắc nghẽn kênh liên lạc.
Việc sử dụng kênh liên lạc mạng là tỷ lệ phần trăm thời gian mà kênh liên lạc truyền tín hiệu, hay nói cách khác - tỷ lệ dung lượng kênh liên lạc bị chiếm bởi các khung, va chạm và nhiễu. Tham số "Sử dụng kênh liên lạc" mô tả mức độ tắc nghẽn mạng.

Kênh truyền thông mạng là tài nguyên mạng dùng chung nên tải của nó ảnh hưởng đến thời gian phản hồi của phần mềm ứng dụng. Ưu tiên hàng đầu là xác định xem liệu có mối tương quan giữa hiệu suất phần mềm ứng dụng kém và việc sử dụng liên kết mạng hay không.

Giả sử rằng bộ phân tích giao thức được cài đặt trong miền mạng (miền va chạm) nơi phần mềm ứng dụng chạy chậm. Hiệu suất sử dụng kênh truyền thông trung bình là 19%, cao nhất đạt 82%. Dựa trên những dữ liệu này, liệu có thể đưa ra kết luận đáng tin cậy rằng nguyên nhân khiến các chương trình trên mạng hoạt động chậm là do tắc nghẽn kênh liên lạc? Khắc nghiệt.

Bạn thường có thể nghe về tiêu chuẩn thực tế, theo đó, để mạng Ethernet hoạt động tốt, việc sử dụng kênh liên lạc “theo xu hướng” (giá trị trung bình trong 15 phút) không được vượt quá 20% và “ở mức cao nhất” (giá trị trung bình trong 1 phút) - 35-40%. Các giá trị nhất định được giải thích là do trong mạng Ethernet, khi mức sử dụng kênh liên lạc vượt quá 40%, số lần va chạm và theo đó, thời gian phản hồi của phần mềm ứng dụng sẽ tăng lên đáng kể. Mặc dù thực tế là lý do như vậy nhìn chung là đúng, nhưng việc tuân thủ vô điều kiện các khuyến nghị đó có thể dẫn đến kết luận sai về nguyên nhân khiến các chương trình trên mạng hoạt động chậm. Chúng không tính đến các đặc điểm của một mạng cụ thể, cụ thể là: loại phần mềm ứng dụng, độ dài của miền mạng, số lượng trạm vận hành đồng thời.

Để xác định mức sử dụng kênh liên lạc tối đa được phép trong trường hợp cụ thể của bạn, chúng tôi khuyên bạn nên tuân theo các quy tắc bên dưới.
Quy tắc số 1.1.
Nếu trong mạng Ethernet tại bất kỳ thời điểm nào việc trao đổi dữ liệu xảy ra giữa không quá hai máy tính thì bất kỳ việc sử dụng mạng ở mức độ cao tùy ý đều có thể chấp nhận được.

Mạng Ethernet được thiết kế theo cách mà nếu hai máy tính đồng thời cạnh tranh với nhau để chiếm được kênh liên lạc, thì sau một thời gian, chúng sẽ đồng bộ hóa với nhau và lần lượt bắt đầu truy cập kênh liên lạc một cách nghiêm ngặt. Trong trường hợp này, thực tế không có va chạm giữa chúng.

Nếu máy trạm và máy chủ có hiệu suất cao và phần lớn dữ liệu được trao đổi giữa chúng thì mức sử dụng trong kênh liên lạc có thể đạt 80-90% (đặc biệt là ở chế độ truyền liên tục). Điều này hoàn toàn không làm chậm mạng mà ngược lại, cho thấy việc sử dụng hiệu quả tài nguyên của phần mềm ứng dụng.

Do đó, nếu mạng của bạn có mức sử dụng băng thông cao, hãy thử xác định xem có bao nhiêu máy tính đang liên lạc cùng một lúc. Điều này có thể được thực hiện, ví dụ, bằng cách thu thập và giải mã các gói tin trong kênh quan tâm trong khoảng thời gian sử dụng cao.
Quy tắc số 1.2.
Việc sử dụng nhiều kênh liên lạc mạng chỉ làm chậm hoạt động của một phần mềm ứng dụng cụ thể khi kênh liên lạc là “nút cổ chai” cho hoạt động của phần mềm cụ thể đó.

Ngoài kênh liên lạc, tình trạng tắc nghẽn trong hệ thống có thể phát sinh do hiệu suất không đủ hoặc cài đặt máy chủ không chính xác, hiệu suất của máy trạm thấp hoặc thuật toán vận hành của chính phần mềm ứng dụng không hiệu quả.

Ở mức độ nào thì kênh liên lạc chịu trách nhiệm cho hiệu suất không đủ của hệ thống có thể được tìm hiểu như sau. Sau khi chọn hoạt động phổ biến nhất của một phần mềm ứng dụng nhất định (ví dụ: đối với phần mềm ngân hàng, hoạt động đó có thể nhập lệnh thanh toán), bạn nên xác định việc sử dụng kênh liên lạc ảnh hưởng như thế nào đến thời gian thực hiện của hoạt động đó.

Cách dễ nhất để thực hiện việc này là sử dụng chức năng tạo lưu lượng có sẵn trong một số bộ phân tích giao thức (ví dụ: Observer). Khi sử dụng chức năng này, cường độ của tải được tạo ra sẽ được tăng dần và so với nền của nó, cần đo thời gian thực hiện thao tác. Nên tăng tải nền từ 0 lên 50-60% với mức tăng không quá 10%.

Nếu thời gian thực hiện một thao tác không thay đổi đáng kể trên một phạm vi tải nền rộng thì nút thắt cổ chai của hệ thống không phải là kênh liên lạc. Nếu thời gian thực hiện thao tác sẽ thay đổi đáng kể tùy thuộc vào kích thước của tải nền (ví dụ: với mức sử dụng kênh liên lạc 10% và 20%, thời gian thực hiện thao tác sẽ thay đổi đáng kể), thì đó chính là kênh liên lạc. rất có thể là nguyên nhân gây ra hiệu suất thấp của hệ thống và giá trị khối lượng công việc của nó rất quan trọng đối với thời gian phản hồi của phần mềm ứng dụng. Biết được thời gian phản hồi mong muốn của phần mềm, bạn có thể dễ dàng xác định việc sử dụng kênh liên lạc nào tương ứng với thời gian phản hồi mong muốn của phần mềm ứng dụng.

Trong thử nghiệm này, tải nền không được đặt quá 60-70%. Ngay cả khi kênh liên lạc không bị tắc nghẽn, dưới mức tải như vậy, thời gian thực hiện có thể tăng lên do thông lượng mạng hiệu quả giảm.
Quy tắc số 1.3.
Việc sử dụng tối đa cho phép một kênh liên lạc phụ thuộc vào độ dài của mạng.

Khi độ dài của miền mạng tăng lên thì mức sử dụng cho phép sẽ giảm đi. Miền mạng càng dài thì các xung đột sẽ được phát hiện muộn hơn. Nếu độ dài của miền mạng nhỏ thì các xung đột sẽ được phát hiện bởi các trạm ở đầu khung, tại thời điểm truyền phần mở đầu. Nếu độ dài của mạng lớn thì xung đột sẽ được phát hiện sau đó - tại thời điểm truyền khung. Kết quả là chi phí truyền gói (IP hoặc IPX) tăng lên. Xung đột được phát hiện càng muộn thì chi phí càng lớn và thời gian truyền gói càng mất nhiều thời gian. Kết quả là thời gian phản hồi của phần mềm ứng dụng dù chỉ tăng lên một chút.

Kết luận. Nếu qua chẩn đoán mạng, bạn xác định rằng nguyên nhân khiến phần mềm ứng dụng hoạt động chậm là do tắc nghẽn kênh liên lạc thì kiến ​​trúc mạng phải được thay đổi. Cần giảm số lượng trạm trong các miền mạng bị quá tải và các trạm tạo ra tải lớn nhất trên mạng phải được kết nối với các cổng chuyển mạch chuyên dụng.
Giai đoạn thứ hai
Đo lường số lượng va chạm trong mạng.

Nếu hai trạm trong miền mạng đồng thời truyền dữ liệu thì xảy ra xung đột trong miền. Có ba loại va chạm: cục bộ, từ xa, muộn.

Xung đột cục bộ là xung đột được phát hiện trong miền nơi thiết bị đo được kết nối, trong phần mở đầu truyền hoặc 64 byte đầu tiên của khung khi nguồn truyền nằm trong miền. Các thuật toán phát hiện xung đột cục bộ cho mạng đôi xoắn (10BaseT) và cáp đồng trục (10Base2) khác nhau.

Trong mạng 10Base2, trạm truyền khung xác định rằng đã xảy ra xung đột cục bộ bằng cách thay đổi mức điện áp trong kênh liên lạc (bằng cách tăng gấp đôi). Sau khi phát hiện xung đột, trạm phát sẽ gửi một loạt tín hiệu gây nhiễu vào kênh liên lạc để tất cả các trạm khác trong miền biết rằng đã xảy ra xung đột. Kết quả của chuỗi tín hiệu này là sự xuất hiện trên mạng các khung hình ngắn, được định dạng không chính xác có độ dài dưới 64 byte với trình tự kiểm tra CRC không chính xác. Những khung như vậy được gọi là các mảnh va chạm hoặc runt.

Trong mạng 10BaseT, một trạm xác định rằng đã xảy ra xung đột cục bộ nếu nó phát hiện hoạt động trên cặp nhận (Rx) trong khi truyền khung.

Xung đột từ xa là xung đột xảy ra trên một phân đoạn vật lý khác của mạng (tức là phía sau bộ lặp). Một trạm biết rằng đã xảy ra xung đột từ xa nếu nó nhận được khung ngắn không đúng định dạng với trình tự kiểm tra CRC không chính xác và mức điện áp liên kết vẫn nằm trong giới hạn được chỉ định (đối với mạng 10Base2). Đối với mạng 10BaseT/100BaseT, chỉ báo là không có hoạt động đồng thời trên các cặp nhận và truyền (Tx và Rx).

Va chạm muộn là va chạm cục bộ được phát hiện sau khi trạm truyền 64 byte đầu tiên của khung vào kênh liên lạc. Trong mạng 10BaseT, các xung đột muộn thường được các thiết bị đo lường báo cáo là lỗi CRC.

Theo quy luật, nếu việc phát hiện các xung đột cục bộ và từ xa vẫn chưa cho thấy sự hiện diện của lỗi trong mạng thì việc phát hiện các xung đột muộn là một xác nhận rõ ràng về sự hiện diện của lỗi trong miền. Thông thường, điều này là do đường dây liên lạc quá dài hoặc thiết bị mạng kém chất lượng.

Ngoài việc sử dụng kênh liên lạc ở mức độ cao, xung đột trong mạng Ethernet có thể do lỗi trong hệ thống cáp và thiết bị hoạt động cũng như do nhiễu.

Ngay cả khi kênh liên lạc không phải là điểm nghẽn của hệ thống thì các xung đột không đáng kể nhưng lại làm chậm quá trình hoạt động của phần mềm ứng dụng. Hơn nữa, sự chậm lại chính không phải do nhu cầu truyền lại khung mà do mỗi máy tính trên mạng, sau khi xảy ra xung đột, phải thực hiện thuật toán quay lui: trước lần thử tiếp theo để vào mạng. kênh liên lạc, nó sẽ phải chờ một khoảng thời gian ngẫu nhiên, tỷ lệ thuận với số lần thử không thành công trước đó.

Về vấn đề này, điều quan trọng là phải tìm ra nguyên nhân gây ra xung đột - mức sử dụng mạng cao hoặc lỗi mạng “ẩn”. Để xác định điều này, chúng tôi khuyên bạn nên tuân theo các quy tắc sau.
Quy tắc số 2.1.

Không phải tất cả các thiết bị đo đều xác định chính xác tổng số va chạm trong mạng.

Hầu như tất cả các máy phân tích giao thức phần mềm thuần túy chỉ phát hiện sự hiện diện của xung đột nếu chúng phát hiện ra một đoạn trong mạng, tức là kết quả của xung đột. Đồng thời, loại xung đột phổ biến nhất - xảy ra tại thời điểm truyền phần mở đầu khung (tức là trước dấu phân cách khung ban đầu (SFD)) - không được phát hiện bởi các công cụ đo phần mềm, đây là cách mà chipset của Card mạng Ethernet được thiết kế. Các máy đo phần cứng như LANMeter của Fluke phát hiện va chạm một cách chính xác nhất.
Quy tắc số 2.2.

Việc sử dụng kênh liên lạc ở mức độ cao không phải lúc nào cũng đi kèm với mức độ xung đột cao.

Mức độ xung đột sẽ thấp nếu không có nhiều hơn hai trạm hoạt động trên mạng cùng một lúc (xem Quy tắc số 1.1) hoặc nếu một số lượng nhỏ các trạm đang trao đổi đồng thời các khung hình dài (đặc biệt điển hình cho chế độ chụp liên tục) . Trong trường hợp này, trước khi bắt đầu truyền khung, các trạm “nhìn thấy” sóng mang trong kênh liên lạc và hiếm khi xảy ra xung đột.
Quy tắc số 2.3.

Dấu hiệu của sự cố trong mạng là tình trạng sử dụng kênh thấp (dưới 30%) đi kèm với mức độ xung đột cao (trên 5%).

Nếu hệ thống cáp đã được quét trước đó, nguyên nhân rất có thể khiến tốc độ xung đột tăng lên là do nhiễu trên đường truyền do nguồn bên ngoài gây ra hoặc card mạng bị lỗi không triển khai đúng thuật toán CSMA/CD.

Công ty Network Instruments, trong bộ phân tích giao thức Observer, ban đầu đã giải quyết được vấn đề xác định các xung đột do lỗi mạng. Thử nghiệm được tích hợp trong chương trình sẽ kích thích xảy ra xung đột: nó gửi một loạt gói vào kênh liên lạc với cường độ 100 gói mỗi giây và phân tích số lượng xung đột đã xảy ra. Trong trường hợp này, biểu đồ kết hợp hiển thị sự phụ thuộc của số lượng xung đột trong mạng vào việc sử dụng kênh liên lạc.

Sẽ rất hợp lý khi phân tích tỷ lệ xung đột trong tổng số khung hình tại thời điểm hoạt động của các trạm đáng ngờ (hoạt động chậm) và chỉ trong trường hợp mức sử dụng kênh liên lạc vượt quá 30%. Nếu trong số ba khung hình gặp phải xung đột, điều này không có nghĩa là mạng có lỗi.

Trong Trình phân tích giao thức quan sát, biểu đồ hiển thị trong Hình 3 thay đổi màu sắc tùy thuộc vào số lượng xung đột và mức độ sử dụng kênh liên lạc được quan sát.
Quy tắc số 2.4.

Khi chẩn đoán mạng 10BaseT, tất cả các xung đột sẽ được báo cáo là đã xóa nếu bộ phân tích giao thức không tạo ra lưu lượng truy cập.

Nếu bạn giám sát một cách thụ động (không tạo lưu lượng truy cập) mạng 10BaseT và phân đoạn vật lý nơi máy phân tích (thiết bị đo lường) được kết nối đang hoạt động thì tất cả các xung đột sẽ được ghi lại dưới dạng từ xa.

Tuy nhiên, nếu bạn thấy xung đột cục bộ thì điều này có thể có nghĩa là một trong ba điều sau: phân đoạn mạng vật lý mà thiết bị đo được kết nối bị lỗi; Cổng hub hoặc cổng chuyển mạch mà đồng hồ kết nối bị lỗi hoặc đồng hồ không thể phân biệt giữa va chạm cục bộ và va chạm từ xa.
Quy tắc số 2.5.

Xung đột trong mạng có thể là hậu quả của việc làm quá tải bộ đệm đầu vào của bộ chuyển mạch.

Cần nhớ rằng khi bộ đệm đầu vào bị quá tải, các switch sẽ mô phỏng các xung đột để “làm chậm” các máy trạm mạng. Cơ chế này được gọi là "kiểm soát dòng chảy".
Quy tắc số 2.6.
Nguyên nhân gây ra nhiều xung đột (và lỗi) trong mạng có thể là do việc tổ chức nối đất không đúng cách cho các máy tính kết nối với mạng cục bộ.

Nếu các máy tính kết nối mạng không có điểm nối đất chung (nối đất) thì có thể xảy ra sự khác biệt tiềm ẩn giữa các thùng máy tính. Trong máy tính cá nhân, nền tảng “bảo vệ” được kết hợp với nền tảng “thông tin”. Vì các máy tính được kết nối bằng kênh liên lạc mạng cục bộ nên sự khác biệt tiềm năng giữa chúng dẫn đến việc tạo ra dòng điện qua kênh liên lạc. Dòng điện này gây ra sự biến dạng thông tin và là nguyên nhân gây ra xung đột, lỗi trong mạng. Hiệu ứng này được gọi là tiếng ồn vòng lặp mặt đất hoặc tiếng ồn liên mặt đất.

Hiệu ứng tương tự xảy ra khi một đoạn cáp đồng trục được nối đất tại nhiều điểm. Điều này thường xảy ra nếu đầu nối chữ T của card mạng tiếp xúc với vỏ máy tính.

Xin lưu ý rằng việc lắp đặt nguồn điện liên tục không làm giảm bớt những khó khăn được mô tả. Những vấn đề này và phương pháp giải quyết được thảo luận chi tiết hơn trong tài liệu của APC (American Power Transformation) trong Sổ tay Bảo vệ Nguồn điện.

Nếu phát hiện thấy một số lượng lớn xung đột và lỗi trong mạng 10Base2, điều đầu tiên cần làm là kiểm tra sự khác biệt tiềm ẩn giữa dây bện cáp đồng trục và vỏ máy tính. Nếu giá trị của nó đối với bất kỳ máy tính nào trên mạng lớn hơn một volt trên dòng điện xoay chiều thì mạng đó không ổn với cấu trúc liên kết của các đường nối đất máy tính.
Giai đoạn thứ ba
Đo số lượng lỗi ở lớp liên kết dữ liệu mạng.

Các loại lỗi phổ biến nhất trong mạng Ethernet là:

Khung ngắn - khung dài dưới 64 byte (sau phần mở đầu 8 byte) với trình tự kiểm tra hợp lệ. Nguyên nhân rất có thể xảy ra tình trạng khung hình ngắn là do card mạng bị lỗi hoặc trình điều khiển mạng bị cấu hình không đúng hoặc bị hỏng.

Gần đây chúng tôi đã thấy một số lượng lớn các lỗi kiểu này trên các máy tính tương đối chậm (486/SX) chạy Windows 95 với card mạng NE2000. Lý do chúng tôi không biết.

Khung dài - khung dài hơn 1518 byte. Một khung dài có thể có trình tự kiểm tra đúng hoặc sai. Trong trường hợp sau, những khung như vậy thường được gọi là jabber. Việc ghi các khung hình dài với trình tự điều khiển chính xác thường cho thấy trình điều khiển mạng không hoạt động chính xác; sửa lỗi loại jabber - do trục trặc của thiết bị đang hoạt động hoặc có sự can thiệp từ bên ngoài.

Lỗi trình tự điều khiển (lỗi CRC) - khung được định dạng chính xác có độ dài chấp nhận được (từ 64 đến 1518 byte), nhưng có trình tự điều khiển không chính xác (lỗi trong trường CRC).

Lỗi căn chỉnh - một khung chứa một số bit không phải là bội số của số byte.

Ghost là một chuỗi tín hiệu có định dạng khác với khung Ethernet, không chứa dấu phân cách (SFD) và dài hơn 72 byte. Thuật ngữ này lần đầu tiên được Fluke giới thiệu để phân biệt sự khác biệt giữa va chạm từ xa và tiếng ồn trong kênh liên lạc.

Ánh sáng chói là lỗi nguy hiểm nhất vì chúng không được các bộ phân tích giao thức phần mềm nhận ra vì lý do tương tự như xung đột ở giai đoạn truyền mở đầu. Độ chói có thể được phát hiện bằng các thiết bị đặc biệt hoặc sử dụng phương pháp kiểm tra căng thẳng mạng (chúng tôi dự định nói về phương pháp này trong các ấn phẩm tiếp theo).

Tuy nhiên, trước nguy cơ phải chịu sự phẫn nộ chính đáng của các nhà phân phối phần mềm quản lý mạng dựa trên SNMP, chúng tôi dám khẳng định rằng mức độ mà các lỗi lớp liên kết ảnh hưởng đến thời gian phản hồi của phần mềm ứng dụng là bị phóng đại quá mức.

Theo tiêu chuẩn thực tế được chấp nhận chung, số lỗi cấp độ liên kết không được vượt quá 1% tổng số khung được truyền qua mạng. Kinh nghiệm cho thấy rằng giá trị này chỉ được áp dụng khi có khiếm khuyết rõ ràng trong hệ thống cáp mạng. Đồng thời, nhiều lỗi nghiêm trọng trong thiết bị hoạt động gây ra nhiều lỗi mạng không xuất hiện ở lớp liên kết dữ liệu của mạng (xem Quy tắc #3.8).
Quy tắc số 3.1.

Trước khi phân tích lỗi mạng, hãy tìm hiểu những loại lỗi nào có thể được phát hiện bởi card mạng và trình điều khiển card trên máy tính nơi phần mềm phân tích giao thức của bạn đang chạy.

Hoạt động của bất kỳ bộ phân tích giao thức nào đều dựa trên việc card mạng và trình điều khiển được chuyển sang chế độ nhận tất cả các khung mạng (chế độ lăng nhăng). Ở chế độ này, card mạng sẽ nhận tất cả các khung hình đi qua mạng chứ không chỉ các khung hình phát sóng và những khung hình được gửi trực tiếp đến nó, như ở chế độ bình thường. Bộ phân tích giao thức nhận tất cả thông tin về các sự kiện trên mạng từ trình điều khiển của card mạng hoạt động ở chế độ nhận tất cả các khung.

Không phải tất cả các card mạng và trình điều khiển mạng đều cung cấp cho bộ phân tích giao thức thông tin giống hệt và đầy đủ về các lỗi mạng. Card mạng 3Com hoàn toàn không cung cấp bất kỳ thông tin lỗi nào. Nếu bạn cài đặt bộ phân tích giao thức trên một bảng như vậy thì các giá trị trên tất cả các bộ đếm lỗi sẽ bằng 0.

EtherExpress Pro của Intel chỉ báo cáo CRC và lỗi căn chỉnh. Card mạng SMC chỉ cung cấp thông tin về các khung ngắn. NE2000 cung cấp thông tin gần như đầy đủ, xác định lỗi CRC, khung ngắn, lỗi căn chỉnh và xung đột.

Báo cáo về card mạng D-Link (ví dụ: DFE-500TX) và Kingstone (ví dụ: KNE 100TX) đã hoàn tất và nếu có trình điều khiển đặc biệt, thậm chí còn mở rộng thông tin về lỗi và xung đột trong mạng.

Một số nhà phát triển bộ phân tích giao thức cung cấp trình điều khiển của họ cho các card mạng phổ biến nhất.
Quy tắc số 3.2.

Hãy chú ý đến việc “ràng buộc” lỗi đối với các địa chỉ MAC cụ thể của các trạm.

Khi phân tích mạng cục bộ, bạn có thể nhận thấy rằng các lỗi thường được “gắn” với một số địa chỉ MAC nhất định của các trạm. Tuy nhiên, các xung đột xảy ra ở phần địa chỉ của khung, chói, các tình huống không được nhận dạng như khung ngắn có độ dài dữ liệu bằng 0 không thể được “gắn” với các địa chỉ MAC cụ thể.

Nếu có nhiều lỗi trên mạng không liên quan đến các địa chỉ MAC cụ thể thì nguồn của chúng rất có thể không phải là thiết bị đang hoạt động. Rất có thể, những lỗi như vậy là kết quả của sự va chạm, lỗi trong hệ thống cáp mạng hoặc tiếng ồn mạnh bên ngoài. Chúng cũng có thể do chất lượng kém hoặc do gián đoạn điện áp cung cấp cho thiết bị đang hoạt động.

Nếu hầu hết các lỗi đều liên quan đến địa chỉ MAC cụ thể của các trạm thì hãy cố gắng xác định mẫu giữa vị trí của các trạm truyền khung bị lỗi, vị trí của thiết bị đo (xem Quy tắc # 3.3, # 3.4) và cấu trúc liên kết mạng.
Quy tắc số 3.3.

Trong một miền mạng (miền va chạm), loại và số lượng lỗi được bộ phân tích giao thức ghi lại phụ thuộc vào nơi thiết bị đo được kết nối.

Nói cách khác, trong phân đoạn cáp đồng trục, hub hoặc ngăn xếp hub, mẫu thống kê liên kết có thể phụ thuộc vào vị trí kết nối đồng hồ.

Đối với nhiều quản trị viên mạng, tuyên bố này có vẻ vô lý vì nó mâu thuẫn với các nguyên tắc của mô hình OSI bảy lớp. Khi mới gặp hiện tượng này, chúng tôi cũng không tin vào kết quả và cho rằng thiết bị đo bị lỗi. Chúng tôi đã thử nghiệm hiện tượng này bằng các dụng cụ đo khác nhau, từ phần mềm thuần túy đến phần mềm và phần cứng. Kết quả là giống nhau.

Sự can thiệp tương tự có thể gây ra lỗi CRC, chớp sáng, va chạm từ xa hoặc hoàn toàn không được phát hiện, tùy thuộc vào vị trí tương đối của nguồn gây nhiễu và thiết bị đo. Vụ va chạm tương tự có thể được ghi nhận là ở xa hoặc muộn, tùy thuộc vào vị trí tương đối của các trạm xung đột và thiết bị đo. Một khung chứa lỗi CRC trên một hub trong ngăn xếp có thể không được ghi lại trên một hub khác trên cùng ngăn xếp.

Hậu quả của quy tắc heuristic trên là thực tế là các chương trình giám sát mạng dựa trên giao thức SNMP không phải lúc nào cũng phản ánh đầy đủ số liệu thống kê về lỗi trong mạng. Lý do cho điều này là tác nhân SNMP được tích hợp trong thiết bị đang hoạt động luôn giám sát trạng thái mạng chỉ từ một điểm. Vì vậy, nếu mạng bao gồm một số nhóm hub "không thông minh" được kết nối với một bộ chuyển mạch "thông minh", thì tác nhân SNMP của bộ chuyển mạch đôi khi có thể không thấy một số lỗi trong ngăn xếp trung tâm.

Xác nhận quy tắc này có thể được tìm thấy trên các máy chủ Web của Fluke (www.fluke.com) và Net3 Group (www.net3group.com).

Để xác định lỗi ở cấp độ liên kết dữ liệu của mạng, các phép đo phải được thực hiện dựa trên nền tảng của bộ phân tích tạo ra các giao thức lưu lượng riêng của nó.

Tạo lưu lượng truy cập cho phép bạn làm trầm trọng thêm các vấn đề hiện có và tạo điều kiện cho chúng biểu hiện. Lưu lượng truy cập phải có cường độ thấp (không quá 100 khung hình/giây) và góp phần hình thành các xung đột trong mạng, tức là chứa các đoạn ngắn (
Khi chọn một bộ phân tích giao thức hoặc công cụ chẩn đoán khác, trước hết cần chú ý đến thực tế là công cụ được chọn có chức năng tích hợp để tạo lưu lượng truy cập ở cường độ xác định. Tính năng này có sẵn trong các máy phân tích NetXray của Network Instruments' Observer và Cinco (nay là Network Associates).
Quy tắc số 3.5.

Nếu số liệu thống kê quan sát được phụ thuộc vào vị trí của thiết bị đo thì nguồn lỗi rất có thể nằm ở cấp độ vật lý của một miền mạng nhất định (lý do là do lỗi trong hệ thống cáp hoặc nhiễu từ nguồn bên ngoài). Mặt khác, nguồn lỗi nằm ở lớp liên kết dữ liệu (hoặc cao hơn) hoặc ở miền mạng lân cận khác.
Quy tắc số 3.6.

Nếu tỷ lệ lỗi CRC trong tổng số lỗi lớn thì cần xác định độ dài của khung chứa loại lỗi này.

Như chúng tôi đã lưu ý, lỗi CRC có thể xảy ra do va chạm, lỗi trong hệ thống cáp, nguồn nhiễu bên ngoài hoặc bộ thu phát bị lỗi. Một nguyên nhân có thể khác gây ra lỗi CRC có thể là do cổng hub hoặc cổng chuyển mạch bị lỗi thêm một vài byte giả vào cuối khung.

Nếu có tỷ lệ lỗi CRC lớn trong tổng số lỗi thì nên tìm hiểu nguyên nhân xuất hiện của chúng. Để làm điều này, các khung hình bị lỗi trong một loạt phim phải được so sánh với các khung hình tốt tương tự trong cùng một loạt phim. Nếu các khung hình sai ngắn hơn đáng kể so với các khung hình tốt thì rất có thể đây là kết quả của sự va chạm. Nếu các khung bị lỗi có độ dài gần như nhau thì nguyên nhân gây ra biến dạng rất có thể là do nhiễu từ bên ngoài. Nếu khung xấu dài hơn khung tốt thì nguyên nhân rất có thể nằm ở cổng bị lỗi trên hub hoặc bộ chuyển mạch, điều này sẽ thêm các byte “trống” vào cuối khung.

Cách dễ nhất để so sánh độ dài của khung hình sai và khung hình chính xác là thu thập một loạt khung hình có lỗi CRC vào bộ đệm của máy phân tích.
Quy tắc số 3.7.

Bảng 1 hệ thống hóa nguyên nhân gây ra lỗi và va chạm cho giai đoạn 2 và 3

Nguyên nhân gây ra lỗi Va chạm cục bộ Đã xóa va chạm Va chạm muộn Cú sút ngắn Cú sút xa nói nhảm lỗi CRC
Card mạng bị lỗi >5% tại
bạn
>5% tại
bạn
Ăn Ăn Ăn Ăn Ăn
Trình điều khiển bảng bị lỗi Ăn Ăn Ăn Ăn
Hub, bộ lặp, bộ thu phát bị lỗi >5% tại
bạn
>5% tại
bạn
Ăn Ăn Ăn
Kết nối không chính xác của thiết bị hoạt động >5% tại
bạn
>5% tại
bạn
Ăn Ăn
Cáp quá dài Ăn Ăn
Hơn 4 bộ lặp hoặc trung tâm xếp tầng Ăn
Nối đất máy tính hoặc cáp đồng trục không đúng cách >5% tại
bạn
>5% tại
bạn
Ăn Ăn Ăn
Khiếm khuyết trong hệ thống cáp và thiết bị thụ động >5% tại
bạn
>5% tại
bạn
Ăn Ăn Ăn
Nguồn ồn gần hệ thống cáp >5% tại
bạn
>5% tại
bạn
Ăn Ăn Ăn
Ghi chú. U - sử dụng kênh liên lạc

Nếu bạn đang chẩn đoán mạng của mình lần đầu tiên và đang gặp sự cố, bạn không nên mong đợi rằng chỉ một thành phần trong mạng của bạn bị lỗi.

Cách đáng tin cậy nhất để khoanh vùng các lỗi là tắt từng trạm, hub và tuyến cáp đáng ngờ, đồng thời kiểm tra cẩn thận cấu trúc liên kết của đường nối đất máy tính (đặc biệt đối với mạng 10Base2).

Nếu mất mạng xảy ra vào những thời điểm không thể đoán trước và không liên quan đến hoạt động của người dùng, hãy kiểm tra mức độ nhiễu trong cáp bằng máy quét cáp. Nếu bạn không có máy quét, hãy kiểm tra trực quan để đảm bảo cáp không đi qua gần các nguồn bức xạ điện từ mạnh: cáp điện áp cao hoặc dòng điện cao, đèn huỳnh quang, động cơ điện, thiết bị sao chép, v.v.
Quy tắc số 3.8.

Việc không có lỗi ở lớp liên kết dữ liệu không đảm bảo rằng thông tin trên mạng của bạn không bị hỏng.

Nó đã được đề cập ở phần đầu của phần này rằng tác động của lỗi lớp liên kết đến hoạt động của mạng đã bị phóng đại quá mức. Hậu quả của lỗi mức độ thấp là việc truyền lại khung. Nhờ tốc độ cao của mạng Ethernet (đặc biệt là Fast Ethernet) và hiệu suất cao của các máy tính hiện đại, các lỗi ở mức độ thấp không ảnh hưởng đáng kể đến thời gian phản hồi của phần mềm ứng dụng.

Chúng tôi rất hiếm khi gặp phải trường hợp chỉ loại bỏ các lỗi ở cấp độ thấp hơn (kênh và vật lý) của mạng có thể cải thiện đáng kể thời gian phản hồi của phần mềm ứng dụng. Các vấn đề chủ yếu liên quan đến những khiếm khuyết nghiêm trọng trong hệ thống cáp của mạng.

Các lỗi như biến mất hoặc biến dạng thông tin trong card mạng, bộ định tuyến hoặc bộ chuyển mạch trong trường hợp hoàn toàn không có thông tin về lỗi ở mức thấp hơn có tác động lớn hơn nhiều đến hoạt động của phần mềm ứng dụng trên mạng. Chúng tôi sử dụng từ “thông tin” vì tại thời điểm bóp méo dữ liệu vẫn chưa được đóng khung.

Lý do cho những khiếm khuyết như sau. Thông tin bị bóp méo (hoặc biến mất) “trong sâu” của thiết bị đang hoạt động - card mạng, bộ định tuyến hoặc bộ chuyển mạch. Trong trường hợp này, bộ phận truyền và nhận của thiết bị này sẽ tính toán trình tự điều khiển (CRC) chính xác của thông tin bị lỗi trước đó và khung được định dạng chính xác sẽ được truyền qua mạng. Đương nhiên, không có lỗi nào được ghi lại trong trường hợp này. Các tác nhân SNMP được tích hợp trong thiết bị hoạt động không thể trợ giúp ở đây.

Đôi khi, ngoài sự biến dạng, thông tin còn biến mất. Thông thường nó xảy ra trên các card mạng giá rẻ hoặc trên các bộ chuyển mạch Ethernet-FDDI. Cơ chế biến mất thông tin trong trường hợp sau là rõ ràng. Trong một số bộ chuyển mạch Ethernet-FDDI, không có phản hồi từ cổng nhanh đến cổng chậm (hoặc ngược lại), do đó, cổng còn lại không nhận được thông tin về tình trạng tắc nghẽn của bộ đệm đầu vào/đầu ra của bộ chuyển mạch nhanh. (chậm) cổng. Trong trường hợp này, khi lưu lượng truy cập lớn, thông tin trên một trong các cổng có thể bị mất.

Một quản trị viên mạng có kinh nghiệm có thể lập luận rằng ngoài việc bảo vệ thông tin ở cấp độ liên kết trong giao thức IPX và TCP/IP, còn có thể bảo vệ thông tin bằng cách sử dụng tổng kiểm tra.

Chỉ có thể dựa vào tính năng bảo vệ tổng kiểm tra đầy đủ nếu phần mềm ứng dụng sử dụng TCP hoặc UDP làm giao thức truyền tải. Chỉ khi chúng được sử dụng, toàn bộ gói tin mới được bảo vệ bằng tổng kiểm tra. Nếu IPX/SPX hoặc chính IP được sử dụng làm “truyền tải” thì chỉ tiêu đề gói được bảo vệ bằng tổng kiểm tra.

Ngay cả với tính năng bảo vệ tổng kiểm tra, sự biến dạng hoặc biến mất thông tin được mô tả sẽ làm tăng đáng kể thời gian phản hồi của phần mềm ứng dụng.

Nếu không cài đặt biện pháp bảo vệ thì hoạt động của phần mềm ứng dụng có thể không thể đoán trước được.

Ngoài việc thay thế (vô hiệu hóa) thiết bị đáng ngờ, những khiếm khuyết đó có thể được xác định theo hai cách.

Phương pháp đầu tiên là chụp, giải mã và phân tích các khung hình từ trạm, bộ định tuyến hoặc bộ chuyển mạch đáng ngờ. Triệu chứng của lỗi được mô tả là việc truyền lại gói IP hoặc IPX, không xảy ra trước lỗi ở lớp mạng thấp hơn. Một số máy phân tích giao thức và hệ thống chuyên gia đơn giản hóa nhiệm vụ bằng cách thực hiện phân tích dấu vết hoặc tự tính toán tổng kiểm tra gói.

Phương pháp thứ hai là phương pháp kiểm tra sức chịu tải của mạng.

Kết luận. Nhiệm vụ chính của việc chẩn đoán mức độ liên kết của mạng là xác định sự hiện diện của số lượng xung đột và lỗi ngày càng tăng trong mạng và tìm ra mối quan hệ giữa số lượng lỗi, mức độ tắc nghẽn của kênh liên lạc, cấu trúc liên kết mạng và vị trí của thiết bị đo. Tất cả các phép đo phải được thực hiện dựa trên nền tảng của máy phân tích tạo ra các giao thức lưu lượng riêng của nó.

Nếu xác định rằng số lượng lỗi và xung đột tăng lên không phải là hậu quả của tắc nghẽn kênh liên lạc thì cần phải thay thế thiết bị mạng trong quá trình hoạt động có số lượng lỗi tăng lên.

Nếu bạn không thể xác định được mối quan hệ giữa hoạt động của thiết bị cụ thể và việc xảy ra lỗi thì hãy tiến hành kiểm tra toàn diện hệ thống cáp, kiểm tra mức độ nhiễu trong cáp, cấu trúc liên kết của đường nối đất máy tính và chất lượng nguồn cung cấp. Vôn.
Những thông số nào cần được theo dõi khi chẩn đoán mạng?
Phương pháp chẩn đoán mạng chủ động
Kỹ thuật chẩn đoán chủ động như sau. Quản trị viên mạng phải giám sát hoạt động của mạng liên tục hoặc trong thời gian dài. Nên thực hiện những quan sát như vậy kể từ thời điểm cài đặt. Dựa trên những quan sát này, trước tiên, quản trị viên phải xác định xem giá trị của các tham số được quan sát ảnh hưởng như thế nào đến công việc của người dùng mạng và thứ hai là chúng thay đổi như thế nào trong một khoảng thời gian dài: một ngày làm việc, tuần, tháng, quý , năm, v.v.

Các thông số quan sát được thường là:

  • thông số vận hành của kênh liên lạc mạng - việc sử dụng kênh liên lạc, số lượng khung được nhận và truyền bởi mỗi trạm mạng, số lỗi trong mạng, số lượng khung phát sóng và phát đa hướng, v.v.;
  • thông số vận hành máy chủ - mức sử dụng bộ xử lý máy chủ, số lượng yêu cầu bị trì hoãn (chờ) vào đĩa, tổng số bộ đệm bộ đệm, số bộ đệm bộ đệm "bẩn", v.v.

Biết được mối quan hệ giữa thời gian phản hồi của phần mềm ứng dụng và các giá trị của các tham số quan sát được, quản trị viên mạng phải xác định các giá trị tham số tối đa được phép đối với một mạng nhất định. Các giá trị này được nhập dưới dạng ngưỡng vào công cụ chẩn đoán. Nếu trong quá trình vận hành mạng, giá trị của các tham số quan sát được vượt quá giá trị ngưỡng, công cụ chẩn đoán sẽ thông báo cho quản trị viên mạng về sự kiện này. Tình huống này cho thấy có vấn đề trong mạng.

Bằng cách quan sát hoạt động của kênh liên lạc và máy chủ trong một thời gian đủ dài, bạn có thể thiết lập xu hướng về giá trị của các thông số vận hành mạng khác nhau (mức sử dụng tài nguyên, số lỗi, v.v.). Dựa trên những quan sát như vậy, quản trị viên có thể đưa ra kết luận về sự cần thiết phải thay thế thiết bị đang hoạt động hoặc thay đổi kiến ​​trúc mạng.

Nếu một sự cố xuất hiện trên mạng, quản trị viên phải ghi kết xuất dấu vết kênh vào một bộ đệm hoặc tệp đặc biệt tại thời điểm nó xuất hiện và dựa trên phân tích nội dung của nó, đưa ra kết luận về các nguyên nhân có thể xảy ra của sự cố.
Nguồn: Thư viện chuyên gia CNTT

http://inform.p-stone.ru/libr/nets/monitor/data/public14/#p1

Trước khi bắt đầu mô tả phương pháp xác định “khiếm khuyết tiềm ẩn”, chúng tôi muốn xác định các thuật ngữ: trên thực tế, mạng cục bộ nghĩa là gì, chẩn đoán mạng cục bộ và loại mạng nào nên được coi là “tốt”. .”

Thông thường, chẩn đoán mạng cục bộ có nghĩa là chỉ kiểm tra hệ thống cáp của nó. Điều này không hoàn toàn đúng. Hệ thống cáp là một trong những thành phần quan trọng nhất của mạng cục bộ, nhưng nó không phải là thành phần duy nhất và không khó nhất theo quan điểm chẩn đoán. Ngoài tình trạng của hệ thống cáp, chất lượng vận hành mạng còn bị ảnh hưởng đáng kể bởi tình trạng của các thiết bị đang hoạt động (card mạng, hub, switch), chất lượng của thiết bị máy chủ và các cài đặt của hệ điều hành mạng. Ngoài ra, hoạt động của mạng phụ thuộc đáng kể vào thuật toán vận hành của phần mềm ứng dụng được sử dụng trong đó.

Với thuật ngữ “mạng cục bộ”, chúng ta sẽ hiểu toàn bộ tổ hợp phần cứng và phần mềm trên; và thuật ngữ “chẩn đoán mạng cục bộ” là quá trình xác định nguyên nhân khiến phần mềm ứng dụng trên mạng hoạt động không đạt yêu cầu. Chất lượng của phần mềm ứng dụng trên mạng có tính chất quyết định theo quan điểm của người dùng. Tất cả các tiêu chí khác, chẳng hạn như số lỗi truyền dữ liệu, mức độ tắc nghẽn tài nguyên mạng, hiệu suất thiết bị, v.v., chỉ là thứ yếu. “Mạng tốt” là mạng mà người dùng không nhận thấy nó hoạt động như thế nào.

Có thể có một số lý do chính dẫn đến hoạt động không đạt yêu cầu của phần mềm ứng dụng trên mạng: hệ thống cáp bị hỏng, lỗi thiết bị hoạt động, quá tải tài nguyên mạng (kênh liên lạc và máy chủ), lỗi trong chính phần mềm ứng dụng. Thông thường một số lỗi mạng che giấu những lỗi khác. Do đó, để xác định một cách đáng tin cậy nguyên nhân khiến phần mềm ứng dụng hoạt động không đạt yêu cầu, mạng cục bộ phải được chẩn đoán toàn diện. Chẩn đoán toàn diện liên quan đến việc thực hiện các công việc (giai đoạn) sau đây.

    Phát hiện các khiếm khuyết ở lớp vật lý của mạng: hệ thống cáp, hệ thống cấp điện của các thiết bị đang hoạt động; sự hiện diện của tiếng ồn từ các nguồn bên ngoài.

    Đo tải hiện tại của kênh liên lạc mạng và xác định ảnh hưởng của giá trị tải của kênh liên lạc đến thời gian phản hồi của phần mềm ứng dụng.

    Đo lường số lượng xung đột trong mạng và tìm ra nguyên nhân xảy ra chúng.

    Đo số lượng lỗi truyền dữ liệu ở cấp độ kênh liên lạc và xác định nguyên nhân xảy ra chúng.

    Xác định các khiếm khuyết kiến ​​trúc mạng.

    Đo tải máy chủ hiện tại và xác định tác động của tải của nó đến thời gian phản hồi của phần mềm ứng dụng.

    Xác định các lỗi phần mềm ứng dụng dẫn đến việc sử dụng băng thông mạng và máy chủ không hiệu quả.

Trong bài viết này, chúng tôi sẽ xem xét bốn giai đoạn đầu tiên của quá trình chẩn đoán phức tạp của mạng cục bộ, cụ thể là: chẩn đoán cấp độ liên kết mạng.

Chúng tôi sẽ không mô tả chi tiết phương pháp thử nghiệm hệ thống cáp mạng. Bất chấp tầm quan trọng của vấn đề này, giải pháp của nó rất tầm thường và rõ ràng: một hệ thống cáp hoàn chỉnh chỉ có thể được kiểm tra bằng một thiết bị đặc biệt - máy quét cáp. Không có cách nào khác. Sẽ chẳng ích gì khi thực hiện quy trình tốn nhiều công sức để xác định các lỗi mạng nếu chúng có thể được bản địa hóa bằng một lần nhấn phím AUTOTEST trên máy quét cáp. Trong trường hợp này, thiết bị sẽ thực hiện đầy đủ các thử nghiệm để đảm bảo hệ thống cáp mạng tuân thủ tiêu chuẩn đã chọn.

Tôi muốn bạn chú ý đến hai điểm, đặc biệt là vì chúng thường bị bỏ quên khi kiểm tra hệ thống cáp mạng bằng máy quét.

Chế độ AUTOTEST không cho phép bạn kiểm tra độ ồn do nguồn bên ngoài trong cáp tạo ra. Đây có thể là tiếng ồn từ đèn huỳnh quang, dây điện, điện thoại di động, máy sao chép mạnh mẽ, v.v. Máy quét cáp thường có chức năng đặc biệt để xác định mức độ tiếng ồn. Do hệ thống cáp mạng chỉ được kiểm tra đầy đủ ở giai đoạn cài đặt và nhiễu trong cáp có thể xảy ra ngoài dự đoán nên không có gì đảm bảo hoàn toàn rằng nhiễu sẽ xuất hiện trong quá trình kiểm tra mạng toàn diện ở giai đoạn cài đặt.

Khi kiểm tra mạng bằng máy quét cáp, thay vì thiết bị hoạt động, một đầu máy quét được kết nối với cáp và đầu kia là đầu phun. Sau khi kiểm tra cáp, máy quét và đầu phun sẽ tắt và thiết bị hoạt động được kết nối: card mạng, hub, switch. Tuy nhiên, không có gì đảm bảo hoàn toàn rằng sự tiếp xúc giữa thiết bị đang hoạt động và cáp sẽ tốt như giữa thiết bị quét và cáp. Chúng tôi đã nhiều lần gặp phải trường hợp lỗi nhỏ ở phích cắm RJ-45 không xuất hiện khi kiểm tra hệ thống cáp bằng máy quét nhưng được phát hiện khi chẩn đoán mạng bằng máy phân tích giao thức.

Trong khuôn khổ phương pháp luận được đề xuất, chúng tôi sẽ không xem xét phương pháp chẩn đoán mạng chủ động trong sách giáo khoa hiện nay (xem thanh bên “Phương pháp chẩn đoán mạng chủ động”). Không đặt câu hỏi về tầm quan trọng của việc chẩn đoán chủ động, chúng tôi chỉ lưu ý rằng trong thực tế nó hiếm khi được sử dụng. Thông thường (mặc dù điều này không chính xác), mạng chỉ được phân tích trong những khoảng thời gian hoạt động không đạt yêu cầu. Trong những trường hợp như vậy, các lỗi mạng hiện có cần được bản địa hóa và sửa chữa nhanh chóng. Kỹ thuật chúng tôi đề xuất nên được coi là trường hợp đặc biệt của kỹ thuật chẩn đoán mạng chủ động.

Bất cứ khi nào bạn gặp sự cố về mạng, giải pháp phổ biến nhất là chạy chương trình chẩn đoán để phát hiện và sửa lỗi. Tuy nhiên, các sự cố mạng phổ biến nhất có thể được giải quyết bằng các lệnh đơn giản như ping, tracert, ipconfig, v.v.

Bạn có biết rằng?
Đội "ipconfig" có thể được sử dụng để tìm máy tính theo địa chỉ IP trên cả máy Windows và Linux/Unix.

Tất cả các lệnh sau phải được nhập tại dấu nhắc lệnh. Để mở dấu nhắc lệnh trong Windows, hãy thực hiện bất kỳ thao tác nào sau đây:

  • Bắt đầu -> Tất cả chương trình -> Phụ kiện -> Dấu nhắc lệnh.
  • Start -> Run và nhập tên chương trình cmd.exe
  • Nhấn phím Thắng +R và nhập tên chương trình cmd.exe

Bất cứ ai có kiến ​​thức cơ bản về mạng đều biết về lệnh ipconfig. Lệnh này cung cấp thông tin về địa chỉ IP của máy tính, cùng với DNS, DHCP, cổng và mặt nạ mạng con. Cần có địa chỉ IP để thực hiện các lệnh khắc phục sự cố khác. Nếu lệnh này trả về cổng mặc định là 0.0.0.0 thì bộ định tuyến của bạn có vấn đề. Bạn có thể thử một biến thể khác của lệnh này để giải quyết các sự cố mạng của mình. Phần mở rộng tiếp theo của lệnh này là lệnh ipconfig/flushdns. Nó xóa bộ đệm DNS trên bất kỳ địa chỉ IP trái phép hoặc lỗi kỹ thuật nào.

Đội "ping"


Ping là một trong những lệnh quan trọng nhất được sử dụng trên web. Lệnh này được sử dụng để kiểm tra kết nối giữa máy chủ và đích. Ưu điểm chính của việc sử dụng lệnh này là tìm ra khu vực có vấn đề trên mạng. Nếu bạn ping từ bất kỳ máy tính nào trên mạng, bạn sẽ nhận được trạng thái của bộ định tuyến. Bạn cũng sẽ nhận được bốn phản hồi cho yêu cầu ping. Nếu bạn không nhận được phản hồi, điều này cho thấy card mạng có vấn đề.


Một ưu điểm khác của việc sử dụng lệnh ping là khả năng kiểm tra kết nối của bạn với bất kỳ trang web/internet nào. Để thực hiện việc này, bạn cần nhập tên trang web sau lệnh ping. Nếu bạn nhận được phản hồi từ trang web thì hầu như không có vấn đề gì. Nhưng nếu bạn không nhận được phản hồi thì có khả năng cáp, modem DSL hoặc sự cố kết nối ISP bị lỗi. Để thu hẹp hơn nữa khả năng xảy ra và tìm ra nguyên nhân cốt lõi của vấn đề, hãy nhập ping 4.2.2.1. Nếu bạn nhận được phản hồi trên dòng lệnh nhưng vẫn không thể truy cập trang web thì bạn có vấn đề với cấu hình DNS của mình.


Lệnh tracert trả về toàn bộ đường dẫn dữ liệu cần thiết để đến đích. Phản hồi sẽ là danh sách các điểm trung chuyển mà dữ liệu đi qua để đến đích. Nếu bạn nhìn kỹ, bạn sẽ thấy rằng mạng thay đổi qua mỗi điểm. Điều này có nghĩa là mỗi mạng truyền dữ liệu sang mạng khác cho đến khi đến đích. Tuy nhiên, bạn có thể thấy dấu hoa thị ở một số điểm, những dấu hoa thị này thể hiện mạng đang gặp sự cố.


Hệ thống tên miền (địa chỉ DNS) về cơ bản là nguyên nhân cốt lõi của nhiều sự cố mạng. Các địa chỉ IP này cần thiết để các thiết bị mạng có thể kết nối với Internet hoặc mạng. Nếu có vấn đề với các địa chỉ này, chức năng của toàn bộ mạng sẽ bị cản trở. Lệnh nslookup trả về danh sách các địa chỉ IP được liên kết với một tên miền. Nếu bạn không thể nhận được bất kỳ thông tin nào liên quan đến địa chỉ IP thì có vấn đề với DNS.


Trong trường hợp mạng, một số lượng lớn máy chủ được kết nối với một bộ định tuyến. Điều này tạo ra một nhiệm vụ nặng nề là xác minh khả năng kết nối của từng nút trong trường hợp có sự cố mạng. Tuy nhiên, đồng thời, điều quan trọng là phải kiểm tra xem các kết nối (cổng TCP, UDP) có hoạt động hay không. Lệnh Netstat trả về danh sách tất cả các máy tính được kết nối với bộ định tuyến và trạng thái của chúng. Khi biết trạng thái này, bạn sẽ biết số cổng (và địa chỉ IP) của kết nối TCP/UDP bị lỗi hoặc ở trạng thái đóng hoặc không hoạt động.


Lệnh "arp" là lệnh bên ngoài được sử dụng để xác định các vấn đề liên quan đến việc phân giải địa chỉ IP và mạng cục bộ. Vấn đề phổ biến nhất có thể tìm thấy trong bảng arp là khi hai hệ thống chia sẻ cùng một địa chỉ IP. Hai máy chủ (một trong số đó chắc chắn là sai) đang sử dụng cùng một địa chỉ IP và khả năng máy chủ phản hồi sai IP trong trường hợp này là rất cao. Điều này sẽ ảnh hưởng đến toàn bộ mạng của bạn. Bạn phải kiểm tra sự hiện diện của các mạng cục bộ được ghép nối và tính chính xác của các địa chỉ IP đã đăng ký. Để thực hiện việc này, bạn phải lập danh sách địa chỉ mạng của từng máy chủ. Bằng cách so sánh danh sách của bạn và bảng lệnh "arp", bạn có thể dễ dàng xác định máy chủ có vấn đề.

Gửi công việc tốt của bạn trong cơ sở kiến ​​thức rất đơn giản. Sử dụng mẫu dưới đây

Các sinh viên, nghiên cứu sinh, các nhà khoa học trẻ sử dụng nền tảng kiến ​​thức trong học tập và công việc sẽ rất biết ơn các bạn.

Phương pháp phân tích có thể được trình bày theo sáu giai đoạn sau:

1. Thu thập dữ liệu.

2. Xem dữ liệu đã chụp.

3. Phân tích dữ liệu.

4. Tìm kiếm lỗi. (Hầu hết các máy phân tích làm cho công việc này trở nên dễ dàng hơn bằng cách phát hiện các loại lỗi và xác định trạm phát ra gói lỗi.)

5. Nghiên cứu hiệu suất. Tốc độ sử dụng băng thông mạng hoặc thời gian phản hồi trung bình cho một yêu cầu được tính toán.

6. Nghiên cứu chi tiết từng phần của mạng. Nội dung của giai đoạn này được xác định khi tiến hành phân tích.

Thông thường, quá trình phân tích các giao thức mất tương đối ít thời gian - 1-2 ngày làm việc.

Hầu hết các máy phân tích hiện đại đều cho phép bạn phân tích một số giao thức mạng toàn cầu cùng một lúc, chẳng hạn như X.25, PPP, SLIP, SDLC/SNA, rơle khung, SMDS, ISDN, giao thức cầu nối/bộ định tuyến (3Com, Cisco, Bay Networks và các giao thức khác). Những máy phân tích như vậy cho phép bạn đo các tham số giao thức khác nhau, phân tích lưu lượng mạng, chuyển đổi giữa các giao thức mạng cục bộ và toàn cầu, độ trễ trên bộ định tuyến trong các chuyển đổi này, v.v. Các công cụ tiên tiến hơn cung cấp khả năng mô phỏng và giải mã các giao thức mạng toàn cầu, kiểm tra “căng thẳng”, và đo lường thông lượng tối đa, kiểm tra chất lượng dịch vụ được cung cấp. Để linh hoạt, hầu hết tất cả các máy phân tích giao thức WAN đều thực hiện các chức năng kiểm tra cho mạng LAN và tất cả các giao diện chính. Một số thiết bị có khả năng phân tích các giao thức điện thoại. Và các mô hình hiện đại nhất có thể giải mã và trình bày tất cả bảy lớp OSI một cách thuận tiện. Sự ra đời của ATM đã khiến các nhà sản xuất trang bị cho máy phân tích của họ những công cụ để kiểm tra các mạng này. Các thiết bị như vậy có thể tiến hành thử nghiệm toàn bộ mạng ATM E-1/E-3 với sự hỗ trợ giám sát và mô phỏng. Tập hợp các chức năng dịch vụ của máy phân tích là rất quan trọng. Một số trong số chúng, chẳng hạn như khả năng điều khiển thiết bị từ xa, đơn giản là không thể thay thế được.

Do đó, các bộ phân tích giao thức WAN/LAN/ATM hiện đại có thể phát hiện lỗi trong cấu hình của bộ định tuyến và cầu nối; đặt loại lưu lượng được gửi qua mạng toàn cầu; xác định dải tốc độ sử dụng, tối ưu hóa tỷ lệ giữa băng thông và số lượng kênh; bản địa hóa nguồn lưu lượng truy cập không chính xác; Thực hiện kiểm tra giao diện nối tiếp và kiểm tra ATM đầy đủ; thực hiện giám sát và giải mã đầy đủ các giao thức chính trên bất kỳ kênh nào; phân tích số liệu thống kê theo thời gian thực, bao gồm phân tích lưu lượng truy cập mạng cục bộ thông qua mạng toàn cầu.

2. 4 đặc điểm chunggiao thứctiềnnhẫn

2. 4 .1 Giao thứcSNMP

SNMP (Giao thức quản lý mạng đơn giản) là giao thức quản lý mạng truyền thông dựa trên kiến ​​trúc TCP/IP.

Dựa trên khái niệm TMN năm 1980-1990. Các cơ quan tiêu chuẩn hóa khác nhau đã phát triển một số giao thức để quản lý mạng dữ liệu với phạm vi triển khai các chức năng TMN khác nhau. Một loại giao thức quản lý như vậy là SNMP. Giao thức SNMP được phát triển để kiểm tra chức năng của các bộ định tuyến và cầu nối mạng. Sau đó, phạm vi của giao thức bao gồm các thiết bị mạng khác, chẳng hạn như hub, cổng, máy chủ đầu cuối, máy chủ Trình quản lý mạng LAN, máy chạy Windows NT, v.v. Ngoài ra, giao thức cho phép khả năng thực hiện các thay đổi đối với hoạt động của các thiết bị này.

Công nghệ này được thiết kế để cung cấp khả năng quản lý và kiểm soát các thiết bị và ứng dụng trong mạng truyền thông bằng cách trao đổi thông tin điều khiển giữa các tác nhân nằm trên thiết bị mạng và người quản lý đặt tại các trạm điều khiển. SNMP định nghĩa mạng là tập hợp các trạm quản lý mạng và các thành phần mạng (máy chủ, cổng và bộ định tuyến, máy chủ đầu cuối) cùng nhau cung cấp liên lạc quản trị giữa các trạm quản lý mạng và tác nhân mạng.

Khi sử dụng SNMP sẽ có hệ thống quản lý và điều khiển. Hệ thống được quản lý bao gồm một thành phần được gọi là tác nhân, tác nhân này sẽ gửi báo cáo đến hệ thống quản lý. Về cơ bản, các tác nhân SNMP chuyển thông tin quản lý đến hệ thống quản lý dưới dạng các biến (chẳng hạn như “bộ nhớ trống”, “tên hệ thống”, “số quy trình đang chạy”).

Tác nhân trong giao thức SNMP là một phần tử xử lý cung cấp cho người quản lý tại các trạm điều khiển mạng quyền truy cập vào các giá trị của biến MIB và do đó cho phép họ thực hiện các chức năng quản lý và giám sát thiết bị.

Tác nhân phần mềm là một chương trình thường trú thực hiện các chức năng quản lý và cũng thu thập số liệu thống kê để chuyển chúng đến cơ sở thông tin của thiết bị mạng.

Tác nhân phần cứng là phần cứng tích hợp (có bộ xử lý và bộ nhớ) trong đó các tác nhân phần mềm được lưu trữ.

Các biến có sẵn thông qua SNMP được tổ chức theo thứ bậc. Các hệ thống phân cấp này và siêu dữ liệu khác (chẳng hạn như loại biến và mô tả) được mô tả bởi Cơ sở thông tin quản lý (MIB).

Ngày nay có một số tiêu chuẩn cho cơ sở dữ liệu thông tin quản lý. Những cái chính là tiêu chuẩn MIB-I và MIB-II, cũng như phiên bản cơ sở dữ liệu điều khiển từ xa RMON MIB. Ngoài ra, còn có các tiêu chuẩn cho các MIB thiết bị cụ thể thuộc một loại cụ thể (ví dụ: MIB cho hub hoặc MIB cho modem), cũng như MIB độc quyền cho các nhà sản xuất thiết bị cụ thể.

Đặc tả MIB-I ban đầu chỉ xác định các hoạt động để đọc các giá trị biến. Các thao tác thay đổi hoặc thiết lập giá trị đối tượng là một phần của thông số kỹ thuật MIB-II.

Phiên bản MIB-I (RFC 1156) xác định tối đa 114 đối tượng, được chia thành 8 nhóm:

· Hệ thống - dữ liệu chung về thiết bị (ví dụ: ID nhà cung cấp, thời gian khởi tạo hệ thống lần cuối).

· Giao diện - mô tả các tham số của giao diện mạng của thiết bị (ví dụ: số lượng, loại, tỷ giá hối đoái, kích thước gói tối đa).

· Bảng dịch địa chỉ - mô tả sự tương ứng giữa mạng và địa chỉ vật lý (ví dụ: thông qua giao thức ARP).

· InternetProtocol - dữ liệu liên quan đến giao thức IP (địa chỉ cổng IP, máy chủ, số liệu thống kê về gói IP).

· ICMP - dữ liệu liên quan đến giao thức trao đổi thông báo điều khiển ICMP.

· TCP - dữ liệu liên quan đến giao thức TCP (ví dụ: về các kết nối TCP).

· UDP - dữ liệu liên quan đến giao thức UDP (số lượng datagram UPD được truyền, nhận và bị lỗi).

· EGP - dữ liệu liên quan đến giao thức trao đổi thông tin định tuyến ExteriorGatewayProtocol được sử dụng trên Internet (số lượng tin nhắn nhận được có lỗi và không có lỗi).

Từ danh sách các nhóm biến này, rõ ràng là tiêu chuẩn MIB-I đã được phát triển với sự tập trung chặt chẽ vào việc quản lý các bộ định tuyến hỗ trợ các giao thức ngăn xếp TCP/IP.

Trong phiên bản MIB-II (RFC 1213), được thông qua năm 1992, bộ đối tượng tiêu chuẩn đã được mở rộng đáng kể (lên tới 185) và số lượng nhóm tăng lên 10.

2. 3 .2 Đại lý RMON

Sự bổ sung mới nhất cho chức năng SNMP là đặc tả RMON, cho phép tương tác từ xa với MIB.

Tiêu chuẩn RMON có từ tháng 11 năm 1991, khi Lực lượng đặc nhiệm kỹ thuật Internet phát hành RFC 1271, "Cơ sở thông tin quản lý giám sát mạng từ xa". Tài liệu này mô tả RMON cho mạng Ethernet.

RMON là một giao thức giám sát mạng máy tính, một phần mở rộng của SNMP, giống như SNMP, dựa trên việc thu thập và phân tích thông tin về bản chất của thông tin được truyền qua mạng. Giống như trong SNMP, thông tin được thu thập bởi các tác nhân phần cứng và phần mềm, dữ liệu từ đó được gửi đến máy tính nơi cài đặt ứng dụng quản lý mạng. Sự khác biệt giữa RMON và phiên bản trước của nó trước hết nằm ở bản chất của thông tin được thu thập - nếu trong SNMP thông tin này chỉ mô tả các sự kiện xảy ra trên thiết bị nơi tác nhân được cài đặt, thì RMON yêu cầu dữ liệu nhận được mô tả lưu lượng giữa Thiết bị mạng.

Trước RMON, SNMP không thể được sử dụng từ xa; nó chỉ cho phép quản lý thiết bị cục bộ. RMON MIB có một bộ thuộc tính được cải tiến để quản lý từ xa, vì nó chứa thông tin tổng hợp về thiết bị, không yêu cầu lượng lớn thông tin được truyền qua mạng. Các đối tượng RMON MIB bao gồm các bộ đếm lỗi gói bổ sung, xu hướng đồ họa và phân tích thống kê linh hoạt hơn, các công cụ lọc mạnh mẽ hơn để thu thập và phân tích các gói riêng lẻ cũng như các điều kiện cảnh báo phức tạp hơn. Tác nhân RMON MIB thông minh hơn tác nhân MIB-I hoặc MIB-II và thực hiện nhiều công việc xử lý thông tin thiết bị mà trước đây người quản lý đã thực hiện. Các tác nhân này có thể được đặt bên trong các thiết bị liên lạc khác nhau và cũng có thể được triển khai dưới dạng các mô-đun phần mềm riêng biệt chạy trên PC và máy tính xách tay phổ thông (LANalyzerNovell là một ví dụ).

Trí thông minh của các tác nhân RMON cho phép chúng thực hiện các hành động đơn giản để chẩn đoán lỗi và cảnh báo về các lỗi có thể xảy ra - ví dụ: trong khuôn khổ công nghệ RMON, bạn có thể thu thập dữ liệu về hoạt động bình thường của mạng (tức là thực hiện cái gọi là cơ sở dữ liệu). ), sau đó đặt tín hiệu cảnh báo khi mạng ở chế độ vận hành lệch khỏi đường cơ sở - đặc biệt, điều này có thể cho thấy rằng thiết bị không hoạt động đầy đủ. Bằng cách kết hợp thông tin nhận được từ các đại lý RMON, ứng dụng quản lý có thể giúp quản trị viên mạng (ví dụ: ở cách phân đoạn mạng đang được phân tích hàng nghìn km) xác định vấn đề và phát triển kế hoạch hành động tối ưu để giải quyết vấn đề đó.

Thông tin RMON được thu thập bởi các đầu dò phần cứng và phần mềm được kết nối trực tiếp với mạng. Để hoàn thành nhiệm vụ thu thập và phân tích dữ liệu sơ cấp, đầu dò phải có đủ tài nguyên máy tính và RAM. Hiện tại có ba loại đầu dò trên thị trường: tích hợp, dựa trên máy tính và độc lập. Một sản phẩm được coi là có khả năng RMON nếu nó triển khai ít nhất một nhóm RMON. Tất nhiên, càng nhiều nhóm dữ liệu RMON được triển khai trong một sản phẩm nhất định thì một mặt nó càng đắt tiền và mặt khác, thông tin đầy đủ hơn về hoạt động của mạng mà nó cung cấp càng nhiều.

Đầu dò nhúng là mô-đun mở rộng cho các thiết bị mạng. Các mô-đun như vậy được sản xuất bởi nhiều nhà sản xuất, đặc biệt là các công ty lớn như 3Com, Cabletron, Bay Networks và Cisco. (Nhân tiện, 3Com và Bay Networks gần đây đã mua lại Axon và ARMON, những công ty được công nhận dẫn đầu trong việc phát triển và sản xuất các công cụ quản lý RMON. Sự quan tâm đến công nghệ này từ các nhà sản xuất thiết bị mạng lớn một lần nữa cho thấy tầm quan trọng của việc giám sát từ xa đối với người dùng.) Hầu hết Quyết định tích hợp các mô-đun RMON vào các trung tâm có vẻ tự nhiên, bởi vì chỉ cần quan sát các thiết bị này, người ta có thể biết được hoạt động của phân khúc. Ưu điểm của các đầu dò như vậy là rõ ràng: chúng cho phép bạn thu được thông tin về tất cả các nhóm dữ liệu RMON chính với chi phí tương đối thấp. Nhược điểm trước hết là hiệu suất không cao lắm, điều này thể hiện cụ thể ở chỗ các đầu dò tích hợp thường không hỗ trợ tất cả các nhóm dữ liệu RMON. Cách đây không lâu, 3Com đã công bố ý định phát hành trình điều khiển hỗ trợ RMON cho bộ điều hợp mạng Etherlink III và Fast Ethernet. Do đó, có thể thu thập và phân tích dữ liệu RMON trực tiếp từ các máy trạm trên mạng.

Các thiết bị thăm dò dựa trên máy tính chỉ đơn giản là các máy tính được kết nối với mạng có cài đặt tác nhân phần mềm RMON trên chúng. Các đầu dò này (chẳng hạn như Cornerstone Agent 2.5 của Network General) có hiệu suất cao hơn các đầu dò tích hợp sẵn và thường hỗ trợ tất cả các nhóm dữ liệu RMON. Chúng đắt hơn các đầu dò tích hợp nhưng rẻ hơn nhiều so với các đầu dò độc lập. Ngoài ra, các đầu dò dựa trên máy tính khá lớn nên đôi khi có thể hạn chế ứng dụng của chúng.

Đầu dò tự động mang lại hiệu suất cao nhất; Thật dễ hiểu, đây đồng thời là những sản phẩm đắt nhất trong số những sản phẩm được mô tả. Thông thường, đầu dò độc lập là bộ xử lý (lớp i486 hoặc bộ xử lý RISC) được trang bị đủ RAM và bộ điều hợp mạng. Dẫn đầu trong lĩnh vực thị trường này là Frontier và Hewlett-Packard. Đầu dò loại này có kích thước nhỏ và rất cơ động - chúng rất dễ kết nối và ngắt kết nối khỏi mạng. Tất nhiên, khi giải quyết vấn đề quản lý mạng quy mô toàn cầu, đây không phải là đặc tính quan trọng lắm, nhưng nếu các công cụ RMON được sử dụng để phân tích hoạt động của mạng công ty cỡ trung bình thì (do giá thành thiết bị cao). ) tính di động của đầu dò có thể đóng một vai trò rất tích cực.

Đối tượng RMON được đánh số 16 trong bộ đối tượng MIB và bản thân đối tượng RMON, như được định nghĩa trong RFC 1271, bao gồm mười nhóm dữ liệu.

· Thống kê - dữ liệu thống kê tích lũy hiện tại về đặc điểm gói, số lần va chạm, v.v.

· Lịch sử - dữ liệu thống kê được lưu ở những khoảng thời gian nhất định để phân tích tiếp theo các xu hướng thay đổi của chúng.

· Cảnh báo - giá trị ngưỡng của các chỉ số thống kê, khi vượt quá, tác nhân RMON sẽ gửi tin nhắn đến người quản lý. Cho phép người dùng xác định một số mức ngưỡng (các ngưỡng này có thể liên quan đến nhiều thứ khác nhau - bất kỳ tham số nào từ nhóm thống kê, biên độ hoặc tốc độ thay đổi của nó, v.v.), khi vượt quá mức đó sẽ tạo ra cảnh báo. Người dùng cũng có thể xác định trong những điều kiện nào vượt quá giá trị ngưỡng thì phải kèm theo tín hiệu cảnh báo - điều này sẽ tránh tạo ra tín hiệu “không có ích gì”, điều này trước hết là không tốt vì không ai chú ý đến đèn đỏ liên tục cháy và thứ hai, vì việc truyền các cảnh báo không cần thiết qua mạng dẫn đến tải không cần thiết trên đường truyền thông. Một cảnh báo thường được gửi đến một nhóm sự kiện để xác định những việc cần làm tiếp theo.

· Máy chủ - dữ liệu về máy chủ mạng, bao gồm cả địa chỉ MAC của chúng..

· HostTopN - bảng các máy chủ bận rộn nhất trên mạng. Bảng N máy chủ hàng đầu (HostTopN) chứa danh sách N máy chủ hàng đầu có giá trị tối đa của một tham số thống kê nhất định trong một khoảng thời gian nhất định. Ví dụ: bạn có thể yêu cầu danh sách 10 máy chủ gặp nhiều lỗi nhất trong 24 giờ qua. Danh sách này sẽ do chính tác nhân tổng hợp và ứng dụng quản lý sẽ chỉ nhận được địa chỉ của các máy chủ này và các giá trị của các tham số thống kê tương ứng. Rõ ràng cách tiếp cận này tiết kiệm tài nguyên mạng ở mức độ nào

· TrafficMatrix - thống kê về cường độ lưu lượng giữa mỗi cặp máy chủ mạng, được tổ chức dưới dạng ma trận. Các hàng của ma trận này được đánh số theo địa chỉ MAC của trạm nguồn tin nhắn và các cột được đánh số theo địa chỉ của trạm nhận. Các phần tử ma trận đặc trưng cho cường độ lưu lượng giữa các trạm tương ứng và số lượng lỗi. Bằng cách phân tích ma trận như vậy, người dùng có thể dễ dàng tìm ra cặp trạm nào tạo ra lưu lượng truy cập lớn nhất. Ma trận này, một lần nữa, được tạo ra bởi chính tác nhân, do đó không cần phải truyền lượng lớn dữ liệu đến máy tính trung tâm chịu trách nhiệm quản lý mạng.

· Filter - điều kiện lọc gói tin. Tiêu chí để lọc các gói có thể rất đa dạng - ví dụ: bạn có thể yêu cầu tất cả các gói có độ dài nhỏ hơn một giá trị được chỉ định nhất định phải được lọc ra vì có lỗi. Chúng ta có thể nói rằng việc cài đặt bộ lọc tương ứng với việc tổ chức một kênh để truyền gói tin. Kênh này dẫn đến đâu do người dùng xác định. Ví dụ: tất cả các gói bị lỗi có thể bị chặn và gửi đến bộ đệm thích hợp. Ngoài ra, sự xuất hiện của gói phù hợp với bộ lọc đã cài đặt có thể được coi là một sự kiện mà hệ thống phải phản ứng theo cách đã định trước.

· PacketCapture - điều kiện để bắt gói tin. Nhóm chụp gói chứa bộ đệm chụp mà các gói có thuộc tính đáp ứng các điều kiện được chỉ định trong nhóm bộ lọc sẽ được gửi tới. Trong trường hợp này, không phải toàn bộ gói có thể được ghi lại mà chỉ có vài chục byte đầu tiên của gói. Nội dung của bộ đệm chụp sau đó có thể được phân tích bằng nhiều công cụ phần mềm khác nhau, tiết lộ một số đặc điểm rất hữu ích của mạng. Bằng cách xây dựng lại các bộ lọc cho các đặc điểm nhất định, có thể mô tả các tham số khác nhau của hoạt động mạng.

· Sự kiện - điều kiện đăng ký và tạo sự kiện. Nhóm sự kiện xác định thời điểm gửi cảnh báo đến ứng dụng quản lý, khi nào chặn gói và nói chung cách phản ứng với các sự kiện nhất định xảy ra trên mạng, ví dụ: khi vượt quá các giá trị ngưỡng được chỉ định trong nhóm cảnh báo : có nên thiết lập thông báo cho ứng dụng điều khiển hay bạn chỉ cần ghi lại sự kiện này và tiếp tục làm việc. Các sự kiện có thể không liên quan đến việc đưa ra cảnh báo - ví dụ: gửi gói đến bộ đệm chụp cũng là một sự kiện.

Các nhóm này được đánh số theo thứ tự, ví dụ nhóm Hosts có tên số là 1.3.6.1.2.1.16.4.

Nhóm thứ mười bao gồm các đối tượng đặc biệt của giao thức TokenRing.

Tổng cộng, tiêu chuẩn RMON MIB xác định khoảng 200 đối tượng trong 10 nhóm, được ghi lại trong hai tài liệu - RFC 1271 cho mạng Ethernet và RFC 1513 cho mạng TokenRing.

Một tính năng đặc biệt của tiêu chuẩn RMON MIB là tính độc lập của nó với giao thức lớp mạng (không giống như các tiêu chuẩn MIB-I và MIB-II, tập trung vào các giao thức TCP/IP). Do đó, rất thuận tiện khi sử dụng trong các môi trường không đồng nhất sử dụng các giao thức lớp mạng khác nhau.

2. 5 Đánh giá về phổ biến shệ thống quản lý mạng

Hệ thống quản lý mạng - phần cứng và/hoặc phần mềm để giám sát và quản lý các nút mạng. Phần mềm hệ thống quản lý mạng bao gồm các tác nhân cư trú trên các thiết bị mạng và truyền thông tin đến nền tảng quản lý mạng. Phương thức trao đổi thông tin giữa ứng dụng điều khiển và tác nhân trên thiết bị được xác định bởi các giao thức.

Hệ thống quản lý mạng phải có một số phẩm chất:

phân phối thực sự phù hợp với khái niệm máy khách/máy chủ,

· khả năng mở rộng,

· tính mở, cho phép bạn xử lý các thiết bị không đồng nhất - từ máy tính để bàn đến máy tính lớn.

Hai thuộc tính đầu tiên có liên quan chặt chẽ với nhau. Khả năng mở rộng tốt đạt được nhờ sự phân phối của hệ thống điều khiển. Phân phối có nghĩa là hệ thống có thể bao gồm một số máy chủ và máy khách. Máy chủ (bởi người quản lý) thu thập dữ liệu về trạng thái hiện tại của mạng từ các tác nhân (SNMP, CMIP hoặc RMON) được tích hợp trong thiết bị mạng và tích lũy chúng trong cơ sở dữ liệu của họ. Máy khách là các bảng điều khiển đồ họa được vận hành bởi quản trị viên mạng. Phần mềm máy khách hệ thống quản lý nhận được yêu cầu thực hiện bất kỳ hành động nào từ quản trị viên (ví dụ: xây dựng bản đồ chi tiết về một phần của mạng) và liên hệ với máy chủ để biết thông tin cần thiết. Nếu máy chủ có thông tin cần thiết thì nó sẽ truyền thông tin đó ngay lập tức đến máy khách; nếu không, nó sẽ cố gắng thu thập thông tin đó từ các tác nhân.

Các phiên bản đầu tiên của hệ thống điều khiển kết hợp tất cả các chức năng trong một máy tính do quản trị viên vận hành. Đối với các mạng nhỏ hoặc mạng có số lượng thiết bị được quản lý nhỏ, cấu trúc này khá khả quan, nhưng với số lượng lớn thiết bị được quản lý, máy tính duy nhất mà thông tin từ tất cả các thiết bị mạng chảy đến sẽ trở thành nút cổ chai. Và mạng không thể đối phó với luồng dữ liệu lớn và bản thân máy tính không có thời gian để xử lý nó. Ngoài ra, một mạng lớn thường được quản lý bởi nhiều quản trị viên, do đó, ngoài một số máy chủ, một mạng lớn phải có một số bảng điều khiển để quản trị viên mạng làm việc và mỗi bảng điều khiển phải cung cấp thông tin cụ thể đáp ứng nhu cầu hiện tại của mạng. người quản trị cụ thể.

Hỗ trợ cho các thiết bị không đồng nhất là một tính năng mong muốn hơn là một tính năng thực tế của các hệ thống điều khiển ngày nay. Bốn trong số các sản phẩm quản lý mạng phổ biến nhất bao gồm Spectrum của Cabletron Systems, OpenView của Hewlett-Packard, NetView của IBM và Solstice của SunSoft, một bộ phận của SunMicrosystems. Ba trong số bốn công ty tự sản xuất thiết bị liên lạc. Đương nhiên, Spectrum quản lý thiết bị Cabletron tốt nhất, OpenView quản lý thiết bị Hewlett-Packard tốt nhất và NetView quản lý thiết bị IBM tốt nhất.

Khi xây dựng bản đồ mạng bao gồm các thiết bị của các nhà sản xuất khác, các hệ thống này bắt đầu mắc lỗi và nhầm một số thiết bị này với các thiết bị khác và khi quản lý các thiết bị này, chúng chỉ hỗ trợ các chức năng cơ bản và nhiều chức năng bổ sung hữu ích giúp phân biệt thiết bị này với các thiết bị khác. những người khác, hệ thống quản lý đơn giản là không hiểu và do đó không thể sử dụng chúng.

Để khắc phục thiếu sót này, các nhà phát triển hệ thống điều khiển không chỉ hỗ trợ MIB I, MIB II và RMON MIB tiêu chuẩn mà còn hỗ trợ nhiều MIB độc quyền từ các nhà sản xuất. Dẫn đầu trong lĩnh vực này là hệ thống Spectrum, hỗ trợ khoảng 1000 MIB từ nhiều nhà sản xuất khác nhau.

Một cách khác để hỗ trợ tốt hơn cho thiết bị cụ thể là sử dụng ứng dụng dựa trên nền tảng quản lý nào đó của công ty sản xuất thiết bị này. Các công ty hàng đầu - nhà sản xuất thiết bị truyền thông - đã phát triển và cung cấp các hệ thống điều khiển đa chức năng và phức tạp cao cho thiết bị của họ. Các hệ thống nổi tiếng nhất của loại này bao gồm Optivity từ BayNetworks, CiscoWorks từ CiscoSystems và Transcend từ 3Com. Ví dụ: Optivity cho phép bạn giám sát và quản lý các mạng bao gồm bộ định tuyến, bộ chuyển mạch và trung tâm BayNetwork, tận dụng tối đa tất cả các khả năng và thuộc tính của chúng. Thiết bị của các nhà sản xuất khác được hỗ trợ ở cấp độ chức năng điều khiển cơ bản. Optivity chạy trên nền tảng OpenView của Hewlett-Packard và SunNetManager của SunSoft (tiền thân của Solstice). Tuy nhiên, việc chạy một nền tảng quản lý đa hệ thống như Optivity quá phức tạp và đòi hỏi các máy tính chạy nó phải có bộ xử lý rất mạnh và nhiều RAM.

Tuy nhiên, nếu mạng bị chi phối bởi thiết bị của một nhà sản xuất duy nhất, thì sự sẵn có của các ứng dụng quản lý từ nhà sản xuất đó cho bất kỳ nền tảng quản lý phổ biến nào sẽ cho phép quản trị viên mạng giải quyết thành công nhiều vấn đề. Do đó, các nhà phát triển nền tảng quản lý cung cấp các công cụ giúp việc phát triển ứng dụng trở nên dễ dàng hơn và tính sẵn có cũng như số lượng của các ứng dụng đó được coi là yếu tố rất quan trọng khi lựa chọn nền tảng quản lý.

Tính mở của nền tảng quản lý cũng phụ thuộc vào hình thức lưu trữ dữ liệu được thu thập về trạng thái của mạng. Hầu hết các nền tảng hàng đầu đều cho phép bạn lưu trữ dữ liệu trong cơ sở dữ liệu thương mại như Oracle, Ingres hoặc Informix. Việc sử dụng các DBMS phổ quát làm giảm tốc độ của hệ thống điều khiển so với việc lưu trữ dữ liệu trong các tệp hệ điều hành, nhưng nó cho phép dữ liệu này được xử lý bởi bất kỳ ứng dụng nào có thể hoạt động với các DBMS này.

Bảng hiển thị các đặc điểm quan trọng nhất của các nền tảng quản lý phổ biến nhất

Bảng 2.1 - Đặc điểm của các nền tảng chẩn đoán phổ biến

Đặc trưng

Trình quản lý nút mạng OpenView 4.1 (Hewlett-Packard)

Trình quản lý doanh nghiệp Spectrum (Hệ thống Cabletron)

NetView dành choAIX SNMPManager (IBM)

Trình quản lý doanh nghiệp Solstice (SunSoft)

Tự động phát hiện

Giới hạn số lượng bộ định tuyến trung gian

Xác định tên máy chủ từ địa chỉ của nó thông qua máy chủ DNS

Khả năng sửa đổi tên máy chủ được chỉ định

Nhận biết cấu trúc liên kết mạng

Bất kỳ mạng nào chạy trên TCP/IP

Ethernet, TokenRing, FDDI, ATM, mạng phân tán, mạng chuyển mạch

nhận dạng bởi giao diện thiết bị

Ethernet, Token-Ring, FDDI, mạng phân tán

200 - 2000, được biết đến nhiều nhất - 35000

Không có hạn chế về phần mềm

Hỗ trợ cơ sở dữ liệu

Sở hữu, Oracle, Sybase, ...

Informix, Oracle, Sybase

Kiểm soát phân tán

Một máy chủ /

khách hàng

Số lượng khách hàng

Không giới hạn phần mềm

Hơn 30 thử nghiệm

Không giới hạn phần mềm

Khách hàng đang sử dụng X-Window

Hệ thống GUI chạy trên máy khách

Bản đồ mạng riêng của khách hàng

Chỉ định các đối tượng mạng có sẵn để xem

Sử dụng sản phẩm bổ sung của Trung tâm Điều hành (HP)

Nhiều máy chủ /

khách hàng

Tình trạng hiện tại

kế hoạch

Số lượng ứng dụng của bên thứ ba

Số MIB của bên thứ ba được hỗ trợ

Không có dữ liệu

Hỗ trợ giao thức SNMP:

Hỗ trợ MIB được IETF phê duyệt

Hầu hết nhưng không có RMON

Hỗ trợ giao thức CMIP

Sản phẩm trả phí bổ sung - Open View HP Distributed Management Platform

Sản phẩm trả phí bổ sung

Giao tiếp với máy tính lớn

Sử dụng ứng dụng của bên thứ ba

Bởi SNA thông qua Blue Vision

Có thể truy cập NetView trên máy tính lớn

Hỗ trợ hệ điều hành

HPUX, SunOS, Solaris

IBM AIX, Sun OS, HP UX, SGI IRIX, Windows NT

AIX, OSF/1, Windows NT

3 Tổ chức chẩn đoán mạng máy tính

Có thể có một số nguyên nhân chính khiến mạng hoạt động không đạt yêu cầu: hệ thống cáp bị hỏng, lỗi thiết bị đang hoạt động, quá tải tài nguyên mạng (kênh liên lạc và máy chủ), lỗi trong chính phần mềm ứng dụng. Thông thường một số lỗi mạng che giấu những lỗi khác. Và để xác định một cách đáng tin cậy nguyên nhân dẫn đến hiệu suất không đạt yêu cầu, mạng cục bộ phải được chẩn đoán toàn diện. Chẩn đoán toàn diện liên quan đến việc thực hiện các công việc (giai đoạn) sau đây.

- Phát hiện các khiếm khuyết ở lớp vật lý của mạng: hệ thống cáp, hệ thống cấp điện của các thiết bị đang hoạt động; sự hiện diện của tiếng ồn từ các nguồn bên ngoài.

- Đo tải hiện tại của kênh truyền thông mạng và xác định ảnh hưởng của tải kênh truyền thông đến thời gian đáp ứng của phần mềm ứng dụng.

- Đo lường số lượng xung đột trong mạng và tìm ra nguyên nhân xảy ra chúng.

- Đo lường số lượng lỗi truyền dữ liệu ở cấp độ kênh liên lạc và xác định nguyên nhân xảy ra lỗi.

- Xác định các khiếm khuyết về kiến ​​trúc mạng.

- Đo tải máy chủ hiện tại và xác định mức độ ảnh hưởng của tải đến thời gian phản hồi của phần mềm ứng dụng.

- Xác định các lỗi phần mềm ứng dụng dẫn đến việc sử dụng máy chủ và băng thông mạng không hiệu quả.

Chúng tôi sẽ trình bày chi tiết hơn về bốn giai đoạn đầu tiên của quá trình chẩn đoán phức tạp của mạng cục bộ, cụ thể là chẩn đoán cấp độ liên kết mạng, vì nhiệm vụ chẩn đoán được giải quyết dễ dàng nhất đối với hệ thống cáp. Như đã thảo luận trong phần thứ hai, hệ thống cáp mạng chỉ có thể được kiểm tra đầy đủ bằng các thiết bị đặc biệt - máy quét hoặc máy kiểm tra cáp. AUTOTEST trên máy quét cáp sẽ cho phép bạn thực hiện đầy đủ các thử nghiệm để xác định xem hệ thống cáp mạng của bạn có tuân thủ tiêu chuẩn đã chọn hay không. Khi kiểm tra hệ thống cáp, tôi muốn chú ý đến hai điểm, đặc biệt vì chúng thường bị lãng quên.

Chế độ AUTOTEST không cho phép bạn kiểm tra độ ồn do nguồn bên ngoài trong cáp tạo ra. Đây có thể là tiếng ồn từ đèn huỳnh quang, dây điện, điện thoại di động, máy sao chép mạnh mẽ, v.v. Máy quét cáp thường có chức năng đặc biệt để xác định mức độ tiếng ồn. Do hệ thống cáp mạng chỉ được kiểm tra đầy đủ ở giai đoạn cài đặt và nhiễu trong cáp có thể xảy ra ngoài dự đoán nên không có gì đảm bảo hoàn toàn rằng nhiễu sẽ xuất hiện trong quá trình kiểm tra mạng toàn diện ở giai đoạn cài đặt.

Khi kiểm tra mạng bằng máy quét cáp, thay vì thiết bị hoạt động, một đầu máy quét được kết nối với cáp và đầu kia là đầu phun. Sau khi kiểm tra cáp, máy quét và đầu phun sẽ tắt và thiết bị hoạt động được kết nối: card mạng, hub, switch. Tuy nhiên, không có gì đảm bảo hoàn toàn rằng sự tiếp xúc giữa thiết bị đang hoạt động và cáp sẽ tốt như giữa thiết bị quét và cáp. Thường có trường hợp lỗi nhỏ ở phích cắm RJ-45 không xuất hiện khi kiểm tra hệ thống cáp bằng máy quét nhưng được phát hiện khi chẩn đoán mạng bằng máy phân tích giao thức.

Việc chẩn đoán các thiết bị mạng (hoặc các thành phần mạng) cũng có những điểm tinh tế riêng. Khi thực hiện nó, các phương pháp khác nhau được sử dụng. Việc lựa chọn một phương pháp cụ thể phụ thuộc vào tiêu chí nào được chọn làm tiêu chí cho hiệu suất thiết bị tốt. Theo quy định, có thể phân biệt ba loại tiêu chí và do đó, ba cách tiếp cận chính.

Đầu tiên là dựa trên việc theo dõi các giá trị hiện tại của các tham số đặc trưng cho hoạt động của thiết bị được chẩn đoán. Tiêu chí để thiết bị hoạt động tốt trong trường hợp này là khuyến nghị của nhà sản xuất hoặc cái gọi là tiêu chuẩn công nghiệp trên thực tế. Ưu điểm chính của phương pháp này là sự đơn giản và thuận tiện trong việc giải quyết những vấn đề phổ biến nhất, nhưng nhìn chung là các vấn đề tương đối không phức tạp. Tuy nhiên, có những trường hợp ngay cả một khiếm khuyết rõ ràng cũng không xuất hiện trong hầu hết thời gian mà chỉ xuất hiện ở một số chế độ vận hành nhất định, tương đối hiếm và vào những thời điểm không thể đoán trước. Rất khó để phát hiện những khiếm khuyết như vậy nếu chỉ giám sát các giá trị tham số hiện tại.

Cách tiếp cận thứ hai dựa trên việc nghiên cứu các tham số cơ bản (còn gọi là xu hướng) đặc trưng cho hoạt động của thiết bị được chẩn đoán. Nguyên tắc cơ bản của cách tiếp cận thứ hai có thể được hình thành như sau: “một thiết bị hoạt động tốt nếu nó hoạt động như mọi khi”. Nguyên tắc này là cơ sở để chẩn đoán mạng chủ động, mục đích của nó là ngăn chặn sự khởi đầu của các trạng thái quan trọng. Ngược lại với chẩn đoán chủ động là chẩn đoán phản ứng, mục tiêu của chẩn đoán này không phải là ngăn ngừa mà là khoanh vùng và loại bỏ khiếm khuyết. Không giống như cách đầu tiên, cách tiếp cận này cho phép bạn phát hiện các khiếm khuyết xuất hiện không liên tục mà theo thời gian. Nhược điểm của cách tiếp cận thứ hai là giả định rằng mạng ban đầu hoạt động tốt. Nhưng “như mọi khi” và “tốt” không phải lúc nào cũng có nghĩa giống nhau.

Cách tiếp cận thứ ba được thực hiện bằng cách theo dõi các chỉ số tích hợp về chất lượng hoạt động của thiết bị được chẩn đoán (sau đây gọi là phương pháp tích hợp). Cần nhấn mạnh rằng từ quan điểm của phương pháp chẩn đoán mạng, có sự khác biệt cơ bản giữa hai cách tiếp cận đầu tiên mà chúng ta sẽ gọi là truyền thống và cách tiếp cận thứ ba là tích hợp. Với các phương pháp tiếp cận truyền thống, chúng tôi quan sát các đặc điểm riêng lẻ của mạng và để xem nó “một cách tổng thể”, chúng tôi phải tổng hợp kết quả của các quan sát riêng lẻ. Tuy nhiên, chúng ta không thể chắc chắn rằng mình sẽ không mất đi những thông tin quan trọng trong quá trình tổng hợp này. Ngược lại, cách tiếp cận tích hợp cho chúng ta một bức tranh tổng quát, trong một số trường hợp không đủ chi tiết. Nhiệm vụ diễn giải kết quả bằng cách tiếp cận tổng hợp về cơ bản là ngược lại: bằng cách quan sát tổng thể, xác định vấn đề nằm ở đâu và cụ thể như thế nào.

Từ những điều trên, phương pháp hiệu quả nhất là phương pháp kết hợp chức năng của cả ba phương pháp được mô tả ở trên. Một mặt, nó phải dựa trên các chỉ số không thể thiếu về chất lượng vận hành mạng, nhưng mặt khác, nó phải được bổ sung và cụ thể hóa bằng dữ liệu thu được bằng cách sử dụng các phương pháp truyền thống. Chính sự kết hợp này cho phép bạn đưa ra chẩn đoán chính xác về sự cố mạng.

3.1 Lập tài liệu mạng

Việc duy trì tài liệu mạng cung cấp một số lợi ích cho quản trị viên mạng. Tài liệu mạng có thể là:

- Công cụ khắc phục sự cố - khi có sự cố xảy ra, tài liệu có thể đóng vai trò là hướng dẫn khắc phục sự cố. Nó sẽ tiết kiệm thời gian và tiền bạc.

- Hỗ trợ đào tạo nhân sự mới - nhân viên mới sẽ có nhiều khả năng sẵn sàng làm việc hơn nếu có sẵn tài liệu về lĩnh vực công việc nơi anh ta sẽ làm việc, điều này sẽ lại tiết kiệm thời gian và tiền bạc.

- Trợ giúp dành cho nhà cung cấp và nhà tư vấn - những người này có xu hướng khá tốn kém, nếu họ cần biết bất kỳ chi tiết nào về cơ sở hạ tầng mạng thì việc có tài liệu sẽ cho phép họ hoàn thành công việc nhanh hơn, điều này một lần nữa giúp tiết kiệm thời gian.

Mỗi mạng có các tính năng độc đáo riêng nhưng cũng có nhiều thành phần chung cần được đưa vào tài liệu:

Cấu trúc mạng- Thông tin này thường được trình bày dưới dạng sơ đồ hiển thị các nút mạng chính như bộ định tuyến, bộ chuyển mạch, tường lửa, máy chủ và cách chúng được kết nối với nhau. Máy in và máy trạm thường không được bao gồm ở đây.

Thông tin máy chủ- tức là thông tin bạn cần để quản lý và quản trị máy chủ, chẳng hạn như tên, chức năng, địa chỉ IP, cấu hình đĩa, hệ điều hành và gói dịch vụ, ngày và nơi mua, bảo hành, v.v...

Phân công cổng bộ chuyển mạch và bộ định tuyến - điều này bao gồm thông tin chi tiết về cấu hình của mạng WAN, Vlan hoặc thậm chí việc gán cổng cho các nút mạng thông qua bảng vá lỗi.

Cấu hình dịch vụ mạng-- Các dịch vụ mạng như DNS, WINS, DHCP và RAS rất quan trọng đối với hoạt động của mạng và cách chúng được cấu trúc phải được mô tả chi tiết. Thông tin này luôn có thể được lấy từ máy chủ, nhưng việc ghi trước thông tin đó ở định dạng dễ đọc sẽ giúp tiết kiệm thời gian.

Chính sách và hồ sơ tên miền- bạn có thể giới hạn khả năng của người dùng bằng Trình chỉnh sửa chính sách trong Windows NT hoặc sử dụng Chính sách nhóm trong Windows 2000. Trong trường hợp này, có thể tạo hồ sơ người dùng được lưu trữ trên máy chủ thay vì trên máy cục bộ. Nếu những khả năng đó được sử dụng thì những thông tin đó phải được ghi lại.

Nhiệm vụ ứng dụng quan trọng- cần phải đưa vào tài liệu cách hỗ trợ các ứng dụng đó, điều gì thường xảy ra với chúng và cách giải quyết các vấn đề đó.

Thủ tục-- bản thân điều đó có thể là một dự án lớn. Về cơ bản, thủ tục là một phương tiện thực hiện chính sách và có thể khá rộng rãi. Cụ thể, chính sách có thể nêu rõ rằng "Mạng phải được bảo vệ khỏi những người dùng trái phép". Tuy nhiên, việc thực hiện một chính sách như vậy sẽ đòi hỏi rất nhiều nỗ lực. Có các quy trình về tường lửa, giao thức mạng, mật khẩu, bảo mật vật lý, v.v. Bạn cũng có thể có các quy trình riêng để xử lý các sự cố do người dùng báo cáo và các quy trình bảo trì máy chủ thường xuyên.

Thực tế cho thấy, hầu hết các doanh nghiệp vừa, đặc biệt là các cơ quan chính phủ, sử dụng phương pháp ghi chép mạng thủ công, tức là danh sách Excel và kiến ​​​​thức của chuyên gia CNTT chịu trách nhiệm là khá đủ đối với họ. Tuy nhiên, việc sử dụng các hệ thống tài liệu mạng đặc biệt sẽ giảm đáng kể rủi ro trong trường hợp hỏng hóc thành phần hoặc hư hỏng vật lý đối với cơ sở hạ tầng do công trình xây dựng, hỏa hoạn hoặc lũ lụt, sự sa thải đột ngột hoặc biến mất của chuyên gia chịu trách nhiệm và giảm thời gian cần thiết. để khôi phục cơ sở hạ tầng.

Hệ thống tài liệu cơ sở hạ tầng mạng (CMS) là một hệ thống tích hợp cho phép bạn lưu trữ ở một nơi duy nhất và có quyền truy cập thuận tiện vào thông tin về tất cả các đối tượng mạng (có thể là máy tính cá nhân, cáp kết nối, hệ thống giám sát truyền hình, báo cháy, v.v.) và các mối liên hệ giữa chúng.

Mục tiêu chính của các hệ thống tài liệu mạng dựa trên phần mềm hiện đại là đạt được tài liệu và quản lý mạng linh hoạt và chính xác với chi phí thấp và độ phức tạp tối thiểu. Hệ thống tài liệu mạng lưu trữ dữ liệu trên tất cả các thành phần mạng thụ động (cáp, đầu nối, bảng chuyển mạch, tủ phân phối) và hoạt động (bộ định tuyến, bộ chuyển mạch, máy chủ, PC, PBX), bao gồm thông tin về các kết nối và trạng thái của chúng (Kết nối) trong một hệ thống quan hệ trung tâm. cơ sở dữ liệu (ví dụ: Oracle, SQL, DB2) và trực quan hóa toàn bộ hệ thống ở cả dạng chữ và số. Ngoài ra, dựa trên sơ đồ tòa nhà và địa điểm, bạn có thể hiển thị vị trí của từng thành phần và tuyến cáp. Thông tin về các thành phần và hình ảnh của chúng được lưu trữ trong thư viện thành phần, được cập nhật liên tục. Nhiều hệ thống hiện đại đã cung cấp các ứng dụng khách Web cho phép bạn truy cập tài liệu qua mạng thông qua Internet. Do đó, kỹ thuật viên dịch vụ có thể trực tiếp yêu cầu lệnh sản xuất tại chỗ thông qua thiết bị di động và sau khi hoàn thành, sẽ xác nhận chúng trong hệ thống sản xuất. Một số hệ thống tài liệu mạng thậm chí còn có chức năng Khám phá để tự động phát hiện các thành phần hoạt động mới thông qua SNMP và đưa chúng vào tài liệu.

Với hệ thống tài liệu mạng được áp dụng, người dùng có thể có được cái nhìn tổng quan và cập nhật toàn diện về tất cả các tài nguyên mạng trong cơ sở hạ tầng của tổ chức bất kỳ lúc nào. Theo tính toán của Diễn đàn quản lý dịch vụ CNTT quốc tế (ITSMF), trong toàn bộ vòng đời của hệ thống CNTT, chi phí bảo trì giảm 80%. Hệ thống tài liệu mạng cho phép bạn thực hiện nhiều hành động hơn (so với xử lý thủ công) cần thiết cho hoạt động của cơ sở hạ tầng mạng, đồng thời tiết kiệm đáng kể thời gian thực hiện chúng. Ngoài ra, ngăn ngừa lỗi nhập dữ liệu hoặc trùng lặp. Các quy trình tự động để thay đổi cơ sở hạ tầng (Yêu cầu Thay đổi) có thể được đưa vào hệ thống và cuối cùng, các lệnh sản xuất có thể được tạo tự động, chẳng hạn như cho công việc cải tạo hoặc di dời. Hoạt động của nhân viên dịch vụ hiện trường trở nên hiệu quả hơn nhiều, nhờ đó các quy trình bảo trì và thay đổi mạng máy tính được đơn giản hóa đáng kể. Các tính toán đã chỉ ra rằng việc giảm nỗ lực và theo đó, chi phí tài chính cho việc lập kế hoạch và ghi lại những thay đổi cần thiết trong mạng có thể đạt tới 90%.

Theo thống kê từ Trung tâm điều hành mạng (NOC), khoảng 80% tất cả các sự cố mạng là do hệ thống dây điện bị lỗi. Bằng cách sử dụng hệ thống tài liệu mạng, doanh nghiệp có thể nhanh chóng khoanh vùng khu vực có vấn đề và do đó giải quyết vấn đề nhanh chóng. Hơn nữa, thông qua hệ thống tài liệu mạng, các tuyến truyền tín hiệu dự phòng có thể được lên kế hoạch và tổ chức để trong trường hợp xảy ra sự cố, chúng có thể được kết nối một cách đơn giản.

Hiện tại, hệ thống tài liệu mạng được sử dụng chủ yếu bởi các công ty lớn cũng như các nhà cung cấp năng lượng và doanh nghiệp thành phố có cơ sở hạ tầng CNTT phức tạp và rộng khắp. Việc ghi chép thủ công sẽ trở thành gánh nặng quá lớn đối với họ. Hệ thống tài liệu cũng được các công ty viễn thông sử dụng, hệ thống này được yêu cầu đảm bảo sự sẵn có của cơ sở hạ tầng cho khách hàng của họ và thực sự xác nhận điều này. Càng ngày, các bệnh viện và các tổ chức khác càng dựa vào các hệ thống tài liệu mạng mà tính sẵn có và độ tin cậy của cấu trúc mạng là điều cần thiết sống còn. Đối với hoạt động hàng ngày của các tổ chức điều hành và chủ sở hữu tòa nhà cung cấp mạng cho một số doanh nghiệp trên cùng lãnh thổ, hệ thống tài liệu mạng cũng có tầm quan trọng rất lớn.

Ví dụ, hãy xem xét một số hệ thống này.

Pinger thân thiện là một ứng dụng mạnh mẽ và tiện lợi để quản trị, giám sát và kiểm kê mạng máy tính. Trình bày các tính năng sau:

· Trực quan hóa mạng máy tính dưới dạng hoạt hình đẹp mắt, hiển thị máy tính nào đang bật và máy tính nào không;

· Thông báo về việc dừng/khởi động máy chủ;

· Xem ai đang truy cập tập tin nào trên máy tính qua mạng;

· Tự động thu thập thông tin về phần mềm, phần cứng của máy tính trên mạng.

·

Hình 3.1 - Sơ đồ mạng

Trạng thái mạng LAN 10 đòn- một chương trình dành cho quản trị viên và người dùng thông thường của mạng Microsoft Windows. Sử dụng LANState, bạn có thể giám sát trạng thái hiện tại của mạng ở dạng đồ họa, quản lý máy chủ và máy trạm, giám sát các thiết bị từ xa bằng cách thăm dò định kỳ các máy tính, giám sát kết nối với tài nguyên mạng và nhận thông báo kịp thời về các sự kiện khác nhau.

LANState chứa nhiều chức năng hữu ích cho quản trị viên và người dùng mạng, chẳng hạn như gửi tin nhắn, khởi động lại và tắt máy tính từ xa, ping, phát hiện tên IP, dò đường, quét cổng và máy chủ. Cũng có thể lấy nhiều thông tin khác nhau về máy tính từ xa (không cần cài đặt phần máy chủ trên chúng). Ví dụ: xem sổ đăng ký qua mạng, xem nhật ký sự kiện từ xa, xem danh sách các chương trình đã cài đặt Windows 95/98/Me/NT/2000/XP đều được hỗ trợ.

Đối với người dùng mạng: chương trình cho phép bạn xem rõ máy tính nào trên mạng đang bật và máy tính nào không. Bất cứ lúc nào, chương trình có thể được gọi từ khay Windows và truy cập nhanh vào tài nguyên của máy tính mong muốn (thay thế cửa sổ Network Neighborhood). Bạn có thể định cấu hình cảnh báo để bật/tắt một số máy tính và máy chủ nhất định trên mạng, về tính khả dụng của các tệp và thư mục, về việc khởi chạy máy chủ web và FTP cũng như các sự kiện khác. LANState giám sát các kết nối tới tài nguyên được chia sẻ và giám sát các truy cập tệp từ mạng. Có thể tìm ra ai đang truy cập tệp nào trên máy tính qua mạng, bao gồm cả thông qua tài nguyên quản trị.

Dành cho quản trị viên: quản lý máy tính trên mạng, thu thập nhiều thông tin khác nhau về máy tính từ xa (danh sách người dùng, dịch vụ và ứng dụng đang chạy, chương trình đã cài đặt, quyền truy cập vào sổ đăng ký và nhật ký sự kiện), quản trị từ xa, khởi động lại, bật/tắt, v.v. Cảnh báo cho phép bạn tìm hiểu kịp thời về việc máy tính và máy chủ trên mạng được bật/tắt, kết nối VPN bị gián đoạn hoặc những thay đổi về kích thước hoặc tính khả dụng của các tệp và thư mục.

Hãy xem xét quá trình tạo sơ đồ mạng cục bộ bằng chương trình này. LANState hỗ trợ quét thiết bị SNMP và có thể tự động vẽ sơ đồ mạng, tạo đường kết nối các máy chủ. Trong trường hợp này, số cổng chuyển đổi được chỉ định trong chú thích dòng. Để tự động xây dựng sơ đồ mạng:

1. SNMP phải được bật trên các thiết bị chuyển mạch. Chương trình phải được phép trong tường lửa để hoạt động thành công bằng giao thức SNMP.

2. Khởi chạy Trình hướng dẫn tạo bản đồ mạng.

3. Chọn quét mạng theo dải địa chỉ IP. Chỉ định phạm vi. Các thiết bị SNMP phải nằm trong phạm vi được chỉ định.

Hình 3.2 - Thiết lập dải địa chỉ

4. Chọn phương pháp quét và cấu hình các thông số của chúng. Chọn hộp bên cạnh tùy chọn "Tìm kiếm thiết bị có SNMP..." và chỉ định chuỗi cộng đồng chính xác để kết nối với bộ chuyển mạch.

Hình 3.3 - Thông số và phương pháp quét

5. Sau khi quét, chương trình sẽ vẽ sơ đồ mạng. Nếu quá trình quét SNMP thành công, kết nối giữa các thiết bị mạng sẽ tự động được rút ra.

Sơ đồ mạng có thể được tải lên hình ảnh hoặc sơ đồ Microsoft Visio

Hình 3.4 - Sơ đồ mạng mở rộng

3. 2 Kỹ thuật chẩn đoán dự đoán

Kỹ thuật chẩn đoán chủ động như sau. Quản trị viên mạng phải giám sát hoạt động của mạng liên tục hoặc trong thời gian dài. Nên thực hiện những quan sát như vậy kể từ thời điểm cài đặt. Dựa trên những quan sát này, trước tiên, quản trị viên phải xác định xem giá trị của các tham số được quan sát ảnh hưởng như thế nào đến công việc của người dùng mạng và thứ hai là chúng thay đổi như thế nào trong một khoảng thời gian dài: một ngày làm việc, tuần, tháng, quý , năm, v.v.

Các thông số quan sát được thường là:

- thông số vận hành của kênh liên lạc mạng - việc sử dụng kênh liên lạc, số lượng khung được nhận và truyền bởi mỗi trạm mạng, số lượng lỗi trong mạng, số lượng khung phát sóng và phát đa hướng, v.v.;

- thông số vận hành máy chủ - việc sử dụng bộ xử lý máy chủ, số lượng yêu cầu bị trì hoãn (chờ) vào đĩa, tổng số bộ đệm bộ đệm, số bộ đệm bộ đệm "bẩn", v.v.

Biết được mối quan hệ giữa thời gian phản hồi của phần mềm ứng dụng và các giá trị của các tham số quan sát được, quản trị viên mạng phải xác định các giá trị tham số tối đa được phép đối với một mạng nhất định. Các giá trị này được nhập dưới dạng ngưỡng vào công cụ chẩn đoán. Nếu trong quá trình vận hành mạng, giá trị của các tham số quan sát được vượt quá giá trị ngưỡng, công cụ chẩn đoán sẽ thông báo cho quản trị viên mạng về sự kiện này. Tình huống này cho thấy có vấn đề trong mạng.

Bằng cách quan sát hoạt động của kênh liên lạc và máy chủ trong một thời gian đủ dài, có thể thiết lập xu hướng thay đổi giá trị của các tham số vận hành mạng khác nhau (mức sử dụng tài nguyên, số lỗi, v.v.). Dựa trên những quan sát như vậy, quản trị viên có thể đưa ra kết luận về sự cần thiết phải thay thế thiết bị đang hoạt động hoặc thay đổi kiến ​​trúc mạng.

Nếu một sự cố xuất hiện trên mạng, quản trị viên phải ghi kết xuất dấu vết kênh vào một bộ đệm hoặc tệp đặc biệt tại thời điểm nó xuất hiện và dựa trên phân tích nội dung của nó, đưa ra kết luận về các nguyên nhân có thể xảy ra của sự cố.

3.2 Tổ chức quá trình chẩn đoán

Không đặt câu hỏi về tầm quan trọng của việc chẩn đoán chủ động, chúng ta phải thừa nhận rằng trong thực tế nó hiếm khi được sử dụng. Thông thường (mặc dù điều này không chính xác), mạng chỉ được phân tích trong những khoảng thời gian hoạt động không đạt yêu cầu. Và thông thường trong những trường hợp như vậy cần phải bản địa hóa và sửa chữa các lỗi mạng hiện có một cách nhanh chóng. Kỹ thuật chúng tôi đề xuất thậm chí có thể được coi là một trường hợp đặc biệt của kỹ thuật chẩn đoán mạng chủ động.

Bất kỳ kỹ thuật kiểm tra mạng nào đều phụ thuộc đáng kể vào các công cụ có sẵn của quản trị viên hệ thống. Theo một số quản trị viên, trong hầu hết các trường hợp, công cụ cần và đủ để phát hiện lỗi mạng (ngoại trừ máy quét cáp) là máy phân tích giao thức mạng. Nó sẽ kết nối với miền xung đột nơi quan sát thấy lỗi, ở khoảng cách tối đa với các trạm hoặc máy chủ đáng ngờ nhất

Nếu mạng có kiến ​​trúc đường trục bị thu gọn và một bộ chuyển mạch được sử dụng làm đường trục thì máy phân tích phải được kết nối với các cổng chuyển mạch mà lưu lượng được phân tích đi qua. Một số chương trình có các tác nhân hoặc đầu dò đặc biệt được cài đặt trên các máy tính được kết nối với các cổng chuyển mạch từ xa. Thông thường, tác nhân (không nên nhầm lẫn với tác nhân SNMP) là một dịch vụ hoặc tác vụ chạy ở chế độ nền trên máy tính của người dùng. Theo quy định, các tác nhân tiêu thụ ít tài nguyên máy tính và không can thiệp vào công việc của người dùng có máy tính được cài đặt. Máy phân tích và tác nhân có thể được kết nối với bộ chuyển mạch theo hai cách.

Trong phương pháp đầu tiên (xem Hình 3.5), máy phân tích được kết nối với một cổng đặc biệt (cổng giám sát hoặc cổng gương) của bộ chuyển mạch, nếu có và lưu lượng truy cập từ tất cả các cổng chuyển mạch quan tâm sẽ lần lượt được gửi đến nó.

Hình 3.5 - Phương pháp kết nối máy phân tích đầu tiên

Nếu bộ chuyển mạch không có cổng đặc biệt thì máy phân tích (hoặc tác nhân) phải được kết nối với các cổng của miền mạng quan tâm ở khoảng cách tối đa với các trạm hoặc máy chủ đáng ngờ nhất (xem Hình 3.6). Đôi khi điều này có thể yêu cầu sử dụng một trung tâm bổ sung. Phương pháp này thích hợp hơn phương pháp đầu tiên. Ngoại lệ là khi một trong các cổng chuyển mạch hoạt động ở chế độ song công hoàn toàn. Nếu đúng như vậy thì trước tiên cổng phải được chuyển sang chế độ bán song công.

Hình 3.6 - Phương pháp kết nối máy phân tích thứ hai

Có rất nhiều máy phân tích giao thức khác nhau trên thị trường - từ phần mềm thuần túy đến phần sụn. Mặc dù hầu hết các máy phân tích giao thức đều có đặc điểm nhận dạng chức năng nhưng mỗi máy đều có những ưu điểm và nhược điểm nhất định. Về vấn đề này, cần chú ý đến hai chức năng quan trọng, nếu không có chức năng này sẽ khó thực hiện chẩn đoán mạng hiệu quả.

Thứ nhất, bộ phân tích giao thức phải có chức năng tạo lưu lượng truy cập tích hợp. Thứ hai, bộ phân tích giao thức phải có khả năng “làm mỏng” các khung nhận được, tức là không chấp nhận tất cả các khung liên tiếp, nhưng, chẳng hạn, mỗi thứ năm hoặc mỗi khung. thứ mười với kết quả gần đúng tiếp theo của các khung nhận được. Nếu chức năng này bị thiếu thì khi mạng bị tải nặng, cho dù máy tính có cài đặt máy phân tích mạnh đến đâu, máy tính sau sẽ bị treo và/hoặc mất khung. Điều này đặc biệt quan trọng khi chẩn đoán các mạng nhanh như Fast Ethernet và FDDI.

Chúng tôi sẽ minh họa phương pháp được đề xuất bằng cách sử dụng bộ phân tích giao thức Observer hoàn toàn dựa trên phần mềm của Network Instruments, một bộ phân tích giao thức mạng mạnh mẽ và công cụ để giám sát và chẩn đoán mạng Ethernet, mạng không dây 802.11 a/b/g, mạng Token Ring và FDDI. Observer cho phép bạn đo các đặc tính hiệu suất mạng theo thời gian thực, giải mã các giao thức mạng (hỗ trợ hơn 500 giao thức), tạo và phân tích xu hướng về đặc tính hiệu suất mạng.

Tài liệu tương tự

    Bản chất và tầm quan trọng của việc giám sát và phân tích mạng cục bộ như giám sát hiệu suất. Phân loại các công cụ giám sát và phân tích, thu thập dữ liệu sơ cấp về vận hành mạng: giao thức và máy phân tích mạng. Giao thức SNMP: sự khác biệt, bảo mật, nhược điểm.

    kiểm tra, thêm vào 07/12/2010

    Khái niệm và cấu trúc của mạng máy tính, phân loại và các loại của chúng. Các công nghệ được sử dụng để xây dựng mạng cục bộ. Bảo mật của mạng cục bộ có dây. Mạng cục bộ không dây, đặc tính và thiết bị được sử dụng của chúng.

    bài tập khóa học, được thêm vào ngày 01/01/2011

    Tổ chức mạng riêng. Cấu trúc của một mạng không được bảo vệ và các loại mối đe dọa đối với thông tin. Các cuộc tấn công từ xa và cục bộ điển hình, cơ chế thực hiện chúng. Lựa chọn công cụ bảo mật cho mạng. Sơ đồ mạng an toàn với máy chủ Proxy và điều phối viên trong mạng cục bộ.

    bài tập khóa học, được thêm vào ngày 23/06/2011

    Truyền thông tin giữa các máy tính. Phân tích các phương pháp và phương tiện trao đổi thông tin. Các loại và cấu trúc của mạng cục bộ. Nghiên cứu thứ tự các máy tính được kết nối trên mạng và hình thức của nó. Cáp để truyền thông tin. Giao thức mạng và gói.

    tóm tắt, được thêm vào ngày 22/12/2014

    Tạo mạng máy tính sử dụng thiết bị mạng và phần mềm đặc biệt. Mục đích của tất cả các loại mạng máy tính. Sự phát triển của mạng. Sự khác biệt giữa mạng cục bộ và mạng toàn cầu. Xu hướng hội tụ các mạng lưới địa phương và toàn cầu.

    trình bày, thêm vào ngày 04/05/2012

    Cơ sở lý thuyết về tổ chức mạng cục bộ. Thông tin chung về mạng. Cấu trúc mạng. Các giao thức trao đổi cơ bản trong mạng máy tính. Đánh giá các công cụ phần mềm. Xác thực và ủy quyền. Hệ thống Kerberos. Cài đặt và cấu hình các giao thức mạng.

    bài tập khóa học, được thêm vào ngày 15/05/2007

    Đặc điểm của các giao thức và phương pháp triển khai mạng ảo riêng. Tổ chức một kênh an toàn giữa một số mạng cục bộ thông qua Internet và người dùng di động. Đường hầm trên điều phối viên thẻ đơn. Phân loại mạng VPN.

    bài tập khóa học, được thêm vào ngày 01/07/2011

    Mạng máy tính và phân loại của chúng. Phần cứng mạng máy tính và cấu trúc liên kết mạng cục bộ. Công nghệ và giao thức của mạng máy tính. Đánh địa chỉ các máy tính trên mạng và các giao thức mạng cơ bản. Ưu điểm của việc sử dụng công nghệ mạng.

    bài tập khóa học, được thêm vào ngày 22/04/2012

    Mục đích và phân loại mạng máy tính. Cấu trúc tổng quát của mạng máy tính và đặc điểm của quá trình truyền dữ liệu. Quản lý sự tương tác của các thiết bị trên mạng. Cấu trúc liên kết điển hình và phương pháp truy cập của mạng cục bộ. Làm việc trên mạng cục bộ.

    tóm tắt, thêm vào ngày 03/02/2009

    Các phương pháp chuyển mạch máy tính. Phân loại, cấu trúc, chủng loại và nguyên lý xây dựng mạng máy tính cục bộ. Lựa chọn hệ thống cáp Các tính năng của Internet và các mạng toàn cầu khác. Mô tả các giao thức trao đổi dữ liệu chính và đặc điểm của chúng.

Nếu các chương trình định kỳ chạy chậm, máy tính bị treo hoặc ngắt kết nối khỏi máy chủ và các lập trình viên nói rằng mạng là nguyên nhân gây ra mọi thứ và quản trị viên mạng nói rằng các chương trình là nguyên nhân gây ra mọi thứ, thì bài viết này dành riêng cho bạn.

Tài liệu được trình bày trong bài viết này không gì khác hơn là sự khái quát hóa kinh nghiệm thực tế nhiều năm của công ty ProLAN trong việc xác định các “khiếm khuyết tiềm ẩn” và “nút thắt cổ chai” của mạng cục bộ.

Trước khi bắt đầu mô tả phương pháp xác định “khiếm khuyết tiềm ẩn”, chúng tôi muốn xác định các thuật ngữ: trên thực tế, mạng cục bộ nghĩa là gì, chẩn đoán mạng cục bộ và loại mạng nào nên được coi là “tốt”. .”

Thông thường, chẩn đoán mạng cục bộ có nghĩa là chỉ kiểm tra hệ thống cáp của nó. Điều này không hoàn toàn đúng. Hệ thống cáp là một trong những thành phần quan trọng nhất của mạng cục bộ, nhưng nó không phải là thành phần duy nhất và không khó nhất theo quan điểm chẩn đoán. Ngoài tình trạng của hệ thống cáp, chất lượng vận hành mạng còn bị ảnh hưởng đáng kể bởi tình trạng của các thiết bị đang hoạt động (card mạng, hub, switch), chất lượng của thiết bị máy chủ và các cài đặt của hệ điều hành mạng. Ngoài ra, hoạt động của mạng phụ thuộc đáng kể vào thuật toán vận hành của phần mềm ứng dụng được sử dụng trong đó.

Với thuật ngữ “mạng cục bộ”, chúng ta sẽ hiểu toàn bộ tổ hợp phần cứng và phần mềm trên; và thuật ngữ “chẩn đoán mạng cục bộ” là quá trình xác định nguyên nhân khiến phần mềm ứng dụng trên mạng hoạt động không đạt yêu cầu. Chất lượng của phần mềm ứng dụng trên mạng có tính chất quyết định theo quan điểm của người dùng. Tất cả các tiêu chí khác, chẳng hạn như số lỗi truyền dữ liệu, mức độ tắc nghẽn tài nguyên mạng, hiệu suất thiết bị, v.v., chỉ là thứ yếu. “Mạng tốt” là mạng mà người dùng không nhận thấy nó hoạt động như thế nào.

Có thể có một số lý do chính dẫn đến hoạt động không đạt yêu cầu của phần mềm ứng dụng trên mạng: hệ thống cáp bị hỏng, lỗi thiết bị hoạt động, quá tải tài nguyên mạng (kênh liên lạc và máy chủ), lỗi trong chính phần mềm ứng dụng. Thông thường một số lỗi mạng che giấu những lỗi khác. Do đó, để xác định một cách đáng tin cậy nguyên nhân khiến phần mềm ứng dụng hoạt động không đạt yêu cầu, mạng cục bộ phải được chẩn đoán toàn diện. Chẩn đoán toàn diện liên quan đến việc thực hiện các công việc (giai đoạn) sau đây.

  • Phát hiện các khiếm khuyết ở lớp vật lý của mạng: hệ thống cáp, hệ thống cấp điện của các thiết bị đang hoạt động; sự hiện diện của tiếng ồn từ các nguồn bên ngoài.
  • Đo tải hiện tại của kênh liên lạc mạng và xác định ảnh hưởng của giá trị tải của kênh liên lạc đến thời gian phản hồi của phần mềm ứng dụng.
  • Đo lường số lượng xung đột trong mạng và tìm ra nguyên nhân xảy ra chúng.
  • Đo số lượng lỗi truyền dữ liệu ở cấp độ kênh liên lạc và xác định nguyên nhân xảy ra chúng.
  • Xác định các khiếm khuyết kiến ​​trúc mạng.
  • Đo tải máy chủ hiện tại và xác định tác động của tải của nó đến thời gian phản hồi của phần mềm ứng dụng.
  • Xác định các lỗi phần mềm ứng dụng dẫn đến việc sử dụng băng thông mạng và máy chủ không hiệu quả.

Trong bài viết này, chúng tôi sẽ xem xét bốn giai đoạn đầu tiên của quá trình chẩn đoán phức tạp của mạng cục bộ, cụ thể là: chẩn đoán cấp độ liên kết mạng.

Chúng tôi sẽ không mô tả chi tiết phương pháp thử nghiệm hệ thống cáp mạng. Bất chấp tầm quan trọng của vấn đề này, giải pháp của nó rất tầm thường và rõ ràng: một hệ thống cáp hoàn chỉnh chỉ có thể được kiểm tra bằng một thiết bị đặc biệt - máy quét cáp. Không có cách nào khác. Sẽ chẳng ích gì khi thực hiện quy trình tốn nhiều công sức để xác định các lỗi mạng nếu chúng có thể được bản địa hóa bằng một lần nhấn phím AUTOTEST trên máy quét cáp. Trong trường hợp này, thiết bị sẽ thực hiện đầy đủ các thử nghiệm để đảm bảo hệ thống cáp mạng tuân thủ tiêu chuẩn đã chọn.

Tôi muốn bạn chú ý đến hai điểm, đặc biệt là vì chúng thường bị bỏ quên khi kiểm tra hệ thống cáp mạng bằng máy quét.

Chế độ AUTOTEST không cho phép bạn kiểm tra độ ồn do nguồn bên ngoài trong cáp tạo ra. Đây có thể là tiếng ồn từ đèn huỳnh quang, dây điện, điện thoại di động, máy sao chép mạnh mẽ, v.v. Máy quét cáp thường có chức năng đặc biệt để xác định mức độ tiếng ồn. Do hệ thống cáp mạng chỉ được kiểm tra đầy đủ ở giai đoạn cài đặt và nhiễu trong cáp có thể xảy ra ngoài dự đoán nên không có gì đảm bảo hoàn toàn rằng nhiễu sẽ xuất hiện trong quá trình kiểm tra mạng toàn diện ở giai đoạn cài đặt.

Khi kiểm tra mạng bằng máy quét cáp, thay vì thiết bị hoạt động, một đầu máy quét được kết nối với cáp và đầu kia là đầu phun. Sau khi kiểm tra cáp, máy quét và đầu phun sẽ tắt và thiết bị hoạt động được kết nối: card mạng, hub, switch. Tuy nhiên, không có gì đảm bảo hoàn toàn rằng sự tiếp xúc giữa thiết bị đang hoạt động và cáp sẽ tốt như giữa thiết bị quét và cáp. Chúng tôi đã nhiều lần gặp phải trường hợp lỗi nhỏ ở phích cắm RJ-45 không xuất hiện khi kiểm tra hệ thống cáp bằng máy quét nhưng được phát hiện khi chẩn đoán mạng bằng máy phân tích giao thức.

Trong khuôn khổ phương pháp luận được đề xuất, chúng tôi sẽ không xem xét phương pháp chẩn đoán mạng chủ động trong sách giáo khoa hiện nay (xem thanh bên “Phương pháp chẩn đoán mạng chủ động”). Không đặt câu hỏi về tầm quan trọng của việc chẩn đoán chủ động, chúng tôi chỉ lưu ý rằng trong thực tế nó hiếm khi được sử dụng. Thông thường (mặc dù điều này không chính xác), mạng chỉ được phân tích trong những khoảng thời gian hoạt động không đạt yêu cầu. Trong những trường hợp như vậy, các lỗi mạng hiện có cần được bản địa hóa và sửa chữa nhanh chóng. Kỹ thuật chúng tôi đề xuất nên được coi là trường hợp đặc biệt của kỹ thuật chẩn đoán mạng chủ động.

Tổ chức quá trình chẩn đoán mạng

Bất kỳ kỹ thuật kiểm tra mạng nào đều phụ thuộc đáng kể vào các công cụ có sẵn của quản trị viên hệ thống. Theo chúng tôi, trong hầu hết các trường hợp, công cụ cần và đủ để phát hiện lỗi mạng (ngoại trừ máy quét cáp) là máy phân tích giao thức mạng. Nó phải kết nối với miền xung đột nơi quan sát thấy lỗi, ở khoảng cách tối đa với các trạm hoặc máy chủ đáng ngờ nhất (xem Quy tắc #3.3).

Nếu mạng có kiến ​​trúc đường trục bị thu gọn và một bộ chuyển mạch được sử dụng làm đường trục thì máy phân tích phải được kết nối với các cổng chuyển mạch mà lưu lượng được phân tích đi qua. Một số chương trình có các tác nhân hoặc đầu dò đặc biệt được cài đặt trên các máy tính được kết nối với các cổng chuyển mạch từ xa. Thông thường, tác nhân (không nên nhầm lẫn với tác nhân SNMP) là một dịch vụ hoặc tác vụ chạy ở chế độ nền trên máy tính của người dùng. Theo quy định, các tác nhân tiêu thụ ít tài nguyên máy tính và không can thiệp vào công việc của người dùng có máy tính được cài đặt. Máy phân tích và tác nhân có thể được kết nối với bộ chuyển mạch theo hai cách.

Trong phương pháp đầu tiên (xem Hình 1a), máy phân tích được kết nối với một cổng đặc biệt (cổng giám sát hoặc cổng gương) của bộ chuyển mạch, nếu có và lưu lượng truy cập từ tất cả các cổng chuyển mạch quan tâm sẽ lần lượt được gửi đến nó.

Hình 1a. Lưu lượng phản chiếu từ tất cả các cổng chuyển mạch lần lượt được gửi đến cổng chuyển mạch mà bộ phân tích giao thức được kết nối.

Nếu bộ chuyển mạch không có cổng đặc biệt thì máy phân tích (hoặc tác nhân) phải được kết nối với các cổng của miền mạng quan tâm ở mức gần nhất với các trạm hoặc máy chủ đáng ngờ nhất (xem Hình 1b). Đôi khi điều này có thể yêu cầu sử dụng một trung tâm bổ sung. Theo Quy tắc #3.3, phương pháp này thích hợp hơn phương pháp đầu tiên. Ngoại lệ là khi một trong các cổng chuyển mạch hoạt động ở chế độ song công hoàn toàn. Nếu đúng như vậy thì trước tiên cổng phải được chuyển sang chế độ bán song công.

Hình 1b. Bộ phân tích giao thức và các tác nhân từ xa giám sát các miền mạng chính. Một trung tâm bổ sung được sử dụng để chẩn đoán miền máy chủ.

Có rất nhiều máy phân tích giao thức khác nhau trên thị trường - từ phần mềm thuần túy đến phần sụn. Mặc dù hầu hết các máy phân tích giao thức đều có đặc điểm nhận dạng chức năng nhưng mỗi máy đều có những ưu điểm và nhược điểm nhất định. Về vấn đề này, chúng tôi muốn thu hút sự chú ý đến hai chức năng quan trọng, nếu không có chức năng này thì sẽ khó tiến hành chẩn đoán mạng hiệu quả.

Đầu tiên, bộ phân tích giao thức phải có chức năng tạo lưu lượng truy cập tích hợp (xem Quy tắc #3.4). Thứ hai, bộ phân tích giao thức phải có khả năng “làm mỏng” các khung nhận được, tức là không nhận tất cả các khung liên tiếp, mà, chẳng hạn, cứ một phần năm hoặc một phần mười với kết quả thu được gần đúng bắt buộc sau đó. Nếu chức năng này bị thiếu thì khi mạng bị tải nặng, cho dù máy tính có cài đặt máy phân tích mạnh đến đâu, máy tính sau sẽ bị treo và/hoặc mất khung. Điều này đặc biệt quan trọng khi chẩn đoán các mạng nhanh như Fast Ethernet và FDDI.

Chúng tôi sẽ minh họa phương pháp được đề xuất bằng cách sử dụng ví dụ về việc sử dụng bộ phân tích giao thức phần mềm thuần túy, Observer, của Network Instruments, chạy trong Windows 95 và Windows NT. Theo quan điểm của chúng tôi, sản phẩm này có tất cả các chức năng cần thiết để chẩn đoán mạng hiệu quả.

Vì vậy, giả sử phần mềm ứng dụng trên mạng Ethernet của bạn trở nên chậm và bạn cần nhanh chóng cách ly và loại bỏ lỗi.

Giai đoạn đầu

Đo lường việc sử dụng mạng và thiết lập mối tương quan giữa tốc độ chậm của mạng và tắc nghẽn kênh liên lạc.

Việc sử dụng kênh liên lạc mạng là tỷ lệ phần trăm thời gian mà kênh liên lạc truyền tín hiệu, hay nói cách khác - tỷ lệ dung lượng kênh liên lạc bị chiếm bởi các khung, va chạm và nhiễu. Tham số "Sử dụng kênh liên lạc" mô tả mức độ tắc nghẽn mạng.

Kênh truyền thông mạng là tài nguyên mạng dùng chung nên tải của nó ảnh hưởng đến thời gian phản hồi của phần mềm ứng dụng. Ưu tiên hàng đầu là xác định xem liệu có mối tương quan giữa hiệu suất phần mềm ứng dụng kém và việc sử dụng liên kết mạng hay không.

Giả sử rằng bộ phân tích giao thức được cài đặt trong miền mạng (miền va chạm) nơi phần mềm ứng dụng chạy chậm. Hiệu suất sử dụng kênh truyền thông trung bình là 19%, cao nhất đạt 82%. Dựa trên những dữ liệu này, liệu có thể đưa ra kết luận đáng tin cậy rằng nguyên nhân khiến các chương trình trên mạng hoạt động chậm là do tắc nghẽn kênh liên lạc? Khắc nghiệt.

Bạn thường có thể nghe về tiêu chuẩn thực tế, theo đó, để mạng Ethernet hoạt động tốt, việc sử dụng kênh liên lạc “theo xu hướng” (giá trị trung bình trong 15 phút) không được vượt quá 20% và “ở mức cao nhất” (giá trị trung bình trong 1 phút) - 35-40%. Các giá trị nhất định được giải thích là do trong mạng Ethernet, khi mức sử dụng kênh liên lạc vượt quá 40%, số lần va chạm và theo đó, thời gian phản hồi của phần mềm ứng dụng sẽ tăng lên đáng kể. Mặc dù thực tế là lý do như vậy nhìn chung là đúng, nhưng việc tuân thủ vô điều kiện các khuyến nghị đó có thể dẫn đến kết luận sai về nguyên nhân khiến các chương trình trên mạng hoạt động chậm. Chúng không tính đến các đặc điểm của một mạng cụ thể, cụ thể là: loại phần mềm ứng dụng, độ dài của miền mạng, số lượng trạm vận hành đồng thời.

Để xác định mức sử dụng kênh liên lạc tối đa được phép trong trường hợp cụ thể của bạn, chúng tôi khuyên bạn nên tuân theo các quy tắc bên dưới.

Quy tắc số 1.1.

Nếu trong mạng Ethernet tại bất kỳ thời điểm nào việc trao đổi dữ liệu xảy ra giữa không quá hai máy tính thì bất kỳ việc sử dụng mạng ở mức độ cao tùy ý đều có thể chấp nhận được.

Mạng Ethernet được thiết kế theo cách mà nếu hai máy tính đồng thời cạnh tranh với nhau để chiếm được kênh liên lạc, thì sau một thời gian, chúng sẽ đồng bộ hóa với nhau và lần lượt bắt đầu truy cập kênh liên lạc một cách nghiêm ngặt. Trong trường hợp này, thực tế không có va chạm giữa chúng.

Nếu máy trạm và máy chủ có hiệu suất cao và phần lớn dữ liệu được trao đổi giữa chúng thì mức sử dụng trong kênh liên lạc có thể đạt 80-90% (đặc biệt là ở chế độ truyền liên tục). Điều này hoàn toàn không làm chậm mạng mà ngược lại, cho thấy việc sử dụng hiệu quả tài nguyên của phần mềm ứng dụng.

Do đó, nếu mạng của bạn có mức sử dụng băng thông cao, hãy thử xác định xem có bao nhiêu máy tính đang liên lạc cùng một lúc. Điều này có thể được thực hiện, ví dụ, bằng cách thu thập và giải mã các gói tin trong kênh quan tâm trong khoảng thời gian sử dụng cao.

Quy tắc số 1.2.

Việc sử dụng nhiều kênh liên lạc mạng chỉ làm chậm hoạt động của một phần mềm ứng dụng cụ thể khi kênh liên lạc là “nút cổ chai” cho hoạt động của phần mềm cụ thể đó.

Ngoài kênh liên lạc, tình trạng tắc nghẽn trong hệ thống có thể phát sinh do hiệu suất không đủ hoặc cài đặt máy chủ không chính xác, hiệu suất của máy trạm thấp hoặc thuật toán vận hành của chính phần mềm ứng dụng không hiệu quả.

Ở mức độ nào thì kênh liên lạc chịu trách nhiệm cho hiệu suất không đủ của hệ thống có thể được tìm hiểu như sau. Sau khi chọn hoạt động phổ biến nhất của một phần mềm ứng dụng nhất định (ví dụ: đối với phần mềm ngân hàng, hoạt động đó có thể nhập lệnh thanh toán), bạn nên xác định việc sử dụng kênh liên lạc ảnh hưởng như thế nào đến thời gian thực hiện của hoạt động đó.

Cách dễ nhất để thực hiện việc này là sử dụng chức năng tạo lưu lượng có sẵn trong một số bộ phân tích giao thức (ví dụ: Observer). Khi sử dụng chức năng này, cường độ của tải được tạo ra sẽ được tăng dần và so với nền của nó, cần đo thời gian thực hiện thao tác. Nên tăng tải nền từ 0 lên 50-60% với mức tăng không quá 10%.

Nếu thời gian thực hiện một thao tác không thay đổi đáng kể trên một phạm vi tải nền rộng thì nút thắt cổ chai của hệ thống không phải là kênh liên lạc. Nếu thời gian thực hiện thao tác sẽ thay đổi đáng kể tùy thuộc vào kích thước của tải nền (ví dụ: với mức sử dụng kênh liên lạc 10% và 20%, thời gian thực hiện thao tác sẽ thay đổi đáng kể), thì đó chính là kênh liên lạc. rất có thể là nguyên nhân gây ra hiệu suất thấp của hệ thống và giá trị khối lượng công việc của nó rất quan trọng đối với thời gian phản hồi của phần mềm ứng dụng. Biết được thời gian phản hồi mong muốn của phần mềm, bạn có thể dễ dàng xác định việc sử dụng kênh liên lạc nào tương ứng với thời gian phản hồi mong muốn của phần mềm ứng dụng.

Trong thử nghiệm này, tải nền không được đặt quá 60-70%. Ngay cả khi kênh liên lạc không bị tắc nghẽn, dưới mức tải như vậy, thời gian thực hiện có thể tăng lên do thông lượng mạng hiệu quả giảm.

Quy tắc số 1.3.

Việc sử dụng tối đa cho phép một kênh liên lạc phụ thuộc vào độ dài của mạng.

Khi độ dài của miền mạng tăng lên thì mức sử dụng cho phép sẽ giảm đi. Miền mạng càng dài thì các xung đột sẽ được phát hiện muộn hơn. Nếu độ dài của miền mạng nhỏ thì các xung đột sẽ được phát hiện bởi các trạm ở đầu khung, tại thời điểm truyền phần mở đầu. Nếu độ dài của mạng lớn thì xung đột sẽ được phát hiện sau đó - tại thời điểm truyền khung. Kết quả là chi phí truyền gói (IP hoặc IPX) tăng lên. Xung đột được phát hiện càng muộn thì chi phí càng lớn và thời gian truyền gói càng mất nhiều thời gian. Kết quả là thời gian phản hồi của phần mềm ứng dụng dù chỉ tăng lên một chút.

Kết luận. Nếu qua chẩn đoán mạng, bạn xác định rằng nguyên nhân khiến phần mềm ứng dụng hoạt động chậm là do tắc nghẽn kênh liên lạc thì kiến ​​trúc mạng phải được thay đổi. Cần giảm số lượng trạm trong các miền mạng bị quá tải và các trạm tạo ra tải lớn nhất trên mạng phải được kết nối với các cổng chuyển mạch chuyên dụng.

Giai đoạn thứ hai

Đo lường số lượng va chạm trong mạng.

Nếu hai trạm trong miền mạng đồng thời truyền dữ liệu thì xảy ra xung đột trong miền. Có ba loại va chạm: cục bộ, từ xa, muộn.

Xung đột cục bộ là xung đột được phát hiện trong miền nơi thiết bị đo được kết nối, trong phần mở đầu truyền hoặc 64 byte đầu tiên của khung khi nguồn truyền nằm trong miền. Các thuật toán phát hiện xung đột cục bộ cho mạng đôi xoắn (10BaseT) và cáp đồng trục (10Base2) khác nhau.

Trong mạng 10Base2, trạm truyền khung xác định rằng đã xảy ra xung đột cục bộ bằng cách thay đổi mức điện áp trong kênh liên lạc (bằng cách tăng gấp đôi). Sau khi phát hiện xung đột, trạm phát sẽ gửi một loạt tín hiệu gây nhiễu vào kênh liên lạc để tất cả các trạm khác trong miền biết rằng đã xảy ra xung đột. Kết quả của chuỗi tín hiệu này là sự xuất hiện trên mạng các khung hình ngắn, được định dạng không chính xác có độ dài dưới 64 byte với trình tự kiểm tra CRC không chính xác. Những khung như vậy được gọi là các mảnh va chạm hoặc runt.

Trong mạng 10BaseT, một trạm xác định rằng đã xảy ra xung đột cục bộ nếu nó phát hiện hoạt động trên cặp nhận (Rx) trong khi truyền khung.

Xung đột từ xa là xung đột xảy ra trên một phân đoạn vật lý khác của mạng (tức là phía sau bộ lặp). Một trạm biết rằng đã xảy ra xung đột từ xa nếu nó nhận được khung ngắn không đúng định dạng với trình tự kiểm tra CRC không chính xác và mức điện áp liên kết vẫn nằm trong giới hạn được chỉ định (đối với mạng 10Base2). Đối với mạng 10BaseT/100BaseT, chỉ báo là không có hoạt động đồng thời trên các cặp nhận và truyền (Tx và Rx).

Va chạm muộn là va chạm cục bộ được phát hiện sau khi trạm truyền 64 byte đầu tiên của khung vào kênh liên lạc. Trong mạng 10BaseT, các xung đột muộn thường được các thiết bị đo lường báo cáo là lỗi CRC.

Theo quy luật, nếu việc phát hiện các xung đột cục bộ và từ xa vẫn chưa cho thấy sự hiện diện của lỗi trong mạng thì việc phát hiện các xung đột muộn là một xác nhận rõ ràng về sự hiện diện của lỗi trong miền. Thông thường, điều này là do đường dây liên lạc quá dài hoặc thiết bị mạng kém chất lượng.

Ngoài việc sử dụng kênh liên lạc ở mức độ cao, xung đột trong mạng Ethernet có thể do lỗi trong hệ thống cáp và thiết bị hoạt động cũng như do nhiễu.

Ngay cả khi kênh liên lạc không phải là điểm nghẽn của hệ thống thì các xung đột không đáng kể nhưng lại làm chậm quá trình hoạt động của phần mềm ứng dụng. Hơn nữa, sự chậm lại chính không phải do nhu cầu truyền lại khung mà do mỗi máy tính trên mạng, sau khi xảy ra xung đột, phải thực hiện thuật toán quay lui: trước lần thử tiếp theo để vào mạng. kênh liên lạc, nó sẽ phải chờ một khoảng thời gian ngẫu nhiên, tỷ lệ thuận với số lần thử không thành công trước đó.

Về vấn đề này, điều quan trọng là phải tìm ra nguyên nhân gây ra xung đột - mức sử dụng mạng cao hoặc lỗi mạng “ẩn”. Để xác định điều này, chúng tôi khuyên bạn nên tuân theo các quy tắc sau.

Quy tắc số 2.1.

Không phải tất cả các thiết bị đo đều xác định chính xác tổng số va chạm trong mạng.

Hầu như tất cả các máy phân tích giao thức phần mềm thuần túy chỉ phát hiện sự hiện diện của xung đột nếu chúng phát hiện ra một đoạn trong mạng, tức là kết quả của xung đột. Đồng thời, loại xung đột phổ biến nhất - xảy ra tại thời điểm truyền phần mở đầu khung (tức là trước dấu phân cách khung ban đầu (SFD)) - không được phát hiện bởi các công cụ đo phần mềm, đây là cách mà chipset của Card mạng Ethernet được thiết kế. Các máy đo phần cứng như LANMeter của Fluke phát hiện va chạm một cách chính xác nhất.

Quy tắc số 2.2.

Việc sử dụng kênh liên lạc ở mức độ cao không phải lúc nào cũng đi kèm với mức độ xung đột cao.

Mức độ xung đột sẽ thấp nếu không có nhiều hơn hai trạm hoạt động trên mạng cùng một lúc (xem Quy tắc số 1.1) hoặc nếu một số lượng nhỏ các trạm đang trao đổi đồng thời các khung hình dài (đặc biệt điển hình cho chế độ chụp liên tục) . Trong trường hợp này, trước khi bắt đầu truyền khung, các trạm “nhìn thấy” sóng mang trong kênh liên lạc và hiếm khi xảy ra xung đột.

Quy tắc số 2.3.

Dấu hiệu của sự cố trong mạng là tình trạng sử dụng kênh thấp (dưới 30%) đi kèm với mức độ xung đột cao (trên 5%).

Nếu hệ thống cáp đã được quét trước đó, nguyên nhân rất có thể khiến tốc độ xung đột tăng lên là do nhiễu trên đường truyền do nguồn bên ngoài gây ra hoặc card mạng bị lỗi không triển khai đúng thuật toán CSMA/CD.

Công ty Network Instruments, trong bộ phân tích giao thức Observer, ban đầu đã giải quyết được vấn đề xác định các xung đột do lỗi mạng. Thử nghiệm được tích hợp trong chương trình sẽ kích thích xảy ra xung đột: nó gửi một loạt gói vào kênh liên lạc với cường độ 100 gói mỗi giây và phân tích số lượng xung đột đã xảy ra. Trong trường hợp này, biểu đồ kết hợp hiển thị sự phụ thuộc của số lượng xung đột trong mạng vào việc sử dụng kênh liên lạc.

Sẽ rất hợp lý khi phân tích tỷ lệ xung đột trong tổng số khung hình tại thời điểm hoạt động của các trạm đáng ngờ (hoạt động chậm) và chỉ trong trường hợp mức sử dụng kênh liên lạc vượt quá 30%. Nếu trong số ba khung hình gặp phải xung đột, điều này không có nghĩa là mạng có lỗi.

Trong Trình phân tích giao thức quan sát, biểu đồ hiển thị trong Hình 3 thay đổi màu sắc tùy thuộc vào số lượng xung đột và mức độ sử dụng kênh liên lạc được quan sát.

Quy tắc số 2.4.

Khi chẩn đoán mạng 10BaseT, tất cả các xung đột sẽ được báo cáo là đã xóa nếu bộ phân tích giao thức không tạo ra lưu lượng truy cập.

Nếu bạn giám sát một cách thụ động (không tạo lưu lượng truy cập) mạng 10BaseT và phân đoạn vật lý nơi máy phân tích (thiết bị đo lường) được kết nối đang hoạt động thì tất cả các xung đột sẽ được ghi lại dưới dạng từ xa.

Tuy nhiên, nếu bạn thấy xung đột cục bộ thì điều này có thể có nghĩa là một trong ba điều sau: phân đoạn mạng vật lý mà thiết bị đo được kết nối bị lỗi; Cổng hub hoặc cổng chuyển mạch mà đồng hồ kết nối bị lỗi hoặc đồng hồ không thể phân biệt giữa va chạm cục bộ và va chạm từ xa.

Quy tắc số 2.5.

Xung đột trong mạng có thể là hậu quả của việc làm quá tải bộ đệm đầu vào của bộ chuyển mạch.

Cần nhớ rằng khi bộ đệm đầu vào bị quá tải, các switch sẽ mô phỏng các xung đột để “làm chậm” các máy trạm mạng. Cơ chế này được gọi là "kiểm soát dòng chảy".

Quy tắc số 2.6.

Nguyên nhân gây ra nhiều xung đột (và lỗi) trong mạng có thể là do việc tổ chức nối đất không đúng cách cho các máy tính kết nối với mạng cục bộ.

Nếu các máy tính kết nối mạng không có điểm nối đất chung (nối đất) thì có thể xảy ra sự khác biệt tiềm ẩn giữa các thùng máy tính. Trong máy tính cá nhân, nền tảng “bảo vệ” được kết hợp với nền tảng “thông tin”. Vì các máy tính được kết nối bằng kênh liên lạc mạng cục bộ nên sự khác biệt tiềm năng giữa chúng dẫn đến việc tạo ra dòng điện qua kênh liên lạc. Dòng điện này gây ra sự biến dạng thông tin và là nguyên nhân gây ra xung đột, lỗi trong mạng. Hiệu ứng này được gọi là tiếng ồn vòng lặp mặt đất hoặc tiếng ồn liên mặt đất.

Hiệu ứng tương tự xảy ra khi một đoạn cáp đồng trục được nối đất tại nhiều điểm. Điều này thường xảy ra nếu đầu nối chữ T của card mạng tiếp xúc với vỏ máy tính.

Xin lưu ý rằng việc lắp đặt nguồn điện liên tục không làm giảm bớt những khó khăn được mô tả. Những vấn đề này và phương pháp giải quyết được thảo luận chi tiết hơn trong tài liệu của APC (American Power Transformation) trong Sổ tay Bảo vệ Nguồn điện.

Nếu phát hiện thấy một số lượng lớn xung đột và lỗi trong mạng 10Base2, điều đầu tiên cần làm là kiểm tra sự khác biệt tiềm ẩn giữa dây bện cáp đồng trục và vỏ máy tính. Nếu giá trị của nó đối với bất kỳ máy tính nào trên mạng lớn hơn một volt trên dòng điện xoay chiều thì mạng đó không ổn với cấu trúc liên kết của các đường nối đất máy tính.

Giai đoạn thứ ba

Đo số lượng lỗi ở lớp liên kết dữ liệu mạng.

Các loại lỗi phổ biến nhất trong mạng Ethernet là:

Khung ngắn - khung dài dưới 64 byte (sau phần mở đầu 8 byte) với trình tự kiểm tra hợp lệ. Nguyên nhân rất có thể xảy ra tình trạng khung hình ngắn là do card mạng bị lỗi hoặc trình điều khiển mạng bị cấu hình không đúng hoặc bị hỏng.

Gần đây chúng tôi đã thấy một số lượng lớn các lỗi kiểu này trên các máy tính tương đối chậm (486/SX) chạy Windows 95 với card mạng NE2000. Lý do chúng tôi không biết.

Khung dài - khung dài hơn 1518 byte. Một khung dài có thể có trình tự kiểm tra đúng hoặc sai. Trong trường hợp sau, những khung như vậy thường được gọi là jabber. Việc ghi các khung hình dài với trình tự điều khiển chính xác thường cho thấy trình điều khiển mạng không hoạt động chính xác; sửa lỗi loại jabber - do trục trặc của thiết bị đang hoạt động hoặc có sự can thiệp từ bên ngoài.

Lỗi trình tự điều khiển (lỗi CRC) - khung được định dạng chính xác có độ dài chấp nhận được (từ 64 đến 1518 byte), nhưng có trình tự điều khiển không chính xác (lỗi trong trường CRC).

Lỗi căn chỉnh - một khung chứa một số bit không phải là bội số của số byte.

Ghost là một chuỗi tín hiệu có định dạng khác với khung Ethernet, không chứa dấu phân cách (SFD) và dài hơn 72 byte. Thuật ngữ này lần đầu tiên được Fluke giới thiệu để phân biệt sự khác biệt giữa va chạm từ xa và tiếng ồn trong kênh liên lạc.

Ánh sáng chói là lỗi nguy hiểm nhất vì chúng không được các bộ phân tích giao thức phần mềm nhận ra vì lý do tương tự như xung đột ở giai đoạn truyền mở đầu. Độ chói có thể được phát hiện bằng các thiết bị đặc biệt hoặc sử dụng phương pháp kiểm tra căng thẳng mạng (chúng tôi dự định nói về phương pháp này trong các ấn phẩm tiếp theo).

Tuy nhiên, trước nguy cơ phải chịu sự phẫn nộ chính đáng của các nhà phân phối phần mềm quản lý mạng dựa trên SNMP, chúng tôi dám khẳng định rằng mức độ mà các lỗi lớp liên kết ảnh hưởng đến thời gian phản hồi của phần mềm ứng dụng là bị phóng đại quá mức.

Theo tiêu chuẩn thực tế được chấp nhận chung, số lỗi cấp độ liên kết không được vượt quá 1% tổng số khung được truyền qua mạng. Kinh nghiệm cho thấy rằng giá trị này chỉ được áp dụng khi có khiếm khuyết rõ ràng trong hệ thống cáp mạng. Đồng thời, nhiều lỗi nghiêm trọng trong thiết bị hoạt động gây ra nhiều lỗi mạng không xuất hiện ở lớp liên kết dữ liệu của mạng (xem Quy tắc #3.8).

Quy tắc số 3.1.

Trước khi phân tích lỗi mạng, hãy tìm hiểu những loại lỗi nào có thể được phát hiện bởi card mạng và trình điều khiển card trên máy tính nơi phần mềm phân tích giao thức của bạn đang chạy.

Hoạt động của bất kỳ bộ phân tích giao thức nào đều dựa trên việc card mạng và trình điều khiển được chuyển sang chế độ nhận tất cả các khung mạng (chế độ lăng nhăng). Ở chế độ này, card mạng sẽ nhận tất cả các khung hình đi qua mạng chứ không chỉ các khung hình phát sóng và những khung hình được gửi trực tiếp đến nó, như ở chế độ bình thường. Bộ phân tích giao thức nhận tất cả thông tin về các sự kiện trên mạng từ trình điều khiển của card mạng hoạt động ở chế độ nhận tất cả các khung.

Không phải tất cả các card mạng và trình điều khiển mạng đều cung cấp cho bộ phân tích giao thức thông tin giống hệt và đầy đủ về các lỗi mạng. Card mạng 3Com hoàn toàn không cung cấp bất kỳ thông tin lỗi nào. Nếu bạn cài đặt bộ phân tích giao thức trên một bảng như vậy thì các giá trị trên tất cả các bộ đếm lỗi sẽ bằng 0.

EtherExpress Pro của Intel chỉ báo cáo CRC và lỗi căn chỉnh. Card mạng SMC chỉ cung cấp thông tin về các khung ngắn. NE2000 cung cấp thông tin gần như đầy đủ, xác định lỗi CRC, khung ngắn, lỗi căn chỉnh và xung đột.

Báo cáo về card mạng D-Link (ví dụ: DFE-500TX) và Kingstone (ví dụ: KNE 100TX) đã hoàn tất và nếu có trình điều khiển đặc biệt, thậm chí còn mở rộng thông tin về lỗi và xung đột trong mạng.

Một số nhà phát triển bộ phân tích giao thức cung cấp trình điều khiển của họ cho các card mạng phổ biến nhất.

Quy tắc số 3.2.

Hãy chú ý đến việc “ràng buộc” lỗi đối với các địa chỉ MAC cụ thể của các trạm.

Khi phân tích mạng cục bộ, bạn có thể nhận thấy rằng các lỗi thường được “gắn” với một số địa chỉ MAC nhất định của các trạm. Tuy nhiên, các xung đột xảy ra ở phần địa chỉ của khung, chói, các tình huống không được nhận dạng như khung ngắn có độ dài dữ liệu bằng 0 không thể được “gắn” với các địa chỉ MAC cụ thể.

Nếu có nhiều lỗi trên mạng không liên quan đến các địa chỉ MAC cụ thể thì nguồn của chúng rất có thể không phải là thiết bị đang hoạt động. Rất có thể, những lỗi như vậy là kết quả của sự va chạm, lỗi trong hệ thống cáp mạng hoặc tiếng ồn mạnh bên ngoài. Chúng cũng có thể do chất lượng kém hoặc do gián đoạn điện áp cung cấp cho thiết bị đang hoạt động.

Nếu hầu hết các lỗi đều liên quan đến địa chỉ MAC cụ thể của các trạm thì hãy cố gắng xác định mẫu giữa vị trí của các trạm truyền khung bị lỗi, vị trí của thiết bị đo (xem Quy tắc # 3.3, # 3.4) và cấu trúc liên kết mạng.

Quy tắc số 3.3.

Trong một miền mạng (miền va chạm), loại và số lượng lỗi được bộ phân tích giao thức ghi lại phụ thuộc vào nơi thiết bị đo được kết nối.

Nói cách khác, trong phân đoạn cáp đồng trục, hub hoặc ngăn xếp hub, mẫu thống kê liên kết có thể phụ thuộc vào vị trí kết nối đồng hồ.

Đối với nhiều quản trị viên mạng, tuyên bố này có vẻ vô lý vì nó mâu thuẫn với các nguyên tắc của mô hình OSI bảy lớp. Khi mới gặp hiện tượng này, chúng tôi cũng không tin vào kết quả và cho rằng thiết bị đo bị lỗi. Chúng tôi đã thử nghiệm hiện tượng này bằng các dụng cụ đo khác nhau, từ phần mềm thuần túy đến phần mềm và phần cứng. Kết quả là giống nhau.

Sự can thiệp tương tự có thể gây ra lỗi CRC, chớp sáng, va chạm từ xa hoặc hoàn toàn không được phát hiện, tùy thuộc vào vị trí tương đối của nguồn gây nhiễu và thiết bị đo. Vụ va chạm tương tự có thể được ghi nhận là ở xa hoặc muộn, tùy thuộc vào vị trí tương đối của các trạm xung đột và thiết bị đo. Một khung chứa lỗi CRC trên một hub trong ngăn xếp có thể không được ghi lại trên một hub khác trên cùng ngăn xếp.

Hậu quả của quy tắc heuristic trên là thực tế là các chương trình giám sát mạng dựa trên giao thức SNMP không phải lúc nào cũng phản ánh đầy đủ số liệu thống kê về lỗi trong mạng. Lý do cho điều này là tác nhân SNMP được tích hợp trong thiết bị đang hoạt động luôn giám sát trạng thái mạng chỉ từ một điểm. Vì vậy, nếu mạng bao gồm một số nhóm hub "không thông minh" được kết nối với một bộ chuyển mạch "thông minh", thì tác nhân SNMP của bộ chuyển mạch đôi khi có thể không thấy một số lỗi trong ngăn xếp trung tâm.

Xác nhận quy tắc này có thể được tìm thấy trên các máy chủ Web của Fluke (www.fluke.com) và Net3 Group (www.net3group.com).

Quy tắc số 3.4.

Để xác định lỗi ở cấp độ liên kết dữ liệu của mạng, các phép đo phải được thực hiện dựa trên nền tảng của bộ phân tích tạo ra các giao thức lưu lượng riêng của nó.

Tạo lưu lượng truy cập cho phép bạn làm trầm trọng thêm các vấn đề hiện có và tạo điều kiện cho chúng biểu hiện. Lưu lượng truy cập phải có cường độ thấp (không quá 100 khung hình/giây) và góp phần hình thành các xung đột trong mạng, tức là chứa các đoạn ngắn (<100 байт) кадры.

Khi chọn một bộ phân tích giao thức hoặc công cụ chẩn đoán khác, trước hết cần chú ý đến thực tế là công cụ được chọn có chức năng tích hợp để tạo lưu lượng truy cập ở cường độ xác định. Tính năng này có sẵn trong các máy phân tích NetXray của Network Instruments' Observer và Cinco (nay là Network Associates).

Quy tắc số 3.5.

Nếu số liệu thống kê quan sát được phụ thuộc vào vị trí của thiết bị đo thì nguồn lỗi rất có thể nằm ở cấp độ vật lý của một miền mạng nhất định (lý do là do lỗi trong hệ thống cáp hoặc nhiễu từ nguồn bên ngoài). Mặt khác, nguồn lỗi nằm ở lớp liên kết dữ liệu (hoặc cao hơn) hoặc ở miền mạng lân cận khác.

Quy tắc số 3.6.

Nếu tỷ lệ lỗi CRC trong tổng số lỗi lớn thì cần xác định độ dài của khung chứa loại lỗi này.

Như chúng tôi đã lưu ý, lỗi CRC có thể xảy ra do va chạm, lỗi trong hệ thống cáp, nguồn nhiễu bên ngoài hoặc bộ thu phát bị lỗi. Một nguyên nhân có thể khác gây ra lỗi CRC có thể là do cổng hub hoặc cổng chuyển mạch bị lỗi thêm một vài byte giả vào cuối khung.

Nếu có tỷ lệ lỗi CRC lớn trong tổng số lỗi thì nên tìm hiểu nguyên nhân xuất hiện của chúng. Để làm điều này, các khung hình bị lỗi trong một loạt phim phải được so sánh với các khung hình tốt tương tự trong cùng một loạt phim. Nếu các khung hình sai ngắn hơn đáng kể so với các khung hình tốt thì rất có thể đây là kết quả của sự va chạm. Nếu các khung bị lỗi có độ dài gần như nhau thì nguyên nhân gây ra biến dạng rất có thể là do nhiễu từ bên ngoài. Nếu khung xấu dài hơn khung tốt thì nguyên nhân rất có thể nằm ở cổng bị lỗi trên hub hoặc bộ chuyển mạch, điều này sẽ thêm các byte “trống” vào cuối khung.

Cách dễ nhất để so sánh độ dài của khung hình sai và khung hình chính xác là thu thập một loạt khung hình có lỗi CRC vào bộ đệm của máy phân tích.

Quy tắc số 3.7.

Bảng 1 hệ thống hóa nguyên nhân gây ra lỗi và va chạm cho giai đoạn 2 và 3
Bảng 1 - Các loại lỗi và va chạm được ghi lại bởi THIẾT BỊ ĐO
Nguyên nhân gây ra lỗi Va chạm cục bộ Đã xóa va chạm Va chạm muộn Cú sút ngắn Cú sút xa nói nhảm lỗi CRC
Card mạng bị lỗi >5% tại
bạn<30%
>5% tại
bạn<30%
Ăn Ăn Ăn Ăn Ăn
Trình điều khiển bảng bị lỗi Ăn Ăn Ăn Ăn
Hub, bộ lặp, bộ thu phát bị lỗi >5% tại
bạn<30%
>5% tại
bạn<30%
Ăn Ăn Ăn
Kết nối không chính xác của thiết bị hoạt động >5% tại
bạn<30%
>5% tại
bạn<30%
Ăn Ăn
Cáp quá dài Ăn Ăn
Hơn 4 bộ lặp hoặc trung tâm xếp tầng Ăn
Nối đất máy tính hoặc cáp đồng trục không đúng cách >5% tại
bạn<30%
>5% tại
bạn<30%
Ăn Ăn Ăn
Khiếm khuyết trong hệ thống cáp và thiết bị thụ động >5% tại
bạn<30%
>5% tại
bạn<30%
Ăn Ăn Ăn
Nguồn ồn gần hệ thống cáp >5% tại
bạn<30%
>5% tại
bạn<30%
Ăn Ăn Ăn
Ghi chú. U - sử dụng kênh liên lạc

Nếu bạn đang chẩn đoán mạng của mình lần đầu tiên và đang gặp sự cố, bạn không nên mong đợi rằng chỉ một thành phần trong mạng của bạn bị lỗi.

Cách đáng tin cậy nhất để khoanh vùng các lỗi là tắt từng trạm, hub và tuyến cáp đáng ngờ, đồng thời kiểm tra cẩn thận cấu trúc liên kết của đường nối đất máy tính (đặc biệt đối với mạng 10Base2).

Nếu mất mạng xảy ra vào những thời điểm không thể đoán trước và không liên quan đến hoạt động của người dùng, hãy kiểm tra mức độ nhiễu trong cáp bằng máy quét cáp. Nếu bạn không có máy quét, hãy kiểm tra trực quan để đảm bảo cáp không đi qua gần các nguồn bức xạ điện từ mạnh: cáp điện áp cao hoặc dòng điện cao, đèn huỳnh quang, động cơ điện, thiết bị sao chép, v.v.

Quy tắc số 3.8.

Việc không có lỗi ở lớp liên kết dữ liệu không đảm bảo rằng thông tin trên mạng của bạn không bị hỏng.

Nó đã được đề cập ở phần đầu của phần này rằng tác động của lỗi lớp liên kết đến hoạt động của mạng đã bị phóng đại quá mức. Hậu quả của lỗi mức độ thấp là việc truyền lại khung. Nhờ tốc độ cao của mạng Ethernet (đặc biệt là Fast Ethernet) và hiệu suất cao của các máy tính hiện đại, các lỗi ở mức độ thấp không ảnh hưởng đáng kể đến thời gian phản hồi của phần mềm ứng dụng.

Chúng tôi rất hiếm khi gặp phải trường hợp chỉ loại bỏ các lỗi ở cấp độ thấp hơn (kênh và vật lý) của mạng có thể cải thiện đáng kể thời gian phản hồi của phần mềm ứng dụng. Các vấn đề chủ yếu liên quan đến những khiếm khuyết nghiêm trọng trong hệ thống cáp của mạng.

Các lỗi như biến mất hoặc biến dạng thông tin trong card mạng, bộ định tuyến hoặc bộ chuyển mạch trong trường hợp hoàn toàn không có thông tin về lỗi ở mức thấp hơn có tác động lớn hơn nhiều đến hoạt động của phần mềm ứng dụng trên mạng. Chúng tôi sử dụng từ “thông tin” vì tại thời điểm bóp méo dữ liệu vẫn chưa được đóng khung.

Lý do cho những khiếm khuyết như sau. Thông tin bị bóp méo (hoặc biến mất) “trong sâu” của thiết bị đang hoạt động - card mạng, bộ định tuyến hoặc bộ chuyển mạch. Trong trường hợp này, bộ phận truyền và nhận của thiết bị này sẽ tính toán trình tự điều khiển (CRC) chính xác của thông tin bị lỗi trước đó và khung được định dạng chính xác sẽ được truyền qua mạng. Đương nhiên, không có lỗi nào được ghi lại trong trường hợp này. Các tác nhân SNMP được tích hợp trong thiết bị hoạt động không thể trợ giúp ở đây.

Đôi khi, ngoài sự biến dạng, thông tin còn biến mất. Thông thường nó xảy ra trên các card mạng giá rẻ hoặc trên các bộ chuyển mạch Ethernet-FDDI. Cơ chế biến mất thông tin trong trường hợp sau là rõ ràng. Trong một số bộ chuyển mạch Ethernet-FDDI, không có phản hồi từ cổng nhanh đến cổng chậm (hoặc ngược lại), do đó, cổng còn lại không nhận được thông tin về tình trạng tắc nghẽn của bộ đệm đầu vào/đầu ra của bộ chuyển mạch nhanh. (chậm) cổng. Trong trường hợp này, khi lưu lượng truy cập lớn, thông tin trên một trong các cổng có thể bị mất.

Một quản trị viên mạng có kinh nghiệm có thể lập luận rằng ngoài việc bảo vệ thông tin ở cấp độ liên kết trong giao thức IPX và TCP/IP, còn có thể bảo vệ thông tin bằng cách sử dụng tổng kiểm tra.

Chỉ có thể dựa vào tính năng bảo vệ tổng kiểm tra đầy đủ nếu phần mềm ứng dụng sử dụng TCP hoặc UDP làm giao thức truyền tải. Chỉ khi chúng được sử dụng, toàn bộ gói tin mới được bảo vệ bằng tổng kiểm tra. Nếu IPX/SPX hoặc chính IP được sử dụng làm “truyền tải” thì chỉ tiêu đề gói được bảo vệ bằng tổng kiểm tra.

Ngay cả với tính năng bảo vệ tổng kiểm tra, sự biến dạng hoặc biến mất thông tin được mô tả sẽ làm tăng đáng kể thời gian phản hồi của phần mềm ứng dụng.

Nếu không cài đặt biện pháp bảo vệ thì hoạt động của phần mềm ứng dụng có thể không thể đoán trước được.

Ngoài việc thay thế (vô hiệu hóa) thiết bị đáng ngờ, những khiếm khuyết đó có thể được xác định theo hai cách.

Phương pháp đầu tiên là chụp, giải mã và phân tích các khung hình từ trạm, bộ định tuyến hoặc bộ chuyển mạch đáng ngờ. Triệu chứng của lỗi được mô tả là việc truyền lại gói IP hoặc IPX, không xảy ra trước lỗi ở lớp mạng thấp hơn. Một số máy phân tích giao thức và hệ thống chuyên gia đơn giản hóa nhiệm vụ bằng cách thực hiện phân tích dấu vết hoặc tự tính toán tổng kiểm tra gói.

Phương pháp thứ hai là phương pháp kiểm tra sức chịu tải của mạng.

Kết luận. Nhiệm vụ chính của việc chẩn đoán mức độ liên kết của mạng là xác định sự hiện diện của số lượng xung đột và lỗi ngày càng tăng trong mạng và tìm ra mối quan hệ giữa số lượng lỗi, mức độ tắc nghẽn của kênh liên lạc, cấu trúc liên kết mạng và vị trí của thiết bị đo. Tất cả các phép đo phải được thực hiện dựa trên nền tảng của máy phân tích tạo ra các giao thức lưu lượng riêng của nó.

Nếu xác định rằng số lượng lỗi và xung đột tăng lên không phải là hậu quả của tắc nghẽn kênh liên lạc thì cần phải thay thế thiết bị mạng trong quá trình hoạt động có số lượng lỗi tăng lên.

Nếu bạn không thể xác định được mối quan hệ giữa hoạt động của thiết bị cụ thể và việc xảy ra lỗi thì hãy tiến hành kiểm tra toàn diện hệ thống cáp, kiểm tra mức độ nhiễu trong cáp, cấu trúc liên kết của đường nối đất máy tính và chất lượng nguồn cung cấp. Vôn.

Những thông số nào cần được theo dõi khi chẩn đoán mạng? Phương pháp chẩn đoán mạng chủ động

Kỹ thuật chẩn đoán chủ động như sau. Quản trị viên mạng phải giám sát hoạt động của mạng liên tục hoặc trong thời gian dài. Nên thực hiện những quan sát như vậy kể từ thời điểm cài đặt. Dựa trên những quan sát này, trước tiên, quản trị viên phải xác định xem giá trị của các tham số được quan sát ảnh hưởng như thế nào đến công việc của người dùng mạng và thứ hai là chúng thay đổi như thế nào trong một khoảng thời gian dài: một ngày làm việc, tuần, tháng, quý , năm, v.v.

Các thông số quan sát được thường là:

  • thông số vận hành của kênh liên lạc mạng - việc sử dụng kênh liên lạc, số lượng khung được nhận và truyền bởi mỗi trạm mạng, số lỗi trong mạng, số lượng khung phát sóng và phát đa hướng, v.v.;
  • thông số vận hành máy chủ - mức sử dụng bộ xử lý máy chủ, số lượng yêu cầu bị trì hoãn (chờ) vào đĩa, tổng số bộ đệm bộ đệm, số bộ đệm bộ đệm "bẩn", v.v.

Biết được mối quan hệ giữa thời gian phản hồi của phần mềm ứng dụng và các giá trị của các tham số quan sát được, quản trị viên mạng phải xác định các giá trị tham số tối đa được phép đối với một mạng nhất định. Các giá trị này được nhập dưới dạng ngưỡng vào công cụ chẩn đoán. Nếu trong quá trình vận hành mạng, giá trị của các tham số quan sát được vượt quá giá trị ngưỡng, công cụ chẩn đoán sẽ thông báo cho quản trị viên mạng về sự kiện này. Tình huống này cho thấy có vấn đề trong mạng.

Bằng cách quan sát hoạt động của kênh liên lạc và máy chủ trong một thời gian đủ dài, bạn có thể thiết lập xu hướng về giá trị của các thông số vận hành mạng khác nhau (mức sử dụng tài nguyên, số lỗi, v.v.). Dựa trên những quan sát như vậy, quản trị viên có thể đưa ra kết luận về sự cần thiết phải thay thế thiết bị đang hoạt động hoặc thay đổi kiến ​​trúc mạng.

Nếu một sự cố xuất hiện trên mạng, quản trị viên phải ghi kết xuất dấu vết kênh vào một bộ đệm hoặc tệp đặc biệt tại thời điểm nó xuất hiện và dựa trên phân tích nội dung của nó, đưa ra kết luận về các nguyên nhân có thể xảy ra của sự cố.