Các loại hệ thống tập tin. Hệ thống tập tin. Cấu trúc hệ thống tập tin

Các tệp trên phương tiện lưu trữ (ổ cứng, ổ flash, phương tiện quang, v.v.) được sắp xếp, lưu trữ và đặt tên theo một thứ tự cụ thể, được gọi là hệ thống tệp. Các phương tiện truyền thông khác nhau có khác nhau các loại hệ thống tập tin. Người dùng bình thường có thể gặp phải ai trong số họ?

Hệ thống tệp tổ chức các tệp để giúp hệ điều hành làm việc với chúng dễ dàng hơn.: trình điều khiển hệ thống tệp truyền dữ liệu tới HĐH về tên tệp, kích thước, thuộc tính và vị trí của chúng. Hệ thống tệp xác định độ dài tối đa có thể có của tên tệp, kích thước tối đa của nó và các tham số khác.

Có nhiều loại hệ thống tập tin khác nhau cho các phương tiện khác nhau. Nhân tiện, phương tiện không nhất thiết phải là vật lý: chẳng hạn như có hệ thống tệp ảo và mạng. Có những loại hệ thống tập tin nào tùy thuộc vào mục đích của chúng, tức là phương tiện lưu trữ?

Trước hết, người dùng phải đối mặt với hệ thống tập tin được thiết kế cho phương tiện truy cập ngẫu nhiên. Các phương tiện như vậy bao gồm, ví dụ, ổ đĩa cứng. Nếu bạn đang sử dụng hệ điều hành Windows thì rất có thể bạn đang xử lý hệ thống tệp NTFS. Các phiên bản cũ hơn của hệ điều hành sử dụng hệ thống tệp FAT32, vẫn được sử dụng trên ổ đĩa flash.

Trong nhiều bản phân phối hệ điều hành dựa trên nhân Linux, hệ thống tệp mặc định thường là máy lẻ(Hệ thống tệp mở rộng - hệ thống tệp mở rộng). Có một số phiên bản của hệ thống tập tin này - ext2, ext3, ext4. Trong các phiên bản phân phối gần đây dựa trên nhân Linux (bao gồm cả Google Android), hệ thống tệp là ext4.

Họ cũng có hệ thống tập tin riêng của họ. phương tiện quang học- Đĩa CD và DVD. Tiêu chuẩn được coi là phổ quát ISO 9660, những đĩa như vậy được đọc bởi máy tính chạy bất kỳ hệ điều hành nào - Windows, Mac OS X, Unix. Ngoài ra còn có một định dạng hệ thống tập tin UDF, phù hợp hơn với các đĩa dung lượng lớn (DVD, Blu-ray). Có những hệ thống tập tin khác dành cho đĩa quang ít phổ biến hơn.

Chúng tôi gặp ổ đĩa cứng và ổ đĩa flash thường xuyên hơn các phương tiện khác, đó là lý do tại sao hệ thống tệp của chúng khiến chúng tôi quan tâm nhất. Nhưng vẫn đáng để biết có những loại hệ thống tập tin nào khác:

  • hệ thống tập tin ảo;
  • hệ thống tập tin mạng;
  • hệ thống tập tin cho phương tiện truy cập tuần tự (điều này bao gồm băng từ);
  • hệ thống tập tin cho bộ nhớ flash;
  • hệ thống tập tin chuyên dụng.

Hãy nói thêm một chút về các loại hệ thống tệp được thiết kế cho phương tiện truy cập ngẫu nhiên, chẳng hạn như ổ đĩa cứng và ổ đĩa flash. Loại hệ thống tệp cụ thể ảnh hưởng đến các tham số của tệp, ví dụ: kích thước của tên tệp. Trong hệ thống FAT32, độ dài tên tệp tối đa là 255 ký tự. Trong NTFS, theo thông số kỹ thuật, có 32.768 ký tự, nhưng một số hệ điều hành áp đặt giới hạn nên trên thực tế độ dài tối đa sẽ là 255 ký tự Unicode. Trong ext2/ext3, độ dài tên được giới hạn ở 255 byte.

Cũng Các thuộc tính tệp có thể có phụ thuộc vào hệ thống tệp. Do đó, hệ thống FAT32 và NTFS cho phép bạn gán các thuộc tính “chỉ đọc”, “hệ thống”, “ẩn” và “lưu trữ” cho các tệp. Và hệ thống ext2 cung cấp các thuộc tính như “đặt ID người dùng”, “đặt ID nhóm” và cái gọi là “bit dính”.

Cũng có sự khác biệt giữa hệ thống tệp FAT32 và NTFS.. Cả hai hệ thống tệp này đều được hệ điều hành Windows sử dụng; hệ thống NTFS đã thay thế FAT32 và được sử dụng trong các phiên bản mới nhất của hệ điều hành. Trong hệ thống FAT32, kích thước đĩa được giới hạn ở khoảng 8 terabyte; ở NTFS, nó có thể là 264 byte. Kích thước tệp tối đa trong FAT32 là 4 GB, ở NTFS là 264 byte trừ 1 kilobyte (về mặt lý thuyết), nhưng trên thực tế là 244 byte trừ 64 kilobyte. Ngoài ra, NTFS có số lượng tệp tối đa lớn hơn và có một số khác biệt khác.

Nhưng tại cùng một thời điểm Hệ thống FAT32 vẫn được sử dụng trên ổ flash USB (ổ flash), vì nó cung cấp tốc độ cao hơn để ghi, đọc và sao chép dữ liệu. Do đó, hầu hết các ổ đĩa flash thường được định dạng ở FAT32 chứ không phải ở NTFS. Việc định dạng ổ đĩa flash ở dạng NTFS chỉ có ý nghĩa nếu bạn cần ghi một tệp lớn hơn 4 GB vào đó.

Bây giờ bạn biết, các loại hệ thống tập tin chính là gì? và trong trường hợp nào bạn có thể gặp phải một hệ thống tệp cụ thể.

CƠ QUAN GIÁO DỤC LIÊN BANG

CƠ SỞ GIÁO DỤC NHÀ NƯỚC

GIÁO DỤC CHUYÊN NGHIỆP CAO CẤP

"ĐẠI HỌC TIỂU BANG ST PETERSBURG

KINH TẾ VÀ TÀI CHÍNH"

BỘ KHOA THÔNG TIN

Tóm tắt về khoa học máy tính

về chủ đề:

Hệ thống tập tin

Hoàn thành: sinh viên 110 nhóm O110

E.V.Andreeva

Người giám sát: giáo sư E.A. Osipova

Saint Petersburg

2009

Giới thiệu……………………………………3

1. Hệ thống tập tin FAT………………………..4

2. Hệ thống tập tin FAT32…………..5

3. Hệ thống tập tin HPFS…………………………6

4. Hệ thống tập tin NTFS…………………………8

Kết luận……………………….9

Danh sách tài liệu tham khảo………………………..10

Giới thiệu

Hệ thống tập tin là thứ khiến cho trật tự trên ổ cứng của chúng ta không còn lý tưởng nhưng vẫn ở mức tối thiểu. Phương tiện lưu trữ chỉ có khả năng lưu trữ, ghi hoặc đọc các bit dữ liệu từ một số khu vực nhất định và hệ thống tệp chịu trách nhiệm truy cập thông tin. Thuật ngữ này có thể được đưa ra một số định nghĩa, mỗi định nghĩa đều đúng. Hệ thống tệp là một hệ thống tổ chức và lưu trữ thông tin trên ổ cứng hoặc phương tiện khác, các thuật toán phần mềm hệ điều hành để quản lý hệ thống tổ chức thông tin này và cuối cùng, ở cấp độ hàng ngày, nó là tập hợp tất cả các tệp và thư mục trên một máy tính. đĩa.

Hệ thống tập tin xác định:

Cách các tập tin và thư mục được lưu trữ trên đĩa;

Thông tin nào được lưu trữ về các tập tin và thư mục;

Làm cách nào bạn có thể biết phần nào của đĩa còn trống và phần nào không;

Định dạng thư mục và thông tin dịch vụ khác trên đĩa.

Chúng ta sẽ xem xét bốn hệ thống tệp - FAT, FAT 32, HPFS, NTFS.

1. Hệ thống tập tin MẬP

FAT là hệ thống tập tin đơn giản nhất được hỗ trợ bởi Windows NT. Cơ sở của hệ thống tệp FAT là bảng phân bổ tệp, nằm ở đầu tập.

Đĩa được định dạng bằng hệ thống tệp FAT được chia thành các cụm, kích thước của cụm này phụ thuộc vào kích thước của ổ đĩa. Đồng thời với việc tạo tệp, một mục nhập được tạo trong thư mục và số cụm đầu tiên chứa dữ liệu được đặt.

Việc cập nhật bảng cấp phát file rất quan trọng và tốn thời gian. Nếu bảng cấp phát file không được cập nhật thường xuyên có thể dẫn đến mất dữ liệu.

Thư mục FAT không có cấu trúc cụ thể và các tập tin được ghi vào vùng trống đầu tiên có sẵn trên đĩa. Ngoài ra, hệ thống tệp FAT chỉ hỗ trợ bốn thuộc tính tệp: Hệ thống, Ẩn, Chỉ đọc và Lưu trữ.

Ưu điểm của hệ thống tập tin FAT

Trên máy tính chạy Windows NT, bạn không thể hoàn tác thao tác xóa trên bất kỳ hệ thống tệp được hỗ trợ nào. Hệ thống tệp FAT là tốt nhất để sử dụng trên các đĩa và phân vùng có kích thước lên tới 200 MB vì ​​nó chạy với chi phí tối thiểu.

Nhược điểm của hệ thống tập tin FAT

Bạn không nên sử dụng hệ thống tệp FAT cho các đĩa và phân vùng lớn hơn 200 MB. Điều này là do khi kích thước ổ đĩa tăng lên, hiệu suất của hệ thống tệp FAT sẽ giảm nhanh chóng. Không thể đặt quyền cho các tệp nằm trên phân vùng FAT.
Phân vùng FAT có giới hạn kích thước: 4 GB cho Windows NT và 2 GB cho MS-DOS.

Hệ thống tập tin 2.FAT32

FAT 32 là một chuỗi dữ liệu liên kết các cụm và tệp không gian đĩa với nhau. Chỉ có một phần tử trong cơ sở dữ liệu cụm. Trong số này, hai phần tử đầu tiên thể hiện thông tin về hệ thống FAT - 32, phần tử thứ ba và các phần tử tiếp theo được đặt theo cụm không gian đĩa.
Số lượng cụm lớn nhất trong hệ thống tệp này là 268.435.445 cụm. Hệ thống này cho phép sử dụng ổ cứng lên tới 32 GB. Tuy nhiên, FAT có thể hỗ trợ không gian lưu trữ có kích thước lên tới 2 terabyte! Ban đầu, hệ thống tệp này được sử dụng như một phần của Windows 95 OSR 2. Chính trong hệ thống tệp này, các thuộc tính tệp đã được mở rộng, giúp lưu trữ ngày giờ tạo cũng như sửa đổi lần truy cập cuối cùng vào tệp hoặc danh mục.

Hệ điều hành FAT – 32 cũng cho phép bạn làm việc với bất kỳ bản sao FAT 32 nào.

MẬP 32:

1. Tốc độ cao;

2. Yêu cầu RAM thấp;

3. Làm việc hiệu quả với các tệp vừa và nhỏ;

4. Độ mòn đĩa thấp hơn do đầu đọc/ghi chuyển động ít hơn.

Nhược điểm của hệ thống tập tin MẬP 32:

1. Khả năng bảo vệ thấp trước các lỗi hệ thống;

2. Làm việc không hiệu quả với các tệp lớn;

3. Giới hạn dung lượng tối đa của phân vùng và tệp;

4. Giảm hiệu suất do bị phân mảnh;

5. Giảm hiệu suất khi làm việc với các thư mục chứa số lượng lớn tệp

3. Hệ thống tập tin HPFS

Hệ thống tệp HPFS lần đầu tiên được sử dụng cho hệ điều hành OS/2 1.2 để cung cấp quyền truy cập vào các ổ đĩa lớn đang xuất hiện trên thị trường vào thời điểm đó.

Hệ thống tệp HPFS hỗ trợ cấu trúc thư mục FAT và thêm tính năng sắp xếp tệp theo tên. Tên tệp có thể chứa tối đa 254 ký tự byte kép. Ngoài ra, khối nhỏ nhất để lưu trữ dữ liệu hiện bằng kích thước của cung vật lý (512 byte), giúp giảm lãng phí dung lượng ổ đĩa.

Ngoài các thuộc tính tệp, thư mục hệ thống tệp HPFS còn lưu trữ thông tin tạo và sửa đổi, cũng như ngày và giờ truy cập. Các mục nhập thư mục hệ thống tệp HPFS trỏ đến FNODE chứ không phải cụm đầu tiên của tệp. FNODE có thể chứa dữ liệu tệp, con trỏ tới dữ liệu tệp hoặc các cấu trúc khác trỏ tới dữ liệu tệp.

HPFS cố gắng đặt dữ liệu tệp vào các khu vực liền kề bất cứ khi nào có thể. Điều này dẫn đến tăng tốc độ xử lý tập tin tuần tự.

HPFS chia đĩa thành các khối có dung lượng 8 MB mỗi khối và luôn cố gắng ghi một tệp trong cùng một khối. Việc chặn dẫn đến hiệu suất được cải thiện.
Ngoài ra, hệ thống tệp HPFS chứa hai đối tượng dữ liệu duy nhất:

· Siêu khối

Siêu khối nằm ở khu vực logic 16 và chứa một con trỏ tới FNODE của thư mục gốc. Đây là mối nguy hiểm chính khi sử dụng HPFS: nếu một khu vực siêu khối được đánh dấu là bị hỏng, điều này sẽ dẫn đến mất tất cả dữ liệu phân vùng, ngay cả trên các vùng không bị hư hại của đĩa. Để khôi phục dữ liệu, bạn cần sao chép nó sang một đĩa khác có cung 16 nguyên vẹn và tạo lại siêu khối.

· Khối dự phòng

Khối dự phòng nằm ở khu vực logic 17 và chứa bảng vá lỗi khẩn cấp cũng như khối thư mục dự phòng. Trong hệ thống tệp HPFS, mục nhập bảng sửa lỗi nóng được sử dụng khi phát hiện khu vực xấu để trỏ một cách hợp lý đến khu vực không xấu hiện có ở vị trí của nó. Công nghệ xử lý lỗi ghi này được gọi là sửa lỗi khẩn cấp.

Ưu điểm của hệ thống tệp HPFS

HPFS là tùy chọn hệ thống tệp tối ưu để sử dụng với các đĩa có kích thước 200–400 MB.

Nhược điểm của hệ thống tệp HPFS

Chi phí bổ sung liên quan đến việc sử dụng HPFS làm giảm hiệu quả của nó trên các đĩa nhỏ hơn 200 MB. Ngoài ra, hiệu suất cũng giảm khi sử dụng đĩa lớn hơn 400 MB. Khi sử dụng HPFS trong Windows NT, bạn không thể đặt cài đặt bảo mật.

Hệ thống tệp HPFS chỉ được hỗ trợ bởi Windows NT phiên bản 3.1, 3.5 và 3.51. Bạn không thể truy cập phân vùng HPFS bằng Windows NT 4.0.

4. Hệ thống tập tin NTFS

Hệ thống tệp Windows NT (NTFS) cung cấp hiệu suất, độ tin cậy và khả năng tương thích. NTFS được phát triển để đảm bảo hiệu suất cao cho các hoạt động tệp tiêu chuẩn (bao gồm đọc, ghi, tìm kiếm) và cung cấp các khả năng nâng cao.
Ngoài ra, NTFS còn có các đặc tính bảo mật cần thiết trên các máy chủ tập tin mạnh mẽ và các máy tính hiệu suất cao trong môi trường doanh nghiệp. Hệ thống tệp NTFS hỗ trợ kiểm soát truy cập dữ liệu và đặc quyền của chủ sở hữu. NTFS là hệ thống tệp duy nhất trong Windows NT cho phép bạn gán quyền truy cập vào từng tệp riêng lẻ.
Hệ thống tập tin NTFS đơn giản nhưng cực kỳ mạnh mẽ. Hầu hết mọi thứ trên một ổ đĩa đều là một tệp và mọi thứ trên một tệp đều là một thuộc tính, bao gồm thuộc tính dữ liệu, thuộc tính bảo mật và thuộc tính tên tệp. Mỗi khu vực bị chiếm dụng trên ổ đĩa NTFS thuộc về một tệp.

Ưu điểm của hệ thống tập tin NTFS :

1. Tốc độ truy cập nhanh vào các tệp nhỏ;

2. Dung lượng ổ đĩa ngày nay thực tế là không giới hạn;

3. Sự phân mảnh tệp không ảnh hưởng đến bản thân hệ thống tệp;

4. Độ tin cậy cao của việc lưu trữ dữ liệu và cấu trúc tệp;

5. Hiệu suất cao khi làm việc với các tệp lớn;

Nhược điểm của hệ thống tập tin NTFS :

Tổng quan. Trong lý thuyết khoa học máy tính, ba loại cấu trúc dữ liệu chính sau đây được xác định: tuyến tính, dạng bảng, phân cấp. Sách ví dụ: trình tự các tờ - cấu trúc tuyến tính. Các phần, phần, chương, đoạn - thứ bậc. Mục lục – bảng – kết nối – phân cấp tuyến tính. Dữ liệu có cấu trúc có thuộc tính mới - Địa chỉ. Vì thế:

      Cấu trúc tuyến tính (danh sách, vectơ). Danh sách thường xuyên. Địa chỉ của mỗi phần tử được xác định duy nhất bởi số của nó. Nếu tất cả các phần tử của danh sách có độ dài bằng nhau – vectơ dữ liệu.

      Cấu trúc dạng bảng (bảng, ma trận). Sự khác biệt giữa bảng và danh sách - mỗi phần tử - được xác định bởi một địa chỉ, không phải một mà bao gồm một số tham số. Ví dụ phổ biến nhất là ma trận - địa chỉ - hai tham số - số hàng và số cột. Các bảng đa chiều.

      Cấu trúc phân cấp. Được sử dụng để trình bày dữ liệu bất thường. Địa chỉ được xác định bởi tuyến đường - từ ngọn cây. Hệ thống tập tin - máy tính. (Tuyến đường có thể vượt quá kích thước dữ liệu, phân đôi - luôn có hai nhánh - trái và phải).

Sắp xếp cấu trúc dữ liệu Phương pháp chính là sắp xếp. ! Khi thêm một phần tử mới vào cấu trúc có thứ tự, có thể thay đổi địa chỉ của phần tử hiện có. Đối với cấu trúc phân cấp - lập chỉ mục - mỗi phần tử có một số duy nhất - sau đó được sử dụng để sắp xếp và tìm kiếm.

    Các thành phần cơ bản của một hệ thống tập tin

Bước lịch sử đầu tiên trong việc lưu trữ và quản lý dữ liệu là việc sử dụng các hệ thống quản lý tệp.

Tệp là một vùng được đặt tên của bộ nhớ ngoài có thể được ghi vào và đọc từ đó. Ba tham số:

    chuỗi số byte tùy ý,

    một tên riêng duy nhất (thực ra là một địa chỉ).

    dữ liệu cùng loại - loại tệp.

Các quy tắc đặt tên tệp, cách truy cập dữ liệu được lưu trữ trong tệp và cấu trúc của dữ liệu đó phụ thuộc vào hệ thống quản lý tệp cụ thể và có thể vào loại tệp.

Hệ thống tệp được phát triển đầu tiên, theo nghĩa hiện đại, được IBM phát triển cho dòng 360 của mình (1965-1966). Nhưng trong các hệ thống hiện tại, nó thực tế không được sử dụng. Cấu trúc dữ liệu danh sách được sử dụng (EC-volume, phần, tệp).

Hầu hết các bạn đều quen thuộc với hệ thống tập tin của các hệ điều hành hiện đại. Đây chủ yếu là MS DOS, Windows và một số có cấu trúc hệ thống tệp cho các biến thể UNIX khác nhau.

Cấu trúc tập tin. Một tập tin đại diện cho một tập hợp các khối dữ liệu nằm trên phương tiện bên ngoài. Để trao đổi với đĩa từ ở cấp độ phần cứng, bạn cần chỉ định số trụ, số bề mặt, số khối trên rãnh tương ứng và số byte cần ghi hoặc đọc từ đầu khối này. Do đó, tất cả các hệ thống tệp đều phân bổ rõ ràng hoặc ngầm định một số mức cơ bản để đảm bảo hoạt động với các tệp đại diện cho một tập hợp các khối có thể định địa chỉ trực tiếp trong không gian địa chỉ.

Đặt tên các tập tin. Tất cả các hệ thống tệp hiện đại đều hỗ trợ đặt tên tệp đa cấp bằng cách duy trì các tệp bổ sung có cấu trúc đặc biệt - thư mục - trong bộ nhớ ngoài. Mỗi thư mục chứa tên của các thư mục và/hoặc tệp có trong thư mục đó. Như vậy, tên đầy đủ của một tệp bao gồm danh sách tên thư mục cộng với tên của tệp trong thư mục chứa ngay tệp đó. Sự khác biệt giữa cách đặt tên tệp trên các hệ thống tệp khác nhau là nơi chuỗi tên bắt đầu. (Unix, DOS-Windows)

Bảo vệ tập tin. Hệ thống quản lý tệp phải cung cấp quyền truy cập vào tệp. Nói chung, cách tiếp cận là liên quan đến từng người dùng đã đăng ký của một hệ thống máy tính nhất định, đối với mỗi tệp hiện có, các hành động được phép hoặc bị cấm đối với người dùng này sẽ được chỉ định. Đã có những nỗ lực để thực hiện phương pháp này một cách đầy đủ. Nhưng điều này gây ra quá nhiều chi phí cả trong việc lưu trữ thông tin dư thừa và sử dụng thông tin này để kiểm soát khả năng đủ điều kiện truy cập. Do đó, hầu hết các hệ thống quản lý tệp hiện đại đều sử dụng phương pháp bảo vệ tệp được triển khai lần đầu tiên trong UNIX (1974). Trong hệ thống này, mỗi người dùng đã đăng ký được liên kết với một cặp số nhận dạng số nguyên: số nhận dạng của nhóm mà người dùng này thuộc về và số nhận dạng của chính người dùng đó trong nhóm. Theo đó, đối với mỗi tệp, mã định danh đầy đủ của người dùng đã tạo tệp này sẽ được lưu trữ và ghi chú những hành động mà bản thân anh ta có thể thực hiện với tệp, những hành động nào với tệp có sẵn cho những người dùng khác trong cùng nhóm và những gì người dùng của các nhóm khác có thể làm gì với tập tin. Thông tin này rất nhỏ gọn, cần vài bước trong quá trình xác minh và phương pháp kiểm soát truy cập này đáp ứng được yêu cầu trong hầu hết các trường hợp.

Chế độ truy cập nhiều người dùng. Nếu hệ điều hành hỗ trợ chế độ nhiều người dùng, hoàn toàn có thể có hai hoặc nhiều người dùng cố gắng làm việc đồng thời với cùng một tệp. Nếu tất cả những người dùng này chỉ đọc tệp thì sẽ không có gì xấu xảy ra. Nhưng nếu ít nhất một trong số họ thay đổi tệp thì cần phải đồng bộ hóa lẫn nhau để nhóm này hoạt động chính xác. Trong lịch sử, các hệ thống tập tin đã thực hiện cách tiếp cận sau. Trong thao tác mở tệp (thao tác đầu tiên và bắt buộc mà phiên làm việc với tệp sẽ bắt đầu), trong số các tham số khác, chế độ vận hành (đọc hoặc thay đổi) đã được chỉ định. + có các quy trình đặc biệt để đồng bộ hóa hành động của người dùng. Không được phép bởi hồ sơ!

    Ghi nhật ký trong hệ thống tập tin. Nguyên tắc chung.

Việc chạy kiểm tra hệ thống (fsck) trên các hệ thống tệp lớn có thể mất nhiều thời gian, điều này thật đáng tiếc đối với các hệ thống tốc độ cao ngày nay. Lý do tại sao không có tính toàn vẹn trong hệ thống tệp có thể là do việc ngắt kết nối không chính xác, chẳng hạn như đĩa đang được ghi vào thời điểm chấm dứt. Các ứng dụng có thể cập nhật dữ liệu chứa trong các tệp và hệ thống có thể cập nhật siêu dữ liệu của hệ thống tệp, đó là “dữ liệu về dữ liệu hệ thống tệp”, nói cách khác, thông tin về khối nào được liên kết với tệp nào, tệp nào nằm trong thư mục nào, và những thứ tương tự. Lỗi (thiếu tính toàn vẹn) trong tệp dữ liệu là xấu, nhưng tệ hơn nhiều là lỗi trong siêu dữ liệu hệ thống tệp, có thể dẫn đến mất tệp và các sự cố nghiêm trọng khác.

Để giảm thiểu các vấn đề về tính toàn vẹn và giảm thiểu thời gian khởi động lại hệ thống, hệ thống tệp được ghi nhật ký sẽ duy trì một danh sách các thay đổi mà nó sẽ thực hiện đối với hệ thống tệp trước khi thực sự ghi các thay đổi. Những bản ghi này được lưu trữ trong một phần riêng biệt của hệ thống tệp được gọi là "nhật ký" hoặc "nhật ký". Khi các mục nhập nhật ký (nhật ký) này được ghi một cách an toàn, hệ thống tệp nhật ký sẽ thực hiện những thay đổi này đối với hệ thống tệp và sau đó xóa các mục nhập này khỏi “nhật ký” (nhật ký). Các mục nhật ký được sắp xếp thành các tập hợp các thay đổi trong hệ thống tệp có liên quan, giống như cách các thay đổi được thêm vào cơ sở dữ liệu được sắp xếp thành các giao dịch.

Hệ thống tệp được ghi nhật ký sẽ tăng khả năng toàn vẹn vì các mục nhập tệp nhật ký được thực hiện trước khi thực hiện thay đổi đối với hệ thống tệp và do hệ thống tệp giữ lại các mục nhập đó cho đến khi chúng được áp dụng đầy đủ và an toàn cho hệ thống tệp. Khi bạn khởi động lại máy tính sử dụng hệ thống tệp được ghi nhật ký, chương trình gắn kết có thể đảm bảo tính toàn vẹn của hệ thống tệp bằng cách kiểm tra tệp nhật ký để tìm những thay đổi dự kiến ​​nhưng không được thực hiện và ghi chúng vào hệ thống tệp. Trong hầu hết các trường hợp, hệ thống không cần kiểm tra tính toàn vẹn của hệ thống tệp, điều đó có nghĩa là máy tính sử dụng hệ thống tệp được ghi nhật ký sẽ có sẵn để sử dụng gần như ngay lập tức sau khi khởi động lại. Theo đó, khả năng mất dữ liệu do sự cố trong hệ thống tệp sẽ giảm đáng kể.

Hình thức cổ điển của hệ thống tệp được ghi nhật ký là lưu trữ các thay đổi trong siêu dữ liệu của hệ thống tệp trong nhật ký (nhật ký) và lưu trữ các thay đổi đối với tất cả dữ liệu hệ thống tệp, bao gồm cả các thay đổi đối với chính các tệp đó.

    Hệ thống tập tin MS-DOS (FAT)

Hệ thống tệp MS-DOS là một hệ thống tệp dựa trên cây dành cho các đĩa nhỏ và cấu trúc thư mục đơn giản, với thư mục gốc là thư mục gốc và các lá là các tệp và thư mục khác, có thể trống. Các tệp được hệ thống tệp này quản lý được đặt trong các cụm, kích thước của chúng có thể dao động từ 4 KB đến 64 KB theo bội số của 4 mà không sử dụng thuộc tính kề theo cách hỗn hợp để phân bổ bộ nhớ đĩa. Ví dụ, hình này hiển thị ba tập tin. Tệp File1.txt khá lớn: nó bao gồm ba khối liên tiếp. Tệp nhỏ File3.txt chỉ sử dụng không gian của một khối được phân bổ. Tệp thứ ba là File2.txt. là một tập tin bị phân mảnh lớn. Trong mỗi trường hợp, điểm vào trỏ đến khối có thể cấp phát đầu tiên thuộc sở hữu của tệp. Nếu một tệp sử dụng nhiều khối được phân bổ thì khối trước đó sẽ trỏ đến khối tiếp theo trong chuỗi. Giá trị FFF được xác định ở cuối chuỗi.

Phân vùng đĩa FAT

Để truy cập tập tin một cách hiệu quả, hãy sử dụng Bảng phân bổ tập tin– Bảng phân bổ tệp, nằm ở đầu phân vùng (hoặc ổ đĩa logic). Chính từ tên của bảng phân bổ mà tên của hệ thống tệp này – FAT – bắt nguồn từ đó. Để bảo vệ phân vùng, hai bản sao FAT được lưu trữ trên đó phòng trường hợp một trong số chúng bị hỏng. Ngoài ra, các bảng phân bổ file phải được đặt ở những địa chỉ cố định nghiêm ngặt để các file cần thiết để khởi động hệ thống được định vị chính xác.

Bảng phân bổ tệp bao gồm các phần tử 16 bit và chứa thông tin sau về từng cụm đĩa logic:

    cụm không được sử dụng;

    cụm được sử dụng bởi tập tin;

    cụm xấu;

    cụm tập tin cuối cùng;.

Vì mỗi cụm phải được gán một số 16-bit duy nhất nên FAT hỗ trợ tối đa 216 hoặc 65.536 cụm trên một đĩa logic (và cũng dành một số cụm cho nhu cầu riêng của nó). Do đó, chúng tôi nhận được kích thước đĩa tối đa do MS-DOS cung cấp là 4 GB. Kích thước cụm có thể tăng hoặc giảm tùy thuộc vào kích thước đĩa. Tuy nhiên, khi kích thước ổ đĩa vượt quá một giá trị nhất định, các cụm sẽ trở nên quá lớn, dẫn đến tình trạng phân mảnh ổ đĩa bên trong. Ngoài thông tin về file, bảng cấp phát file còn có thể chứa thông tin về thư mục. Điều này coi các thư mục là các tệp đặc biệt với các mục nhập 32 byte cho mỗi tệp có trong thư mục đó. Thư mục gốc có kích thước cố định - 512 mục cho đĩa cứng và đối với đĩa mềm, kích thước này được xác định bởi kích thước của đĩa mềm. Ngoài ra, thư mục gốc nằm ngay sau bản sao thứ hai của FAT vì nó chứa các tệp cần thiết cho bộ tải khởi động MS-DOS.

Khi tìm kiếm một tập tin trên đĩa, MS-DOS buộc phải xem qua cấu trúc thư mục để tìm ra nó. Ví dụ: để chạy tệp thực thi C:\Program\NC4\nc.exe tìm tệp thực thi bằng cách thực hiện như sau:

    đọc thư mục gốc của ổ C: và tìm thư mục Chương trình trong đó;

    đọc Chương trình cụm ban đầu và tìm trong thư mục này mục nhập về thư mục con NC4;

    đọc cụm ban đầu của thư mục con NC4 và tìm kiếm mục nhập cho tệp nc.exe trong đó;

    đọc tất cả các cụm của tệp nc.exe.

Phương pháp tìm kiếm này không phải là nhanh nhất trong số các hệ thống tệp hiện tại. Hơn nữa, độ sâu của các thư mục càng lớn thì việc tìm kiếm sẽ càng chậm. Để tăng tốc hoạt động tìm kiếm, bạn nên duy trì cấu trúc tệp cân bằng.

Ưu điểm của FAT

    Nó là sự lựa chọn tốt nhất cho các ổ đĩa logic nhỏ, bởi vì... bắt đầu với chi phí tối thiểu. Trên các đĩa có kích thước không vượt quá 500 MB, nó hoạt động với hiệu suất chấp nhận được.

Nhược điểm của FAT

    Vì kích thước của mục nhập tệp bị giới hạn ở 32 byte và thông tin phải bao gồm kích thước tệp, ngày, thuộc tính, v.v. nên kích thước của tên tệp cũng bị giới hạn và không được vượt quá 8 + 3 ký tự cho mỗi tệp. Việc sử dụng cái gọi là tên tệp ngắn làm cho FAT kém hấp dẫn hơn so với các hệ thống tệp khác.

    Sử dụng FAT trên các đĩa lớn hơn 500 MB là không hợp lý do chống phân mảnh đĩa.

    Hệ thống tệp FAT không có bất kỳ tính năng bảo mật nào và hỗ trợ các khả năng bảo mật thông tin tối thiểu.

    Tốc độ hoạt động trong FAT tỷ lệ nghịch với độ sâu của việc lồng thư mục và dung lượng ổ đĩa.

    Hệ thống tập tin UNIX - hệ thống (ext3)

Hệ điều hành Linux hiện đại, mạnh mẽ và miễn phí cung cấp một phạm vi rộng lớn cho việc phát triển các hệ thống hiện đại và phần mềm tùy chỉnh. Một số phát triển thú vị nhất trong các nhân Linux gần đây là các công nghệ mới, hiệu suất cao để quản lý việc lưu trữ, sắp xếp và cập nhật dữ liệu trên đĩa. Một trong những cơ chế thú vị nhất là hệ thống tệp ext3, đã được tích hợp vào nhân Linux kể từ phiên bản 2.4.16 và đã có sẵn theo mặc định trong các bản phân phối Linux của Red Hat và SuSE.

Hệ thống tệp ext3 là một hệ thống tệp ghi nhật ký, tương thích 100% với tất cả các tiện ích được tạo để tạo, quản lý và tinh chỉnh hệ thống tệp ext2, đã được sử dụng trên hệ thống Linux trong vài năm qua. Trước khi mô tả chi tiết sự khác biệt giữa hệ thống tệp ext2 và ext3, chúng ta hãy làm rõ thuật ngữ về hệ thống tệp và lưu trữ tệp.

Ở cấp độ hệ thống, tất cả dữ liệu trên máy tính tồn tại dưới dạng khối dữ liệu trên một số thiết bị lưu trữ, được tổ chức bằng các cấu trúc dữ liệu đặc biệt thành các phân vùng (bộ logic trên thiết bị lưu trữ), sau đó được tổ chức thành các tệp, thư mục và không được sử dụng (miễn phí) không gian.

Hệ thống tệp được tạo trên các phân vùng đĩa để đơn giản hóa việc lưu trữ và tổ chức dữ liệu dưới dạng tệp và thư mục. Linux, giống như hệ thống Unix, sử dụng hệ thống tệp phân cấp được tạo thành từ các tệp và thư mục, tương ứng chứa các tệp hoặc thư mục. Các tệp và thư mục trong hệ thống tệp Linux được cung cấp cho người dùng bằng cách gắn chúng (lệnh "mount"), lệnh này thường là một phần của quá trình khởi động hệ thống. Danh sách các hệ thống tệp có sẵn để sử dụng được lưu trữ trong tệp /etc/fstab (FileSystem TABle). Danh sách các hệ thống tệp hiện không được hệ thống gắn kết được lưu trữ trong tệp /etc/mtab (Mount TABle).

Khi hệ thống tệp được gắn trong khi khởi động, một bit trong tiêu đề ("bit sạch") sẽ bị xóa, cho biết hệ thống tệp đang được sử dụng và cấu trúc dữ liệu được sử dụng để kiểm soát vị trí và tổ chức của tệp và thư mục trong hệ thống tệp đó có thể thay đổi.

Một hệ thống tệp được coi là hoàn chỉnh nếu tất cả các khối dữ liệu trong đó đang được sử dụng hoặc miễn phí; mỗi khối dữ liệu được phân bổ bị chiếm bởi một và chỉ một tệp hoặc thư mục; tất cả các tập tin và thư mục đều có thể được truy cập sau khi xử lý một loạt các thư mục khác trong hệ thống tập tin. Khi một hệ thống Linux bị cố tình tắt bằng cách sử dụng các lệnh của người vận hành, tất cả các hệ thống tệp sẽ không được kết nối. Việc ngắt kết nối hệ thống tệp trong khi tắt máy sẽ đặt "bit sạch" trong tiêu đề hệ thống tệp, cho biết rằng hệ thống tệp đã được ngắt kết nối đúng cách và do đó có thể được coi là nguyên vẹn.

Nhiều năm gỡ lỗi và thiết kế lại hệ thống tệp cũng như việc sử dụng các thuật toán cải tiến để ghi dữ liệu vào đĩa đã làm giảm đáng kể tình trạng hỏng dữ liệu do ứng dụng hoặc chính nhân Linux gây ra, nhưng việc loại bỏ tình trạng hỏng hóc và mất dữ liệu do mất điện và các sự cố hệ thống khác vẫn là một thách thức. . Trong trường hợp xảy ra sự cố hoặc tắt hệ thống Linux đơn giản mà không sử dụng quy trình tắt máy tiêu chuẩn, “bit sạch” không được đặt trong tiêu đề hệ thống tệp. Lần tiếp theo khi hệ thống khởi động, quá trình gắn kết sẽ phát hiện rằng hệ thống không được đánh dấu là "sạch" và kiểm tra vật lý tính toàn vẹn của nó bằng tiện ích kiểm tra hệ thống tệp Linux/Unix "fsck" (Kiểm tra hệ thống tệp K).

Có một số hệ thống tệp nhật ký có sẵn cho Linux. Nổi tiếng nhất trong số đó là: XFS, một hệ thống tệp nhật ký được phát triển bởi Silicon Graphics, nhưng hiện được phát hành dưới dạng nguồn mở; RaiserFS, một hệ thống tệp ghi nhật ký được thiết kế dành riêng cho Linux; JFS, một hệ thống tệp nhật ký ban đầu được IBM phát triển nhưng hiện được phát hành dưới dạng nguồn mở; ext3 là một hệ thống tệp được phát triển bởi Tiến sĩ Stephan Tweedie tại Red Hat và một số hệ thống khác.

Hệ thống tệp ext3 là phiên bản Linux được ghi nhật ký của hệ thống tệp ext2. Hệ thống tệp ext3 có một lợi thế đáng kể so với các hệ thống tệp nhật ký khác - nó hoàn toàn tương thích với hệ thống tệp ext2. Điều này cho phép sử dụng tất cả các ứng dụng hiện có được thiết kế để thao tác và tùy chỉnh hệ thống tệp ext2.

Hệ thống tệp ext3 được hỗ trợ bởi nhân Linux phiên bản 2.4.16 trở lên và phải được bật bằng hộp thoại Cấu hình hệ thống tệp khi xây dựng hạt nhân. Các bản phân phối Linux như Red Hat 7.2 và SuSE 7.3 đã bao gồm hỗ trợ riêng cho hệ thống tệp ext3. Bạn chỉ có thể sử dụng hệ thống tập tin ext3 nếu hỗ trợ ext3 được tích hợp trong kernel của bạn và bạn có phiên bản mới nhất của tiện ích "mount" và "e2fsprogs".

Trong hầu hết các trường hợp, việc chuyển đổi hệ thống tệp từ định dạng này sang định dạng khác đòi hỏi phải sao lưu tất cả dữ liệu chứa trong đó, định dạng lại các phân vùng hoặc ổ đĩa logic chứa hệ thống tệp, sau đó khôi phục tất cả dữ liệu vào hệ thống tệp đó. Do tính tương thích của hệ thống tệp ext2 và ext3, tất cả các bước này không cần phải thực hiện và việc dịch có thể được thực hiện bằng một lệnh duy nhất (chạy với quyền root):

# /sbin/tune2fs -j<имя-раздела >

Ví dụ: chuyển đổi hệ thống tệp ext2 nằm trên phân vùng /dev/hda5 sang hệ thống tệp ext3 có thể được thực hiện bằng lệnh sau:

# /sbin/tune2fs -j /dev/hda5

Tùy chọn "-j" cho lệnh "tune2fs" sẽ tạo nhật ký ext3 trên hệ thống tệp ext2 hiện có. Sau khi chuyển đổi hệ thống tệp ext2 thành ext3, bạn cũng phải thực hiện các thay đổi đối với các mục nhập tệp /etc/fstab để cho biết rằng phân vùng hiện là hệ thống tệp "ext3". Bạn cũng có thể sử dụng tính năng tự động phát hiện loại phân vùng (tùy chọn “tự động”), nhưng vẫn nên chỉ định rõ ràng loại hệ thống tệp. Ví dụ sau đây tệp /etc/fstab hiển thị các thay đổi trước và sau khi truyền hệ thống tệp cho phân vùng /dev/hda5:

/dev/ hda5 /opt ext2 mặc định 1 2

/dev/ hda5 /opt ext3 mặc định là 1 0

Trường cuối cùng trong /etc/fstab chỉ định bước trong quá trình khởi động trong đó cần kiểm tra tính toàn vẹn của hệ thống tệp bằng tiện ích "fsck". Khi sử dụng hệ thống tệp ext3, bạn có thể đặt giá trị này thành "0" như trong ví dụ trước. Điều này có nghĩa là chương trình "fsck" sẽ không bao giờ kiểm tra tính toàn vẹn của hệ thống tệp, do thực tế là tính toàn vẹn của hệ thống tệp được đảm bảo bằng cách khôi phục nhật ký.

Việc chuyển đổi hệ thống tệp gốc sang ext3 yêu cầu một cách tiếp cận đặc biệt và được thực hiện tốt nhất ở chế độ một người dùng sau khi tạo đĩa RAM hỗ trợ hệ thống tệp ext3.

Ngoài việc tương thích với các tiện ích hệ thống tệp ext2 và dịch hệ thống tệp dễ dàng từ ext2 sang ext3, hệ thống tệp ext3 còn cung cấp một số loại nhật ký khác nhau.

Hệ thống tệp ext3 hỗ trợ ba chế độ ghi nhật ký khác nhau có thể được kích hoạt từ tệp /etc/fstab. Các chế độ ghi nhật ký này như sau:

    Nhật ký / tạp chí – ghi lại tất cả các thay đổi đối với dữ liệu và siêu dữ liệu hệ thống tệp. Chậm nhất trong cả ba chế độ ghi nhật ký. Chế độ này giảm thiểu khả năng mất các thay đổi tệp bạn thực hiện đối với hệ thống tệp.

    Tuần tự/theo thứ tự - Chỉ ghi các thay đổi vào siêu dữ liệu hệ thống tệp nhưng ghi các cập nhật dữ liệu tệp vào đĩa trước khi thay đổi siêu dữ liệu hệ thống tệp liên quan. Chế độ ghi nhật ký ext3 này được cài đặt theo mặc định.

    Writeback - chỉ những thay đổi đối với siêu dữ liệu hệ thống tệp mới được ghi, dựa trên quy trình tiêu chuẩn để ghi các thay đổi vào dữ liệu tệp. Đây là phương pháp ghi nhật ký nhanh nhất.

Sự khác biệt giữa các chế độ ghi nhật ký này vừa tinh tế vừa sâu sắc. Việc sử dụng chế độ nhật ký yêu cầu hệ thống tệp ext3 ghi mọi thay đổi vào hệ thống tệp hai lần - đầu tiên vào nhật ký và sau đó vào chính hệ thống tệp. Điều này có thể làm giảm hiệu suất tổng thể của hệ thống tệp của bạn, nhưng chế độ này được người dùng yêu thích nhất vì nó giảm thiểu khả năng mất các thay đổi dữ liệu đối với tệp của bạn, vì cả thay đổi dữ liệu meta và thay đổi dữ liệu tệp đều được ghi vào nhật ký ext3 và có thể được lặp lại khi hệ thống được khởi động lại.

Khi sử dụng chế độ "tuần tự", chỉ những thay đổi đối với siêu dữ liệu của hệ thống tệp mới được ghi lại, giúp giảm sự dư thừa giữa việc ghi vào hệ thống tệp và nhật ký, đó là lý do tại sao phương pháp này nhanh hơn. Mặc dù các thay đổi đối với dữ liệu tệp không được ghi vào nhật ký nhưng chúng phải được thực hiện trước khi các thay đổi đối với siêu dữ liệu hệ thống tệp liên quan được thực hiện bởi daemon ghi nhật ký ext3, điều này có thể làm giảm hiệu suất hệ thống của bạn một chút. Việc sử dụng phương pháp ghi nhật ký này đảm bảo rằng các tệp trên hệ thống tệp không bao giờ không đồng bộ với siêu dữ liệu hệ thống tệp được liên kết.

Phương pháp ghi lại nhanh hơn hai phương pháp ghi nhật ký còn lại vì nó chỉ lưu trữ các thay đổi đối với siêu dữ liệu của hệ thống tệp và không đợi dữ liệu liên quan của tệp thay đổi khi ghi (trước khi cập nhật những thứ như kích thước tệp và thông tin thư mục). Do dữ liệu tệp được cập nhật không đồng bộ đối với các thay đổi được ghi nhật ký đối với siêu dữ liệu của hệ thống tệp, nên các tệp trong hệ thống tệp có thể hiển thị lỗi trong siêu dữ liệu, ví dụ: lỗi chỉ ra chủ sở hữu của các khối dữ liệu (bản cập nhật chưa được hoàn thành tại thời điểm hệ thống được khởi động lại). Điều này không gây tử vong nhưng có thể ảnh hưởng đến trải nghiệm của người dùng.

Việc chỉ định chế độ ghi nhật ký được sử dụng trên hệ thống tệp ext3 được thực hiện trong tệp /etc/fstab cho hệ thống tệp đó. Chế độ "Tuần tự" là mặc định, nhưng bạn có thể chỉ định các chế độ ghi nhật ký khác nhau bằng cách thay đổi các tùy chọn cho phân vùng mong muốn trong tệp /etc/fstab. Ví dụ: một mục trong /etc/fstab biểu thị việc sử dụng chế độ ghi nhật ký ghi lại sẽ trông như thế này:

/dev/hda5 /opt ext3 data=writeback 1 0

    Hệ thống tệp gia đình Windows NT (NTFS)

      Cấu trúc vật lý của NTFS

Hãy bắt đầu với sự thật chung. Về lý thuyết, một phân vùng NTFS có thể có kích thước gần như bất kỳ. Tất nhiên, có một giới hạn, nhưng tôi thậm chí sẽ không chỉ ra điều đó, vì nó sẽ đủ cho sự phát triển của công nghệ máy tính trong một trăm năm tới - với bất kỳ tốc độ tăng trưởng nào. Điều này hoạt động như thế nào trong thực tế? Hầu như giống nhau. Kích thước tối đa của phân vùng NTFS hiện chỉ bị giới hạn bởi kích thước của ổ cứng. Tuy nhiên, NT4 sẽ gặp sự cố khi cố gắng cài đặt trên một phân vùng nếu bất kỳ phần nào của nó lớn hơn 8 GB so với phần đầu vật lý của đĩa, nhưng sự cố này chỉ ảnh hưởng đến phân vùng khởi động.

Lạc đề trữ tình. Phương pháp cài đặt NT4.0 trên một đĩa trống khá độc đáo và có thể dẫn đến những suy nghĩ sai lầm về khả năng của NTFS. Nếu bạn yêu cầu trình cài đặt rằng bạn muốn định dạng ổ đĩa thành NTFS, kích thước tối đa nó sẽ cung cấp cho bạn chỉ là 4GB. Tại sao lại nhỏ như vậy nếu kích thước của phân vùng NTFS thực tế là không giới hạn? Thực tế là phần cài đặt đơn giản là không biết hệ thống tệp này :) Chương trình cài đặt định dạng đĩa này thành FAT thông thường, kích thước tối đa trong NT là 4 GB (sử dụng cụm 64 KB khổng lồ không hoàn toàn tiêu chuẩn) và NT cài đặt trên FAT này. Nhưng ngay trong lần khởi động đầu tiên của hệ điều hành (vẫn đang trong giai đoạn cài đặt), phân vùng sẽ nhanh chóng được chuyển đổi sang NTFS; vì vậy người dùng không nhận thấy bất cứ điều gì ngoại trừ “giới hạn” kỳ lạ về kích thước NTFS trong quá trình cài đặt. :)

      Cấu trúc phần - nhìn tổng quát

Giống như bất kỳ hệ thống nào khác, NTFS chia tất cả không gian hữu ích thành các cụm - khối dữ liệu được sử dụng tại một thời điểm. NTFS hỗ trợ hầu hết mọi kích thước cụm - từ 512 byte đến 64 KB, trong khi cụm 4 KB được coi là một tiêu chuẩn nhất định. NTFS không có bất kỳ điểm bất thường nào trong cấu trúc cụm, vì vậy không có nhiều điều để nói về vấn đề này, nói chung là một chủ đề khá tầm thường.

Đĩa NTFS thường được chia thành hai phần. 12% đầu tiên của đĩa được phân bổ cho cái gọi là vùng MFT - không gian mà siêu tệp MFT phát triển (xem thêm về điều này bên dưới). Không thể ghi bất kỳ dữ liệu nào vào khu vực này. Vùng MFT luôn được giữ trống - điều này được thực hiện để tệp dịch vụ quan trọng nhất (MFT) không bị phân mảnh khi nó phát triển. 88% còn lại của đĩa là không gian lưu trữ tệp thông thường.

Tuy nhiên, dung lượng đĩa trống bao gồm tất cả không gian trống về mặt vật lý - các phần chưa được lấp đầy của vùng MFT cũng được bao gồm ở đó. Cơ chế sử dụng vùng MFT như sau: khi không thể ghi tệp vào không gian thông thường nữa, vùng MFT chỉ đơn giản là giảm đi (trong các phiên bản hệ điều hành hiện tại chính xác một nửa), do đó giải phóng không gian để ghi tệp. Khi không gian được giải phóng trong khu vực MFT thông thường, khu vực này có thể mở rộng trở lại. Đồng thời, có thể các tệp thông thường vẫn nằm trong vùng này: không có điều gì bất thường ở đây. Chà, hệ thống đã cố gắng giữ cô ấy tự do, nhưng không có tác dụng gì. Cuộc sống vẫn tiếp diễn... Siêu tệp MFT có thể vẫn bị phân mảnh, mặc dù điều này là không mong muốn.

      MFT và cấu trúc của nó

Hệ thống tệp NTFS là một thành tựu nổi bật về cấu trúc: mọi thành phần của hệ thống đều là một tệp - thậm chí cả thông tin dịch vụ. Tệp quan trọng nhất trên NTFS được gọi là MFT, hay Master File Table - một bảng chung gồm các tệp. Nó nằm trong vùng MFT và là một thư mục tập trung của tất cả các tệp đĩa khác, và nghịch lý thay, chính nó. MFT được chia thành các mục có kích thước cố định (thường là 1 KB) và mỗi mục tương ứng với một tệp (theo nghĩa chung của từ này). 16 tệp đầu tiên có tính chất dịch vụ và không thể truy cập được vào hệ điều hành - chúng được gọi là siêu tệp, với siêu tệp đầu tiên chính là MFT. 16 phần tử MFT đầu tiên này là phần duy nhất của đĩa có vị trí cố định. Điều thú vị là bản sao thứ hai của ba bản ghi đầu tiên, vì độ tin cậy (chúng rất quan trọng), được lưu trữ chính xác ở giữa đĩa. Phần còn lại của tệp MFT có thể được đặt, giống như bất kỳ tệp nào khác, ở những vị trí tùy ý trên đĩa - bạn có thể khôi phục vị trí của nó bằng cách sử dụng chính tệp đó, "nối" trên cơ sở - phần tử MFT đầu tiên.

        Siêu tệp

16 tệp NTFS (siêu tệp) đầu tiên có tính chất dịch vụ. Mỗi người trong số họ chịu trách nhiệm về một số khía cạnh hoạt động của hệ thống. Ưu điểm của cách tiếp cận mô-đun như vậy là tính linh hoạt đáng kinh ngạc của nó - ví dụ: trên FAT, thiệt hại vật lý trong vùng FAT sẽ ảnh hưởng nghiêm trọng đến hoạt động của toàn bộ đĩa và NTFS có thể dịch chuyển, thậm chí cả phân đoạn trên đĩa, tất cả dịch vụ của nó các khu vực, bỏ qua mọi đứt gãy bề mặt - ngoại trừ 16 phần tử MFT đầu tiên.

Siêu tệp nằm trong thư mục gốc của đĩa NTFS - chúng bắt đầu bằng ký hiệu tên "$", mặc dù rất khó để có được bất kỳ thông tin nào về chúng bằng các phương tiện tiêu chuẩn. Điều tò mò là những tệp này cũng có kích thước rất thực được chỉ định - ví dụ: bạn có thể tìm hiểu xem hệ điều hành chi bao nhiêu cho việc lập danh mục toàn bộ đĩa của bạn bằng cách xem kích thước của tệp $MFT. Bảng sau đây hiển thị các siêu tệp hiện đang được sử dụng và mục đích của chúng.

bản sao của 16 bản ghi MFT đầu tiên được đặt ở giữa đĩa

tập tin hỗ trợ ghi nhật ký (xem bên dưới)

thông tin dịch vụ - nhãn ổ đĩa, phiên bản hệ thống tệp, v.v.

danh sách các thuộc tính tệp tiêu chuẩn trên ổ đĩa

thư mục gốc

bản đồ không gian trống

khu vực khởi động (nếu phân vùng có khả năng khởi động)

một tệp ghi lại quyền sử dụng dung lượng ổ đĩa của người dùng (bắt đầu chỉ hoạt động trong NT5)

file - một bảng tương ứng giữa chữ hoa và chữ thường trong tên tệp trên ổ đĩa hiện tại. Nó cần thiết chủ yếu vì tên tệp trong NTFS được viết bằng Unicode, lên tới 65 nghìn ký tự khác nhau, việc tìm kiếm các ký tự lớn và nhỏ tương đương là rất không tầm thường.

        Tệp và luồng

Vì vậy, hệ thống có các tệp - và không có gì ngoài các tệp. Khái niệm này bao gồm những gì trên NTFS?

    Trước hết, một yếu tố bắt buộc là ghi trong MFT, bởi vì, như đã đề cập trước đó, tất cả các tệp trên đĩa đều được đề cập trong MFT. Tất cả thông tin về tệp được lưu trữ ở nơi này, ngoại trừ chính dữ liệu đó. Tên tệp, kích thước, vị trí trên đĩa của từng đoạn riêng lẻ, v.v. Nếu một bản ghi MFT không đủ thông tin thì nhiều bản ghi sẽ được sử dụng và không nhất thiết phải liên tiếp.

    Phần tử tùy chọn - luồng dữ liệu tệp. Định nghĩa về “tùy chọn” có vẻ lạ, tuy nhiên, không có gì lạ ở đây cả. Thứ nhất, tệp có thể không có dữ liệu - trong trường hợp này, nó không tiêu tốn dung lượng trống của đĩa. Thứ hai, tệp có thể không lớn lắm. Sau đó, một giải pháp khá thành công được đưa ra: dữ liệu tệp được lưu trữ trực tiếp trong MFT, trong khoảng trống còn lại của dữ liệu chính trong một bản ghi MFT. Các tệp chiếm hàng trăm byte thường không có hiện thân “vật lý” trong vùng tệp chính - tất cả dữ liệu của tệp đó được lưu trữ ở một nơi - trong MFT.

Tình huống với dữ liệu tập tin khá thú vị. Nói chung, mỗi tệp trên NTFS có cấu trúc hơi trừu tượng - nó không có dữ liệu như vậy nhưng có các luồng. Một trong những luồng có ý nghĩa mà chúng ta quen thuộc - dữ liệu tệp. Nhưng hầu hết các thuộc tính của tệp cũng là luồng! Do đó, hóa ra tệp chỉ có một thực thể cơ bản - số trong MFT và mọi thứ khác đều là tùy chọn. Sự trừu tượng hóa này có thể được sử dụng để tạo ra những thứ khá thuận tiện - ví dụ: bạn có thể "đính kèm" một luồng khác vào một tệp bằng cách ghi bất kỳ dữ liệu nào vào đó - ví dụ: thông tin về tác giả và nội dung của tệp, như được thực hiện trong Windows 2000 (tab ngoài cùng bên phải trong thuộc tính tệp, được xem từ Explorer). Điều thú vị là những luồng bổ sung này không thể hiển thị bằng các phương tiện tiêu chuẩn: kích thước tệp được quan sát chỉ bằng kích thước của luồng chính chứa dữ liệu truyền thống. Ví dụ: bạn có thể có một tệp có độ dài bằng 0, khi bị xóa, tệp này sẽ giải phóng 1 GB dung lượng trống - đơn giản vì một số chương trình hoặc công nghệ xảo quyệt đã mắc kẹt một luồng bổ sung có kích thước gigabyte (dữ liệu thay thế) trong đó. Nhưng trên thực tế, hiện tại, các chủ đề thực tế không được sử dụng, vì vậy người ta không nên sợ những tình huống như vậy, mặc dù về mặt giả thuyết là có thể xảy ra. Chỉ cần nhớ rằng tệp trên NTFS là một khái niệm sâu sắc hơn và toàn diện hơn người ta có thể tưởng tượng bằng cách duyệt qua các thư mục của đĩa. Và cuối cùng: tên tệp có thể chứa bất kỳ ký tự nào, bao gồm toàn bộ bộ bảng chữ cái quốc gia, vì dữ liệu được trình bày bằng Unicode - biểu diễn 16 bit cung cấp 65535 ký tự khác nhau. Độ dài tên tệp tối đa là 255 ký tự.

      Danh mục

Thư mục NTFS là một tệp cụ thể lưu trữ các liên kết đến các tệp và thư mục khác, tạo ra cấu trúc dữ liệu phân cấp trên đĩa. Tệp danh mục được chia thành các khối, mỗi khối chứa tên tệp, thuộc tính cơ bản và liên kết đến phần tử MFT, phần tử này đã cung cấp thông tin đầy đủ về phần tử danh mục. Cấu trúc thư mục nội bộ là một cây nhị phân. Đây là ý nghĩa của điều này: để tìm một tệp có tên đã cho trong một thư mục tuyến tính, chẳng hạn như FAT, hệ điều hành phải xem qua tất cả các thành phần của thư mục cho đến khi tìm thấy đúng. Cây nhị phân sắp xếp tên tệp sao cho việc tìm kiếm tệp được thực hiện nhanh hơn - bằng cách nhận được câu trả lời gồm hai chữ số cho các câu hỏi về vị trí của tệp. Câu hỏi mà cây nhị phân có thể trả lời là: tên bạn đang tìm kiếm nằm trong nhóm nào, liên quan đến một phần tử nhất định - ở trên hay ở dưới? Chúng tôi bắt đầu với một câu hỏi như vậy cho phần tử ở giữa và mỗi câu trả lời sẽ thu hẹp khu vực tìm kiếm trung bình hai lần. Ví dụ: các tệp được sắp xếp đơn giản theo thứ tự bảng chữ cái và câu hỏi được trả lời theo cách rõ ràng - bằng cách so sánh các chữ cái đầu tiên. Khu vực tìm kiếm, bị thu hẹp một nửa, bắt đầu được khám phá theo cách tương tự, bắt đầu lại từ phần tử ở giữa.

Kết luận - ví dụ: để tìm kiếm một tệp trong số 1000 tệp, FAT sẽ phải thực hiện trung bình 500 so sánh (rất có thể tệp sẽ được tìm thấy ở giữa quá trình tìm kiếm) và hệ thống dựa trên cây sẽ có chỉ tạo ra khoảng 10 (2^10 = 1024). Tiết kiệm thời gian tìm kiếm là điều hiển nhiên. Tuy nhiên, bạn không nên nghĩ rằng trong các hệ thống truyền thống (FAT) mọi thứ đều bị bỏ qua: thứ nhất, việc duy trì danh sách các tệp ở dạng cây nhị phân khá tốn công sức và thứ hai, ngay cả FAT cũng được thực hiện bởi một hệ thống hiện đại (Windows2000). hoặc Windows98) sử dụng tìm kiếm tối ưu hóa tương tự. Đây chỉ là một thực tế khác để bổ sung vào nền tảng kiến ​​thức của bạn. Tôi cũng muốn xóa bỏ quan niệm sai lầm phổ biến (mà bản thân tôi đã chia sẻ gần đây) rằng việc thêm tệp vào thư mục ở dạng cây khó hơn so với thư mục tuyến tính: đây là những thao tác khá giống nhau về mặt thời gian - thực tế là rằng để thêm một tệp vào thư mục, trước tiên bạn cần đảm bảo rằng tệp có tên đó chưa có ở đó :) - và ở đây trong hệ thống tuyến tính, chúng ta sẽ gặp khó khăn khi tìm tệp, được mô tả ở trên, nhiều hơn là bù đắp cho sự đơn giản của việc thêm một tập tin vào thư mục.

Thông tin gì có thể thu được bằng cách đọc một tập tin danh mục? Chính xác những gì lệnh dir tạo ra. Để thực hiện điều hướng ổ đĩa đơn giản, bạn không cần vào MFT cho từng tệp, bạn chỉ cần đọc thông tin chung nhất về tệp từ tệp thư mục. Thư mục chính của đĩa - thư mục gốc - không khác gì các thư mục thông thường, ngoại trừ một liên kết đặc biệt đến nó từ đầu siêu tệp MFT.

      Ghi nhật ký

NTFS là một hệ thống có khả năng chịu lỗi, có thể dễ dàng tự khôi phục về trạng thái chính xác trong hầu hết mọi trường hợp xảy ra lỗi thực sự. Bất kỳ hệ thống tệp hiện đại nào cũng dựa trên khái niệm giao dịch - một hành động được thực hiện hoàn toàn và chính xác hoặc hoàn toàn không được thực hiện. NTFS đơn giản là không có trạng thái trung gian (sai hoặc không chính xác) - lượng thay đổi dữ liệu không thể được chia thành trước và sau lỗi, dẫn đến sự phá hủy và nhầm lẫn - nó bị cam kết hoặc bị hủy bỏ.

Ví dụ 1: dữ liệu đang được ghi vào đĩa. Đột nhiên, hóa ra không thể ghi vào nơi mà chúng tôi vừa quyết định ghi phần dữ liệu tiếp theo - thiệt hại vật lý trên bề mặt. Hành vi của NTFS trong trường hợp này khá logic: giao dịch ghi được khôi phục hoàn toàn - hệ thống nhận ra rằng việc ghi không được thực hiện. Vị trí được đánh dấu là không thành công và dữ liệu được ghi vào vị trí khác - một giao dịch mới bắt đầu.

Ví dụ 2: trường hợp phức tạp hơn - dữ liệu đang được ghi vào đĩa. Đột nhiên, bang - nguồn bị tắt và hệ thống khởi động lại. Quá trình ghi dừng ở giai đoạn nào, dữ liệu ở đâu và vô nghĩa ở đâu? Một cơ chế hệ thống khác được giải cứu - nhật ký giao dịch. Thực tế là hệ thống, nhận ra mong muốn ghi vào đĩa, đã đánh dấu trạng thái này trong siêu tệp $LogFile. Khi khởi động lại, tệp này sẽ được kiểm tra để tìm sự hiện diện của các giao dịch chưa hoàn thành bị gián đoạn do tai nạn và kết quả của nó là không thể đoán trước - tất cả các giao dịch này đều bị hủy: nơi thực hiện ghi được đánh dấu lại là các phần tử miễn phí, chỉ mục và MFT được đưa trở lại trạng thái trước khi thất bại và toàn bộ hệ thống vẫn ổn định. Chà, điều gì sẽ xảy ra nếu xảy ra lỗi khi ghi vào nhật ký? Cũng không sao: giao dịch chưa bắt đầu (chỉ có nỗ lực ghi lại ý định thực hiện) hoặc nó đã kết thúc - nghĩa là có nỗ lực ghi lại rằng giao dịch thực sự đã được thực hiện hoàn thành. Trong trường hợp sau, ở lần khởi động tiếp theo, bản thân hệ thống sẽ hoàn toàn hiểu rằng trên thực tế, mọi thứ đều được viết chính xác và sẽ không chú ý đến giao dịch “chưa hoàn thành”.

Tuy nhiên, hãy nhớ rằng ghi nhật ký không phải là thuốc chữa bách bệnh tuyệt đối mà chỉ là phương tiện để giảm đáng kể số lượng lỗi và lỗi hệ thống. Người dùng NTFS thông thường khó có thể nhận thấy lỗi hệ thống hoặc buộc phải chạy chkdsk - kinh nghiệm cho thấy NTFS được khôi phục về trạng thái hoàn toàn chính xác ngay cả trong trường hợp xảy ra lỗi vào những thời điểm rất bận rộn với hoạt động của đĩa. Bạn thậm chí có thể tối ưu hóa ổ đĩa và nhấn đặt lại ở giữa quá trình này - khả năng mất dữ liệu ngay cả trong trường hợp này sẽ rất thấp. Tuy nhiên, điều quan trọng là phải hiểu rằng hệ thống khôi phục NTFS đảm bảo tính chính xác của hệ thống tệp chứ không phải dữ liệu của bạn. Nếu bạn đang ghi vào đĩa và gặp sự cố, dữ liệu của bạn có thể không được ghi. Không có phép lạ.

Các tệp NTFS có một thuộc tính khá hữu ích - "nén". Thực tế là NTFS có hỗ trợ nén đĩa tích hợp - thứ mà trước đây bạn phải sử dụng Stacker hoặc DoubleSpace. Bất kỳ tệp hoặc thư mục nào cũng có thể được lưu trữ riêng lẻ trên đĩa ở dạng nén - quá trình này hoàn toàn minh bạch đối với các ứng dụng. Nén tệp có tốc độ rất cao và chỉ có một thuộc tính tiêu cực lớn - sự phân mảnh ảo rất lớn của các tệp nén, tuy nhiên, điều này không thực sự làm phiền bất kỳ ai. Quá trình nén được thực hiện theo khối gồm 16 cụm và sử dụng cái gọi là "cụm ảo" - một lần nữa là một giải pháp cực kỳ linh hoạt cho phép bạn đạt được các hiệu ứng thú vị - ví dụ: một nửa tệp có thể được nén và một nửa thì không. Điều này đạt được là do việc lưu trữ thông tin về việc nén một số đoạn nhất định rất giống với việc phân mảnh tệp thông thường: ví dụ: một bản ghi điển hình về bố cục vật lý cho một tệp thực, không nén:

cụm tệp từ 1 đến 43 được lưu trữ trong cụm đĩa bắt đầu từ 400, cụm tệp từ 44 đến 52 được lưu trữ trong cụm đĩa bắt đầu từ 8530...

Bố cục vật lý của một tệp nén điển hình:

cụm tệp từ 1 đến 9 được lưu trong cụm đĩa bắt đầu từ 400 cụm tệp từ 10 đến 16 không được lưu ở đâu Cụm tệp từ 17 đến 18 được lưu trong cụm đĩa bắt đầu từ cụm tệp 409 từ 19 đến 36 không được lưu ở đâu. ...

Có thể thấy file nén có các cụm “ảo”, trong đó không có thông tin thật. Ngay khi hệ thống nhìn thấy các cụm ảo như vậy, nó sẽ hiểu ngay rằng dữ liệu từ khối trước đó, bội số của 16, phải được giải nén và dữ liệu thu được sẽ chỉ lấp đầy các cụm ảo - trên thực tế, đó là toàn bộ thuật toán .

      Sự an toàn

NTFS chứa nhiều phương tiện phân định quyền của các đối tượng - người ta tin rằng đây là hệ thống tệp tiên tiến nhất trong số tất cả các hệ thống tệp hiện có. Về lý thuyết, điều này chắc chắn là đúng, nhưng thật không may, trong quá trình triển khai hiện nay, hệ thống quyền còn khá xa lý tưởng và mặc dù cứng nhắc nhưng không phải lúc nào cũng là một tập hợp các đặc điểm hợp lý. Các quyền được gán cho bất kỳ đối tượng nào và được hệ thống tôn trọng rõ ràng đang phát triển - những thay đổi và bổ sung lớn đối với các quyền đã được thực hiện nhiều lần và đến Windows 2000, cuối cùng chúng đã đạt được một bộ khá hợp lý.

Các quyền của hệ thống tệp NTFS được liên kết chặt chẽ với chính hệ thống - nghĩa là, nói chung, chúng không bắt buộc phải được hệ thống khác tôn trọng nếu nó được cấp quyền truy cập vật lý vào đĩa. Để ngăn chặn truy cập vật lý, Windows 2000 (NT5) vẫn giới thiệu một tính năng tiêu chuẩn - xem bên dưới để biết thêm về điều này. Hệ thống quyền trong tình trạng hiện tại khá phức tạp và tôi nghi ngờ rằng mình có thể nói với độc giả phổ thông bất cứ điều gì thú vị và hữu ích đối với anh ta trong cuộc sống hàng ngày. Nếu quan tâm đến chủ đề này, bạn sẽ tìm thấy nhiều sách về kiến ​​trúc mạng NT mô tả chi tiết hơn.

Tại thời điểm này, việc mô tả cấu trúc của hệ thống tập tin có thể được hoàn thành; nó vẫn chỉ mô tả một số thứ đơn giản có tính thực tế hoặc nguyên bản.

Tính năng này đã có trong NTFS từ thời xa xưa, nhưng rất hiếm khi được sử dụng - tuy nhiên: Liên kết cứng là khi cùng một tệp có hai tên (một số con trỏ thư mục tệp hoặc các thư mục khác nhau trỏ đến cùng một bản ghi MFT). Giả sử cùng một tệp có tên 1.txt và 2.txt: nếu người dùng xóa tệp 1, tệp 2 sẽ vẫn còn. Nếu anh ta xóa 2, tệp 1 sẽ vẫn giữ nguyên, tức là cả hai tên, kể từ thời điểm tạo. là hoàn toàn bình đẳng. Tệp chỉ bị xóa vật lý khi họ của nó bị xóa.

      Liên kết tượng trưng (NT5)

Một tính năng thiết thực hơn nhiều cho phép bạn tạo các thư mục ảo - giống hệt như các đĩa ảo sử dụng lệnh subst trong DOS. Các ứng dụng khá đa dạng: thứ nhất là đơn giản hóa hệ thống danh mục. Nếu bạn không thích thư mục Documents and settings\Administrator\Documents, bạn có thể liên kết nó với thư mục gốc - hệ thống sẽ vẫn liên lạc với thư mục bằng đường dẫn hoang dã và bạn sẽ có một tên ngắn hơn nhiều và hoàn toàn tương đương đến nó. Để tạo các kết nối như vậy, bạn có thể sử dụng chương trình kết nối (junction.zip(15 Kb), 36 kb), được viết bởi chuyên gia nổi tiếng Mark Russinovich (http://www.sysinternals.com). Chương trình chỉ hoạt động trong NT5 (Windows 2000), cũng như tính năng này. Để xóa kết nối, bạn có thể sử dụng lệnh rd tiêu chuẩn. CẢNH BÁO: Cố gắng xóa một liên kết bằng Explorer hoặc các trình quản lý tệp khác không hiểu bản chất ảo của một thư mục (chẳng hạn như FAR) sẽ xóa dữ liệu được liên kết tham chiếu! Hãy cẩn thận.

      Mã hóa (NT5)

Một tính năng hữu ích dành cho những người quan tâm đến bí mật của họ - mỗi tệp hoặc thư mục cũng có thể được mã hóa, khiến bản cài đặt NT khác không thể đọc được. Kết hợp với mật khẩu tiêu chuẩn và hầu như không thể phá được để khởi động hệ thống, tính năng này cung cấp đủ mức bảo mật cho hầu hết các ứng dụng đối với dữ liệu quan trọng mà bạn chọn.

Sớm hay muộn, người mới sử dụng máy tính sẽ phải đối mặt với một khái niệm như hệ thống tệp (FS). Theo quy định, lần đầu tiên làm quen với thuật ngữ này xảy ra khi định dạng phương tiện lưu trữ: ổ đĩa logic và phương tiện được kết nối (ổ đĩa flash, thẻ nhớ, ổ cứng ngoài).

Trước khi định dạng, hệ điều hành Windows sẽ nhắc bạn chọn loại hệ thống tệp trên phương tiện, kích thước cụm và phương thức định dạng (nhanh hoặc đầy đủ). Hãy cùng tìm hiểu hệ thống tập tin là gì và tại sao nó lại cần thiết?

Tất cả thông tin được ghi trên phương tiện dưới dạng phải được sắp xếp theo một thứ tự nhất định, nếu không hệ điều hành và các chương trình sẽ không thể hoạt động với dữ liệu. Thứ tự này được hệ thống tệp sắp xếp bằng cách sử dụng các thuật toán và quy tắc nhất định để đặt tệp trên phương tiện.

Khi một chương trình cần một tập tin được lưu trữ trên đĩa, nó không cần biết nó được lưu trữ như thế nào và ở đâu. Tất cả những gì chương trình yêu cầu là biết tên tệp, kích thước và thuộc tính của nó để chuyển dữ liệu này sang hệ thống tệp, hệ thống này sẽ cung cấp quyền truy cập vào tệp mong muốn. Điều tương tự cũng xảy ra khi ghi dữ liệu vào phương tiện: chương trình chuyển thông tin về tệp (tên, kích thước, thuộc tính) sang hệ thống tệp, hệ thống này sẽ lưu tệp theo các quy tắc cụ thể của riêng nó.

Để hiểu rõ hơn, hãy tưởng tượng một thủ thư đưa một cuốn sách cho khách hàng dựa trên tựa đề của nó. Hoặc theo thứ tự ngược lại: khách hàng trả lại cuốn sách đã đọc cho thủ thư, người này sẽ cất nó trở lại kho. Khách hàng không cần biết sổ sách được cất giữ ở đâu và như thế nào; đây là trách nhiệm của nhân viên cơ sở. Thủ thư biết các quy tắc biên mục thư viện và theo các quy tắc này, tìm kiếm ấn phẩm hoặc đặt nó trở lại, tức là. thực hiện các chức năng chính thức của mình. Trong ví dụ này, thư viện là phương tiện lưu trữ, thủ thư là hệ thống tệp và máy khách là chương trình.

Các chức năng hệ thống tệp cơ bản

Các chức năng chính của hệ thống tập tin là:

  • vị trí và tổ chức trên vật mang dữ liệu dưới dạng tệp;
  • xác định lượng dữ liệu được hỗ trợ tối đa trên phương tiện lưu trữ;
  • tạo, đọc và xóa tập tin;
  • gán và thay đổi các thuộc tính tệp (kích thước, thời gian tạo và sửa đổi, chủ sở hữu và người tạo tệp, tệp chỉ đọc, tệp ẩn, tệp tạm thời, lưu trữ, thực thi, độ dài tên tệp tối đa, v.v.);
  • xác định cấu trúc tập tin;
  • tổ chức thư mục để tổ chức hợp lý các tập tin;
  • bảo vệ tập tin trong trường hợp hệ thống bị lỗi;
  • bảo vệ các tập tin khỏi sự truy cập trái phép và thay đổi nội dung của chúng.

Thông tin được ghi trên ổ cứng hoặc bất kỳ phương tiện nào khác được đặt ở đó trên cơ sở tổ chức cụm. Cụm là một loại ô có kích thước nhất định mà toàn bộ tệp hoặc một phần của nó phù hợp.

Nếu tệp có kích thước cụm thì nó chỉ chiếm một cụm. Nếu kích thước tệp vượt quá kích thước ô thì nó sẽ được đặt trong một số ô cụm. Hơn nữa, các cụm trống có thể không nằm cạnh nhau mà có thể nằm rải rác trên bề mặt vật lý của đĩa. Hệ thống này cho phép bạn sử dụng không gian hiệu quả nhất khi lưu trữ tệp. Nhiệm vụ của hệ thống tệp là phân phối tệp khi ghi vào các cụm trống một cách tối ưu, đồng thời tập hợp nó khi đọc và đưa nó cho chương trình hoặc hệ điều hành.

Các loại hệ thống tập tin

Trong quá trình phát triển của máy tính, phương tiện lưu trữ và hệ điều hành, một số lượng lớn hệ thống tệp đã ra đời và biến mất. Trong quá trình lựa chọn tiến hóa như vậy, ngày nay các loại hệ thống tệp sau chủ yếu được sử dụng để hoạt động với ổ cứng và thiết bị lưu trữ ngoài (ổ flash, thẻ nhớ, ổ cứng ngoài, CD):

  1. FAT32
  2. ISO9660

Hai hệ thống cuối cùng được thiết kế để hoạt động với đĩa CD. Hệ thống tệp Ext3 và Ext4 hoạt động với các hệ điều hành dựa trên Linux. NFS Plus là hệ thống tệp dành cho hệ điều hành OS X được sử dụng trên máy tính Apple.

Các hệ thống tệp được sử dụng rộng rãi nhất là NTFS và FAT32, và điều này không có gì đáng ngạc nhiên, bởi vì... chúng được thiết kế cho hệ điều hành Windows, hệ điều hành chạy phần lớn máy tính trên thế giới.

Hiện FAT32 đang được thay thế tích cực bằng hệ thống NTFS tiên tiến hơn do độ tin cậy cao hơn trong việc bảo vệ và an toàn dữ liệu. Ngoài ra, các phiên bản mới nhất của hệ điều hành Windows sẽ không cho phép cài đặt chúng nếu phân vùng ổ cứng được định dạng FAT32. Trình cài đặt sẽ yêu cầu bạn định dạng phân vùng thành NTFS.

Hệ thống tệp NTFS hỗ trợ các đĩa có dung lượng hàng trăm terabyte và kích thước tệp duy nhất lên tới 16 terabyte.

Hệ thống tệp FAT32 hỗ trợ các đĩa có dung lượng lên tới 8 terabyte và kích thước tệp duy nhất lên tới 4GB. Thông thường, FS này được sử dụng trên ổ đĩa flash và thẻ nhớ. Ổ đĩa ngoài được định dạng ở FAT32 tại nhà máy.

Tuy nhiên, giới hạn kích thước tệp 4GB hiện nay đã là một bất lợi lớn, bởi vì... Do việc phân phối video chất lượng cao, kích thước tệp của phim sẽ vượt quá giới hạn này và sẽ không thể ghi nó trên phương tiện truyền thông.

Chia sẻ.

23.08.2015

Người dùng thường gặp phải thực tế là ổ đĩa hoạt động với máy tính, nhưng không phải lúc nào cũng hoạt động với các thiết bị gia dụng. Đây là cách thể hiện sự khác biệt giữa các hệ thống tập tin, mỗi hệ thống có những đặc điểm riêng.

Trước khi sử dụng, mỗi phương tiện thường được định dạng và xóa tất cả các tệp có thể có trên đó, tên đĩa được đặt và quan trọng nhất là toàn bộ bề mặt của đĩa được đánh dấu để làm việc tiếp.

Về cơ bản, một hệ thống tệp mới được tạo trên đó và hệ thống tệp cũ sẽ bị xóa cùng với các tệp. Trong hầu hết các trường hợp, người dùng không chú ý đến định dạng của nó. Nhưng nếu bạn tiếp cận vấn đề một cách tỉ mỉ một chút, bạn có thể thấy rằng khi định dạng, có thể chỉ định các tùy chọn hệ thống tệp khác nhau - FAT, FAT32, NTFS.

Khái niệm “hệ thống tập tin” xuất hiện vào thời điểm đĩa mềm có dung lượng chỉ 1,44 MB được sử dụng làm phương tiện lưu trữ. Kể từ đó, rất ít thay đổi, chỉ dần dần các tiêu chuẩn mới được đưa ra để cải thiện các đặc tính kỹ thuật của máy tính, tuy nhiên, chúng gần như hoàn toàn tương thích với các sửa đổi cũ.

Hiện nay, các loại hệ thống tập tin sau đây được sử dụng rộng rãi nhất.

  • MẬP. Phương pháp định dạng ổ đĩa lỗi thời nhất.
  • FAT32. Một tiêu chuẩn chuyển tiếp, thường được hỗ trợ bởi các thiết bị gia dụng.
  • NTFS. Hệ thống tệp tiên tiến nhất trong số các tùy chọn được trình bày là lý tưởng cho máy tính gia đình.
    Mỗi hệ thống này đều có những nhược điểm và ưu điểm riêng.

MẬP

Do đã có tuổi đời rất lâu nên nó chỉ được sử dụng trong trường hợp các thiết bị cũ, chẳng hạn như trung tâm âm nhạc, không thể đọc được ổ đĩa flash được định dạng theo tiêu chuẩn khác. Người ta tin rằng đây là phiên bản thô sơ của Windows 98 khi nó còn được sử dụng. Nhưng ngay cả sau đó nó đã được thay thế bằng hệ thống FAT32 hiện đại hơn.

Nguyên nhân là do công nghệ không thể hỗ trợ đúng cách các ổ đĩa có dung lượng trên 500 MB. Nếu đối với ổ đĩa flash, dung lượng như vậy là giấc mơ tối thượng thì ổ cứng đã nhanh chóng vượt quá nó và bắt đầu yêu cầu một giải pháp hiệu quả hơn.

FAT32

Phiên bản hệ thống tệp này ra đời cùng với dòng Windows 95/98 và có thể đáp ứng nhu cầu phân vùng đĩa nhanh chóng, đủ tin cậy cho lần sử dụng tiếp theo. Về bản chất, đây là cùng một FAT, chỉ có khả năng tăng cường.

Vì vậy, sự khác biệt quan trọng nhất là:

  • Hỗ trợ ổ đĩa lên tới 4 GB đã xuất hiện.
  • Giảm yêu cầu về tài nguyên máy tính khi vận hành ổ đĩa.
  • Vùng khởi động của đĩa đã được mở rộng.
  • Tăng tốc độ hoạt động thêm 10-15%.

Hệ thống FAT32 được hỗ trợ bởi đại đa số các thiết bị gia dụng, vì vậy các ổ đĩa ngoài thường được định dạng trong đó cho đến ngày nay.

NTFS

Hệ thống tệp NTFS xuất hiện lần đầu tiên trong Windows 2000, nơi nó được chuyển từ các phiên bản NT của hệ điều hành, điều này rất cụ thể, bởi vì Nó chỉ được sử dụng cho các máy chủ và không ai thực sự nhìn thấy nó trên máy tính ở nhà hoặc văn phòng.

Nhưng theo thời gian, người dùng đã thích nghi với khả năng của loại đánh dấu mới và đánh giá đầy đủ những ưu điểm của nó.

  • Tích hợp hỗ trợ nén thư mục để tiết kiệm dung lượng lưu trữ.
  • Một kỹ thuật để tăng tốc truy cập vào các tập tin trong các thư mục lớn.
  • Công cụ phục hồi dữ liệu nâng cao cho các lỗi đĩa cục bộ.
  • Hệ thống bảo mật tiên tiến với khả năng áp đặt các hạn chế đối với người dùng cá nhân.

Có một số biến thể của hệ thống tệp này; với việc chuyển đổi sang các phiên bản Windows mới hơn, các tiêu chuẩn về vị trí tệp cũng đã thay đổi. Ví dụ: khi kết nối ổ đĩa có NTFS với hệ thống Windows 2000 đã lỗi thời, hệ thống sau có thể không nhận dạng được ổ đĩa flash được định dạng trong Windows 7.

Cách định dạng ổ đĩa tốt nhất

Nhiều phiên bản của hệ thống tệp, thậm chí cùng một họ, chẳng hạn như NTFS 4.0, 5.0, có thể dễ dàng được giải thích là do sự phát triển tự nhiên, khi các tiêu chuẩn cũ không thể đáp ứng được những đổi mới dự kiến ​​​​sẽ được giới thiệu trong tương lai. Cần phát triển một tiêu chuẩn có khả năng mới và phù hợp hơn với nhu cầu hiện tại.

Tất nhiên, vấn đề tương thích là vấn đề cấp bách nhất đối với các nhà phát triển, trong đó có Microsoft, nhưng không phải lúc nào họ cũng quan tâm đúng mức. Đặc biệt là khi nói đến hoạt động của các ổ đĩa được định dạng trên máy tính kết hợp với các thiết bị gia dụng (TV, đầu thu, hệ thống âm thanh nổi).

Khi chọn hệ thống tệp, mục đích của ổ đĩa được tính đến trước tiên. Do đó, NTFS thích hợp hơn cho các ổ cứng được sử dụng như một phần của máy tính; nó không chỉ cho phép bạn phát huy hết tiềm năng của các phiên bản Windows hiện tại mà còn loại bỏ nhiều hạn chế khác nhau. Ví dụ: có thể ghi các tệp lớn hơn 4 GB vào chúng, điều này sẽ gây ra lỗi khi sử dụng FAT32.

Nếu người dùng thích chơi trò chơi trên máy tính bằng cách tải xuống hình ảnh đĩa từ mạng hoặc thích tải xuống video ở định dạng HD hoặc Full HD độ phân giải cao thì NTFS sẽ thể hiện tốt nhất.

Đối với ổ đĩa ngoài, việc lựa chọn phương án tốt nhất sẽ dễ dàng hơn nhiều nếu bạn biết về sự hỗ trợ của ổ flash USB và ổ cứng cho tất cả các thiết bị gia dụng hiện có. Với thái độ này, bạn có thể dễ dàng nói liệu hệ thống FAT32 có cần thiết trên ổ đĩa flash hay bạn có thể dễ dàng sử dụng giá trị “tiêu chuẩn” và để lại lựa chọn “mặc định” – NTFS.
Rất ít đài và trung tâm âm nhạc hỗ trợ nó, vì vậy nếu bạn muốn nghe nhạc bằng kỹ thuật cụ thể này, bạn chỉ có thể sử dụng FAT32. Chỉ những TV chấp nhận hầu hết mọi định dạng lưu trữ mới ít nhiều phổ biến.

Cách thay đổi hệ thống tập tin

Đôi khi cần phải thay đổi hệ thống tệp trên ổ đĩa theo cách giữ cho tất cả dữ liệu không thay đổi. Trên thực tế, đối với các tệp và thư mục, việc chúng được lưu trữ ở đâu không quan trọng. Vì vậy vấn đề chuyển đổi là khá gay gắt.

Hệ điều hành Windows, bắt đầu từ phiên bản XP, được tích hợp sẵn tiện ích chuyển đổi FAT32 sang NTFS. Thật không may, không có quy trình ngược lại, vì vậy nếu bạn tìm thấy các chương trình không hoạt động với đánh dấu mới, bạn sẽ phải thay đổi chúng thành phiên bản cập nhật.


Trong những tình huống quan trọng, bạn có thể sử dụng các chương trình của bên thứ ba, chẳng hạn như Magic Magic. Chúng chứa rất nhiều chức năng không chuẩn dành cho Windows, chẳng hạn như phân vùng đĩa thành các phân vùng logic trong khi vẫn bảo toàn mọi thông tin. Vì vậy, quá trình ngược lại (từ NTFS sang FAT32) có thể được tổ chức.

Đối với ổ đĩa flash, quy trình định dạng nó thành hệ thống tệp mong muốn phù hợp hơn, nhưng trước đó, tất cả dữ liệu sẽ được sao chép vào ổ cứng máy tính và sau đó quay trở lại phương tiện bên ngoài.

Trên các ổ đĩa flash có dung lượng từ 2 GB trở xuống mà bạn gặp phải trong quá trình sử dụng, bạn chỉ nên giữ FAT32, đặc biệt vì các ổ đĩa này thường được sử dụng làm nơi lưu trữ nhạc cho radio, v.v. không có giá trị nó Nếu không có vấn đề gì phát sinh khi kết nối với các thiết bị khác nhau thì không cần phải định dạng ổ đĩa flash.