Tên tập tin đầy đủ bắt đầu bằng . Tập tin: tên tập tin. Tên tệp đầy đủ, ngắn, dài, đúng và không chính xác, thành phần, mẫu và mặt nạ của nó

(FS), thường được gọi là thư mục, thư mục hoặc thư mục. Tên tệp được xây dựng theo các quy tắc được áp dụng trong một tệp và hệ điều hành (HĐH) cụ thể. Nhiều hệ thống cho phép bạn gán tên cho cả tệp và thư mục thông thường cũng như các đối tượng đặc biệt (liên kết tượng trưng, ​​​​thiết bị khối, v.v.).

Tên tập tin là một phần tên tập tin đầy đủ, còn được gọi là hoàn thành hoặc một cách tuyệt đối vào tập tin. Họ và tên có thể bao gồm các thành phần sau:

Tên tệp là cần thiết để người dùng có thể truy cập tệp. Không thể có hai tập tin trong một thư mục với cùng tên(một số hệ thống tệp không phân biệt chữ hoa chữ thường, điều này cho phép tạo các tệp có tên khác nhau tùy từng chữ).

Tên file gồm 2 phần cách nhau bởi dấu chấm:

Tên tệp trên các hệ thống khác nhau

Đầy, hoặc tuyệt đối, là tên của tệp chứa tất cả các thư mục cho đến thư mục gốc của hệ thống tệp. Liên quan đến tên tệp không chứa đường dẫn đầy đủ và thường được liên kết với thư mục hiện tại.

các cửa sổ

  • \ - dấu phân cách thư mục con
  • / - dấu phân cách khóa thông dịch lệnh
  • : - phân tách ký tự ổ đĩa hoặc tên của luồng dữ liệu thay thế
  • * - ký tự thay thế (che dấu "bất kỳ số lượng ký tự nào")
  • ? - ký tự thay thế (che dấu "bất kỳ ký tự nào")
  • " - dùng để chỉ định đường dẫn chứa khoảng trắng
  • < - перенаправление ввода
  • > - chuyển hướng đầu ra
  • | - biểu thị một băng tải

Trong các hệ điều hành giống UNIX và UNIX, dấu gạch chéo (/) - dấu phân cách thư mục con - và ký tự cuối dòng (\0) đều bị cấm. Các ký tự được liệt kê ở trên (ngoại trừ dấu gạch chéo) có thể được sử dụng, nhưng vì lý do tương thích, tốt hơn nên tránh chúng.

Phần mở rộng tên tệp

Phần mở rộng tên tệp(Tiếng Anh) phần mở rộng tên tập tin, họ thường nói đơn giản phần mở rộng tập tin hoặc sự mở rộng) - một chuỗi ký tự được thêm vào tên tệp và nhằm mục đích xác định loại (định dạng) của tệp. Đây là một trong những cách phổ biến mà người dùng hoặc phần mềm máy tính có thể xác định loại dữ liệu được lưu trữ trong một tệp. Phần mở rộng được phân tách khỏi phần chính của tên tệp bằng dấu chấm cuối cùng. Đôi khi một số phần mở rộng có thể được sử dụng, nối tiếp nhau, ví dụ: ".tar.gz".

Hệ điều hành hoặc trình quản lý tệp có thể ánh xạ các phần mở rộng tệp tới các ứng dụng. Khi người dùng mở một tệp có tiện ích mở rộng đã đăng ký, chương trình tương ứng với tiện ích mở rộng đó sẽ tự động khởi chạy. Một số tiện ích mở rộng có thể chỉ ra rằng tệp có thể thực thi được (trên Windows).

Xem thêm

Văn học

  • Robachevsky A. N., Nemnyugin S. A., Stesik O. L. Tên tệp/Tệp cơ sở hệ thống Hệ thống V/ Chương 4. Hệ thống file // hệ điều hành UNIX. - tái bản lần thứ 2. - St.Petersburg. : BHV-Petersburg, 2008. - trang 338-339. - 656 giây. - ISBN 978-5-94157-538-1

Quỹ Wikimedia. 2010.

  • Yasaka-jinja
  • Dubovik

Xem “Tên tệp” là gì trong các từ điển khác:

    Thuộc tính tệp- một tập hợp các byte để phân biệt một tập tin với nhiều tập tin khác. Các thuộc tính của tệp là: tên tệp và loại nội dung; ngày và giờ tạo tập tin; tên chủ sở hữu tập tin; Kích thước tập tin; quyền truy cập tập tin; phương pháp truy cập tập tin. Xem thêm:… … Từ điển tài chính

    Phần mở rộng tên tệp- (phần mở rộng tên tệp tiếng Anh, thường được gọi đơn giản là phần mở rộng hoặc phần mở rộng tệp) một chuỗi ký tự được thêm vào tên tệp và nhằm mục đích xác định loại (định dạng) của tệp. Đây là một trong những phương pháp phổ biến, với... ... Wikipedia

    chuyển tập tin- Chuyển một tập tin từ một thư mục hoặc thư mục khác. Thông thường, khi chuyển, người dùng sẽ thay đổi tên tệp. Kết quả là tập tin được ghi ở một vị trí mới và bị xóa ở vị trí cũ. Ngược lại, khi bạn sao chép một tập tin, nó sẽ xuất hiện ở một vị trí mới... ...

    định dạng tập tin X- định dạng tệp để lưu trữ các đối tượng 3D được tạo bởi bởi Microsoft. Định dạng này lưu trữ thông tin về hình học của vật thể 3D (tọa độ đỉnh và tọa độ chuẩn), tọa độ kết cấu, mô tả vật liệu, đường dẫn và tên đến kết cấu ... Wikipedia

    Định dạng tệp- Đặc tả định dạng của cấu trúc dữ liệu được ghi trong tập tin máy tính. Định dạng tệp thường được biểu thị bằng tên của nó, dưới dạng một phần được phân cách bằng dấu chấm (phần này thường được gọi là phần mở rộng tên tệp, mặc dù nói đúng ra thì điều này không đúng). Ví dụ,... ... Wikipedia

    thuộc tính tập tin- Thuộc tính tệp có thể nhận dạng (tên, v.v.) [E.S. Alekseev, A.A. Myachev. Tiếng Anh Tiếng Nga Từ điển trong kỹ thuật hệ thống máy tính. Matxcơva 1993] Chủ đề công nghệ thông tin nói chung thuộc tính tệp EN ... Hướng dẫn dịch thuật kỹ thuật

thư mục, vì vậy "methody", "Methody" và "METHODY" sẽ là ba khác biệt những cái tên.

Có một số ký tự được phép sử dụng trong tên tệp và thư mục phải được sử dụng thận trọng. Đây là những ký tự đặc biệt "*", "\", "&", "< ", " >"," ; ", " ( ", " ) ", " | ", cũng như các ký tự dấu cách và tab. Thực tế là các ký tự này có ý nghĩa đặc biệt đối với bất kỳ vỏ bọc, vì vậy cần phải có sự quan tâm đặc biệt để đảm bảo rằng vỏ lệnh coi các ký tự này là một phần của tên tệp hoặc thư mục. VỀ Ý nghĩa đặc biệt ký tự "-" cho Lệnh Linuxđã được thảo luận ở bài giảng 2, ở đó cũng đã thảo luận về cách thay đổi cách giải thích của anh ấy về 1 Ký hiệu " - " có nghĩa là từ tiếp theo là một khóa, còn dấu cách và tab phân tách các tham số trên dòng lệnh.. Tại sao shell lệnh cần các ký tự đặc biệt sẽ được thảo luận ở Bài 8.

Mã hóa và tên tiếng Nga

Như bạn có thể thấy, cho đến nay trong tất cả các tên tệp và thư mục gặp phải, chỉ có các ký tự Latinh và một số dấu chấm câu được sử dụng. Điều này không phải ngẫu nhiên mà là do mong muốn làm cho các ví dụ được cung cấp trông giống nhau trên bất kỳ hệ thống nào. Trong Linux, được phép sử dụng bất kỳ ký tự nào từ bất kỳ ngôn ngữ nào trong tên tệp và thư mục, nhưng sự tự do đó đòi hỏi phải có những hy sinh mà Methodius, chẳng hạn, không thể thực hiện được.

Thực tế là trong một thời gian dài, mỗi ký hiệu (chữ cái) của mỗi ngôn ngữ theo truyền thống được thể hiện dưới dạng một byte. Quan điểm này áp đặt những hạn chế rất nghiêm ngặt đối với số lượng chữ cái trong bảng chữ cái: không thể có nhiều hơn 256 trong số chúng và trừ các ký tự điều khiển, số, dấu chấm câu và những thứ khác - thậm chí còn ít hơn. Các bảng chữ cái mở rộng (ví dụ, chữ tượng hình tiếng Nhật và tiếng Trung) phải được thay thế bằng cách thể hiện đơn giản hóa chúng. Ngoài ra, tốt nhất bạn nên luôn giữ nguyên 128 ký tự đầu tiên trong số 256 ký tự này, tương ứng với tiêu chuẩn ASCII, bao gồm tiếng Latin, số, dấu câu và các ký tự phổ biến nhất thường thấy trên bàn phím máy đánh chữ. Việc giải thích 128 ký tự còn lại phụ thuộc vào loại mã hóa được cài đặt trên hệ thống. Ví dụ: trong mã hóa KOI8-R của Nga, ký tự thứ 228 của bảng như vậy tương ứng với chữ cái “D” và trong mã hóa Tây Âu ISO-8859-1, ký tự tương tự tương ứng với chữ cái “a” có hai dấu chấm ở trên nó (giống như chữ cái “e” của chúng ta).

Tên tập tin, ghi lại vào đĩa có cùng mã hóa, chúng trông thật lố bịch nếu duyệt danh mục một cái khác đã được cài đặt. Hơn nữa, nhiều bảng mã điền phạm vi ký tự với các số từ 128 đến 255 không hoàn toàn, vì vậy ký hiệu tương ứng có thể không tồn tại! Nó có nghĩa là đi vào Tên tệp bị bóp méo như vậy từ bàn phím (ví dụ: để đổi tên nó) sẽ không thể thực hiện được trực tiếp: bạn sẽ phải sử dụng nhiều thủ thuật khác nhau được mô tả trong bài giảng 8. Cuối cùng, nhiều ngôn ngữ, bao gồm cả tiếng Nga, về mặt lịch sử có một số bảng mã 2 Bản thân Methodius đã nhận được nhiều lần email, bắt đầu bằng các từ "bNOPNYA" hoặc "bMHLYUMHE" - kết quả của việc biểu diễn văn bản có mã hóa CP-1251 theo mã hóa KOI8-R.. Thật không may là hiện tại không phương pháp chuẩn cho biết mã hóa trực tiếp trong tên tệp, do đó trong một hệ thống tập tin Cần tuân thủ một bảng mã duy nhất khi đặt tên tệp.

Có một bảng mã phổ quát bao gồm các ký tự từ tất cả các chữ viết trên thế giới - UNICODE. Tiêu chuẩn UNICODE hiện đang ngày càng trở nên phổ biến và được tuyên bố là phổ biến cho tất cả các văn bản được lưu trữ trong ở dạng điện tử. Tuy nhiên, nó vẫn chưa đạt được tính linh hoạt như mong muốn, đặc biệt là trong lĩnh vực tên file. Một một ký tự trong UNICODE có thể chiếm hơn một byte - và thế là xong nhược điểm chính, vì có nhiều điều hữu ích chương trình ứng dụng, làm việc tuyệt vời với mã hóa một byte, cần phải được làm lại một cách triệt để hoặc thậm chí hoàn toàn để dạy họ cách xử lý UNICODE. Có lẽ lý do khiến mã hóa này không phổ biến cũng là vì UNICODE là một tiêu chuẩn rất cồng kềnh và nó có thể trở nên không hiệu quả khi làm việc với hệ thống tập tin, trong đó tốc độ xử lý và độ tin cậy là những phẩm chất rất cần thiết.

Điều này không có nghĩa là bạn không nên sử dụng ngôn ngữ khác ngoài tiếng Anh khi đặt tên file. Miễn là bạn biết chính xác tên tệp được mã hóa theo cách nào thì sẽ không có vấn đề gì. Tuy nhiên, Methodius quyết định rằng có sự đảm bảo trong việc chuyển tập tin có tên bằng tiếng Nga sang một số người. khác hệ thống chỉ có thể đạt được bằng cách chuyển kèm theo nó một cài đặt mã hóa, thậm chí là hai cài đặt: trong hệ thống của bạn và trong hệ thống của người nhận (không biết cái nào!). Khác, nhiều hơn nữa cách dễ dàng tập tin chuyển - sử dụng tên của nó chỉ một ký tự ASCII.

Tiện ích mở rộng

Nhiều người dùng đã quen thuộc với khái niệm này sự mở rộng- phần tên file sau dấu chấm, thường giới hạn ở một vài ký tự và cho biết loại dữ liệu có trong file. TRONG hệ thống tập tin Linux không có quy định nào về phần mở rộng: tên tệp có thể có số lượng dấu chấm bất kỳ (kể cả không có dấu chấm nào) và sau dấu chấm cuối cùng có thể có số lượng ký tự bất kỳ 3 Ngược lại với các hệ thống tệp cũ được tổ chức theo nguyên tắc “8 + 3” (DOS, ISO9660, v.v.), trong đó tên tệp được phép có nhiều hơn một dấu chấm và phần mở rộng không được dài quá 3 ký tự. Giới hạn này đã xác định sự xuất hiện của nhiều phần mở rộng tệp được biết đến ngày nay, chẳng hạn như "txt" cho tệp văn bản.. Mặc dù các tiện ích mở rộng là tùy chọn và không bị áp đặt bởi công nghệ trên Linux, nhưng chúng vẫn được sử dụng rộng rãi: tiện ích mở rộng cho phép một người hoặc chương trình xác định mà không cần mở tệp, chỉ bằng tên của nó, loại dữ liệu chứa trong đó. Tuy nhiên, hãy nhớ rằng phần mở rộng chỉ là một tập hợp các quy ước đặt tên tệp các loại khác nhau. Nói đúng ra, dữ liệu trong tệp có thể không tương ứng với phần mở rộng đã khai báo vì lý do này hay lý do khác, vì vậy bạn không thể hoàn toàn dựa vào phần mở rộng.

Bạn cũng có thể xác định loại nội dung tệp dựa trên chính dữ liệu đó. Nhiều định dạng cung cấp chỉ dẫn ở đầu tệp về cách diễn giải thêm thông tin: dưới dạng một chương trình, dữ liệu nguồn cho soạn thảo văn bản, trang HTML, tập tin âm thanh, hình ảnh hoặc cái gì khác. Có sẵn Người dùng Linux Luôn có một tiện ích tệp, được thiết kế đặc biệt để xác định loại dữ liệu có trong tệp:

$ file -- -filename-with- -filename-with-: Văn bản tiếng Anh ASCII $ file /home/methody /home/methody: thư mục Ví dụ 3.1. Xác định kiểu dữ liệu trong file

Methodius, vì đã quên những gì chứa trong tập tin "-filename-with-", mà ông đã tạo trong ví dụ được trình bày ở bài giảng trước, nên muốn xem nội dung của nó bằng cách sử dụng lệnh mèo. Tuy nhiên, anh đã bị Gurevich ngăn lại, người khuyên anh trước tiên nên tìm hiểu xem tệp này chứa loại dữ liệu nào. Có thể đây là tệp nhị phân của một chương trình thực thi và tệp đó có thể chứa các chuỗi ngẫu nhiên trùng với trình tự thoát hiểm phần cuối. Hoạt động của thiết bị đầu cuối sau đó có thể trở nên không thể đoán trước được và người dùng thiếu kinh nghiệm khó có thể đương đầu được với nó. Methodius đã nhận được câu trả lời hoàn toàn chính xác từ tiện ích tập tin: tập tin của anh ấy chứa văn bản tiếng Anh ở dạng mã hóa ASCII. tập tin có thể phân biệt nhiều loại dữ liệu và gần như chắc chắn sẽ tạo ra Thông tin chính xác. Tiện ích này không bao giờ tin cậy vào phần mở rộng tệp (nếu có) và tự phân tích dữ liệu. file không chỉ phân biệt các dữ liệu khác nhau mà còn phân biệt các loại tệp khác nhau, đặc biệt, nó sẽ báo cáo nếu tệp đang được kiểm tra không phải là tệp thông thường mà là một thư mục chẳng hạn.

Cây thư mục

Khái niệm thư mục cho phép hệ thống hóa tất cả các đối tượng nằm trên phương tiện lưu trữ (ví dụ: đĩa). Hầu hết các hệ thống tập tin hiện đại đều sử dụng mô hình phân cấp tổ chức dữ liệu: có một thư mục kết hợp tất cả dữ liệu trong hệ thống tập tin- đây là “gốc rễ” của mọi thứ hệ thống tập tin, thư mục gốc . Thư mục gốc có thể chứa bất kỳ đối tượng nào hệ thống tập tin và đặc biệt là các thư mục con (thư mục ở cấp độ lồng nhau đầu tiên). Ngược lại, chúng cũng có thể chứa bất kỳ đối tượng nào hệ thống tập tin và các thư mục con (mức lồng nhau thứ hai), v.v. Do đó, Tất cả những gì được ghi trên đĩa - các tập tin, thư mục và các tập tin đặc biệt - nhất thiết phải "thuộc về" thư mục gốc : trực tiếp (có trong nó) hoặc ở một mức độ lồng nhau nào đó.

Hệ thống phân cấp của các thư mục lồng vào nhau có thể tương quan với hệ thống phân cấp của dữ liệu trong hệ thống: được kết hợp theo chủ đề tài liệu liên quan vào danh mục, các danh mục có liên quan theo chủ đề - thành một thư mục chung v.v. Nếu bạn tuân thủ nghiêm ngặt nguyên tắc phân cấp thì càng sâu sắc mức độ lồng nhau thư mục, đặc biệt vì dữ liệu chứa trong đó phải được kết hợp bởi một tính năng cụ thể. Nếu bạn không tuân theo nguyên tắc này, thì việc đặt tất cả các tệp vào một thư mục và tìm kiếm tệp bạn cần trong số chúng sẽ sớm trở nên dễ dàng hơn nhiều so với việc thực hiện tìm kiếm như vậy trong tất cả các thư mục con của hệ thống. Tuy nhiên, trong trường hợp này, về bất kỳ tổ chức tập tin không cần phải nói chuyện.

Kết cấu hệ thống tập tin có thể được hình dung như một cái cây 4 Ở đây chúng tôi muốn nói đến một cái cây theo nghĩa toán học chặt chẽ: một đồ thị có hướng không có chu trình với một đỉnh gốc duy nhất, trong đó mỗi đỉnh chứa chính xác một cạnh., có “gốc” là thư mục gốc, và tất cả phần còn lại đều nằm ở các đỉnh

Thông tin trong bộ nhớ ngoài(tức là ngoài RAM và ROM) được lưu trữ trong các tệp.

Tài liệu- đây là một cái tên theo một cách nào đó một phần của ký ức. Đây là dung lượng bộ nhớ ngoài được thiết kế để lưu trữ cùng loại bộ nhớ.

Trước đây, chỉ có thể đặt tên tệp bằng các chữ cái và số Latinh, không sử dụng dấu chấm câu và tổng cộng không quá 8 ký tự.

Bây giờ gần như tất cả các hạn chế đã được dỡ bỏ.

Sau tên file có phần mở rộng (cần thiết để xác định loại và định dạng của file). Điểm đi vào nó. Tất cả cùng nhau (tên + dấu chấm + phần mở rộng) được gọi là tên file đầy đủ.

Tiện ích mở rộng cho phép bạn xác định xem tệp này là thông tin thực thi (chương trình) hay tĩnh (-static?) (văn bản, nhạc, hình ảnh).

Các loại có thể thực thi:

*.exe (thực thi) – các chương trình thực thi cho DOS và Windows.

*.COM (nhỏ gọn) – loại đơn giản tập tin thực thi cho DOS, nhưng cũng có thể được thực hiện trên Windows.

*.bat (tệp bó) - một tệp văn bản trong MS-DOS hoặc Windows, chứa một chuỗi các lệnh dành cho trình thông dịch lệnh thực thi.

Đặc điểm kỹ thuật – đường dẫn đến tên tệp đầy đủ.

Nó thu được dựa trên cấu trúc phân cấp (thư mục, thư mục).

Thư mục (thư mục, thư mục) – một phần bộ nhớ được đặt tên theo một cách nhất định, trong đó tên của các tập tin và thư mục khác có nhiều hơn mức độ cao làm tổ.

ổ cứng có thể được chia thành nhiều ổ đĩa logic (C:, D:, E:, v.v.).

C:\tên thư mục cấp 1\2nd\cấp 3\...\...\......\*.*

Bạn cũng có thể liên kết đến một tệp bằng biểu tượng, phím tắt chứ không chỉ bằng cách nhập đường dẫn vào dòng lệnh.

Cấu trúc tập tin ký ức.

Câu hỏi 1. Hệ thống tập tin. Tổ chức công việc với các tập tin và thư mục.

Lưu trữ thông tin trong bộ nhớ ngoài.

HĐH cung cấp khả năng lưu trữ thông tin trong bộ nhớ ngoài (trên đĩa mềm, ổ cứng và đĩa laser) dưới dạng tệp.

Tài liệu– một vùng bộ nhớ được đặt tên để lưu trữ thông tin khác nhau: văn bản, đồ họa, âm thanh, video - dữ liệu và chương trình.

Loại tập tin

1. Văn bản

2. Âm thanh

3. Đồ họa

4. Tệp video

5. Số

6. Phần mềm

Tên tập tin

Tên tập tin đầy đủ cần thiết để chỉ ra chính xác vị trí của tập tin. Gồm 2 phần cách nhau bởi dấu chấm:

Tên riêng [.Extension]

Ví dụ, tài liệu 1.doc.

Tên có thể chứa:

1. Từ 1 đến 8 ký tự (đối với MS-DOS)

2. Từ 1 đến 255 ký tự (đối với W-95).

Phần tên của chính tôi các tập tin có thể bao gồm:

1. Chữ thường và chữ hoa bức thư(đối với MS-DOS), cũng như các chữ cái tiếng Nga (đối với Windows).

3. Một số ký hiệu dịch vụ:

Các ký tự sau không thể được sử dụng trong tên tệp: / \ * ? : | “ < >

Sự mở rộng(tùy chọn) - cho biết loại tệp, được xác định bởi thông tin được lưu trữ trong đó. Bắt đầu bằng dấu chấm và chứa từ 1 đến 3 ký tự.

MỞ RỘNG

1. Tệp văn bản: .txt, .doc, v.v.

2. Tệp đồ họa: .bmp, .pcx, .gif, v.v.

3. Tập tin âm thanh: .wav, .mid, .snd, v.v.

4. Tệp video: .avi, .gtw, v.v.

5. Tệp số: .thùng rác

6. File chương trình: .bat, .com, .exe.

Để tổ chức tìm kiếm nhanh tập tin mong muốn trên đĩa, các tập tin được gộp thành các nhóm - thư mục (thư mục). Mỗi thư mục có một tên duy nhất. Yêu cầu đối với tên thư mục cũng giống như đối với tên tệp. Phần mở rộng trong tên thư mục (thư mục) không được sử dụng. Các tệp và thư mục tạo thành một “cây” thư mục, trong đó mỗi tệp và thư mục có vị trí (cấp độ) riêng. Nhằm xác định địa điểm chính xác tập tin, bạn nên biết tên ổ đĩa chứa nó ( Đ:, C: v.v.) và trình tự các thư mục cần mở trên đường dẫn đến thư mục chứa tệp.

Cây thư mục.

Trang chủ Thư mục Thư mục Thư mục Thư mục FILES

Cấp thư mục I Cấp II Cấp III Cấp YI

Hệ thống tệp - thứ tự xác định cách tổ chức, lưu trữ và đặt tên dữ liệu trên phương tiện lưu trữ trong máy tính cũng như trong các thiết bị khác điện tử thiết bị: máy ảnh kĩ thuật số , điện thoại di động v.v. Hệ thống tập tin xác định định dạng nội dung và phương pháp lưu trữ thông tin vật lý, thường được nhóm lại dưới dạng các tập tin. Hệ thống tệp cụ thể xác định kích thước của tên tệp ( thư mục), tối đa kích thước có thể tập tin và phần, thiết lập thuộc tính tài liệu. Một số hệ thống tệp cung cấp khả năng dịch vụ, ví dụ: kiểm soát truy cập hoặc mã hóa các tập tin.

TRONG theo nghĩa rộng Khái niệm "hệ thống tập tin" bao gồm:

  • tổng số tất cả các tập tin trên đĩa,
  • · Bộ cấu trúc dữ liệu được sử dụng để quản lý tệp, chẳng hạn như thư mục tệp, bộ mô tả tệp, bảng phân bổ không gian đĩa trống và đã sử dụng,
  • · hệ thống phức tạp phần mềm, thực hiện quản lý tệp, cụ thể: tạo, hủy, đọc, ghi, đặt tên, tìm kiếm và các thao tác khác trên tệp.

Tệp là một khái niệm quen thuộc với bất kỳ người dùng máy tính nào. Đối với người dùng, mỗi tệp là một đối tượng riêng biệt, có phần đầu và phần cuối, đồng thời khác với tất cả các tệp khác về tên và vị trí (“nó được gọi là gì” và “nó nằm ở đâu”). Giống như bất kỳ đối tượng nào, một tập tin có thể được tạo, di chuyển và hủy, nhưng nếu không có sự can thiệp từ bên ngoài, nó sẽ không thay đổi vô thời hạn. trong một khoảng thời gian dài. Tệp này nhằm mục đích lưu trữ bất kỳ loại dữ liệu nào - văn bản, đồ họa, âm thanh, chương trình thực thi và nhiều hơn nữa. Sự tương tự của một tệp với một đối tượng cho phép người dùng nhanh chóng cảm thấy thoải mái khi làm việc với dữ liệu trong hệ điều hành.

Tên tập tin:

Các tập tin được xác định bằng tên. Người dùng đặt tên tượng trưng cho tệp, có tính đến các hạn chế của hệ điều hành đối với cả ký tự được sử dụng và độ dài của tên. Cho đến gần đây, những ranh giới này rất hẹp. Vì vậy, trong tập tin phổ biến Hệ thống FATđộ dài của tên bị giới hạn bởi sơ đồ 8.3 nổi tiếng (8 ký tự - chính tên, 3 ký tự - phần mở rộng tên) và trong UNIX System V, tên không được chứa nhiều hơn 14 ký tự. Tuy nhiên, sẽ thuận tiện hơn nhiều cho người dùng khi làm việc với tên dài, vì chúng cho phép bạn đặt cho tệp một cái tên thực sự dễ nhớ, mà ngay cả sau một khoảng thời gian khá dài, bạn vẫn có thể nhớ tệp này chứa gì. Do đó, các hệ thống tệp hiện đại có xu hướng hỗ trợ các tên tệp tượng trưng dài. Ví dụ: Windows NT trong tệp mới của nó hệ thống NTFS chỉ định rằng tên tệp có thể dài tối đa 255 ký tự, không tính ký tự null kết thúc.

Tên dài không chỉ được hỗ trợ bởi các hệ thống tệp mới mà còn bởi các phiên bản mới của hệ thống tệp nổi tiếng. Ví dụ: Windows 95 sử dụng hệ thống tệp VFAT, đây là phiên bản được sửa đổi đáng kể của FAT. Trong số nhiều cải tiến khác, một trong những ưu điểm chính của VFAT là hỗ trợ các tên dài. Ngoài vấn đề tạo ra các tên ngắn tương đương, khi triển khai phiên bản FAT mới, một nhiệm vụ quan trọng là vấn đề lưu trữ tên dài, với điều kiện là phương thức lưu trữ và cấu trúc dữ liệu trên đĩa về cơ bản không được thay đổi.

Thường xuyên các tập tin khác nhau có thể có cùng tên tượng trưng. Trong trường hợp này, tệp được xác định duy nhất bằng cái gọi là tên ghép, là một chuỗi các tên thư mục tượng trưng. Một số hệ thống không thể đặt nhiều tên khác nhau cho cùng một tệp, trong khi những hệ thống khác không có hạn chế như vậy. Trong trường hợp sau, hệ điều hành gán một tên duy nhất bổ sung cho tệp để có thể thiết lập sự tương ứng một-một giữa tệp và tên duy nhất của nó. Tên duy nhất là một mã định danh bằng số và được sử dụng bởi các chương trình hệ điều hành. Một ví dụ về tên tệp duy nhất như vậy là số inode V. hệ thống UNIX.

Loại tập tin:

Các tập tin có nhiều loại khác nhau: tập tin thông thường, tập tin đặc biệt, tập tin thư mục.

Ngược lại, các tệp thông thường được chia thành văn bản và nhị phân. Các tệp văn bản bao gồm các chuỗi ký tự được biểu thị bằng mã ASCII. Đây có thể là những tài liệu văn bản nguồn các chương trình, v.v. Các tập tin văn bản có thể được đọc trên màn hình và được in trên máy in. Tệp nhị phân không sử dụng mã ASCII, chúng thường có cấu trúc bên trong phức tạp, chẳng hạn như mã đối tượng chương trình hoặc tập tin lưu trữ. Tất cả các hệ điều hành phải có khả năng nhận dạng ít nhất một loại tệp - tệp thực thi của riêng chúng.

Các tập tin đặc biệt là các tệp được liên kết với các thiết bị I/O cho phép người dùng thực hiện các thao tác I/O bằng cách sử dụng các lệnh thông thường để ghi hoặc đọc từ một tệp. Các lệnh này trước tiên được xử lý bởi các chương trình hệ thống tệp, sau đó ở một số giai đoạn thực hiện yêu cầu, chúng được HĐH chuyển đổi thành các lệnh điều khiển cho thiết bị tương ứng. Các tệp đặc biệt, như thiết bị I/O, được chia thành hướng khối và hướng byte.

Một mặt, thư mục là một nhóm các tệp được người dùng kết hợp dựa trên những cân nhắc nhất định (ví dụ: các tệp chứa chương trình trò chơi hoặc các tệp tạo thành một thư mục). gói phần mềm) và mặt khác là một tệp chứa thông tin hệ thống về nhóm tập tin tạo nên nó. Thư mục chứa danh sách các tệp có trong đó và sự tương ứng được thiết lập giữa các tệp và các đặc tính (thuộc tính) của chúng.

Vô tư hệ thống tập tin có thể được sử dụng làm thuộc tính đặc điểm khác nhau, Ví dụ:

  • thông tin về quyền truy cập được phép,
  • · mật khẩu để truy cập tập tin,
  • · chủ sở hữu tập tin,
  • · người tạo tập tin,
  • dấu hiệu "chỉ đọc"
  • · dấu hiệu " tập tin ẩn",
  • · dấu hiệu " tập tin hệ thống",
  • · ký vào "tập tin lưu trữ",
  • · dấu "nhị phân/ký tự",
  • · ký "tạm thời" (xóa sau quá trình hoàn thành),
  • · biển báo chặn,
  • chiều dài kỷ lục
  • · con trỏ tới trường khóa trong bản ghi,
  • · độ dài khóa,
  • · thời gian tạo, lần truy cập cuối cùng và thay đổi cuối cùng,
  • kích thước tập tin hiện tại,
  • · Kích thước tối đa tài liệu.

Các thư mục có thể chứa trực tiếp các giá trị của các đặc điểm tệp, như được thực hiện trong hệ thống tệp MS-DOS hoặc tham chiếu đến các bảng chứa các đặc điểm này, như được triển khai trong hệ điều hành UNIX.

Các thư mục có thể tạo thành một cấu trúc phân cấp do thực tế là thư mục này có nhiều cấp thấp có thể là một phần của thư mục cấp cao hơn.

/libhistory.so.5.2

(Hệ thống tệp phân cấp trong các hệ điều hành giống Unix và UNIX):

Hệ thống phân cấp thư mục có thể là một cây hoặc một mạng. Các thư mục tạo thành một cây nếu một tập tin chỉ được phép đưa vào một thư mục và một mạng nếu một tập tin có thể được đưa vào nhiều thư mục cùng một lúc. Trong MS-DOS, các thư mục tạo thành một cấu trúc cây và trong UNIX, chúng tạo thành một cấu trúc mạng.Giống như bất kỳ tệp nào khác, một thư mục có một tên tượng trưng và được xác định duy nhất bằng một tên ghép chứa một chuỗi các tên tượng trưng của tất cả các thư mục mà qua đó đường dẫn từ thư mục gốc đến thư mục này đi qua.

Tổ chức tập tin logic:

Lập trình viên xử lý việc tổ chức logic của một tệp, biểu diễn tệp dưới dạng các bản ghi logic được tổ chức theo một cách nhất định. Bản ghi logic là phần dữ liệu nhỏ nhất mà lập trình viên có thể thao tác khi trao đổi với thiết bị bên ngoài. Ngay cả khi việc trao đổi vật lý với thiết bị được thực hiện theo đơn vị lớn, hệ điều hành vẫn cung cấp cho người lập trình quyền truy cập vào một bản ghi logic riêng biệt. Hình 2.33 cho thấy một số sơ đồ tổ chức logic của một tập tin. Bản ghi có thể có độ dài cố định hoặc độ dài thay đổi. Các bản ghi có thể được sắp xếp tuần tự trong một tệp (tổ chức tuần tự) hoặc theo thứ tự phức tạp hơn, sử dụng cái gọi là bảng chỉ mục để đảm bảo truy cập nhanhđến một bản ghi logic riêng biệt (tổ chức tuần tự chỉ mục). Một trường đặc biệt trong bản ghi được gọi là khóa có thể được sử dụng để xác định bản ghi. Trong hệ thống tập tin UNIX OS và tập tin MS-DOS có cách đơn giản nhất cấu trúc logic- một chuỗi các bản ghi một byte.

Tổ chức vật lý và địa chỉ tệp:

Tổ chức tệp vật lý mô tả các quy tắc đặt tệp trên thiết bị lưu trữ bên ngoài, đặc biệt là trên đĩa. Tập tin bao gồm hồ sơ vật lý- khối. Khối là đơn vị dữ liệu nhỏ nhất được thiết bị bên ngoài trao đổi với RAM. Vị trí liên tục - lựa chọn đơn giản nhất tổ chức thể chất(Hình 2.34a), trong đó tệp được cung cấp một chuỗi các khối đĩa tạo thành một vùng liên tục duy nhất bộ nhớ đĩa. Để chỉ định địa chỉ tệp trong trường hợp này, chỉ cần chỉ định số khối bắt đầu là đủ. Một ưu điểm khác của phương pháp này là tính đơn giản của nó. Nhưng cũng có hai nhược điểm đáng kể. Thứ nhất, khi tạo một tệp, độ dài của nó không được biết trước, có nghĩa là không biết nên dành bao nhiêu bộ nhớ cho tệp này và thứ hai, với thứ tự vị trí này, chắc chắn sẽ xảy ra hiện tượng phân mảnh và dung lượng ổ đĩa không được sử dụng hiệu quả. , từ khu vực riêng biệt kích thước nhỏ(tối thiểu 1 khối) có thể vẫn chưa được sử dụng.

Phương pháp tổ chức vật lý tiếp theo là sắp xếp theo hình thức danh sách liên kết khối bộ nhớ đĩa (Hình 2.34b). Với phương pháp này, ở đầu mỗi khối có một con trỏ tới khối tiếp theo. Trong trường hợp này, địa chỉ tệp cũng có thể được chỉ định bằng một số - số của khối đầu tiên. không giống phương pháp trước đó, mỗi khối có thể được gắn vào một chuỗi của bất kỳ tệp nào, do đó không có sự phân mảnh. Tệp có thể thay đổi trong quá trình tồn tại, làm tăng số lượng khối. Nhược điểm là sự phức tạp của việc thực hiện quyền truy cập vào một vị trí được chỉ định tùy ý trong tệp: để đọc khối thứ năm của tệp theo thứ tự, cần phải đọc tuần tự bốn khối đầu tiên, truy tìm chuỗi số khối. Ngoài ra, với phương pháp này, lượng dữ liệu tệp chứa trong một khối không bằng lũy ​​thừa hai (một từ được sử dụng cho số khối tiếp theo) và nhiều chương trình đọc dữ liệu theo khối có kích thước bằng lũy ​​thừa của hai.

Một phương pháp phổ biến được sử dụng, ví dụ, trong hệ điều hành FAT Hệ thống MS-DOS, là sử dụng danh sách chỉ mục được liên kết. Mỗi khối được liên kết với một phần tử nhất định - một chỉ mục. Các chỉ mục được đặt trong một vùng riêng biệt của đĩa (trong MS-DOS đây là bảng FAT). Nếu một khối nhất định được phân bổ cho một tệp nhất định thì chỉ mục của khối này chứa số khối tiếp theo của tệp này. Với cách tổ chức vật lý này, tất cả các ưu điểm của phương pháp trước vẫn được giữ nguyên, nhưng cả hai nhược điểm đã lưu ý đều bị loại bỏ: thứ nhất, để truy cập vào một vị trí tùy ý trong tệp, chỉ cần đọc khối chỉ mục, đếm là đủ số lượng yêu cầu tập tin khối dọc theo chuỗi và xác định số lượng khối mong muốn và thứ hai, dữ liệu tệp chiếm toàn bộ khối, có nghĩa là nó có âm lượng bằng lũy ​​thừa hai.

Để kết luận, hãy xem xét việc chỉ định vị trí vật lý của tệp bằng cách liệt kê các số khối mà tệp này chiếm giữ. Hệ điều hành UNIX sử dụng tùy chọn phương pháp này, cho phép độ dài địa chỉ cố định bất kể kích thước tệp. Có 13 trường được phân bổ để lưu trữ địa chỉ tệp. Nếu kích thước tệp nhỏ hơn hoặc bằng 10 khối thì số lượng của các khối này sẽ được liệt kê trực tiếp trong mười trường đầu tiên của địa chỉ. Nếu kích thước tệp lớn hơn 10 khối thì trường thứ 11 tiếp theo chứa địa chỉ của khối trong đó có thể định vị 128 số khác của các khối tiếp theo của tệp. Nếu tệp lớn hơn 10+128 khối thì trường thứ 12 sẽ được sử dụng, chứa số khối, chứa 128 số khối, mỗi khối chứa 128 số khối của tệp này. Và cuối cùng, nếu tệp lớn hơn 10+128+128 (128), thì trường thứ 13 cuối cùng được sử dụng cho hướng ba, cho phép bạn chỉ định địa chỉ của tệp có kích thước tối đa là 10+ 128 + 128 (128 + 128).

Quyền tập tin:

Xác định quyền truy cập vào một tệp có nghĩa là xác định cho mỗi người dùng một tập hợp các thao tác mà anh ta có thể áp dụng. tập tin này. Các hệ thống tệp khác nhau có thể có danh sách các hoạt động truy cập khác nhau. Danh sách này có thể bao gồm hoạt động sau đây:

và các thao tác khác với tập tin và thư mục.

Chớm ban đầu trường hợp chung Quyền truy cập có thể được mô tả bằng ma trận quyền truy cập, trong đó các cột tương ứng với tất cả các tệp trong hệ thống, các hàng tương ứng với tất cả người dùng và tại giao điểm của các hàng và cột các hoạt động được phép được chỉ định (Hình 2.35). Trong một số hệ thống, người dùng có thể được chia thành các loại riêng biệt. Quyền truy cập thống nhất được xác định cho tất cả người dùng cùng loại. Ví dụ: trong hệ thống UNIX, tất cả người dùng được chia thành ba loại: chủ sở hữu tệp, các thành viên trong nhóm của anh ta và những người khác.

Mô hình hệ thống tập tin chung:

Chức năng của bất kỳ hệ thống tệp nào có thể được biểu diễn bằng mô hình nhiều cấp, trong đó mỗi cấp cung cấp một giao diện (bộ chức năng) nhất định cho cấp trên và chính nó sẽ sử dụng giao diện đó (xử lý một tập hợp các yêu cầu) cấp dưới để thực hiện công việc của mình.

Nhiệm vụ của cấp độ biểu tượng là xác định tên duy nhất của nó từ tên tệp biểu tượng. Trong các hệ thống tệp trong đó mỗi tệp chỉ có thể có một tên tượng trưng (ví dụ: MS-DOS), cấp độ này không có, vì tên tượng trưng được người dùng gán cho tệp vừa là duy nhất vừa có thể được sử dụng. hệ điều hành. Trong các hệ thống tệp khác, trong đó cùng một tệp có thể có nhiều tên tượng trưng, ​​lớp này sẽ duyệt qua chuỗi thư mục để xác định tên tệp duy nhất. Ví dụ: trong hệ thống tệp UNIX, tên duy nhất là số inode của tệp (i-node).

Ở cấp độ cơ bản tiếp theo tên duy nhất tập tin, các đặc điểm của nó được xác định: quyền truy cập, địa chỉ, kích thước và những thứ khác. Như đã đề cập, các đặc điểm của tệp có thể là một phần của thư mục hoặc được lưu trữ trong bảng riêng biệt. Khi bạn mở một tập tin, các đặc tính của nó sẽ được chuyển từ đĩa này sang đĩa khác. ĐẬPđể giảm thời gian truy cập tập tin trung bình. Trong một số hệ thống tệp (ví dụ: HPFS), khi một tệp được mở, một số khối đầu tiên của tệp chứa dữ liệu sẽ được chuyển vào RAM cùng với các đặc điểm của nó.

Giai đoạn tiếp theo của việc thực hiện yêu cầu đối với một tệp là kiểm tra quyền truy cập vào tệp đó. Để thực hiện việc này, chính quyền của người dùng hoặc quy trình đưa ra yêu cầu sẽ được so sánh với danh sách các loại quyền truy cập được phép vào tệp này. Nếu loại quyền truy cập được yêu cầu được cho phép thì yêu cầu sẽ tiếp tục; nếu không, một thông báo về vi phạm quyền truy cập sẽ được đưa ra.

Ở cấp độ logic, tọa độ của bản ghi logic được yêu cầu trong tệp được xác định, nghĩa là cần xác định khoảng cách (tính bằng byte) từ đầu tệp mà bản ghi logic cần thiết được đặt. Trong trường hợp này, vị trí vật lý của tệp được trừu tượng hóa; nó được biểu diễn dưới dạng một chuỗi byte liên tục. Thuật toán làm việc cấp độ này phụ thuộc vào cách tổ chức logic của tập tin. Ví dụ: nếu một tệp được tổ chức dưới dạng một chuỗi các bản ghi logic có độ dài cố định l, thì bản ghi logic thứ n có độ lệch là l((n-1) byte. với tổ chức tuần tự chỉ mục, bảng chỉ mục (khóa) được đọc, trong đó địa chỉ của bản ghi logic được chỉ định trực tiếp.

Xin chào các độc giả của trang bài học CNTT! Hôm nay các bạn sẽ có bài học với một bí mật nhỏ nhưng quan trọng. Và bí mật này áp dụng cho tên đúng các tập tin.

Vì lý do nào đó, không ai nói với người dùng mới làm quen cách tốt nhất để đặt tên tập tin là gì. Nhưng sự thiếu hiểu biết Quy tắc đơn giản có thể tốn rất nhiều thần kinh và thời gian.

Bài học này sẽ là bước tiếp theo trong việc tăng cường tính bảo mật và độ tin cậy của việc lưu trữ dữ liệu.

Làm thế nào để đặt tên file chính xác?

Luôn lưu phiên bản mới của tệp với tên mới.

Nhưng để tránh nhầm lẫn, tên mới phải giống với tên cũ (dựa trên tên cũ). Do đó việc bổ sung vào khuyến nghị:

Đến cái tên phiên bản mới thêm số tập tin.

Đôi khi không chỉ phiên bản quan trọng mà bạn còn cần biết ngày bạn thực hiện các thay đổi. Trong trường hợp này:

Bạn có thể thêm ngày vào tên tệp ở định dạng NĂM-THÁNG-NGÀY.

Tại sao lại ở dạng này? Rất đơn giản, trong Explorer các file sẽ được sắp xếp thành yêu cầu hợp lý(theo ngày và phiên bản).

Trong hình bên dưới, tên tệp của một trong các bài học CNTT:

Có, bạn sẽ có cả một tập hợp các tệp có tên tương tự nhau và đây chính xác là những gì chúng tôi cần. Bây giờ tôi sẽ giải thích bằng một ví dụ:

Ví dụ ba (tốt)

Bạn gõ văn bản vào một tài liệu (báo cáo/báo cáo/luận văn/sơ yếu lý lịch) và định kỳ lưu nó dưới một tên mới: "Báo cáo 01", sau nửa giờ "Báo cáo 02", ngày hôm sau "Báo cáo 03" và như thế.

Phải làm gì nếu ngày hôm sau bạn thay đổi một phần văn bản và lưu tài liệu dưới dạng "Báo cáo 04" và sau đó quyết định khôi phục phiên bản cũ(như trong ví dụ đầu tiên với Pushkin)? Chỉ cần mở "Báo cáo 03" và sao chép văn bản bắt buộc sang phiên bản mới.

Phải, "Báo cáo 05"! Học một cách nhanh chóng :)

Ví dụ 4 (xuất sắc)

Có những tài liệu mà ngày tạo của chúng đóng một vai trò quan trọng, chẳng hạn như sơ yếu lý lịch. Trong trường hợp này bạn có thể tạo một tập tin “Sơ yếu lý lịch của tôi 20140108”. Sau lần thay đổi tiếp theo, bạn sẽ lưu nó dưới dạng "Sơ yếu lý lịch của tôi 20140201".

Bạn có thể cần tạo nhiều phiên bản của một tài liệu trong cùng một ngày, vì vậy tốt nhất bạn nên thêm cả ngày và số phiên bản: “Sơ yếu lý lịch của tôi 20140201-02”.

Có vẻ như có đủ ví dụ.

Phần kết luận

Hôm nay chúng ta đã tìm ra cách đặt tên tập tin tốt nhất. Có nhiều ví dụ và mô tả nên tôi sẽ tóm tắt dưới dạng công thức này với tên chính xác:

tái bút Bài học tiếp theo sẽ là bài học quan trọng nhất trong loạt bài này, đừng bỏ lỡ! Bạn có thể đăng ký nhận tin tức của trang web bằng liên kết này hoặc sử dụng hình thức đặc biệt dưới.

Cấm sao chép, nhưng bạn có thể chia sẻ liên kết.