Tổ chức hệ thống tập tin. Khái niệm "tập tin", "thư mục". Yêu cầu về tên file và thư mục. Tên tập tin đầy đủ. Loại tập tin. Sử dụng ký hiệu

thư mục, vì vậy "methody", "Methody" và "METHODY" sẽ là ba khác biệt những cái tên.

Có một số ký tự được phép sử dụng trong tên tệp và thư mục phải được sử dụng thận trọng. Đây là những ký tự đặc biệt "*", "\", "&", "< ", " >"," ; ", " ( ", " ) ", " | ", cũng như các ký tự dấu cách và tab. Thực tế là các ký tự này có ý nghĩa đặc biệt đối với bất kỳ vỏ bọc, vì vậy cần phải đặc biệt cẩn thận để đảm bảo rằng shell xử lý các ký tự này như một phần của tên tệp hoặc thư mục. Ý nghĩa đặc biệt của ký hiệu "-" đối với các lệnh Linux đã được thảo luận trong Bài giảng 2 và ở đó cũng đã thảo luận về cách thay đổi cách hiểu của nó. 1Ký hiệu "" - " có nghĩa là từ tiếp theo là một khóa, còn dấu cách và tab phân tách các tham số trên dòng lệnh.. Tại sao shell lệnh cần các ký tự đặc biệt sẽ được thảo luận ở Bài 8.

Mã hóa và tên tiếng Nga

Như bạn có thể thấy, cho đến nay trong tất cả các tên tệp và thư mục gặp phải, chỉ có các ký tự Latinh và một số dấu chấm câu được sử dụng. Điều này không phải ngẫu nhiên mà là do mong muốn làm cho các ví dụ được cung cấp trông giống nhau trên bất kỳ hệ thống nào. Trong Linux, được phép sử dụng bất kỳ ký tự nào từ bất kỳ ngôn ngữ nào trong tên tệp và thư mục, nhưng sự tự do đó đòi hỏi phải có những hy sinh mà Methodius, chẳng hạn, không thể thực hiện được.

Thực tế là trong một thời gian dài, mỗi ký hiệu (chữ cái) của mỗi ngôn ngữ theo truyền thống được thể hiện dưới dạng một byte. Quan điểm này áp đặt những hạn chế rất nghiêm ngặt đối với số lượng chữ cái trong bảng chữ cái: không thể có nhiều hơn 256 trong số chúng và trừ các ký tự điều khiển, số, dấu chấm câu và những thứ khác - thậm chí còn ít hơn. Các bảng chữ cái mở rộng (ví dụ, chữ tượng hình tiếng Nhật và tiếng Trung) phải được thay thế bằng cách thể hiện đơn giản hóa chúng. Ngoài ra, tốt nhất bạn nên luôn giữ nguyên 128 ký tự đầu tiên trong số 256 ký tự này, tương ứng với tiêu chuẩn ASCII, bao gồm tiếng Latin, số, dấu câu và các ký tự phổ biến nhất thường thấy trên bàn phím máy đánh chữ. Việc giải thích 128 ký tự còn lại phụ thuộc vào loại mã hóa được cài đặt trên hệ thống. Ví dụ: trong mã hóa KOI8-R của Nga, ký tự thứ 228 của bảng như vậy tương ứng với chữ cái “D” và trong mã hóa Tây Âu ISO-8859-1, ký tự tương tự tương ứng với chữ cái “a” có hai dấu chấm ở trên nó (giống như chữ cái “e” của chúng ta).

Tên tập tin, ghi lại vào đĩa có cùng mã hóa, chúng trông thật lố bịch nếu duyệt danh mục một cái khác đã được cài đặt. Hơn nữa, nhiều bảng mã điền phạm vi ký tự với các số từ 128 đến 255 không hoàn toàn, vì vậy ký hiệu tương ứng có thể không tồn tại! Nó có nghĩa là đi vào Tên tệp bị bóp méo như vậy từ bàn phím (ví dụ: để đổi tên nó) sẽ không thể thực hiện được trực tiếp: bạn sẽ phải sử dụng nhiều thủ thuật khác nhau được mô tả trong bài giảng 8. Cuối cùng, nhiều ngôn ngữ, bao gồm cả tiếng Nga, về mặt lịch sử có một số bảng mã 2 Bản thân Methodius đã nhiều lần nhận được email bắt đầu bằng từ “bNOPNYA” hoặc “bMHLYUMKHE” - kết quả của việc thể hiện văn bản được mã hóa CP-1251 bằng mã hóa KOI8-R.. Thật không may, hiện tại không có cách tiêu chuẩn nào để chỉ định mã hóa trực tiếp trong tên tệp, vì vậy trong một hệ thống tập tin Cần tuân thủ một bảng mã duy nhất khi đặt tên tệp.

Có một bảng mã phổ quát bao gồm các ký tự từ tất cả các chữ viết trên thế giới - UNICODE. Tiêu chuẩn UNICODE hiện đang ngày càng trở nên phổ biến và được tuyên bố là tiêu chuẩn chung cho tất cả các văn bản được lưu trữ dưới dạng điện tử. Tuy nhiên, nó vẫn chưa đạt được tính linh hoạt như mong muốn, đặc biệt là trong lĩnh vực tên file. Một một ký tự trong UNICODE có thể chiếm hơn một byte - và đây là nhược điểm chính của nó, vì nhiều chương trình ứng dụng hữu ích hoạt động tốt với mã hóa một byte, cần phải được làm lại một cách triệt để hoặc thậm chí hoàn toàn để dạy họ cách xử lý UNICODE. Có lẽ lý do khiến mã hóa này không phổ biến cũng là vì UNICODE là một tiêu chuẩn rất cồng kềnh và nó có thể trở nên không hiệu quả khi làm việc với hệ thống tập tin, trong đó tốc độ xử lý và độ tin cậy là những phẩm chất rất cần thiết.

Điều này không có nghĩa là bạn không nên sử dụng ngôn ngữ khác ngoài tiếng Anh khi đặt tên file. Miễn là bạn biết chính xác tên tệp được mã hóa theo cách nào thì sẽ không có vấn đề gì. Tuy nhiên, Methodius quyết định rằng có sự đảm bảo trong việc chuyển tập tin có tên bằng tiếng Nga sang một số người. khác hệ thống chỉ có thể đạt được bằng cách chuyển kèm theo nó một cài đặt mã hóa, thậm chí là hai cài đặt: trong hệ thống của bạn và trong hệ thống của người nhận (không biết cái nào!). Một cách khác dễ dàng hơn nhiều để chuyển một tập tin là sử dụng tên của nó chỉ một ký tự ASCII.

Tiện ích mở rộng

Nhiều người dùng đã quen thuộc với khái niệm này sự mở rộng- phần tên file sau dấu chấm, thường giới hạn ở một vài ký tự và cho biết loại dữ liệu có trong file. TRONG hệ thống tập tin Linux không có quy định nào về phần mở rộng: tên tệp có thể có số lượng dấu chấm bất kỳ (kể cả không có dấu chấm nào) và sau dấu chấm cuối cùng có thể có số lượng ký tự bất kỳ 3 Ngược lại với các hệ thống tệp cũ được tổ chức theo nguyên tắc “8 + 3” (DOS, ISO9660, v.v.), trong đó tên tệp được phép có nhiều hơn một dấu chấm và phần mở rộng không được dài quá 3 ký tự. Giới hạn này đã xác định sự xuất hiện của nhiều phần mở rộng tệp được biết đến ngày nay, ví dụ: "txt" cho tệp văn bản.. Mặc dù các tiện ích mở rộng là tùy chọn và không bị công nghệ áp đặt trên Linux, nhưng chúng được sử dụng rộng rãi: tiện ích mở rộng cho phép một người hoặc chương trình xác định mà không cần mở tệp, chỉ bằng tên của nó, loại dữ liệu chứa trong đó. Tuy nhiên, cần phải lưu ý rằng phần mở rộng chỉ là một tập hợp các quy ước đặt tên cho các loại tệp khác nhau. Nói đúng ra, dữ liệu trong tệp có thể không tương ứng với phần mở rộng đã khai báo vì lý do này hay lý do khác, vì vậy bạn không thể hoàn toàn dựa vào phần mở rộng.

Bạn cũng có thể xác định loại nội dung tệp dựa trên chính dữ liệu đó. Nhiều định dạng cung cấp chỉ dẫn ở đầu tệp về cách diễn giải thêm thông tin: dưới dạng chương trình, đầu vào cho trình soạn thảo văn bản, trang HTML, tệp âm thanh, hình ảnh hoặc nội dung nào khác. Người dùng Linux luôn có sẵn tiện ích tệp, tiện ích này được thiết kế đặc biệt để xác định loại dữ liệu có trong tệp:

$ file -- -filename-with- -filename-with-: Văn bản tiếng Anh ASCII $ file /home/methody /home/methody: thư mục Ví dụ 3.1. Xác định kiểu dữ liệu trong file

Methodius, đã quên những gì chứa trong tập tin “-filename-with-”, mà ông đã tạo trong ví dụ được trình bày ở bài giảng trước, nên muốn xem nội dung của nó bằng lệnh cat. Tuy nhiên, anh đã bị Gurevich ngăn lại, người khuyên anh trước tiên nên tìm hiểu xem tệp này chứa loại dữ liệu nào. Có thể đây là tệp nhị phân của một chương trình thực thi và tệp đó có thể chứa các chuỗi ngẫu nhiên trùng với trình tự thoát hiểm phần cuối. Hoạt động của thiết bị đầu cuối sau đó có thể trở nên khó đoán và người dùng thiếu kinh nghiệm khó có thể đối phó được với nó. Methodius đã nhận được câu trả lời hoàn toàn chính xác từ tiện ích tệp: tệp của anh ấy chứa văn bản tiếng Anh ở dạng mã hóa ASCII. file có thể phân biệt nhiều loại dữ liệu và gần như chắc chắn sẽ đưa ra thông tin chính xác. Tiện ích này không bao giờ tin cậy vào phần mở rộng tệp (nếu có) và tự phân tích dữ liệu. file không chỉ phân biệt các dữ liệu khác nhau mà còn phân biệt các loại tệp khác nhau, đặc biệt, nó sẽ báo cáo nếu tệp đang được kiểm tra không phải là tệp thông thường mà là một thư mục chẳng hạn.

Cây thư mục

Khái niệm thư mục cho phép hệ thống hóa tất cả các đối tượng nằm trên phương tiện lưu trữ (ví dụ: đĩa). Hầu hết các hệ thống tệp hiện đại đều sử dụng mô hình tổ chức dữ liệu phân cấp: có một thư mục kết hợp tất cả dữ liệu vào hệ thống tập tin- đây là “gốc rễ” của mọi thứ hệ thống tập tin, thư mục gốc . Thư mục gốc có thể chứa bất kỳ đối tượng nào hệ thống tập tin và đặc biệt là các thư mục con (thư mục ở cấp độ lồng nhau đầu tiên). Ngược lại, chúng cũng có thể chứa bất kỳ đối tượng nào hệ thống tập tin và các thư mục con (mức lồng nhau thứ hai), v.v. Do đó, Tất cả những gì được ghi trên đĩa - các tập tin, thư mục và các tập tin đặc biệt - nhất thiết phải "thuộc về" thư mục gốc: trực tiếp (có trong nó) hoặc ở một mức độ lồng nhau nào đó.

Hệ thống phân cấp của các thư mục lồng vào nhau có thể tương quan với hệ thống phân cấp của dữ liệu trong hệ thống: kết hợp các tệp có liên quan theo chủ đề vào một thư mục, các thư mục có liên quan theo chủ đề vào một thư mục chung, v.v. Nếu bạn tuân thủ nghiêm ngặt nguyên tắc phân cấp thì càng sâu sắc hơn. mức độ lồng nhau thư mục, đặc biệt vì dữ liệu chứa trong đó phải được kết hợp bởi một tính năng cụ thể. Nếu bạn không tuân theo nguyên tắc này, thì việc đặt tất cả các tệp vào một thư mục và tìm kiếm tệp bạn cần trong số chúng sẽ sớm trở nên dễ dàng hơn nhiều so với việc thực hiện tìm kiếm như vậy trong tất cả các thư mục con của hệ thống. Tuy nhiên, trong trường hợp này, về bất kỳ tổ chức tập tin không cần phải nói chuyện.

Kết cấu hệ thống tập tin có thể được hình dung như một cái cây 4 Ở đây chúng tôi muốn nói đến một cái cây theo nghĩa toán học chặt chẽ: một đồ thị có hướng không có chu trình với một đỉnh gốc duy nhất, trong đó mỗi đỉnh chứa chính xác một cạnh., có “gốc” là thư mục gốc, và tất cả phần còn lại đều nằm ở các đỉnh

Máy tính làm việc với thông tin, có thể là định dạng văn bản, đồ họa, âm thanh hoặc video. Tất cả thông tin được xử lý trên máy tính được lưu trữ trong các tập tin. Khái niệm tệp là một trong những khái niệm cơ bản của kiến ​​thức máy tính.

Tài liệu là vùng bộ nhớ được đặt tên trên phương tiện lưu trữ của máy tính. Nói cách khác, tệp là một tập hợp dữ liệu trên phương tiện máy tính (ổ cứng, ổ CD và DVD, ổ flash, v.v.), có tên riêng ( tên tập tin).

Những ký tự nào có thể được sử dụng trong tên tệp? Nên sử dụng các chữ cái, số, dấu cách và dấu chấm câu bằng tiếng Nga và tiếng Latinh trong tên tệp. Tuy nhiên, tên tệp không được bắt đầu bằng dấu chấm và cũng không được sử dụng dấu ngoặc vuông hoặc dấu ngoặc nhọn ( ) trong tên. Các ký tự dịch vụ sau đây không hợp lệ đối với tên tệp: / \ | : * ? “< >

Có độ dài tên tệp tối đa không? Độ dài tên tệp không được vượt quá 255 ký tự. Trên thực tế, 20-25 ký tự thường là đủ.

Windows không phân biệt chữ thường và chữ in hoa cho tên tệp. Điều này có nghĩa là bạn không thể lưu trữ các tập tin có tên chỉ khác nhau trong cùng một thư mục. Ví dụ: hai tên tệp "Title.doc" và "TITLE.doc" đối với Windows sẽ có cùng tên cho cùng một tệp.

Bạn có nghĩ rằng có thể có nhiều tệp có cùng tên PRIMER trong một thư mục không? Điều này có thể thực hiện được với điều kiện tên PRIMER có các phần mở rộng khác nhau.

Phần mở rộng tên tệp chỉ tới loại tệp(đôi khi họ cũng nói - định dạng tập tin). Như vậy,

  • "loại tệp",
  • "định dạng tệp",
  • "phần mở rộng tập tin",
  • “phần mở rộng tên tập tin” –

nhìn chung thì đây là điều tương tự.

Ví dụ,

PRIMER.doc(x) – loại tệp là tài liệu Word (hoặc tệp ở định dạng Word),

PRIMER.bmp – loại tệp là hình ảnh,

PRIMER.avi – loại tệp là tệp video,

PRIMER.wav – Loại tệp là tệp âm thanh.

Tất cả các tệp này có tên khác nhau (do phần mở rộng tên tệp khác nhau) và có thể được lưu trữ ở cùng một nơi, tức là. trong một thư mục. Nếu chúng ta so sánh với tên của mọi người thì tên tệp giống với tên của người đó và phần mở rộng tên tệp là họ của người đó. Theo đó, PRIMER.doc và PRIMER.bmp theo cách tương tự này cũng giống như Ivan Petrov và Ivan Sidorov. Các tệp có tên PRIMER.doc và VARIANT.doc là hai anh em trong cùng một họ tài liệu (có cùng phần mở rộng .doc), chẳng hạn như Ivan Petrov và Fedor Petrov là anh em trong cùng một họ Petrov.

Phần mở rộng tên tệp là phần tên tệp bắt đầu bằng dấu chấm, theo sau là một số ký tự.

Các phần mở rộng bao gồm ba chữ cái là phổ biến - .doc, .txt, .bmp, .gif, v.v. Trường hợp không quan trọng, vì vậy .doc và .DOC là phần mở rộng tài liệu giống nhau.

Phần mở rộng là một thuộc tính tùy chọn trong tên tệp, tức là. nó có thể không tồn tại. Trong trường hợp này, thường không có dấu chấm ở cuối tên file. Việc mở rộng, mặc dù không cần thiết, vẫn được mong muốn, bởi vì nó cho Windows biết đó là loại tập tin gì. Nói một cách đơn giản, loại tệp sẽ cho Windows biết nên mở tệp bằng chương trình nào. Ví dụ: phần mở rộng .doc cho biết rằng tệp phải được mở bằng trình soạn thảo Word và phần mở rộng .cdr cho biết rằng tệp phải được mở bằng chương trình đồ họa Corel Draw.

Có những tên (dịch vụ) dành riêng không thể được sử dụng làm tên tệp vì chúng là tên thiết bị:

PRN – máy in,

COM1-COM4 – thiết bị được kết nối với cổng nối tiếp 1-4,

Aux – giống như COM1,

LPT1-LPT4 – thiết bị được kết nối với cổng song song 1-4 (thường là máy in),

CON (consol) – cho đầu vào – bàn phím, cho đầu ra – màn hình,

NUL là một thiết bị "trống".

Dưới đây là ví dụ về tên tệp không hợp lệ:

5<>8/7.txt – ký hiệu "<», «>" và "/" bị cấm,

Câu hỏi là gì? - biểu tượng "?" Cấm

PRN.bmp – ở đây PRN là tên dành riêng.

Tùy thuộc vào loại file mà các biểu tượng khác nhau được hiển thị trên màn hình Windows:

Windows Explorer (Start-Programs-Accessories-Explorer) theo mặc định có chế độ trong đó phần mở rộng tên tệp không được hiển thị trên màn hình nhưng các biểu tượng tệp được hiển thị.

Khi lưu tệp, chỉ cần viết tên tệp và chọn loại tệp từ danh sách có sẵn. Phần mở rộng đã chọn sẽ tự động được thêm vào tên tệp. Ví dụ, trong hình bên dưới, chính chương trình sẽ thêm phần mở rộng .jpg vào tên tệp. Kết quả Windows sẽ ghi nhớ file này với tên “drawing in Paint.jpg”.

Để tránh hiểu lầm khi lưu tệp, hãy luôn chú ý đến dòng “loại tệp”, nếu có. Xét cho cùng, loại tệp là một gợi ý dành cho Windows, với sự trợ giúp của hệ thống sẽ xác định chương trình nào tệp này có thể được mở.

Ví dụ: nếu bạn đã tải xuống một tệp từ Internet, với phần mở rộng .rar, nhưng bạn không cài đặt chương trình lưu trữ trên máy tính của mình để hoạt động với các tệp “được nén, lưu trữ” như vậy, thì đừng ngạc nhiên khi tệp đó làm như vậy. đừng mở. Nói cách khác, bạn cần lưu ý rằng nếu bạn mở tệp, chẳng hạn như ở định dạng video, thì máy tính phải có chương trình thích hợp để hoạt động với định dạng này.

Có thể rút ra một sự tương tự giữa một tệp (chính xác hơn là giữa một loại tệp) và một chương trình hoạt động với loại tệp đó. Tệp là một ổ khóa và chương trình mở tệp này là chìa khóa. Ổ khóa không thể mở được nếu không có chìa khóa, và chìa khóa không có ổ khóa thì không có giá trị gì đặc biệt.

Bài tập tin học:

1) Hãy thử tạo hai thư mục trên Desktop của bạn với tên: PRIMER và Primer. Để thực hiện việc này, trên Màn hình nền, nhấp chuột phải vào một khoảng trống và trong cửa sổ xuất hiện, nhấp vào tùy chọn “Tạo” và cuối cùng, nhấp vào tùy chọn “Thư mục”. Thay thế "Thư mục mới" bằng "PRIMER". Sau đó lặp lại tất cả những điều này để tạo thư mục thứ hai có tên là “primer”. Windows có cho phép bạn mở thư mục thứ hai không?

2) Ví dụ: đi tới trình soạn thảo Word và thử lưu tài liệu với tên PRN. Windows có cho phép tên này cho một tệp mới không?

3) Cách giải quyết: “Tôi tải file từ Internet về nhưng chúng ở định dạng xsd (PM)/RAR và không thể mở hoặc đọc được trên máy tính. Phải làm gì?"

tái bút Bài viết đã kết thúc nhưng bạn vẫn có thể đọc được:

Nhận các bài viết về kiến ​​thức máy tính mới nhất trực tiếp vào hộp thư đến của bạn.
Đã nhiều hơn nữa 3.000 người đăng ký

.

Vậy thì rất có thể bạn đã sai. Có những quy tắc mà bạn không thể đặt tên tệp bằng bất kỳ tên nào giống như một đối tượng vật lý thông thường. Trước tiên, hãy làm rõ tên tệp là gì và nó được sử dụng như thế nào.

Khái niệm “đường dẫn” và “tên file”

Rất thường xuyên trong tài liệu máy tính, thuật ngữ “đường dẫn” và “tên tệp” được sử dụng với các ý nghĩa khác nhau. Thông thường, từ “đường dẫn” dùng để chỉ địa chỉ hoặc vị trí của tệp, tức là ổ đĩa, thư mục và thư mục con chứa tệp. Tuy nhiên, Microsoft và những người khác tin rằng đường dẫn đến tệp không chỉ bao gồm vị trí của tệp mà còn bao gồm cả tên tệp. Và một số người dùng từ “đường dẫn” chỉ có nghĩa là tên của tệp và thư mục chứa nó mà không chỉ định ổ đĩa. Một số người dùng tin rằng "tên tệp" không bao gồm phần mở rộng. Trong bài viết này, phần mở rộng luôn là một phần của tên file. Trong ví dụ bên dưới, đường dẫn đến tệp được tô sáng màu xanh lam và tên tệp được tô sáng màu đỏ.
X:\thư mục\thư mục con\
tập tin.extension

Ký tự và tên dành riêng

Các ký tự được sử dụng phổ biến nhất đều được phép có trong tên tệp. Tên tệp không được chứa “ < ” (dấu ít hơn),“ > ” (dấu hiệu lớn hơn),“ : ” (dấu hai chấm), ““” (dấu ngoặc kép), “/” (dấu gạch chéo), “\” (dấu gạch chéo ngược), “|” (thanh dọc), “?” (dấu chấm hỏi), “*” (dấu hoa thị) và không được kết thúc bằng dấu chấm hoặc dấu cách. Các tập tin cũng không thể được đặt tên bằng tên thiết bị dành riêng: CON, PRN, Aux, KHÔNG, COM1, COM2, COM3, COM4, COM5, COM6, COM7, COM8, COM9, LPT1, LPT2, LPT3, LPT4, LPT5, LPT6, LPT7, LPT8, Và LPT9.

Hạn chế về tên tệp và độ dài đường dẫn

Có những hạn chế về độ dài của tên tệp và độ dài của đường dẫn. Giới hạn tuyệt đối về độ dài của tên tệp bao gồm cả đường dẫn của nó là 260 ký tự. Giới hạn này được gọi là giới hạn MAX_PATH. Trên thực tế, trên thực tế, giới hạn về tên thậm chí còn nhỏ hơn do một số hạn chế khác. Ví dụ: mỗi dòng ở cuối phải chứa cái gọi là ký tự rỗng, đánh dấu sự kết thúc của dòng. Mặc dù điểm đánh dấu cuối dòng không được hiển thị nhưng nó được tính là một ký tự riêng biệt khi tính toán độ dài, để lại 259 ký tự có sẵn cho tên tệp và đường dẫn. Ba ký tự đầu tiên trong đường dẫn được sử dụng để xác định ổ đĩa (ví dụ: C:\). Điều này làm giảm giới hạn tên thư mục, thư mục con và tên tệp xuống còn 256 ký tự.

Tên đối tượng (thư mục hoặc tệp) được giới hạn ở 255 ký tự. Giới hạn này chỉ hợp lệ nếu đối tượng không nằm trong một thư mục. Vì khi một đối tượng được đặt bên trong một thư mục, tổng độ dài của tất cả các thư mục chứa nó, dấu phân cách và tên đối tượng được giới hạn ở 256 ký tự, nên giới hạn độ dài của chính tên đối tượng sẽ nhỏ hơn 255 ký tự.

» [Kỳ thi tin học][Vé số 9]

Hệ thống tập tin. Thư mục và tập tin. Tên, loại, đường dẫn đến tập tin.

Tài liệu.

Tất cả các chương trình và dữ liệu được lưu trữ trong bộ nhớ dài hạn (ngoài) của máy tính dưới dạng tệp.

Tệp là một lượng thông tin (chương trình hoặc dữ liệu) nhất định có tên và được lưu trữ trong bộ nhớ dài hạn (bên ngoài).

Tên tệp bao gồm hai phần, cách nhau bằng dấu chấm: tên tệp thực và phần mở rộng xác định loại của nó (chương trình, dữ liệu, v.v.). Tên thực của tệp do người dùng đặt và loại tệp thường được chương trình đặt tự động khi nó được tạo.

Các hệ điều hành khác nhau có định dạng tên tệp khác nhau. Trong hệ điều hành MS-DOS, bản thân tên tệp không được chứa quá tám chữ cái trong bảng chữ cái Latinh và số, đồng thời phần mở rộng bao gồm ba chữ cái Latinh, ví dụ: proba.txt

Trong hệ điều hành Windows, tên tệp có thể có tối đa 255 ký tự và có thể sử dụng bảng chữ cái tiếng Nga, ví dụ:
Đơn vị thông tin.doc

Hệ thống tập tin.

Mỗi phương tiện lưu trữ (đĩa mềm, đĩa cứng hoặc đĩa laser) có thể lưu trữ một số lượng lớn tệp. Thứ tự các tệp được lưu trữ trên đĩa được xác định bởi hệ thống tệp đã cài đặt.

Hệ thống tập tin là một hệ thống lưu trữ các tập tin và tổ chức các thư mục.

Đối với các đĩa có số lượng tệp nhỏ (lên đến vài chục), sẽ thuận tiện khi sử dụng hệ thống tệp một cấp khi thư mục (mục lục đĩa) là một chuỗi tên tệp tuyến tính.

Nếu hàng trăm, hàng nghìn tệp được lưu trữ trên đĩa thì để dễ tìm kiếm, các tệp này được sắp xếp thành một hệ thống tệp phân cấp nhiều cấp, có cấu trúc “cây”.

Thư mục ban đầu, gốc chứa các thư mục con cấp 1, lần lượt trong mỗi thư mục đó lại có các thư mục con cấp 2, v.v. Cần lưu ý rằng các tệp có thể được lưu trữ trong các thư mục ở mọi cấp độ.

Đường dẫn đến tập tin.

Để tìm tệp theo cấu trúc tệp phân cấp, bạn phải chỉ định đường dẫn đến tệp. Đường dẫn đến tệp bao gồm tên logic của đĩa, được ghi thông qua dấu phân cách “\” và một chuỗi tên của các thư mục lồng nhau, tên cuối cùng chứa tệp mong muốn.

Ví dụ: đường dẫn đến các tệp trong hình có thể được viết như sau:

C:\Âm nhạc\Dã ngoại\

Tên tập tin đầy đủ.

Đường dẫn đến tệp cùng với tên tệp được gọi là tên tệp đủ điều kiện.

Ví dụ về tên tập tin đầy đủ:

C:\basic\prog123.bas

C:\Music\Picnic\Hieroglyph.mp3

Các thao tác trên tập tin.

Khi làm việc trên các tệp trên máy tính, các thao tác sau thường được thực hiện nhất: sao chép (bản sao của tệp được đặt trong một thư mục khác); di chuyển (bản thân tập tin được chuyển sang thư mục khác); xóa (mục nhập tệp bị xóa khỏi thư mục); đổi tên (thay đổi tên tập tin).

Biểu diễn đồ họa của hệ thống tập tin.

Hệ thống tệp phân cấp MS-DOS chứa các thư mục và tệp được thể hiện trong hệ điều hành Windows thông qua giao diện đồ họa dưới dạng hệ thống phân cấp các thư mục và tài liệu. Một thư mục trong Windows tương tự như thư mục MS-DOS. Tuy nhiên, cấu trúc phân cấp của các hệ thống này có phần khác nhau. Trong hệ thống tệp phân cấp MS-DOS, phần trên cùng của hệ thống phân cấp đối tượng là thư mục gốc của đĩa, có thể so sánh với thân cây - các nhánh (thư mục con) mọc trên đó và các lá (tệp) nằm trên đó. các chi nhánh.

Trong Windows, ở đầu hệ thống phân cấp thư mục là thư mục Desktop. (Cấp độ tiếp theo được thể hiện bằng các thư mục My Computer, Recycle Bin và Network Neighborhood (nếu máy tính được kết nối với mạng cục bộ).

Khi gặp một cụm từ khó hiểu, người đọc thường cố gắng tìm hiểu ý nghĩa của nó. Bài viết này là một chuyến tham quan ngắn gọn dành cho người dùng vào thế giới của những điều chưa biết.

Khái niệm chung về tập tin

Bộ nhớ dài hạn lưu trữ tất cả dữ liệu dưới dạng tệp. Nó là gì? Một tập tin là một chuỗi byte được đặt tên, lần lượt bao gồm các bit. Nó có tên và địa chỉ vị trí riêng. Tham số đầu tiên được chỉ định bởi một người và tham số thứ hai được hệ điều hành thiết lập và ghi nhớ trong một thời gian dài. Việc tìm kiếm được thực hiện theo tên tệp nên người dùng không cần phải ghi lại địa chỉ của nó.

Nó xảy ra rằng thông tin không thể được tìm thấy trên phương tiện máy tính. Nhưng ngay cả một tệp trống cũng có tên riêng, đây là thuộc tính quan trọng của tập dữ liệu được ghi trên đĩa cứng. Nếu nó vắng mặt thì cấu trúc như vậy không thể được gọi là bộ lưu trữ.

Hệ thống tập tin

Mỗi (đĩa mềm, cứng hoặc đĩa laze) có thể chứa một lượng lớn nó. Hệ thống tập tin được thiết kế để lưu trữ dữ liệu và sắp xếp các thư mục khác nhau. Theo nghĩa rộng, nó bao gồm tổng thể tất cả thông tin trên đĩa, bộ cấu trúc dữ liệu và bộ công cụ phần mềm hệ thống. Thư mục gốc bao gồm các tệp đính kèm cấp 2, lần lượt bao gồm các thư mục cấp 3, v.v. Hệ thống tuyến tính một cấp được sử dụng cho các đĩa có nhiều tệp, hệ thống phân cấp nhiều cấp cho các đĩa có số lượng lớn. Thứ hai được đặc trưng bởi một cấu trúc cây.

Mục đích của hệ thống tập tin

Nó bao gồm việc cung cấp giao diện thuận tiện cho một người khi truy cập thông tin trên đĩa và nhận ra khả năng chia sẻ đối tượng giữa nhiều người và các quy trình đang diễn ra. Kiểu cấu trúc này cho phép bạn đạt được kết quả tối đa khi làm việc với dữ liệu.

Loại tập tin

Nhờ một số thông tin nhất định, máy tính có thể “hiểu” đại khái những gì có trong tập dữ liệu và có thể sử dụng chương trình nào để mở nó. Phần mở rộng là một vài chữ cái hoặc số xuất hiện sau dấu chấm trong tên tệp tiêu chuẩn. Nó xác định kiểu dữ liệu và chương trình tương ứng. Ví dụ: thông tin được ghi trên đĩa có phần mở rộng mp3 sẽ mở trong trình phát. Hình ảnh chương trình có trong hình ảnh tập tin. Bằng biểu tượng này, người dùng có kinh nghiệm sẽ hiểu ngay nơi có thể áp dụng loại dữ liệu đã chỉ định. Tài liệu sẽ chỉ mở trong một chương trình được thiết kế cho văn bản. Các tập tin video có thể được phát trong trình phát. Thông tin ở dạng hình ảnh sẽ mở ra trong trình chỉnh sửa đồ họa. Có nhiều tập tin khác nhau. Mỗi người trong số họ có một biểu tượng cho biết chương trình tương ứng.

Tập tin: tên tập tin

Người dùng đặt tên tượng trưng cho tập dữ liệu trên đĩa. Các tập tin được xác định bởi chúng. Trong trường hợp này, phải tính đến các hạn chế của hệ thống đối với cả ký tự được sử dụng và toàn bộ độ dài của cụm từ. Tên tệp là tên được chỉ định ở trên, có thể giống nhau đối với một số tập dữ liệu. Trong trường hợp này, trình tự nhận dạng thư mục, tức là địa chỉ chứa thông tin, sẽ khác nhau. Trong một số hệ thống, cùng một đối tượng không thể có nhiều tên, ở những hệ thống khác thì không có hạn chế nào như vậy. Trong trường hợp sau, tập dữ liệu được đặt một tên duy nhất. Đây là mã định danh bằng số được sử dụng bởi bất kỳ chương trình hệ điều hành nào.

Thành phần tên tập tin

Bất kỳ thông tin nào trên đĩa đều chứa một số phần tử. Tên tập tin bao gồm những gì? Để hiểu điều này, bạn cần phải có một mẫu trước mắt. Tên tệp bao gồm hai phần có liên quan với nhau: tên và phần mở rộng, xác định kiểu dữ liệu. Nó xác định bất kỳ thông tin nào trên phương tiện.

Họ và tên

Đây là một ví dụ:

C:\Music\Holiday\Melody.mp3.

Tên tệp đầy đủ được chỉ ra trong mẫu là tên bao gồm chính tệp đó và đường dẫn thông tin. Mục cuối cùng được liệt kê là danh sách ID thư mục sẽ được mở tuần tự để lấy từ cấp cao nhất đến tập dữ liệu. Tên tệp đầy đủ phải được chỉ định, bắt đầu từ thư mục gốc và chứa danh sách tất cả các tệp đính kèm phụ thuộc ở các cấp độ khác. Tên này là tuyệt đối. Nó đề cập đến thông tin liên quan đến thư mục gốc, bất kể thư mục hiện tại. Tất cả các thành phần tên được phân tách bằng ký tự gạch chéo (\). Ký tự này phải được chỉ định trước tên của thư mục gốc.

Tên ngắn

Những hạn chế là lý do thuật ngữ này ra đời. Vào thời đó, một tập tin chỉ có thể có 8 ký tự trong tên của nó. Một lát sau, người ta có thể đặt dấu chấm sau tên và thêm 3 ký tự mở rộng.

Nó trông như thế này:

Giai Điệu.mp3.

Các nhà phát triển bắt đầu sử dụng phần mở rộng tên cho các nhu cầu kỹ thuật. Với sự giúp đỡ của họ, các chương trình đã "học" cách nhận dạng loại tệp. Sơ đồ ghi tên tệp này được gọi là hệ thống 8.3 (theo số ký tự trong tên và phần mở rộng và dấu chấm giữa chúng). Nó có một số nhược điểm: không có khả năng sử dụng dấu cách, dấu chấm câu và các chữ cái không phải bảng chữ cái tiếng Anh. Vì vậy, việc tạo ra một cái tên có ý nghĩa là rất khó khăn. Tên ngắn không chứa dấu gạch chéo lên ( \ ). Bằng tên này, bạn có thể tham khảo dữ liệu trong thư mục hiện tại.

Tên dài

Trước đây, khi hàng nghìn tệp được lưu trữ trên đĩa, người dùng biết khá rõ dữ liệu nhất định đến từ đâu trên phương tiện. Hiện tại, không thể theo dõi lịch sử thông tin gửi đến. Do đó, các hạn chế nghiêm ngặt về độ dài tiêu đề đối với dữ liệu đã bị xóa. Tên tập tin bao gồm những gì? Bây giờ tên có thể được viết bằng chữ cái tiếng Nga, với một số dấu chấm câu và thậm chí cả dấu cách. Phần mở rộng được biểu thị không chỉ bằng ba ký tự. Nếu tên chứa nhiều dấu chấm thì loại tệp sẽ được biểu thị sau dấu chấm câu cuối cùng.

Tuy nhiên, truyền thống chứa đựng sức mạnh to lớn, đó là lý do tại sao không tìm thấy phần mở rộng dài trên máy tính. Ba ký tự là đủ để hệ thống chỉ ra loại tệp. Có thể có ít nhất 250 ký tự, mặc dù điều này chắc chắn có vẻ quá mức cần thiết.

Đối tượng vấn đề

Tài liệu có tiêu đề dài có thể không được đọc chính xác trên máy tính khác. Vì vậy, khi gửi dữ liệu bạn nên sử dụng chữ cái Latin. Bảng chữ cái tiếng Nga có thể không có trên máy tính của người nhận và thay vì các cụm từ, một bộ ký tự khó hiểu sẽ xuất hiện. Để tổ chức hệ thống lưu trữ tệp trên máy tính cá nhân của người dùng, bất kỳ chữ cái nào cũng được sử dụng.

Tên tập tin đúng

Nó có thể bao gồm bất kỳ chữ cái viết hoa hoặc viết thường, số, dấu chấm và dấu gạch dưới. Việc sử dụng không gian không bị cấm. Tuy nhiên, bạn không nên lạm dụng nó và cũng không nên đặt nó ở đầu tên. Bạn có thể bao gồm các ký tự khác trong tên, ngoại trừ các ký tự dành riêng (>< | ? * / \ : "). Расширение отделяется от названия последней правой точкой. Длина имени ограничивается 255 знаками. На самом деле обычному пользователю хватает 20 символов. Операционная система не различает строчные и прописные буквы в имени файла. Это означает, что сохранить в одном каталоге два элемента с одинаковым названием, написанным в разном регистре, не получится. Так может выглядеть пример совпадающих имен: «Текст.doc» и «ТЕКСТ.doc».

Tên tập tin không chính xác

Ngoài những hạn chế này, còn có lệnh cấm sử dụng tên thiết bị dành riêng.

Vì vậy, PRN là một máy in. COM1-COM4 - thiết bị được kết nối với cổng nối tiếp 1-4. Aux thực hiện chức năng tương tự như COM1. LPT1-LPT4 là các phần tử được kết nối với các cổng song song 1-4 (máy in), CON (consol) cho đầu vào - bàn phím, đầu ra - màn hình, NUL - thiết bị “trống”. Khi người dùng cố gắng chỉ định tên dành riêng, hệ thống sẽ hiển thị lỗi. Cảnh báo cũng được hiển thị khi sử dụng các ký tự bị cấm. Nó chỉ ra một tên tập tin không hợp lệ. Thông tin được ghi không chính xác về tập dữ liệu sẽ không được lưu mà sẽ lấy giá trị trước đó.

Mẫu tên tập tin

Hệ điều hành shell, cũng như các ngôn ngữ lập trình khác nhau, cho phép người dùng tìm kiếm tên và thư mục cho các nhóm cụ thể. Tất cả các tệp đều được kiểm tra xem có tuân thủ một mẫu nhất định không, nếu bất kỳ tệp nào khớp với mẫu thì nó sẽ được tính đến, nếu không, nó sẽ bị bỏ qua.

Tại sao lại cần một mẫu như vậy? Thường thì bạn cần thực hiện cùng một hành động trên toàn bộ nhóm tệp. Việc này mất ít thời gian hơn so với việc truy cập từng tài liệu riêng lẻ. Mẫu tên tệp cho phép bạn chọn một nhóm đáp ứng các yêu cầu cụ thể từ đám đông. Nó thậm chí còn được sử dụng trong việc truy xuất dữ liệu.

Ký tự đặc biệt

Mẫu tên tệp được chỉ định bằng các ký tự đặc biệt:

  • Dấu hoa thị là biểu tượng cho bất kỳ nhóm ký tự nào. Số lượng của họ không quan trọng. Ví dụ: một ngôi sao là mẫu khớp với tất cả thông tin trong danh mục. Nhờ lệnh *.mp3, bạn có thể thay đổi bất kỳ tệp nào cùng loại. Tên tệp bắt đầu bằng my và kết thúc bằng .txt được đánh dấu bằng mẫu my*.txt. Mẫu *2014* xác định tất cả các đối tượng hiện có trên máy tính có tên chứa nhóm ký tự 2014.
  • là một chỉ định cho bất kỳ ký tự đơn lẻ nào. Ví dụ như nhạc mẫu.??? dữ liệu bắt đầu bằng từ được chỉ định và có phần mở rộng bằng ba chữ cái tiếng Anh là phù hợp. Trong mẫu na?e.txt, bất kỳ ký hiệu nào cũng có thể được sử dụng thay cho dấu chấm hỏi tiêu chuẩn.

Các đội khác

Ngoài ra còn có các quy tắc khác để biên soạn mẫu. Bằng cách bao gồm dấu ngoặc vuông () trong lệnh cùng với danh sách các giá trị có thể, bạn có thể làm cho việc tìm kiếm linh hoạt hơn. Nếu bạn muốn tìm bất kỳ tệp nào bắt đầu bằng chữ t, không tính đến trường hợp nào, thì mẫu phải được viết như sau: *. Khi tìm kiếm dữ liệu có tên theo thứ tự bảng chữ cái, bạn có thể tạo một phạm vi. Một mẫu tương tự trông như thế này: ?.jpg. Hệ thống sẽ tìm các tệp có loại tiện ích mở rộng được chỉ định, có tên bao gồm hai ký tự. Hơn nữa, chữ cái đầu tiên k, l, y hoặc z không phân biệt chữ hoa chữ thường.

Ý nghĩa vỏ

Một số ký tự đặc biệt có thể được sử dụng trong một mẫu. Các mẫu được kết hợp với nhiều lệnh: duyệt thư mục, sao chép tệp, tìm kiếm, v.v. Tuy nhiên, các hành động được thực hiện không phải với mẫu mà với dữ liệu phù hợp với nó. Các đối tượng cần thiết được chọn bởi lệnh shell.

Mở rộng mẫu là quá trình thay thế ký tự * bằng một chuỗi tên tệp nhất quán.

Một số lệnh sẽ không bao giờ có thể tìm thấy ký tự đặc biệt trong danh sách tham số của chúng. Vậy cái gì chịu trách nhiệm cho việc truy xuất dữ liệu? Shell lệnh thực hiện việc mở rộng mẫu cần thiết theo cách mà tất cả các tên tệp phù hợp với mẫu sẽ được liệt kê.

Mặt nạ tên tập tin

Chúng được sử dụng trong các hoạt động nhóm với dữ liệu. Mặt nạ là một chuỗi ký tự được phép có trong tên tệp, cũng có thể chứa dấu chấm hỏi và dấu hoa thị. Với sự trợ giúp của nó, bạn có thể xóa bất kỳ tệp tạm thời nào trên máy tính của mình. Tên tệp trong lệnh có thể chứa các ký hiệu khác nhau. Dấu chấm hỏi đánh dấu một ký tự tùy ý, trong khi dấu hoa thị đánh dấu toàn bộ chuỗi. Ví dụ: sử dụng lệnh rm *mp3, bạn có thể xóa tất cả các tệp kết thúc bằng đoạn này. Nếu cần xóa toàn bộ dữ liệu trong một thư mục, bạn nên sử dụng lệnh rm *. Lệnh hoạt động gần như giống với việc thay đổi một ký tự. Mặt nạ tên cũng có thể được sử dụng với các thư mục.

Sao chép có vấn đề

Việc chuyển đổi sang tên dài tạo ra vấn đề về khả năng tương thích với các chương trình được tạo trước đó sử dụng các cụm từ nhỏ. Để các ứng dụng có thể mở thông tin theo cấu trúc lưu trữ đã được áp dụng trước đó, hệ thống tệp phải có khả năng cung cấp các bí danh ngắn duy nhất cho dữ liệu có tên phức tạp. Hệ điều hành mới hơn hỗ trợ tên dài. Nhưng đôi khi người dùng gặp phải những sự cố không mong muốn. Việc sao chép các tập tin có tên dài có thể khó khăn.

Trong trường hợp này, ngay cả việc tạo một lối tắt cũng không giúp ích được gì. Thông thường, người dùng chỉ cần đổi tên file và thử lại. Ngoài ra, bạn có thể lưu trữ dữ liệu, sao chép và giải nén. Nhưng bạn nên làm gì nếu trong thư mục con thứ một trăm chứa tệp được yêu cầu, tên tệp quá dài do đường dẫn được ghi trong đó?

Tùy chọn sao lưu

Nếu các phương pháp trên không hiệu quả, bạn chỉ cần kết nối ổ đĩa mạng bằng cách nhấp chuột phải vào hình ảnh máy tính và chọn kết nối từ menu xuất hiện. Trong trường hợp này, bạn phải chỉ định chữ cái cho phương tiện mong muốn và đường dẫn tệp.

Phương sách cuối cùng, người dùng có thể sử dụng chương trình sao chép tên dài FAR 2.0 và thậm chí vô hiệu hóa Thùng rác.