Các tập tin dữ liệu là gì? Các tập tin dữ liệu bên ngoài. Cấu trúc dữ liệu và tệp Falcon

Các tệp được lưu ở định dạng dữ liệu sẽ được Analysis Studio sử dụng và ứng dụng này lưu trữ dữ liệu bộ phận được sử dụng để phân tích ngoại tuyến trong các tệp này. Dữ liệu này có thể được nhập vào tệp dữ liệu tương ứng do người dùng Analysis Studio tạo. Thường được phân loại là tệp dữ liệu, các tệp DATA này được đính kèm với phần mở rộng .data và được gọi cụ thể hơn là tệp dữ liệu ngoại tuyến của Analysis Studio. Appricon đã phát triển định dạng và phần mềm dữ liệu Analysis Studio để cung cấp cho người dùng chức năng phân tích và lưu trữ dữ liệu ngoại tuyến với chức năng nghiên cứu, lưu trữ, quản lý và phân tích dữ liệu thống kê hữu ích. Nội dung của các tệp dữ liệu này có thể bao gồm dữ liệu được mã hóa ở định dạng được phân cách bằng văn bản hoặc tab. Người dùng Analysis Studio cũng có thể đưa tiêu đề tệp của Analysis Studio vào dữ liệu tệp này. Người dùng bị ngắt kết nối khỏi máy chủ Analysis Studio thường truy cập ngoại tuyến các dữ liệu tệp này, mặc dù phần mềm Analysis Studio cũng cho phép người dùng truy cập nội dung của các tệp dữ liệu này ngay cả trong thời gian thực. Nội dung của các tệp dữ liệu này cũng có thể được nhập từ các cơ sở dữ liệu khác như cơ sở dữ liệu Microsoft SQL Server và Microsoft Access. Phần mềm Analysis Studio liên kết tệp dữ liệu thành tệp STP tương ứng và nội dung của các tệp STP này bao gồm siêu dữ liệu đối tượng và chi tiết thiết kế sơ đồ. Người dùng Microsoft Windows có thể xóa tệp tiêu đề Analysis Studio của tệp dữ liệu để mở và xem nội dung của tệp bằng bảng tính Microsoft Excel 2010.

Chúc một ngày tốt lành, người dùng thân mến, trong bài viết này chúng ta sẽ nói về một chủ đề như tập tin. Cụ thể, chúng ta sẽ xem xét: Quản lý tập tin, loại tập tin, cấu trúc tập tin, thuộc tính tập tin.

Hệ thống tập tin

Một trong những nhiệm vụ chính của HĐH là mang lại sự thuận tiện cho người dùng khi làm việc với dữ liệu được lưu trữ trên đĩa. Để thực hiện điều này, HĐH thay thế cấu trúc vật lý của dữ liệu được lưu trữ bằng một số mô hình logic thân thiện với người dùng, được triển khai dưới dạng cây thư mục hiển thị trên màn hình bằng các tiện ích như Norton Commander, Far Manager hoặc Windows Explorer. Yếu tố cơ bản của mô hình này là tài liệu, điều này cũng giống như hệ thống tập tin nói chung, có thể được đặc trưng bởi cả cấu trúc logic và vật lý.

Quản lý tập tin

Tài liệu– một vùng được đặt tên của bộ nhớ ngoài dành cho việc đọc và ghi dữ liệu.

Các tập tin được lưu trữ trong bộ nhớ không phụ thuộc vào nguồn điện. Một ngoại lệ là đĩa điện tử, khi cấu trúc bắt chước hệ thống tệp được tạo trong OP.

Hệ thống tập tin(FS) là một thành phần hệ điều hành cung cấp cho tổ chức việc tạo, lưu trữ và truy cập vào các tập dữ liệu - tệp được đặt tên.

Hệ thống tập tin bao gồm: Hệ thống tập tin bao gồm:

  • Tập hợp tất cả các tập tin trên đĩa.
  • Tập hợp cấu trúc dữ liệu được sử dụng để quản lý tệp (thư mục tệp, bộ mô tả tệp, bảng phân bổ không gian đĩa trống và đã sử dụng).
  • Một bộ công cụ phần mềm hệ thống thực hiện các thao tác khác nhau trên tệp: tạo, hủy, đọc, ghi, đặt tên, tìm kiếm.

Các vấn đề được FS giải quyết phụ thuộc vào cách tổ chức toàn bộ quá trình tính toán. Loại đơn giản nhất là hệ thống tệp trong hệ điều hành một người dùng và một chương trình. Các chức năng chính trong FS như vậy nhằm giải quyết các nhiệm vụ sau:

  • Đặt tên các tập tin.
  • Giao diện phần mềm cho các ứng dụng.
  • Ánh xạ mô hình hệ thống tệp logic vào tổ chức vật lý của kho dữ liệu.
  • FS chống lại sự cố mất điện, lỗi phần cứng và phần mềm.

Các tác vụ FS trở nên phức tạp hơn trong các hệ điều hành đa nhiệm một người dùng, được thiết kế cho công việc của một người dùng nhưng có thể chạy nhiều quy trình cùng một lúc. Đối với các tác vụ được liệt kê ở trên, một tác vụ mới sẽ được thêm vào - quyền truy cập chung vào một tệp từ một số quy trình.

Tệp trong trường hợp này là tài nguyên được chia sẻ, có nghĩa là FS phải giải quyết toàn bộ các vấn đề liên quan đến tài nguyên đó. Đặc biệt: phải có các phương tiện để chặn một tập tin và các phần của nó, đối chiếu các bản sao, ngăn chặn sự chạy đua và loại bỏ các bế tắc. Trong hệ thống nhiều người dùng, một tác vụ khác xuất hiện: Bảo vệ tệp của một người dùng khỏi sự truy cập trái phép của người dùng khác.

Các chức năng của FS, hoạt động như một phần của hệ điều hành mạng, thậm chí còn trở nên phức tạp hơn; các tập tin một người dùng khỏi sự truy cập trái phép của một người dùng khác.

Mục đích chính hệ thống tập tin và tương ứng với nó hệ thống quản lý tập tin– tổ chức quản lý thuận tiện các tệp được sắp xếp dưới dạng tệp: thay vì truy cập cấp thấp vào dữ liệu chỉ ra địa chỉ vật lý cụ thể của bản ghi mà chúng ta cần, quyền truy cập logic được sử dụng để chỉ ra tên tệp và bản ghi trong đó.

Phải phân biệt thuật ngữ “hệ thống tệp” và “hệ thống quản lý tệp”: trước hết, hệ thống tệp xác định các nguyên tắc truy cập vào dữ liệu được tổ chức dưới dạng tệp. Và thuật ngữ “hệ thống quản lý tệp” nên được sử dụng liên quan đến việc triển khai cụ thể hệ thống tệp, tức là. Đây là một tập hợp các mô-đun phần mềm cung cấp khả năng làm việc với các tệp trong một hệ điều hành cụ thể.

Ví dụ

Hệ thống tệp FAT (bảng phân bổ tệp) có nhiều triển khai như một hệ thống quản lý tệp

  • Hệ thống được phát triển cho những chiếc PC đầu tiên được gọi đơn giản là FAT (bây giờ được gọi đơn giản là FAT-12). Nó được thiết kế để hoạt động với đĩa mềm và trong một thời gian, nó được sử dụng để hoạt động với ổ cứng.
  • Sau đó, nó được cải tiến để hoạt động với các ổ cứng lớn hơn và cách triển khai mới này được gọi là FAT-16. tên này cũng được sử dụng liên quan đến SUF của chính MS-DOS.
  • Việc triển khai SUF cho OS/2 được gọi là super-FAT (điểm khác biệt chính là khả năng hỗ trợ các thuộc tính mở rộng cho mỗi tệp).
  • Có phiên bản SUF dành cho Windows 9x/NT, v.v. (FAT-32).

Loại tập tin

Tệp thông thường: chứa thông tin có tính chất tùy ý được người dùng nhập vào hoặc được tạo ra do hoạt động của hệ thống và chương trình người dùng. Nội dung của một tệp thông thường được xác định bởi ứng dụng hoạt động với nó.

Các tập tin thông thường có thể có hai loại:

  1. Phần mềm(có thể thực thi) – là các chương trình được viết bằng ngôn ngữ lệnh của hệ điều hành và thực hiện một số chức năng hệ thống (có phần mở rộng .exe, .com, .bat).
  2. Hồ sơ dữ liệu– tất cả các loại tệp khác: tài liệu văn bản và đồ họa, bảng tính, cơ sở dữ liệu, v.v.

Danh mục- một mặt, đây là một nhóm các tệp được người dùng kết hợp dựa trên những cân nhắc nhất định (ví dụ: các tệp chứa chương trình trò chơi hoặc các tệp tạo nên một gói phần mềm), mặt khác, đây là một đặc biệt loại tệp chứa thông tin trợ giúp hệ thống về một tập hợp tệp được người dùng nhóm theo một số tiêu chí không chính thức (loại tệp, vị trí trên đĩa, quyền truy cập, ngày tạo và sửa đổi).

Các tập tin đặc biệt– đây là các tệp giả được liên kết với các thiết bị đầu vào/đầu ra, được sử dụng để thống nhất cơ chế truy cập tệp và thiết bị bên ngoài. Các tệp đặc biệt cho phép người dùng thực hiện các thao tác I/O bằng cách sử dụng lệnh ghi tệp hoặc đọc tệp thông thường. Các lệnh này trước tiên được xử lý bởi các chương trình FS, sau đó ở một số giai đoạn thực hiện yêu cầu, chúng được HĐH chuyển đổi thành các lệnh điều khiển cho thiết bị tương ứng (PRN, LPT1 - cho cổng máy in (tên tượng trưng cho HĐH - đây là tập tin), CON - cho bàn phím).

Ví dụ. Sao chép con text1 (làm việc với bàn phím).

Cấu trúc tập tin

Cấu trúc tập tin– toàn bộ tập hợp các tệp trên đĩa và mối quan hệ giữa chúng (thứ tự các tệp được lưu trữ trên đĩa).

Các loại cấu trúc tập tin:

  • đơn giản, hoặc Cấp một: Một thư mục là một chuỗi tuyến tính của các tập tin.
  • thứ bậc hoặc đa cấp: Bản thân một thư mục có thể là một phần của thư mục khác và chứa nhiều tệp và thư mục con bên trong nó. Cấu trúc phân cấp có thể có hai loại: “Cây” và “Mạng”. Các thư mục tạo thành một “Cây” nếu tệp chỉ được phép đưa vào một thư mục (OS MS-DOS, Windows) và “Mạng” - nếu tệp có thể được đưa vào nhiều thư mục cùng một lúc (UNIX).
  • Cấu trúc tệp có thể được biểu diễn dưới dạng biểu đồ mô tả thứ bậc của các thư mục và tệp:



Các loại tên tệp

Các tập tin được xác định theo tên. Người dùng đưa file tên tượng trưng, điều này tính đến các hạn chế của hệ điều hành đối với cả ký tự được sử dụng và độ dài của tên. Trong các hệ thống tập tin đầu tiên, ranh giới này khá hẹp. Vì vậy phổ biến Hệ thống tập tin FATĐộ dài của tên bị giới hạn bởi sơ đồ 8.3 nổi tiếng (8 ký tự - chính tên, 3 ký tự - phần mở rộng tên) và trong UNIX System V, tên không được chứa nhiều hơn 14 ký tự.

Tuy nhiên, sẽ thuận tiện hơn nhiều cho người dùng khi làm việc với những cái tên dài, vì chúng cho phép bạn đặt cho tệp một cái tên thực sự dễ nhớ, nhờ đó, ngay cả sau một khoảng thời gian khá dài, bạn vẫn có thể nhớ tệp này chứa gì. Do đó, các hệ thống tệp hiện đại có xu hướng hỗ trợ các tên tệp có tính biểu tượng dài.

Ví dụ: Windows NT chỉ định trong hệ thống tệp NTFS của nó rằng tên tệp có thể dài tới 255 ký tự, không tính ký tự null kết thúc.

Việc chuyển sang tên dài sẽ tạo ra sự cố tương thích với các ứng dụng đã tạo trước đó sử dụng tên ngắn. Để các ứng dụng có thể truy cập các tệp theo các quy ước đã được chấp nhận trước đó, hệ thống tệp phải có khả năng cung cấp tên ngắn (bí danh) tương đương cho các tệp có tên dài. Vì vậy, một trong những nhiệm vụ quan trọng là vấn đề tạo ra những tên viết tắt phù hợp.

Tên tượng trưng có thể có ba loại: đơn giản, ghép và tương đối:

  1. Tên đơn giản xác định một tệp trong một thư mục, được gán cho các tệp có tính đến danh pháp ký hiệu và độ dài tên.
  2. Họ và tên là một chuỗi các tên tượng trưng đơn giản của tất cả các thư mục mà qua đó đường dẫn từ gốc đến một tệp nhất định, tên đĩa, tên tệp sẽ đi qua. Vậy tên đầy đủ là hỗn hợp, trong đó các tên đơn giản được phân tách với nhau bằng dấu phân cách được chấp nhận trong HĐH.
  3. Tập tin cũng có thể được xác định tên họ hàng. Tên tệp tương đối được xác định thông qua khái niệm "thư mục hiện tại". Tại bất kỳ thời điểm nào, một trong các thư mục đều hiện hành và thư mục này được người dùng tự chọn theo lệnh của HĐH. Hệ thống tệp ghi lại tên của thư mục hiện tại để sau đó có thể sử dụng nó làm phần bổ sung cho tên tương đối để tạo thành tên tệp đủ điều kiện.

Trong cấu trúc tệp dạng cây, có sự tương ứng một-một giữa tệp và tên đầy đủ của nó - “một tệp - một tên đầy đủ”. Trong cấu trúc tệp mạng, một tệp có thể được bao gồm trong một số thư mục, nghĩa là nó có thể có nhiều tên đầy đủ; Sự tương ứng ở đây là “một tập tin - nhiều tên đầy đủ.”

Đối với tệp 2.doc, xác định cả ba loại tên, với điều kiện thư mục hiện tại là thư mục 2008_year.

  • Tên đơn giản: 2.doc
  • Tên đầy đủ: C:\2008_year\Documents\2.doc
  • Tên tương đối: Documents\2.doc

Thuộc tính tệp

Một đặc tính quan trọng của một tập tin là các thuộc tính của nó. Thuộc tính– đây là thông tin mô tả các thuộc tính của tập tin. Ví dụ về các thuộc tính tệp có thể có:

  • Thuộc tính chỉ đọc;
  • Ký “file ẩn” (Hidden);
  • Ký “file hệ thống” (System);
  • Ký “tập tin lưu trữ” (Archive);
  • Loại tệp (tệp thông thường, thư mục, tệp đặc biệt);
  • Chủ sở hữu tập tin;
  • Trình tạo tập tin;
  • Mật khẩu để truy cập tập tin;
  • Thông tin về các hoạt động truy cập tập tin được phép;
  • Thời gian tạo, lần truy cập cuối cùng và thay đổi cuối cùng;
  • Kích thước tập tin hiện tại;
  • Kích thước tệp tối đa;
  • Ký “tạm thời (xóa sau khi hoàn tất quá trình)”;
  • Dấu hiệu chặn.

Trong các loại hệ thống tệp khác nhau, các bộ thuộc tính khác nhau có thể được sử dụng để mô tả các tệp (ví dụ: trong hệ điều hành một người dùng, bộ thuộc tính sẽ không chứa các đặc điểm liên quan đến người dùng và bảo mật (người tạo tệp, mật khẩu để truy cập tập tin, v.v.).

Người dùng có thể truy cập các thuộc tính bằng cách sử dụng các phương tiện được hệ thống tệp cung cấp cho mục đích này. Thông thường, bạn có thể đọc giá trị của bất kỳ thuộc tính nào, nhưng chỉ thay đổi một số thuộc tính, ví dụ: bạn có thể thay đổi quyền truy cập của một tệp, nhưng bạn không thể thay đổi ngày tạo hoặc kích thước hiện tại của tệp.

Quyền tập tin

Xác định quyền truy cập vào một tệp có nghĩa là xác định cho mỗi người dùng một tập hợp các thao tác mà anh ta có thể áp dụng cho một tệp nhất định. Các hệ thống tệp khác nhau có thể có danh sách các hoạt động truy cập khác nhau. Danh sách này có thể bao gồm các hoạt động sau:

  • việc tạo tập tin.
  • sự hủy diệt tập tin.
  • ghi vào một tập tin.
  • đang mở một tập tin.
  • đóng tập tin.
  • đọc từ tập tin.
  • bổ sung tập tin.
  • tìm kiếm trong tập tin.
  • lấy thuộc tính tập tin.
  • thiết lập các giá trị thuộc tính mới.
  • đổi tên.
  • thực thi tập tin.
  • đọc một danh mục, v.v.

Trong trường hợp tổng quát nhất quyền truy cập có thể được mô tả bằng một ma trận quyền truy cập, trong đó các cột tương ứng với tất cả các tệp trong hệ thống, các hàng tương ứng với tất cả người dùng và tại giao điểm của các hàng và cột, các thao tác được phép được chỉ định:

Trong một số hệ thống, người dùng có thể được chia thành các loại riêng biệt. Đối với tất cả người dùng cùng loại, quyền truy cập thống nhất được xác định, ví dụ: trong hệ thống UNIX, tất cả người dùng được chia thành ba loại: chủ sở hữu tệp, thành viên của nhóm và những người khác.

Tất cả thông tin chứa trong các biến và mảng sẽ biến mất khi chương trình kết thúc. Nếu có thể cần thiết trong tương lai thì thông tin này sẽ được lưu trên ổ cứng, đĩa mềm hoặc phương tiện khác và lần tiếp theo khi chương trình được khởi chạy, nó sẽ được tải lại từ phương tiện bên ngoài vào mảng hoặc biến. Bản ghi như vậy trên đĩa hoặc phương tiện khác được gọi là tập tin dữ liệu. Ngoài các tập tin dữ liệu, còn có Các tập tin thực thi(các chương trình ở dạng mã máy có phần mở rộng là .exe hoặc .com). Một số ngôn ngữ và hệ thống lập trình (bao gồm cả phương ngữ Pascal - Borland Pascal và Delphi) cho phép bạn chạy một tệp như vậy từ chương trình của riêng bạn. Pascal ABC không có tùy chọn này.

Các tập tin được nhóm thành các nhóm (thư mục hoặc thư mục). Để xác định tập tin nào sẽ làm việc, hãy chỉ ra nó Họ và tên. Nó bao gồm một số phần, ví dụ:

Thư mục chứa chương trình của chúng tôi là thư mục đang hoạt động (hiện tại). Điều này có nghĩa là khi truy cập vào một file dữ liệu nằm trong thư mục đó thì không cần thiết phải chỉ định đường dẫn.

Để sử dụng file dữ liệu trong chương trình bạn cần có trong phần VAR mô tả một biến tập tin(f/n), sẽ lưu trữ thông tin về tệp này (tên đầy đủ, độ dài, ngày và giờ tạo, v.v.). Mô tả này khác nhau đối với các loại tệp khác nhau. Ví dụ:


Trong các tệp được mô tả là điển hình, tất cả dữ liệu đều cùng loại (được chỉ định trong phần mô tả), giống như trong mảng. Vì vậy, nội dung của mảng thường được lưu trữ trong các tập tin như vậy. Thật bất tiện khi lưu trữ văn bản trong một tệp tiêu chuẩn vì tất cả các dòng phải có cùng độ dài. Một tệp văn bản được sử dụng để lưu trữ văn bản với các dòng có độ dài khác nhau. Để tách dòng này khỏi dòng khác, trong tệp như vậy, mỗi dòng kết thúc bằng một ký tự tương ứng với phím ENTER. Ngoài chuỗi, bạn cũng có thể lưu trữ số trong tệp văn bản (nhưng cách này ít tiết kiệm hơn so với tệp tiêu chuẩn, nơi chúng được lưu trữ dưới dạng mã nhị phân chứ không phải theo từng ký tự).

ĐẾN đặt tên tệp vào một biến tệp, lệnh được sử dụng

gán(f/n, 'tên file đầy đủ');

Trong lệnh này, bạn không cần phải chỉ định đường dẫn cho tệp nằm trong thư mục làm việc (cùng nơi với chính chương trình).

Để tất cả các thông tin khác về tệp được đưa vào biến tệp, nó phải mở bằng cách sử dụng một trong các lệnh sau:

đặt lại(f/n); - mở một tệp đã có sẵn và đặt một con trỏ về phần đầu của nó (thường đây là cách mở tệp để đọc, nhưng bạn cũng có thể ghi vào một tệp tiêu chuẩn. Việc ghi xảy ra thay vì dữ liệu hiện có trong tệp).

nối thêm(f/n); - mở một tệp đã có sẵn và đặt con trỏ đến cuối tệp (để thêm thông tin sau khi kết thúc tệp).

viết lại(f/n); - tạo một file mới (nếu file đã tồn tại thì nó sẽ bị xóa).

Con trỏ tệp lưu trữ vị trí trong tệp mà từ đó chúng ta có thể đọc (hoặc ghi) thông tin. Mỗi thao tác đọc hoặc ghi sẽ di chuyển con trỏ tới bản ghi tiếp theo.

ĐẾN đọc thông tin từ tập tin, đặt nó vào một biến, các lệnh được sử dụng:

read(f/n, danh sách các biến); - đọc từ một tập tin tiêu chuẩn và văn bản.

readln(f/n, danh sách các biến); - đọc từ một tập tin văn bản.

Nếu không phải các từ hoặc số riêng lẻ được đọc từ một tệp văn bản mà là toàn bộ dòng thì chỉ một biến chuỗi được sử dụng.

write(f/n, danh sách các biến); - ghi vào một tập tin tiêu chuẩn và văn bản.

writeln(f/n, danh sách các biến); - ghi vào một tập tin văn bản với một dòng cấp dữ liệu.

Để di chuyển qua một tập tin (chỉ điển hình!) hãy sử dụng lệnh seek(f/n, record number); . Việc đánh số các bản ghi trong tệp bắt đầu từ đầu. Để đến cuối tệp và thêm bản ghi mới, hàm filesize(f/n) được sử dụng làm số trong lệnh này, hàm này xác định kích thước tệp (không phải tính bằng byte mà tính bằng bản ghi thuộc một loại nhất định).

Khi đọc từ một tệp có độ dài không xác định, bạn có thể kiểm tra trước khi đọc xem tệp đó chưa kết thúc bằng cách sử dụng hàm eof(f/n), hàm này trả về true nếu con trỏ ở sau bản ghi cuối cùng. Ví dụ:


Sau khi làm việc xong với tập tin, bạn cần phải đóng lệnh đóng(f/n); . Nếu bạn không làm điều này, Pascal sẽ không lưu các thay đổi vào đĩa. Nhưng ngay cả khi không có thay đổi nào, bạn nên đóng tệp. Sau đó, biến tệp và vùng đệm tệp (vùng bộ nhớ mà Pascal sử dụng khi làm việc với bộ nhớ) sẽ được giải phóng.

Lệnh đổi tên (f/n,'new_name') đổi tên tệp được liên kết với biến tệp. Tập tin phải được đóng lại.

Lệnh xóa(f/n) xóa tệp được liên kết với một biến tệp. Tập tin phải được đóng lại.

Thao tác tập tin không phải lúc nào cũng thành công. Ví dụ, khi bạn cố đọc từ một đĩa mềm mà bạn quên đưa vào ổ đĩa, một thông báo lỗi sẽ xuất hiện và chương trình bị treo. Tốt hơn là ngăn chặn những lỗi như vậy. Hàm FileExists('name') trả về True nếu có một tệp có tên (và đường dẫn) đã cho trên đĩa, nếu không thì trả về Sai. Nó phải được sử dụng trước khi cố gắng truy cập vào một tập tin đã tồn tại. Nếu bạn cần tạo một tệp mới, hàm CanCreateFile('name') sẽ được sử dụng trước tiên. Nếu tên hoặc đường dẫn tệp không chính xác hoặc không còn dung lượng ổ đĩa hoặc vì lý do khác không thể tạo tệp có tên đó, nó sẽ trả về Sai.

khá tự nhiên.

Tài liệu- đây là chuỗi tuần tự của tập dữ liệu có tên và phần mở rộng (phần mở rộng có thể bị thiếu - trong trường hợp này, Windows sẽ coi tệp là không thể phát hiện được). Tệp là một thực thể thông tin nên nó được lưu trữ trên phương tiện vật lý (ổ cứng, ổ flash, v.v.). Để một tệp được xác định đầy đủ, tên tệp đầy đủ, bao gồm tên, dấu chấm và phần mở rộng (đây là chuỗi), phải là duy nhất trong cùng một bộ lưu trữ (theo thuật ngữ thư mục của Windows). Phần mở rộng tệp cho phép hệ thống xác định chương trình nào có thể mở, chạy, đọc và sử dụng chính xác một tệp nhất định.

Điều đáng biết là một thư mục là cùng một tệp nhưng có các tính năng cụ thể. Không giống như các tệp thông thường, nó không thể chứa dữ liệu nhưng có thể bao gồm các tệp hoặc thư mục khác. Tương tự như tài liệu trong kho lưu trữ. Có những thư mục chứa những mảnh giấy (tập tin) bên trong. Và có những thư mục dày hơn, bên trong có những thư mục khác.

Hãy xem một ví dụ. Tập tin "document.doc". Ở đây, "tài liệu" là tên tệp và "doc" là phần mở rộng, cho Windows biết rằng tệp phải được mở và chỉnh sửa bằng trình xử lý văn bản như Microsoft Word hoặc OpenOffice Writer. Nếu Windows không biết tiện ích mở rộng (các chương trình cần thiết chưa được cài đặt), hệ thống sẽ nhắc bạn chọn chương trình theo cách thủ công. Điều đáng biết là Windows có các tập hợp mở rộng nổi tiếng được xác định trước, chẳng hạn như txt (tệp văn bản), exe (chương trình thực thi) và các phần mở rộng khác.

Phân loại tập tin theo ứng dụng chức năng

Sự đa dạng của các loại tệp thường được chia theo chức năng sử dụng của chúng. Đây không phải là tiêu chí bắt buộc nhưng nó giúp bạn dễ hiểu mục đích của các tệp hơn. Ngoài ra, điều quan trọng cần biết là việc phân loại theo ứng dụng chức năng không hề giới hạn tập hợp các tiện ích mở rộng. Ví dụ: mỗi lớp có thể chứa kho lưu trữ, tài liệu, tệp thực thi, v.v.

1. Tập tin người dùng- hình ảnh, trang web, tài liệu, bảng biểu và các tệp khác mà người dùng sử dụng cho nhiệm vụ riêng của họ. Tên của những tệp như vậy chỉ bị giới hạn bởi tiêu chuẩn đặt tên của Windows. Phần mở rộng của những tệp như vậy thường không được người dùng chỉ định mà được các chương trình được sử dụng trong quá trình tạo tệp tự động chỉ định. Ví dụ: Microsoft Word đặt phần mở rộng thành "doc" hoặc "docx" (tùy theo phiên bản) và OpenOffice Writer đặt phần mở rộng thành "odt".

2. Tập tin hệ thống- tất cả các tệp mà Windows cần để hoạt động bình thường. Tên của những tệp như vậy cũng không mâu thuẫn với tiêu chuẩn đặt tên của Windows nhưng chúng được xác định trước trước khi cài đặt hệ điều hành. Do đó, người dùng không nên đổi tên hoặc sửa đổi những tệp như vậy vì điều này có thể gây ra lỗi.

3. File chương trình- tất cả các tệp được sử dụng bởi phần mềm đã cài đặt. Từ quan điểm hình thành tên, chúng tương tự như các tệp hệ thống. Nói cách khác, chúng cũng không mâu thuẫn với những tên tiêu chuẩn mà có những tên cố định do tác giả xác định. Điều đáng biết là các chương trình cũng có thể tạo các tệp chương trình trong quá trình hoạt động. Ví dụ: tệp nhật ký lỗi hoặc tệp cấu hình. Các file này chỉ được chính chương trình chỉnh sửa, nếu không có thể xảy ra lỗi (trừ khi phần mềm có quy định khác).

Chuẩn đặt tên file trong hệ điều hành Windows.

Hãy cùng xem tiêu chuẩn đặt tên file trong hệ điều hành Windows. Có hai bộ ký tự:

1. Bộ ký tự được đề xuất. Được phép sử dụng số, tiếng Latin, tiếng Nga và bất kỳ bảng chữ cái quốc gia nào khác trong tên tệp. Dấu gạch nối cũng được hỗ trợ. Tất cả các chữ cái của ngôn ngữ có thể được viết bằng các trường hợp khác nhau (viết hoa và viết thường).

2. Bộ ký tự hợp lệ. Điều này bao gồm dấu cách, dấu gạch dưới, dấu nháy đơn, dấu chấm phẩy, dấu chấm, dấu phẩy cũng như các ký tự đặc biệt " ! @ # $ % & " (và một số ký tự đặc biệt từ mã hóa chính). Điều đáng biết là bộ ký tự này được Windows diễn giải cụ thể. Vì vậy, nếu có thể, bạn không nên sử dụng chúng. Tuy nhiên, các ký tự dấu cách, dấu chấm, dấu phẩy và dấu gạch dưới hiếm khi gây ra sự cố. Nhưng khi sử dụng các ký hiệu khác có thể xảy ra lỗi. Đặc biệt với một số ký tự đặc biệt. Cũng cần biết rằng nếu bạn cần các tệp sẽ mở bình thường trong các hệ điều hành khác, thì bạn nên giới hạn chỉ ở các số và bảng chữ cái Latinh, đồng thời chỉ sử dụng dấu chấm để phân tách tên và phần mở rộng.

Bộ ký tự bị cấm- trong tên tệp bạn không thể sử dụng: \ /: * ?< > |

Tệp trong GUI là gì? Windows có lớp vỏ đồ họa riêng cho phép người dùng tương tác với máy tính. Trong giao diện này, các tập tin được hiển thị dưới dạng hình ảnh nhỏ hay còn gọi là biểu tượng hoặc biểu tượng và tên có phần mở rộng (với một số cài đặt nhất định, phần mở rộng của tập tin không được hiển thị). Thông thường, nếu Windows biết loại tiện ích mở rộng thì biểu tượng cho tệp đó sẽ cụ thể. Ví dụ: các tệp văn bản có phần mở rộng "txt" thường được biểu thị bằng biểu tượng notepad.

Đường dẫn đầy đủ đến tệp được hình thành như thế nào. Máy tính có đĩa, chúng được biểu thị bằng chữ cái Latinh. Đây là thành phần đầu tiên của đường dẫn. Theo sau nó là dấu phân cách ở dạng dấu hai chấm và dấu gạch chéo lên ":\". Nếu tệp nằm ở thư mục gốc của đĩa thì tên tệp đầy đủ sẽ xuất hiện tiếp theo (sau đây chỉ đơn giản là tên tệp). Nếu tệp nằm trong một thư mục, tên thư mục được chỉ định trước, sau đó ký tự "\" được chèn và tên tệp được chỉ định. Nếu tệp nằm trong thư mục con của một thư mục thì thư mục đó cũng phải được theo sau bởi tên của thư mục con và "\". Hơn nữa bằng cách tương tự. Trong trường hợp này, ký tự "\" là dấu phân cách cho phép bạn xác định từng phần của đường dẫn đầy đủ đến tệp.

Dữ liệu trên máy tính được lưu trữ dưới dạng tập tin. Tệp là đơn vị cấu trúc cơ bản để tổ chức và lưu trữ dữ liệu trên máy tính. Có khá nhiều định nghĩa về khái niệm tệp, bản chất của chúng tóm tắt như sau: tệp là một lượng thông tin nhất định (tệp có thể chứa chương trình máy tính, tài liệu văn bản, dữ liệu số, hình ảnh được mã hóa). , v.v.), có tên và được lưu trên bộ nhớ ngoài. Tên tệp bao gồm hai phần, được phân tách bằng dấu chấm: phần đầu tiên là tên tệp, phần thứ hai là phần mở rộng của nó, xác định loại của nó, tức là những gì được lưu trữ trong một tệp cụ thể (chương trình máy tính, dữ liệu đồ họa, v.v.). ). Tên tệp do người dùng chỉ định (nếu vì lý do nào đó người dùng không chỉ định tên tệp thì chương trình máy tính sẽ gán tên mặc định sau khi hoàn thành công việc) và loại tệp có thể do người dùng hoặc do người dùng ép buộc đặt. một ứng dụng (chương trình máy tính) tự động khi nó được tạo. Trong bảng 6.2 hiển thị một số loại tệp và phần mở rộng tương ứng của chúng, có dấu hoa thị cho biết tên tệp có thể có.

Bảng 6.2

Ngoài tên tệp, còn có một thứ như “định dạng tệp”, xác định cách thông tin (cấu trúc dữ liệu) được lưu trữ trong tệp và cách tệp được hiển thị trên màn hình hoặc khi được in. Định dạng tệp xác định quy tắc ghi tên tệp và tùy thuộc vào hệ thống tệp được hỗ trợ bởi hệ điều hành (OS) được cài đặt trên máy tính. Ví dụ: trong hệ điều hành MS DOS Tên tệp không được chứa quá tám chữ cái trong bảng chữ cái Latinh và phần mở rộng bao gồm ba chữ cái Latinh - Primer.txt, prim.txt, priml.txt, v.v. Trong họ HĐH các cửa sổ Tên tệp có thể có tối đa 255 ký tự và bạn cũng có thể sử dụng bảng chữ cái tiếng Nga - ví dụ như album, jpg. syus, v.v. Những quy tắc này có trong HĐH MS DOS và họ hệ điều hành các cửa sổ cấm sử dụng các dấu hiệu và ký hiệu sau khi gán tên file: / \: *?< >|.

Bất kỳ thiết bị lưu trữ bên ngoài nào ở trên đều có thể lưu trữ một số lượng lớn tệp. Thứ tự lưu trữ được xác định bởi hệ thống tệp, hệ thống này có thể có cấu trúc tệp cụ thể. Mỗi tên tệp có một địa chỉ duy nhất, cho phép MP, nếu cần, tìm tệp mong muốn trên thiết bị lưu trữ bên ngoài, sau đó đọc dữ liệu từ tệp đó vào RAM. Các tệp trong hệ điều hành, dựa trên các đặc điểm chức năng hoặc chủ đề, có thể được kết hợp thành các thư mục hoặc thư mục, do đó có thể được đưa vào các thư mục hoặc thư mục khác, tức là có cấu trúc tệp phức tạp.