Расширения документов какие бывают. Какие бывают форматы файлов

На жёстких дисках современного компьютера, а также на других накопителях и носителях информации обычно хранится одновременно много различных данных, и эти данные представлены в двоичном коде. Для того чтобы получить доступ к той или иной информации (например, чтобы прочитать текст, записанный в электронном виде, или запустить программу, которая записана на носителе), требуется указать, с какого конкретного места на диске следует считывать данные. Другими словами, для того чтобы компьютер «знал», где расположена нужная в данный момент информация на диске, ему требуется указать точный её «адрес» - для дискового накопителя, например, это номер сектора диска, номер дорожки и т. п.

Согласитесь, что запоминать местоположение данных в таком виде, особенно, когда данных много, весьма неудобно. Поэтому данные при записи на диск объединяют в поименованные последовательности. Эти последовательности и называются файлами. Файлом может являться и программа, которую можно запустить, и текст, набранный пользователем, и оцифрованный звуковой фрагмент, и любая другая последовательность данных. При этом в первых секторах каждого диска хранится информация о соответствии имени файла адресу его физического расположения на диске.

(adsbygoogle = window.adsbygoogle || ).push({});

Теперь вместо того чтобы запоминать, например, что программа-редактор текстов записана на дорожке 10, сектора 12 и 13 и для её запуска нам нужно обратиться к этим секторам, мы присваиваем файлу этой программы имя kwriter. Этому имени ставятся в соответствие данные сектора на диске, о чём делается запись в начале диска. Теперь при обращении к этому файлу по имени компьютер будет искать это имя в своём списке. Найдя его, он автоматически обратится к нужным секторам, чтобы считать с них данные. Для удобства желательно, чтобы имя файла отражало его содержимое. Например, файл стандартной программы-редактора текстов «Блокнот» из операционных систем семейства Windows носит имя notepad (блокнот). Таким образом, пользователю становится легко ориентироваться в записанных на диске данных.
Итак, пользователь указывает только имя файла, а конкретное место его расположения на диске определяет операционная система (об операционных системах см. в гл. 5). В некоторых старых операционных системах, например DOS, имя файла ограничивалось восемью символам и могло состоять только из латинских букв и некоторых специальных символов (например, подчёркивание или восклицательный знак).

В современных системах имя файла может быть очень длинным - например, до 255 символов в современных версиях Windows. При этом в имени файла могут использоваться самые разные символы, в том числе пробелы и даже русские буквы. Однако мы не рекомендуем злоупотреблять русскими буквами в названиях файлов. Дело в том, что, во-первых, такие «русские» файлы могут не читаться в некоторых системах (а мало ли, что может понадобиться!), а во-вторых, в неко­торых аварийных ситуациях извлечь или спасти такие файлы бывает значительно труднее, чем файлы, в именах которых использованы только латинские буквы. Иногда это и вовсе невозможно.

Ну вот, скажете вы, только начался рассказ о хранении данных в файлах, как автор уже пугает аварийными ситуациями... Автору, конечно, никого пугать не хочется. Однако непредвиденные аварийные ситуации могут возникнуть в любой области, в том числе и в компьютерной системе. Поэтому всегда лучше заранее принять меры предосторожности, тем более, что в данном случае это совсем нетрудно.
Считается, что в полное имя файла ещё входят путь к нему (path) и расширение (extension). Речь об этом и пойдёт далее

Какие бывают файлы

Когда пользователь начинает работу с каким-либо файлом, системе необходимо «знать», с помощью какой программы этот файл можно открыть и в каком формате он записан. Например, если файл содержит обычный текст, то он может быть прочитан в любой текстовой программе («Блокнот», WordPad, kwriter и т. п.). Если файл является звуковым фрагментом, то его можно открыть в программе-проигрывателе (Winamp, XMMS и пр.) или в каком-нибудь звуковом редакторе (Sound Forge, Adobe Audition, Samplitude и т. п.).

Таким образом, программа, которая открывает файл, должна «понимать» формат, в котором этот файл записан. Если же, например, попробовать открыть текстовый файл в звуковом редакторе, то последний, скорее всего, выдаст сообщение об ошибке («неверный формат файла»), а если вы откроете звуковой файл в виде текста, то увидите на экране полную бессмыслицу.

Расширение в имени файла. Чтобы программы и операционные системы могли «с первого взгляда» определять тип файла, к имени файла добавляют так называемое расширение. Оно обычно состоит из небольшого количества символов. В старых системах вроде DOS оно ограничивалось тремя символами. В современных системах, в том числе в Windows XP или Linux, такого ограничения нет, однако большинство файлов всё равно оканчивается трёхбуквенными расширениями. От собственного имени файла расширение отделяется точкой.

Во многих современных системах и в Интернете принят ряд стандартных расширений имён файлов. Некоторые из них приведены в табл. 3.1.

Стандартные расширения имён файлов

Сжатый музыкальный файл формата mp4 audio
.аас
Файл архива

Векторный рисунок формата популярной программы Adobe Illustrator
.ai
Звуковой файл (как правило, на Macintosh)

Aiff
Анимированный указатель мыши

Ani
Файл архива

Arj

Потоковый звуковой или видеофайл
.asx
Звуковой файл (формат Sun Audio)

Видеофайл стандартного для Windows формата
.avi

Старая (предыдущая) копия какого-либо файла
.bak

«Командный файл» - содержит ряд команд операционных систем DOS или Windows, которые будут выполняться последовательно
.bat

Двоичный файл
.bin
Растровый рисунок

Bmp
Файл архива

Bz
Файл архива

Код программы на языке С или С++
.c

Установки для какой-либо программы
.cfg

Программа (апплет), написанная на языке Java
.class

Исполняемый файл (программа, которую можно непосредст­венно запустить)
.com
Файл конфигурации какой-либо программы (обычно в Linux)

Conf
Музыкальный проект популярной программы Cubase

Файл стиля для веб-страниц
.ess

Указатель мыши
.cur

Видеоклип
.dat

Файл базы данных
.db

Динамическая библиотека связей (обычно компонент какой-либо программы)
.dll

Документ, как правило, формата Microsoft Word
.doc


.eps

Исполняемый файл (программа, которую можно непосредс­твенно запустить)
.ехе

Рисунок (сжатый файл)
.gif

Файл справки
.sр


.htm

Гипертекстовый файл, обычно для веб-страниц
.html

Значок
Лео

Сведения для установки какой-либо программы
.inf

Файл настроек программы (обычно в Windows или DOS)
.ini

Файл образа компакт-диска
.iso

Файл шрифта
.fon

Файл архива
.gz

Файл архива
.gzip

Исполняемая программа на языке Java
.jar

Рисунок (сжатый файл)
.jpeg

Рисунок (сжатый файл)
jpg

Скрипт на языке JavaScrpipt
.js

Музыкальный файл с текстом (для караоке)
.kar

Файл архива
.zip

«Протокол» действий, совершённых какой-либо программой (обычно при установке)
.log

Листинг
.1st


.m3u

MIDI-файл (музыкальный файл, который исполняется через синтезатор звуковой карты)
.mid


.mov

Сжатый музыкальный файл формата трЗ
.трЗ

Сжатый видеофайл формата mpeg
.mpg

Файл установки программы для Windows
.msi

Нотный файл формата популярной программы Finale
.mus

Системный файл ActiveX
.осх

Сжатый музыкальный файл формата Ogg Vorbis
.ogg

Старая копия какого-либо файла
.old

Документ формата Adobe Acrobat
.pdf

Скрипт на языке РНР
.php

Скрипт на языке РНР
.phtml

Скрипт на языке PERL
.pi

Стандартный список воспроизведения
.pis

Файл вёрстки в формате Adobe Pagemaker
.pmd

Рисунок сжатого формата
png

Графический файл полиграфического формата PostScript
.ps

Рисунок формата популярной растровой программы Adobe Photoshop
.psd

Зашифрованный пароль и другие сведения о пользователе
.pwl

Видео или звуковой файл формата Apple Quick Time
qt

Файл Real Audio
.ra

Файл архива
.rar

Сведения для внесения в системный реестр Windows
.reg

Файл установки программы для Linux
.rpm

Текстовый файл со шрифтовой разметкой
.rtf

Нотный файл формата популярной программы Sibelius
.sib

Файл установки программы для мобильного телефона
.sis

Файл фильма популярного формата Shokwave Flash
.swf

Документ в формате OpenOffice.org
.sxw

Системный файл
sys

Файл архива
.tar

Рисунок
.tif

Файл шрифта TrueType
.ttf

Текстовый файл
.txt

Драйвер виртуального устройства - один из системных ком­понентов Windows
.vxd

Стандартный звуковой файл в Windows
.wav

Сжатый музыкальный файл формата Windows Media
.wma

Рисунок (стандартный Windows-формат)
.wmf

Сжатый видеофайл формата Windows Media
.wmv

Текстовый документ в формате Write или WordPad
.wri

Документ, размеченный в соответствии со стандартом XML
.xml

Конечно, здесь перечислены далеко не все расширения и типы файлов, их слишком много Дело в том, что каждая вновь создаваемая программа может использовать уже имеющийся стандартный тип для своих рабочих файлов, а может иметь и свой собственный. Так, например, графический редактор Adobe Photoshop может работать со стандартными форматами рисунков (bmp, jpg, tif и пр.), но в то же время имеет свой собственный файловый формат (psd). Музыкальная программа Cubase может работать со стандартными MIDI-файлами (mid) или звуковыми файлами (wav), однако при работе чаще используется оригинальный формат (срг).

Более того, поскольку программ существует очень много, то легко может случиться так, что две или более программы будут «стараться» использовать одинаковое расширение для файлов своего формата. Например, расширение mus традиционно используется для нотных файлов формата Finale, однако это же расширение mus имеют и нотные файлы совершенно другого формата MusicTime.

Вообще говоря, в некоторых системах тип файла определяется не только по расширению, и в этом случае файлы могут вообще не иметь расширений. Например, исполняемые файлы в Linux определяются не по расширению (ехе или com), а по специальному файловому атрибуту. Однако для совместимости с традиционно сложившейся ситуацией большинство программ в этих системах сегодня также оперирует файлами с расширениями.

Открытие файлов. В современных системах, таких как Windows XP или Linux с графической оболочкой это обычно осуществляется с помощью двойного щелчка мыши на имени или значке файла. Получив команду «Открыть файл», система прежде всего определяет тип файла по его расширению. Если файл окажется исполняемым (программа), то его содержимое загружается в память и передаётся процессору для исполнения. Если же файл имеет другой известный тип, то система сначала открывает ту программу, которая работает с этим типом файлов, и затем файл будет открыт уже из этой программы. Если тип файла системе неизвестен, то пользователю будет предложено выбрать рабочую программу самому. Эта ситуация в операционных системах Windows показана на рис. 3.1.

Каталоги

Итак, теперь вы знаете, что такое файл. Если бы файлов на диске было не больше одного-двух десятков, запомнить, что означают их имена, и разобраться в них не предоставляло бы труда. Однако их уже очень много на новом диске, и в дальнейшем их количество растет с ураганной скоростью. Например, на жёстких дисках моего компьютера расположено около тридцати тысяч различных файлов. Откуда они вообще берутся и как в них разобраться?
Рис. 3.1 Выбор программы для открытия файла (в Windows и Linux)

Во-первых, в состав современных программ (за редким исключением) входят от нескольких десятков до сотен вспомогательных файлов. К примеру, система Windows XP состоит из почти 10 000 файлов. Чтобы облегчить жизнь, решили все файлы, относящиеся к одной программе, объединять в группу. В результате на диске будет несколько таких групп.

Полезно также разделить файлы по типам и назначению (для работы, для развлечения, для детей и др.). Если компьютером пользуется несколько человек, следует объединить в одну группу файлы одного пользователя.

Такие группы файлов принято называть каталогами, директориями или, в новой терминологии, папками (folders). Все каталоги, как и файлы, имеют свои имена. Внешне имена каталогов ничем не отличаются от имён файлов, но обычно не имеют расширений (хотя и могут иметь их).

Итак, файлы (все или часть) распределили по каталогам (папкам). Но процесс продолжается, и вот уже внутри одного каталога может располагаться другой каталог, в нём ещё один и так далее, как в русской матрёшке.

Теперь, чтобы указать точное местоположение файла, кроме имени файла и расширения, необходимо указать ещё и путь к файлу. Путь (path) состоит из имён всех каталогов, внутри которых файл расположен. В системах DOS и Windows это выглядит так: в начале пути к файлу ставится буквенное имя диска (логического раздела), после которого всегда ставится двоеточие, и далее следует перечисление имён каталогов, в которых расположен данный файл. При этом имена каталогов разделяются обратной косой чертой (\). Например, если вы записали звуковой файл и назвали его MySound.wav, а затем поместили его в каталог Sounds, который, в свою очередь, вложен в каталог MyFiles на жёстком диске D:, то полное имя файла (включающее путь) будет выглядеть так:

D:\MyFiles\Sounds\MySound.wav

В системе Linux и других с подобной организацией имён файлов, имена каталогов разделяются обычной косой чертой (/). Ею же обозначается корневой раздел. Например, если вы поместили звуковой файл MySound.wav в свой домашний каталог под названием Ivanov, который находится в каталоге home, то полный путь к файлу будет выглядеть так:

/home/Ivanov/MySound.wav

Файловые системы. Иногда возникает ситуация, когда файлы (а точнее - целые логические диски), которые прекрасно «видны» из-под одной операционной системы, бесследно исчезают в другой. Как правило, это бывает, когда операционные системы используют разные файловые системы. Файловая система - это формат, в котором записана информация о расположении файлов на диске. Существует универсальная файловая система на PC, которая называется FAT или FAT16. С ней могут работать DOS, Windows, OS/2, Linux, BeOS и т. п. Универсальной является и файловая система FAT32, но она к тому же разрешает использование больших жёстких дисков. При файловой системе FAT16 размер раздела не должен превышать 2 Гбайт. С FAT32 могут работать практически все операционные системы, кроме DOS.

Существует и другие же файловые системы, но они не столь универсальны. Например, систему HPFS могли понимать только OS/2 и Windows NT ранних версий. Файловую систему NTFS, которая используется в Windows NT/2000/XP, не «понимают» Windows 95/98/ME, а в Linux её лучше использовать только для чтения, но не для записи. Характерная для Linux файловая система ext3 обычно не читается из Windows.Если по разным причинам на компьютере работает несколько операционных систем, то автор рекомендует пользоваться наиболее универсальной файловой системой FAT32.

Программные пакеты

Современные программы, как правило, состоят не из одного исполняемого файла, а из множества, или компонентов пакета. Для работы программ бывает необходимо подготовить систему, т. е. произвести определённые настройки и дать знать системе о существовании программ. С этой целью программные пакеты поставляют в «запакованном» виде, и к ним прилагают небольшую программку, обычно именуемую Setup или Instal. Эта программка распаковывает файлы-компоненты программы, помещает их в нужные каталоги, записывает или изменяет системные установки и т. д. Этот процесс называется установкой программы, а запакованный программный пакет с программой установки называется дистрибутивом.

Например, дистрибутив нотно-графической программы Finale 2004 содержит файл Setup.exe. При запуске он создаёт специальный каталог для программы Finale 2004, помещает туда десять необходимых файлов, создаёт внутри него ещё десять каталогов (для библиотек установок, шаблонов, учебных файлов, подключаемых модулей и пр.) и наполняет их содержимым. Кроме того, устанавливает в системе «нотные» шрифты (Maestro, Petrucci и пр.) и несколько PostScript-шрифтов (специальных шрифтов для полиграфических работ).

Иногда вместо установочного файла или сценария, который совершает подобную работу, дистрибутив программы содержит несколько команд для стандартного инсталлятора системы. Эти указания могут быть запакованы вместе с необходимыми для работы программы данными в один файл со стандартным расширением msi (для Windows) или rpm (для Linux). Для установки такой программы достаточно открыть этот файл, а всё остальное система сделает сама.




Здравствуйте, друзья, с Вами снова сайт! Предлагаю сегодня поговорить о таком явлении, как расширение файла , заодно разберемся с понятием "тип файла " и узнаем, какие типы файлов наиболее распространены в наше время. Давайте вместе подумаем, а зачем нужны разные типы файлов, что они означают, почему бы не сделать всем файлам, например, Windows, один и тот же формат?

Несомненно, каждый из Вас замечал, что определенные файлы, имеющие отношения к компьютерам и прочей электронно-цифровой технике, объединены одним и тем же "окончанием", например, документы всем известного MS Word заканчиваются doc, различные песни и музыкальные треки чаще всего - mp3. Вот именно это окончание и называется расширением файла.

Что такое расширение файла и тип файла (формат файла)

Для начала определимся с тем, что такое тип файла - это определенная спецификация (одна из многих), описывающая действительную структуру файла. В соответствии с данной структурой файл обрабатывается программами и хранится на носителе. Видимая для пользователя часть типа файла - это расширение файла.

Расширение файла - конкретная последовательность символов (букв и цифр), следующая за именем файла через символ точки "." и применяемая для идентификации типа файла программными продуктами и/или пользователем. То есть с помощью расширения файла программы и человек понимают (если знают) какой тип данных заключен в конкретном файле, какими особенностями он обладает, что необходимо для его исполнения.

В системе Windows (о самой Windows можно почитать ) существует множество похожих приложений, способных открывать одни и те же типы файлов, например, AIMP-плеер и KMP-плеер. Оба они могут воспроизводить музыкальные файлы, но, в то же время, ни один, ни второй не смогут открыть файл с расширением.exe или.zip, следовательно плееры не знают спецификацию архивных или исполняемых файлов. Таким образом можно понять, что каждое приложение, каждая программа создается для того, чтобы работать только с определенными типами файлов. Из этого можно сделать вывод: не существует (и не может существовать) программы, которая знала бы все типы файлов и умела бы с ними работать. Мало того, что такую программу невозможно создать из-за гарантированных проблем совместимости различных модулей, так она еще и весила бы гигабайт 500 в итоге

Отсюда и ответ на второй вопрос, озвученный в начале статьи, один и тот же формат всем файлам сделать нельзя, потому что программа должна понимать, какое действие или набор действий от нее ожидается, что она должна сделать. Кроме того, видимая часть, после имени файла, я говорю о расширении, помогает пользователям группировать файлы так, как им будет удобно, позволяет запоминать, что и как открывать в конкретном случае. Например, файл.doc(docx) знаем, что нужно открыть MS Word (про Word можно почитать в этой статье), файл.avi - KMP-плеером , а файл.adr будем открывать браузером Opera (это файл закладок оперы).

Стоит заметить, что расширения файлов часто означают именно специфику файла, а не принадлежность файла к какой-либо группе. Речь о том, что все типы файлов можно объединить в группы, а уже каждая группа имеет свою общую специфику. Например, файл.mp3, файл.ac3, файл.waw, файл.flac - это все музыкальные файлы, то есть все они могут открываться 1 программой, хотя и имеют разное расширение. А некоторые файлы не имеют вариаций, взять, хотя бы, обычный документ Word, файл.doc(docx) и больше нет ничего похожего. Но при этом можно объединить такой файл в группу текстовых файлов (txt, html, doc/docx).

Кроме символьного расширения, все файлы в системе windows имеют значок, миниатюрное изображение, характеризующее тот или иной тип файла. Как правило, значки эти присваиваются файлам уже самой программой, которая работает с данным видом файлов.

Вот так выглядят хорошо всем известные файлы в Windows 7 (как установить Windows 7 читайте ):

Документы Microsoft Word:

Документы Microsoft Excel:

Музыкальные файлы, открываемые через проигрыватель Windows:

Исполняемый файл.exe антивируса Касперского (зачем он нужен я писал в этой статье):

С помощью таких, легко узнаваемых значков, мы уже сразу понимаем, какого типа файл перед нами, более того, мы понимаем, что он сделает, если на него кликнуть.

Что делать, если Вам нужно узнать расширение файла, но через проводник его не видно? Первое, что приходит в голову - запустить Total Commander, но кто-то работает через проводник и не хочет никаких "коммандеров" (хотя время они экономят очень прилично), для таких пользователей есть способ. Нажимаем "Пуск ", выбираем "Панель управления - Параметры папок ", затем выбираем сверху вкладку "Вид ", проматываем вниз, находим строку "Скрывать расширения для зарегистрированных типов файлов " и убираем галочку.

(кликните для увеличения)

Теперь через проводник нам будут показаны не только значки файлов, но и их расширение, а это, иногда, очень важно. Кстати, расширение Вы можете сами менять (например, вместо jpg сделать png) простым переименованием файла и заменой символов после точки, но я не советую этого делать, так-то в большинстве случаев не произойдет смены формата, а просто сменятся символы, которые видите Вы. Кроме этого, Вы можете "наэкспериментировать" и забыть, какое расширение было изначально, следовательно, испортите файл безвозвратно. Также, обратите внимание, если Вам нужно просто ПЕРЕИМЕНОВАТЬ сам файл, то изменяйте символы, которые находятся только ДО точки, например, нужно изменить название с "Поющая Девочка.mp3" на "Поющий мальчик.mp3" - в этом случае изменяйте только часть до ".mp3" иначе файл потеряет расширение, а компьютер не будет знать, что это за файл и как его открыть.

Что означает расширения файла, связь расширения и программы

Специально для Вас я составил список расширений, наиболее часто встречающихся на компьютере, вместе со списком программ, которые данный тип файла открывают.

Итак, преступим!

Вид расширения Тип (формат) файла Программа\утилита
.exe Исполняемый файл (программный бинарный файл) Любая рабочая программа Windows, DOS, Symbian, OS/2
.msi Инсталлятор программ (установщик) Пакет программ, требующих установки (MS Office, например)
.doc(docx) Документ Word (Word 2007 и выше) MS Word, одно из приложений Office
.xls(xlsx) Файл таблиц Excel (Excel 2007 и выше) MS Excel, одно из приложений Office
.txt Текстовый файл простого формата (документ) Блокнот
.ppt(pptx) Файл презентаций PowerPoint MS PowerPoint, одно из приложений Office
.accdb База данных Access MS Access, одно из приложений Office
.mp3, .flac, .ape, .ogg, .waw, .ac3, .wma, .m4a, .aac и другие форматы Звуковой (цифровой) файл Любой аудио-плеер (не только Windows) с необходимыми кодеками
.bmp, .jpg(jpeg), .png, .gif, .tiff, .ico, .raw Файл изображения Стандартные менеджеры изображений, иногда специальные программы для конкретного формата (MOPM,ACDC,Stone)
.avi, .wmw, .mkv, .3gp, .flv, .mpeg, .mp4, .mov, .vob Видео файлы Различные плееры, главное условие - установлен необходимый кодек для вывода изображений соответствующего формата
.swf, .flv Флеш или видео файлы в интернете Воспроизводятся любым браузером с установленным flash-проигрывателем
.rar, .zip, .7z, .tar, .gzip, .gz, .jar Архивный контейнер В большинстве случает хватает WinRar и 7-Zip для работы со всеми популярными архивами
.html, .htm, .php Веб-страница Браузеры
.dll Программный модуль Не должен открываться, подключается в виде библиотеки различными компонентами MS Windows при возникновении необходимости
.ini Конфигурационный файл Используется Windows для загрузки настроек различных компонентов, к которым относится конкретный ini-файл
.bat Пакетный файл. Имеет свой синтаксис, может быть создан из обычного тестового файла заменой расширения Используется командным интерпретатором (CMD.exe/Command.com) для выполнения заложенных в bat-файл последовательных команд.
.iso, .mds/.mdf, .vdf, .img, .daa, .vcd, .nrg Файл образа диска Различные форматы открываются различными программами. Например, Alcohol, UltraISo, VirtualCD, Nero, Daemon Tools, PowerIso и другими.
.djvu Файл сжатых изображений. Используется для точной передачи информации (сканированные книги, исторические документы) без потери данных. Любая программа для чтения djvu-файлов. WinDJView, DJVUReader и т.д.
.pdf Файл электронного документа, подходит для передачи любой полиграфической продукции и прочего Adobe Reader, Foxit PDF Reader и прочие

Надеюсь, используя полученные сегодня данные, Вы с легкостью сможете определить, какой перед Вами файл, чем его открыть и зачем он нужен. Немного практики, и файлы будут узнаваться на лету.

ЛЕКЦИЯ 19. СИСТЕМЫ ФАЙЛОВ

Понятие файла

Файл (file) – это смежная область логического адресного пространства. Как правило, файлы хранятся во внешней памяти.

Немного о терминологии. Слово файл уже несколько десятков лет используется как русское – один из многочисленных примеров программистских неологизмов. Первоначально, когда около 50 лет назад появился данный английский термин, в русскоязычной литературе специалисты пытались ввести другую терминологию – слово file переводили как фонд и даже тека (в смысле хранилище ). Однако исторически сложилось иное решение – слово файл стало русским. В английском языке слово file имеет много других значений: например, подшитый в папку бумажный документ и даже стадо (например, слонов) – в последнем случае, как можно предположить, размер "файла" может быть очень велик. У всех в памяти название легендарного сериала " X files" (в вольном русском переводе – "Секретные материалы").

Фирма IBM в документации по своей системе IBM 360 в 1960-х гг. использовала иной термин – набор данных (data set) – для обозначения этого же понятия, однако он не пережил операционную систему, в которой использовался.

Каждый файл имеет свой тип , определяющий, какая информация хранится в файле. Основные типы файлов – программа (код) или данные . Данные подразделяются на числовые, символьные (текстовые) идвоичные ( произвольная информация ).

Структура файла

В различных системах приняты различные точки зрения на структуру файлов. В ряде систем структура файла привязывалась к типу устройства, на котором он находится. В некоторых других системах структура файла была искусственно усложнена. Однако наиболее простую и унифицированную точку зрения из них предложили авторы системы UNIX : файл – это последовательность слов или байтов . Казалось бы, это очевидно, но преимущество данного подхода к файлам в том, что базовое представление файла и базовые операции над ним (read , write ) не зависят от типа устройства. В свое время для программистов нашего поколения такой подход к файлам был откровением, после сложностей системы файлов IBM 360, а затем – "Эльбруса". Можно сказать, что файлы в своем развитии прошли путь , аналогичный развитиюархитектур компьютеров – сначала в сторону значительных усложнений, затем – упрощения и унификации .

Файлы можно условно подразделять на файлы простой и сложной структуры (хотя точка зрения на структуру файла зависит от той программы, которая его обрабатывает).

Файлы простой структуры состоят из последовательности записей (records) – элементарных единиц, в терминах которых выполняются операции обмена с файлом. Записи могут быть:

· строками , если это текстовый файл ;

· двоичными данными фиксированной длины ;

· двоичными данными переменной длины .

Файлы сложной структуры могут быть самого разного вида, например:

· отформатированным документом Microsoft Office (такой файл, кроме собственно текста, содержит управляющие символы переключения шрифтов, цветов и т.д.);

· загрузочным модулем реального или виртуального двоичного кода, например, portable executable (PE) -файлом для платформы.NET; class-файлом для платформы Java; подобные файлы состоят из нескольких секций, содержат внутренние ссылки и таблицы и т.д.

Сложная структура файла может быть смоделирована записями путем добавления соответствующих управляющих символов .

Файлы интерпретируются операционной системой или программами их обработки.

Атрибуты файла

Практически в любой системе файлов можно считать, что файл состоит из заголовка и памяти .В заголовке файла хранятся его атрибуты – общие свойства, описывающие содержимое файла, память файла – это его записи, строки, секции и т.д., содержащие собственно хранимую в нем информацию.

Различаются следующие основные атрибуты файла :

Имя (Name) – название файла в символьной форме, воспринимаемое пользователем.

Тип (Type) – тип хранимой в файле информации. Отдельный атрибут тип необходим для систем, которые поддерживают различные типы файлов. Например, в системе "Эльбрус" значением атрибута тип файла является число, кодирующее тип: 0 – данные, 2 – код, 3 – текст и т.д. Однако более общепринятым подходом является подход, принятый в системах MS DOS , Windows , UNIX : тип файла кодируется расширением имени , например, book.txt – текстовый файл (.txt), содержащий текст книги.

Размещение (Location) указатель на размещение файла на устройстве.

Размер (Size) – текущий размер файла .

Защита (Protection) – управляющая информация , задающая полномочия чтения, изменения и исполнения файла.

Время и дата . Например, во всех системах хранится дата создания файла и дата последней модификации файла. Последняя играет важную роль при компиляции (сборке) больших программных проектов, так как утилиты для сборки проектов (например, make ) определяют по соотношению дат последней модификации файлов исходного кода и двоичного кода, следует ли перекомпилировать исходный файл .

В ОС UNIX дату модификации файла можно изменить командой touch f, где f – имя файла . Touch дословно означает потрогать . Кроме изменения времени модификации, больше никаких действий над файлом не производится.

Идентификация пользователя .В любой системе поддерживается понятие хозяин (создатель) файла (owner) .Именно хозяин вправе задавать другим пользователям полномочия для работы с файлом.

Информация о файлах хранится в структуре директорий ( или справочников - directories) ,иногда, например, в системе Windows , называемых также папками (folders) – структурами во внешней памяти, содержащими символьные имена файлов и ссылки на них. Важнейшая концепция директории подробно рассматривается далее в данной лекции.

Операции над файлами

Хотя набор операций над файлами и особенно их обозначений различается от системы к системе, можно выделить следующие основные операции над файлами.

· Создание файла (Create ). Создается заголовок файла; первоначально его содержимое (память) пусто.

· Запись в файл (Write ). Как правило, происходит записями (records) или блоками – более крупными логическими единицами информации, объединяющими несколько записей, с целью оптимизацииопераций ввода-вывода .

· Чтение из файла (Read ). Обычно также выполняется записями или блоками.

· Поиск позиции внутри файла (позиционирование) (Seek ). Позиция задается номером записи или блока, либо специальными именами, обозначающими начало файла (позиция перед первой записью) или конец файла (позиция после последней записи).

· Удаление файла (Delete ). В зависимости от реализации системы файлов, ошибочное удаление файла может быть фатальным (UNIX) или исправимым (MS DOS).

· Сокращение файла (Truncate ).

· Открытие файла (Open ) – поиск файла в структуре директорий по его символьному имени (пути) и считывание его заголовка и одного или нескольких смежных блоков в буфера в основной памяти.

· Закрытие файла (Close ) – запись содержимого буферов в блоки файла; обновление файла во внешней памяти в соответствии с его текущим состоянием; освобождение всех структур в основной памяти, связанных с файлом.

Для выполнения операций обмена с файлом (read, write ), как правило, файл необходимо открыть. Закрытие файла является обязанностью пользовательского процесса ; однако, если он по какой-либо причине этого не выполняет, то закрывает все файлы, открытые процессом, операционная система после завершения или прекращения процесса.

Типы файлов – имена и расширения

В таблица 19.1 приведены некоторые наиболее употребительные типы файлов и соответствующие им расширения имен.

Таблица 19.1. Типы файлов – имена и расширения
тип файла расширение имени функциональность
исполняемый код (загрузочный модуль) exe, com, bin или отсутствует готовая к выполнению программа в бинарном машинном коде
обьектный модуль obj , о откомпилированная программа в бинарном коде, но не слинкованная
исходный код на языке программирования с, сс, Java, pas, asm , а исходный код на различных языках (Си, Паскаль и др.)
командный файл bat, sh файл с командами для командного интерпретатора
текст txt, doc текстовые данные, документы
документ для текстового процессора wp, tex, rtf , doc документ в формате какого-либо текстового процессора
библиотека lib, a, so, dll, mpeg, mov, rm библиотеки модулей для программирования
файл для печати или визуализации arc , zip, tar ASCII или бинарный файл в формате для печати или визуализации
архив arc , zip, tar несколько файлов, сгруппированных в один файл, для архивации или хранения
мультимедиа mpeg, mov, rm бинарный файл , содержащий аудио- или видео информацию

Смысл их ясен из приведенной таблицы. Следует заметить, что унифицированных расширений имен, принятых в различных ОС, очень мало – по -видимому, только .txt (текст) и расширения для исходных кодов на языках программирования, например, .c – Си , .p или. pas – Паскаль и др. Объектные модули называются по -разному (в Windows .obj , в UNIX - .o ), библиотеки – тоже: статически линкуемые в Windows - .lib , вUNIX - .a ; динамически линкуемые в Windows - .dll , в UNIX – .so .Интересно отметить, что для исполняемого кода в Windows есть стандартное расширение - .exe ,а в UNIX – нет, зато есть весьма экзотическое полное стандартное имя: a.out (assembler output) .Унифицированы расширения имен для различных текстовых процессоров: . doc - Microsoft Word , .pdf – Adobe Acrobat и др.

Методы доступа к файлам

Традиционно различаются файлы последовательного доступа и прямого доступа .Файл последовательного доступа – это файл , доступ к которому возможен только позиционированием на начало и конец и затем операциями обмена вида считать или обновить следующую (предыдущую ) запись . Файл прямого доступа – это файл , для которого возможен непосредственный доступ по номеру записи и операция обмена с явным указанием номера записи. В любом случае, при выполнении обмена с файлом всегда существует некоторая текущая позиция по файлу, указывающая на некоторую запись , на позицию перед началом или после конца файла. В операциях над файлом последовательного доступа произвольная установка позиции не допускается, а разрешены только операции , автоматически передвигающие текущую позицию на следующую (предыдущую) запись .

Подобная особенность связана с различием устройств, на которых размещены файлы (например, магнитная лента – по сути дела, последовательное устройство), однако необходимость организации последовательных или прямых файлов может быть связана с сутью задачи.

По -видимому, последовательный доступ используется чаще: именно так происходит ввод данных, вывод результатов на печать или на экран.

Типичные :

reset – установка на начало файла для чтения

rewrite – установка на начало файла для записи.

Типичные операции прямого доступа:

position to n – позиционирование на запись с номером n

rewrite n, где n - относительный номер блока (записи).

Описанная трактовка последовательных файлов и операций над ними иллюстрируется рис. 19.1.

Рис. 19.1. Файл последовательного доступа.

При необходимости можно смоделировать операции последовательного доступа для файла с прямым доступом. Способ моделирования показан в таблица 19.2.

Указатель на текущую позицию, характерный для последовательного доступа , для файла прямого доступа моделируется переменной cp , а операции последовательного доступа – операциями прямого доступа с указанием cp в качестве номера блока.

Для ускорения доступа к файлу большого объема может использоваться индексный файл , содержащий ссылки на записи основного (относительного ) файла. рис. 19.2 изображен пример основного файла, содержащего упорядоченные по фамилиям анкетные данные людей. Индексный файл для данного основного файла содержит ссылки на первые логические записи анкет с заданной фамилией, например, Smith.


Рис. 19.2. Индексный файл и основной файл.

Директории

Директория (directory, folder) - узел, содержащий информацию о файлах – их имена и ссылки на файлы и на другие директории во внешней памяти. Таким образом, возможна организация иерархии директорий или их более сложных взаимосвязей, вплоть до произвольных графов. Как структура директорий, так и файлы хранятся на диске. С помощью директорий поддерживается именование файлов с помощью путей (paths) – многослоговых имен, состоящих из имени корневой директории (или логического диска) и последовательности имен директорий последующих уровней. Например, в системе Windows c:\doc\plan.txt путь доступа к файлу, задающий его расположение – на логическом диске C: ,в директории doc (документы), и имя файла plan.txt .Имя содержит расширение, указывающее на тип файла .

Резервное копирование (back-up) файлов и директорий выполняется на специальные предназначенные для этого носители – например, на ленту (стример ), flash-память , внешний переносной жесткий диск , компакт-диск (CD , DVD ). Настоятельно рекомендуется регулярно копировать на внешний носитель (или на несколько внешних носителей) наиболее важные директории.

Особенности системы файлов в "Эльбрусе"

Говоря о структуре директорий и именовании файлов, нельзя не упомянуть столь экзотическую систему файлов, как в МВК "Эльбрус". Это будет полезно читателям, чтобы сравнить и лучше оценить разнообразие подходов к системам файлов.

Основные концепции системы файлов МВК "Эльбрус" – это файлы , контейнеры , справочники . Понятие контейнера в "Эльбрусе" близко к современным понятиям тома и контейнера в системах Windows и Solaris: контейнер – это хранилище файлов на одном или нескольких дисках. Понятие справочника близко к понятию директории в традиционных файловых системах.

Файл в "Эльбрусе" состоит из заголовка и памяти. В заголовке хранятся атрибуты файла , число которых – порядка 100 (!).

Существенным отличием файловой системы "Эльбруса" является то, что возможно создание файла и управление им без присваивания ему имени , т.е. без отображения его в справочниках (директориях). Такой временный файл создается в программе, ссылка на файл хранится в глобальной или локальной переменной, и по окончании выполнения программы файл уничтожается, если на него не была сохранена ссылка в справочнике на диске. Кроме того, файлы могут ссылаться друг на друга (по прямой "физической" файловой ссылке, а не c помощью символьных путей) через справочники внешних ссылок (СВС) .СВС имеется у каждого файла. Его элементы адресуются по номерам, а не по именам. Типичный пример: файл объектного кода (ФОК) ссылается через свой СВС на файл дополнения к файлу объектного кода (ДФОК) ,содержащий в унифицированном виде таблицы именованных сущностей, определенных в программе и ее процедурах. Выражаясь современным языком, ДФОК содержит метаданные . Эта взаимосвязь используется при диагностике ошибок времени выполнения и для многих других целей.

К недостаткам файловой системы "Эльбруса" можно отнести усложненную структуру файлов, большое число атрибутов, зависимость логической структуры файла и набора операций над ним от типа внешнего устройства , на котором он расположен. По сравнению с системой файлов "Эльбруса", система файлов в UNIX гораздо проще и удобнее, но нисколько не уступает по функциональности.

Типичная организация файловой системы изображена на рис. 19.3.


Рис. 19.3. Организация файловой системы.

Файловые системы организуются на дисках . Каждый диск поделен на разделы (partitions) – смежные области дисковой памяти, имеющие свои логические имена (обычно в виде первых букв латинского алфавита). Однако возможна и организация раздела, занимающего несколько дисков. Для деления диска на разделы рекомендуем утилиту Partition Magic . В разделах хранятся директории и файлы. Каждый раздел имеет корневую директорию , у которой при необходимости могут быть организованы поддиректории , на которые она ссылается.

Следует иметь в виду, что в разных разделах могут быть установлены различные операционные системы, использующие разное форматирование и разные файловые системы для своей работы. Даже если на компьютере установлена только одна ОС, различные разделы могут использовать различные типы файловых систем, например, в Windows раздел A может использовать файловую систему FAT32 , а раздел B – файловую систему NTFS . В разделе C может быть инсталлирована ОС Linux, использующая свою собственную файловую систему Ext2Fs .


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-11

Большинству пользователей известно, что каждый файл имеет свое наименование, состоящее из самого имени и расширения. Между собой эти два элемента обычно бывают разделены точкой. Имя файла пользователь может выбрать самостоятельно. А вот с расширением все немного сложнее.


Дело в том, что оно привязано к типу файла. Изменять его не рекомендуется. Чаще всего человек работает с одним и тем же форматом файлов, который непосредственно связан с родом его деятельности. Так, например, профессиональные музыканты часто работают со звуковыми файлами. Но есть наиболее распространенные типы файлов, которые используют практически все пользователи в своей повседневной жизни.

К ним относятся:

1. Архивы.

Rar –группа файлов или один файл, который сжат с использованием технологии сжатия rar. Коэффициент сжатия более высокий, чем у формата zip. Аббревиатура rar расшифровывается следующим образом: roshal Archive от имени разработчика, Евгения Рошаля.

— zip – файл, сжатый при помощи технологии zip. Данный формат поддерживается большинством современных архиваторов. Пользователи Windows могут создавать такие архивы, используя программу WinZip.

2. Видео

— Avi — видео файлы с данными, закодированными при помощи различных кодеков. Формат использует меньшую степень сжатия, чем аналогичные форматы. Для воспроизведения avi файлов могут быть использованы различные медиа-плееры. Главное, чтобы программа поддерживала кодек, используемый при кодировании файла.

— mpeg1-2 (MPG) – формат для хранения звука и видео с потерей данных и компрессией.

— mpeg4 (MP4) – клип или видео, сжатый в формате MP4 обычно используется для передачи и обмена файлами в интернете. Также в данном формате могут использоваться различные технологии сжатия для видео и аудио дорожек.

— SWF – файлы с таким расширением создаются при помощи программы Macromedia Flash. Данный формат используется для хранения анимационных клипов и векторной графики. Файлы могут содержать звук. Для их просмотра нужен проигрыватель Flash Player и современный интернет-браузер. Файлы с расширением swf нельзя редактировать.

3. Графические файлы

— bmp – растровый графический формат. Это стандартный формат, используемый для графических файлов в ОС Windows. Сегодня практически все программы и приложения для редактирования изображений, могут читать и редактировать файлы в этом формате. Отличительной чертой формата является то, что изображение не подвергается сжатию.

— gif – Graphics Interchange Format – стандарт, разработанный фирмой CompuServe. Используется для хранения цветных растровых изображений. Формат был создан для использования в сети, поэтому файлы в этом формате имеют малый размер. Gif можно использовать для записи черно-белого изображения. Также можно использовать для сохранения анимации.

JPG — обычно используется для хранения растровых изображений. Формат JPEG отличается высокой степенью сжатия. Это позволяет значительно уменьшить размер файлов. Однако для данного формата характерна потеря качества. Сегодня JPEG считается одним из лучших форматов для хранения цветных изображений и фотографий. Его удобно использовать в Интернете и для рассылки по электронной почте.

— psd – графический формат, используемый при работе с программой Photo Shop.

— tif (tiff) – Тегированный формат, растровый графический формат. Данное расширение используется для сохранения изображений высокого качества. На сегодняшний день данный формат является стандартным для обмена данными. При использовании tif, можно сжимать изображение без потери информации. Tif широко используется пользователями цифровых фотоаппаратов.

4. Текстовые файлы

— doc – текстовый документ, созданный при помощи программы Microsoft Word. В нем может содержаться текст, таблицы, графики, диаграммы, параметры печати и форматирования.

— pdf – текстовый документ, используемый в программе Adobe Acrobat. Подходит для предоставления документов в фиксированной форме. Отображение документа не будет зависеть от типа устройства, но котором оно будет открыто. Это означает, что документ будет отображаться в таком виде, в каком он был создан.

— rtf – формат, используемый для хранения размеченных текстовых документов. Предложен компанией Microsoft. Документы в формате rtf сегодня поддерживается в большинстве текстовых редакторов. Также в наиболее распространенных редакторах реализована возможность импорта и экспорта в формат rtf. В связи с этим формат Rtf довольно часто используется для переноса текста из одной программы в другую. Встроенный в ОС Windows редактор текста WordPad сохраняет все документы в формате rtf по умолчанию.

— txt – стандартный текстовый формат. Позволяет сохранять неформатированный текст. Открыть документ в формате txt можно в любой программе для обработки текста.

5. Звуковые файлы

— midi – с помощью данного формата можно создавать схожие звуки на различных устройствах. Кроме того, этот формат позволяет организовать обмен данными между устройствами.

— mp3 – параметры сжатия, используемые формате MP3 аналогичны тем, которые используют в JPG изображениях. Используя данных формат можно добиться десятикратного сжатия, с соответственной потерей качества звука. Конечно, качество звука в этом формате является предметов споров, но для не профессиональных музыкантов этого вполне достаточно.

— wav – формат, разработанный компанией Microsoft. Используется в операционной системе Windows. При помощи данного формата можно достаточно точно передать звук. При этом формат не занимает много места на диске. Но для передачи в сети интернет формат Wav не подходит.

— wma – формат также разработан компанией windows. Используется для трансляции и хранения звуковых файлов.
Другие распространенные форматы

— exe – в данном формате хранятся приложения и программы. Запускается файл в формате exe при двойном клике мыши.

— html – Hyper Text Markup language – формат, используемый для создания интернет-страниц.

Файл (от англ. file - цепочка) - последовательный набор данных, который хранится на каком-либо физическом носителе. Чтобы пользователь мог найти то, что ему необходимо, файл имеет название. Чтобы компьютер «мог различать» файлы, они имеют расширение, жестко привязанное к формату. И если с названием файлов все понятно: мы сами назначаем название (например, фото с отпуска 2011), то форматы файлов - вещь более тонкая...

Итак, формат позволяет системе понять, к какому типу файл относится, и с помощью какой программы его можно открыть. К примеру, музыкальные файлы открываются с помощью музыкальных редакторов, текстовые документы - с помощью редакторов текстовых и так далее. На каждый формат файлов существует программа, с помощью которой этот файл можно открыть, и это вполне понятно, ведь файлы создавались каким-то образом, в какой-то программе, значит, как минимум, этой же программой файл можно открыть.

Тем не менее, не только компьютер должен различать файлы по форматам (расширениям), пользователь также может вынести много пользы из знаний о форматах - как минимум, вы сможете знать, о каком файле идет речь (музыкальном, видео, текстовом, об архиве), и примерно предполагать, какой именно программой файл можно открыть (хотя это знать в большинстве случаев необязательно - операционная система сама способна распознать формат файла по расширению, и подобрать нужную программу).

Итак, какие бывают форматы файлов?

Условно все многообразие форматов можно разделить на несколько групп: архивы, музыкальные файлы, видео, текстовые файлы. Остановимся на каждой категории более подробно.

Архивы предназначаются для пересылки и хранения данных в наиболее удобном компактном виде. Представлены, в основном, такими форматами, как ZIP и RAR, причем последний отличается большим коэффициентом сжатия, то есть, если вы заархивируете один из тот же файл, то в RAR-сжатии он будет весить меньше - а чем меньше архив, тем меньше потребуется места для его хранения, а для передачи понадобится меньше времени и меньшая пропускная способность канала передачи.

Видео файлы

Наиболее распространенным форматом видео файлов является формат AVI. Однако нужно заметить, что файлы этого формата могут кодироваться в различных кодеках, и чтобы плеер мог проиграть ролик, он должен поддерживать соответствующий кодек.

Для пересылки видео роликов в Интернете используют не менее распространенный формат MP4, который характеризуется раздельным сжатием видео и аудио дорожек - это может незначительно отражаться на качестве.

Аудио файлы

MP3 характеризуется высоким коэффициентом сжатия, при этом качество звука может теряться. Майкрософт предлагает свое решение - формат WAV, который не использует сжатия, благодаря чему качество звука остается на высоком уровне, но при этом файлы занимают много места на диске.

Графические файлы

Открываются графическими редакторами. Одним из наиболее популярных форматов является BMP - практически любые утилиты Windows способны читать и создавать файлы в этом формате.

Для обмена графическими данными в Сети используют, как правило, формат GIF .

JPG (JPEG) используют для растровых изображений. Этот формат называют аналогом MP3 (аудио файлы) и MP4 (видео файлы). Характеризуется высоким коэффициентом сжатия, но при этом нередко приводит к потере качества изображения.

Среди форматов текстовых файлов стоит отметить DOC (документ, создаваемый в Ворде), PDF (документ утилиты Adobe Acrobat), PTF (от Майкрософт), TXT (неформатированные тексты).

Выше представлены наиболее популярные сегодня форматы файлов, но список на этом не заканчивается - существует еще огромное количество разнообразных форматов, как для текстов и изображений, так и для аудио, видео роликов.