Phần mở rộng tệp văn bản: các loại và khía cạnh chính của việc xác định tư cách thành viên chương trình. Học các định dạng tệp văn bản

Kiểu dữ liệu được sử dụng phổ biến nhất trong thế giới máy tính và trên Internet - văn bản. Các video và đồ họa có nhiều màu sắc hơn và nhìn chung thà xem một lần còn hơn nghe hàng trăm lần. Chà, nghe cũng hay - trong trường hợp này có các định dạng dữ liệu âm thanh. Tuy nhiên, những chữ cái và con số khó coi và khiêm tốn lại thống trị màn hình máy tính. Bạn không thể đi bất cứ đâu mà không có chúng, thậm chí bạn không thể đặt tên cho một tập tin khác. Dữ liệu văn bản rất quan trọng và đa dạng - nó bao gồm sách, tài liệu và Mã chương trình. Và đối với mỗi mục đích đều có các tùy chọn định dạng riêng. Đây là những điều sẽ được thảo luận trong bài viết này. Đúng, cần phải báo trước ngay lập tức - trong đánh giá này Các định dạng sách điện tử sẽ không bị ảnh hưởng; chúng xứng đáng được thảo luận riêng. Ở đây chúng ta sẽ nói về các định dạng tài liệu.

Định dạng văn bản – TXT (Văn bản thuần túy)

Vì vậy - định dạng TXT đơn giản nhất có thể. Đây là văn bản ở dạng thuần túy và không phức tạp. Chỉ chứa nội dung của văn bản và dữ liệu dịch vụ tối thiểu tuyệt đối - các ký hiệu bắt đầu và kết thúc văn bản, trả về vận chuyển và những thứ tương tự.

Mặc dù có sự đơn giản gần như kiểu Spartan, nhưng định dạng này không phải là không có những biến thể và khác biệt. Thứ nhất, có một số khác biệt giữa các cửa sổ, Unix và Phiên bản MacOS trong đó chúng được sử dụng biểu tượng khác nhau kết thúc dòng. Sự khác biệt cũng có thể là do việc sử dụng các trang mã 8 bit (ASCII) hoặc 16 bit (UNICODE).

Tuy nhiên, bất chấp điều này, định dạng TXT cực kỳ linh hoạt, được các lập trình viên và quản trị viên hệ thống rất yêu thích.

Các định dạng tài liệu MS Office và tương tự – DOC, DOCX, RTF, ODT

Bất chấp tất cả tính linh hoạt và đơn giản của nó, TXT hoàn toàn không phù hợp để tạo tài liệu thực tế - văn bản dùng để in tuân theo các quy tắc và tiêu chuẩn thiết kế nhất định. Vì những tài liệu như vậy, ngoài bản thân văn bản, còn phải chứa nhiều thông tin về thiết kế và định dạng của văn bản. Và cả về định dạng và kích thước của tờ giấy nơi chúng nên được đặt.

Vì những mục đích này, khá nhiều định dạng của các gói văn phòng khác nhau đã được tạo ra. Các định dạng phổ biến nhất và thực sự gần với phổ quát có thể được coi là MS Word – doc và docx. Đầu tiên là một định dạng đóng đặc biệt được tạo bởi Microsoft cho trình soạn thảo văn bản của bạn (chính xác hơn là toàn bộ dòng định dạng - trong quá trình tồn tại, nó đã được cải thiện nhiều lần). Cùng với đó, vào buổi bình minh của sự phát triển của công ty, định dạng RTF (Rich Text Format) đã được tạo ra với sự cộng tác của Adobe Corporation. không giống cấu trúc DOCĐịnh dạng này có sẵn và được hầu hết các trình soạn thảo văn bản hiện có hỗ trợ thành công. Mặc dù nó có phần kém hơn DOC về phạm vi chức năng sẵn có.

Tính bí mật của sự phát triển của Microsoft đã dẫn tới việc tạo ra một cơ chế mở đồng phục công sở Mở văn phòng. Định dạng ODT (Định dạng văn bản OpenDocument) riêng của nó đã được phát triển. Định dạng này không được các biên tập viên thương mại hỗ trợ tốt, bao gồm cả MS Word và có thể mở có lỗi.

Cuối cùng, vào năm 2007, Microsoft quyết định từ bỏ việc đặt cược vào định dạng DOC và phát triển một nhóm định dạng văn phòng mở XML, bao gồm DOCX, đã trở thành định dạng chính cho các phiên bản mới của MS Word.

định dạng PDF

Từ chối hợp tác với Microsoft, Adobe đã đi theo con đường riêng của mình. Nó được phát triển bởi cô ấy định dạng PDFđó là một định dạng không dành nhiều cho việc phát triển tài liệu mà là để xem và in chúng. Không giống như nhóm trước, là văn bản được định dạng, hình thức của văn bản này tuy nhiên có thể thay đổi tùy thuộc vào loại máy cụ thể mà nó được hiển thị hoặc in trên đó, PDF là định dạng tài liệu về cơ bản không thay đổi và vẫn giữ nguyên hình thức cũng như bố cục trong mọi điều kiện. Nó cũng hỗ trợ một phạm vi khá rộng của cả yếu tố in ấn và Dịch vụ bổ sung(Ví dụ bảo vệ mật khẩu tài liệu từ chỉnh sửa hoặc in ấn, v.v.). Tất cả điều này làm cho PDF trở thành một định dạng phù hợp hơn để phân phối các tài liệu và thậm chí cả sách phức tạp và được thực thi chuyên nghiệp.

Phần mềm xử lý dữ liệu văn bản và đồ họa.

Một trong những chức năng phổ biến nhất của máy tính cá nhân hiện đại là chuẩn bị nhiều loại tài liệu văn bản.

Có hai nhóm chương trình chính để chuẩn bị tài liệu văn bản: soạn thảo văn bản và xử lý văn bản.

Trình soạn thảo văn bản Về cơ bản, đây là những chương trình tạo tệp văn bản mà không có thành phần định dạng (nghĩa là chúng không cho phép bạn làm nổi bật các phần của văn bản bằng các phông chữ và kiểu chữ khác nhau). Những biên tập viên kiểu này không thể thiếu khi tạo văn bản cho các chương trình máy tính.

Bộ xử lý từ ngữ biết cách định dạng văn bản, chèn đồ họa và các đối tượng khác vào tài liệu không liên quan đến khái niệm “văn bản” cổ điển. Cần lưu ý rằng sự phân chia này có điều kiện - sự đa dạng của các chương trình xử lý văn bản cho phép bạn tìm một trình soạn thảo với bất kỳ bộ chức năng nào.

Một số trình xử lý văn bản được gọi là trình soạn thảo WYSIWYG. Cái tên bắt nguồn từ những chữ cái đầu tiên của cụm từ What You See Is What You Get - những gì bạn thấy là những gì bạn nhận được. Khi họ nói rằng đây là trình soạn thảo WYSIWYG, họ đảm bảo tuân thủ đầy đủ hình thức của tài liệu trên màn hình máy tính và bản in của nó. Những loại trình soạn thảo này bao gồm Word và StarWriter.

Một số trình soạn thảo hiện đại hỗ trợ khái niệm WYSIWYG "gần như". Hình thức của tài liệu trên màn hình hơi khác so với hình thức của tài liệu được in nhưng điều này được thực hiện đặc biệt nhằm mục đích hiểu rõ hơn. sử dụng hiệu quả cửa sổ tài liệu làm việc. Ví dụ về các trình soạn thảo WYSIWYG "gần như" là Netscape Composer và KLyX.

Định dạng tập tin văn bản

Tệp văn bản- kiểu dữ liệu phổ biến nhất trong thế giới máy tính. Có một số vấn đề liên quan đến tập tin văn bản. Đầu tiên là cực kỳ một số lượng lớn ký tự cần thiết để hỗ trợ ngôn ngữ khác nhau. Các lập trình viên người Mỹ sử dụng bộ ký tự ASCII của Mỹ để làm việc với 128 ký tự. mã chuẩnđể trao đổi thông tin). Để hỗ trợ các ngôn ngữ khác, 256 ký tự thường không đủ, do đó việc chuyển đổi dần dần sang mã hóa Unicode, trong đó hai byte được phân bổ để lưu trữ một ký tự (nghĩa là có thể mã hóa 65.536 ký tự khác nhau).

Vấn đề thứ hai là mọi người muốn tài liệu in có chứa đồ thị, sơ đồ, ghi chú, tiêu đề và sử dụng nhiều phông chữ khác nhau. Các tài liệu được phân phối trên Internet (tài liệu trực tuyến) có thể chứa hình ảnh động, liên kết đến nhiều trang khác nhau. tài nguyên mạng và nhạc nền.

Nhiều tập tin văn bản được chuyển dưới dạng văn bản thô(văn bản thô). Văn bản đơn giản khó tạo ra sự hấp dẫn và dễ đọc vì nó không có các kiểu phông chữ, đồ họa, tiêu đề, tiêu đề phụ, v.v. khác nhau. Tính năng bổ sungđược gọi là đánh dấu văn bản.

Nói về đánh dấu văn bản, người ta phân biệt khái niệm đánh dấu vật lý và đánh dấu logic. Khi sử dụng đánh dấu văn bản vật lý, hình thức chính xác của từng đoạn sẽ được chỉ định. Ví dụ: "văn bản được căn giữa, 14 điểm, in đậm, kiểu chữ Times". Với đánh dấu logic, giá trị logic của một đoạn nhất định được chỉ định, ví dụ: “đây là tiêu đề của chương”. Hai phương pháp đánh dấu này thường được sử dụng trong các tình huống khác nhau. Để in văn bản trên máy in, bạn phải sử dụng đánh dấu vật lý. Các quyết định phải được đưa ra về kích thước ký quỹ và thụt lề đoạn văn. Phiên bản đầu bộ xử lý văn bản chỉ được sử dụng loại vật lýđánh dấu. Đồng thời, đối với mỗi đoạn, phông chữ, kích thước và kiểu dáng đã được chỉ định.

Khi trao đổi thông tin với người khác, hình thức vật lý của văn bản đặt ra một số hạn chế, đặc biệt đối với các tài liệu trực tuyến. Kích thước màn hình, độ phân giải, phông chữ khác nhau đối với hệ thống khác nhau. Vì những lý do này, định dạng văn bản logic ngày càng được sử dụng nhiều hơn. Trong một số trường hợp, thiết kế hợp lý là thực tế cần thiết: ​​khi tạo tài liệu điện tử chẳng hạn như các trang WWW hoặc khi tạo và xuất bản các tác phẩm lớn như sách.

Để lưu đánh dấu tài liệu khi truyền thông tin văn bản từ máy này sang máy khác, người ta sử dụng những cách khác. Bộ xử lý văn bản và hệ thống xuất bản sử dụng các định dạng tệp được thiết kế đặc biệt không chỉ chứa văn bản mà còn chứa thông tin về cách định dạng văn bản. Vấn đề chính ở đây là sự không tương thích của các định dạng như vậy, mặc dù hầu hết chương trình phức tạp thường có thể đọc các tập tin ở các định dạng chương trình cạnh tranh. Ví dụ về phương pháp này là bộ xử lý văn bản Word và StarWriter.

Theo một cách tiếp cận khác, những điều sau đây được chèn trực tiếp vào văn bản của tài liệu: đội đặc biệtđánh dấu. Ngay cả khi bạn không có phần mềm, hỗ trợ định dạng này, bạn vẫn có thể hiểu được nó. Có nhiều cách để thể hiện đánh dấu văn bản theo cách này, bao gồm:

siêu văn bản Ngôn ngữ đánh dấu(HTML) được sử dụng trong toàn thế giới Web;

TeX và LaTeX, phổ biến với nhiều ấn phẩm học thuật, cũng như các nhà toán học, vật lý, nhà hóa học và thậm chí cả nhạc sĩ.

Ví dụ về các chương trình cho phép bạn đánh dấu văn bản theo cách này là Netscape Composer và LyX (KLyX).

Tệp đã được tạo bởi các biên tập viên khác nhau, thường có các tiện ích mở rộng độc đáo cho phép bạn đoán cách đánh dấu văn bản mà không cần nhìn vào bên trong tài liệu. Do đó, các tệp được tạo bởi trình soạn thảo văn bản thuần túy thường có phần mở rộng là .txt và các tệp được chuẩn bị trong trình soạn thảo Lyx - .lyx. Xử lý văn bản Theo mặc định, Word tạo các tệp ở định dạng MS Word (phần mở rộng .doc), nhưng cũng hỗ trợ các định dạng khác, chẳng hạn như RTF (phần mở rộng .rtf). Tài liệu chứa lệnh đánh dấu ngôn ngữ HTML, có phần mở rộng là .html hoặc .htm.

Rõ ràng, không thể liệt kê hết tất cả các trình soạn thảo văn bản. Nhiều trong số chúng được “điều chỉnh” cho một hoặc một hoạt động cụ thể khác. Danh sách dưới đây chỉ chứa phần nhỏ các trình soạn thảo văn bản.

Trình soạn thảo văn bản thô

NotePad - được tích hợp sẵn trong hệ điều hành Windows, rõ ràng và dễ sử dụng;

McEdit - tương tự như trình soạn thảo Edit của MS DOS, một thành phần quản lý tập tin mc ( Chỉ huy nửa đêm) Hệ điều hành Linux;

KEdit là một trình soạn thảo văn bản đơn giản, có trong KDE Linux;

KWrite là một trình soạn thảo văn bản có một số cài đặt thêm so với các trình soạn thảo văn bản đơn giản khác;

Emacs - kết hợp các chức năng của trình quản lý tệp và trình soạn thảo văn bản; một trong tính năng đặc biệt là khả năng tạo lệnh macro (macro); có sẵn trong tất cả các bản sao Unix, bao gồm cả Linux; Emacs cũng có thể được sử dụng trên MS Windows.

Trình soạn thảo tạo văn bản có các thành phần đánh dấu

Word – dùng để tạo ra nhiều loại tài liệu in ấn, là một thành phần Ứng dụng văn phòng trong MS Windows;

StarWriter - một phần của chương trình StarOffice, vẻ bề ngoài và chức năng của nó tương tự như Word, hoạt động tốt như nhau trên cả hệ điều hành MS Windows và Linux;

LyX (KLyX trong KDE) là một trình soạn thảo văn bản hiện đại được thiết kế dành cho những người muốn có một tài liệu trông chuyên nghiệp trong khoảng thời gian tối thiểu; trình soạn thảo chèn các lệnh đánh dấu TeX và LaTeX vào văn bản;

Netscape Composer - chèn các lệnh đánh dấu HTML vào văn bản; có phiên bản cho cả Linux và MS Windows.

Khi xử lý thông tin liên quan đến hình ảnh trên màn hình, người ta thường phân biệt ba lĩnh vực chính: nhận dạng mẫu, xử lý hình ảnh và đồ họa máy tính.

Nhiệm vụ chính của nhận dạng hình ảnh cơ bản là chuyển đổi một hình ảnh hiện có thành một hình thức ngôn ngữ rõ ràng nhân vật. Hệ thống nhận dạng mẫu hoặc thị giác kỹ thuật (TẦM NHÌN MÁY TÍNH) là một tập hợp các phương pháp cho phép bạn lấy mô tả về hình ảnh được cung cấp làm đầu vào hoặc để gán hình ảnh được chỉ địnhđến một số lớp (ví dụ, việc này được thực hiện khi sắp xếp thư). Một trong những nhiệm vụ của TẦM NHÌN MÁY TÍNH là cái gọi là khung hóa các đối tượng, trong đó cơ sở nhất định của đối tượng, “bộ xương” của nó được khôi phục.

Đang xử lý hình ảnh(XỬ LÝ HÌNH ẢNH) xem xét các tác vụ trong đó cả dữ liệu đầu vào và đầu ra đều là hình ảnh. Ví dụ: truyền hình ảnh có chức năng khử nhiễu và nén dữ liệu, chuyển từ loại hình này sang loại hình khác (từ màu sang đen trắng), v.v. Như vậy, xử lý ảnh đề cập đến các hoạt động trên ảnh (chuyển đổi ảnh). Nhiệm vụ xử lý hình ảnh có thể là cải tiến tùy thuộc vào một tiêu chí nhất định (khôi phục, phục hồi) hoặc chuyển đổi đặc biệt làm thay đổi hoàn toàn hình ảnh.

Trong xử lý ảnh có các nhóm sau nhiệm vụ:

Hãy giới hạn bản thân chỉ làm việc với hình ảnh kỹ thuật số. Chuyển đổi số Theo mục đích chuyển đổi, nó có thể được chia thành hai loại:

Phục hồi hình ảnh - bù lại sự biến dạng hiện có (ví dụ: điều kiện chụp ảnh kém);

Nâng cao hình ảnh là sự biến dạng của hình ảnh để cải thiện nhận thức thị giác hoặc chuyển đổi nó thành dạng phù hợp để xử lý tiếp.

Đồ họa máy tính (máy)(ĐỒ HỌA MÁY TÍNH) tái tạo hình ảnh khi thông tin nguồn không có tính chất đồ họa. Ví dụ: trực quan hóa dữ liệu thử nghiệm dưới dạng biểu đồ, biểu đồ hoặc sơ đồ, hiển thị thông tin trên màn hình trò chơi máy tính, tổng hợp cảnh trên mô phỏng.

Đồ họa máy tính hiện đã nổi lên như một môn khoa học về phần cứng và phần mềm cho nhiều loại hình ảnh từ những bức vẽ đơn giản đến hình ảnh thực tế của các vật thể tự nhiên. Đồ họa máy tính được sử dụng trong hầu hết các ngành khoa học và kỹ thuật để mang lại sự rõ ràng, nhận thức và truyền tải thông tin. Dùng trong y học, kinh doanh quảng cáo, công nghiệp giải trí,… Không có đô họa may tinh không một cái nào là đủ chương trình hiện đại. Làm việc về đồ họa chiếm tới 90% thời gian làm việc của các nhóm lập trình sản xuất các chương trình sử dụng đại trà.

Sản phẩm cuối cùng của đồ họa máy tính là hình ảnh. Hình ảnh này có thể được sử dụng trong nhiều lĩnh vực khác nhau Ví dụ: nó có thể là bản vẽ kỹ thuật, hình minh họa một bộ phận trong sách hướng dẫn, sơ đồ đơn giản, hình ảnh kiến ​​trúc của cấu trúc hoặc thông số thiết kế được đề xuất, hình minh họa quảng cáo hoặc ảnh tĩnh từ phim hoạt hình.

Đồ họa máy tính là một ngành khoa học có chủ đề nghiên cứu là tạo, lưu trữ và xử lý các mô hình và hình ảnh của chúng bằng máy tính, tức là. Đây là một nhánh của khoa học máy tính giải quyết các vấn đề thu được nhiều hình ảnh khác nhau (hình vẽ, hình vẽ, hoạt ảnh) trên máy tính.

Các tác vụ sau đây được xem xét trong đồ họa máy tính:

Biểu diễn hình ảnh trong đồ họa máy tính;

Chuẩn bị hình ảnh để trực quan hóa;

Tạo một hình ảnh;

Thực hiện các hành động với hình ảnh.

Đồ họa máy tính thường đề cập đến việc tự động hóa các quá trình chuẩn bị, chuyển đổi, lưu trữ và tái tạo thông tin đồ họa bằng máy tính. Dưới thông tin đồ họa mô hình của các đối tượng và hình ảnh của chúng được hiểu.

Nếu người dùng có thể kiểm soát các đặc điểm của đối tượng thì họ sẽ nói về đồ họa máy tính tương tác, tức là. khả năng hệ thống máy tính tạo đồ họa và tiến hành đối thoại với một người. Ngày nay, hầu hết mọi chương trình đều có thể được coi là một hệ thống đồ họa máy tính tương tác.

Đồ họa máy tính tương tác- đây cũng là việc sử dụng máy tính để chuẩn bị và tái tạo hình ảnh, nhưng đồng thời người dùng có khả năng nhanh chóng thực hiện các thay đổi đối với hình ảnh trực tiếp trong quá trình tái tạo hình ảnh, tức là. Nó giả định khả năng làm việc với đồ họa ở chế độ hội thoại trong thời gian thực.

Đồ họa tương tácđại diện cho một nhánh quan trọng của đồ họa máy tính, nơi người dùng có khả năng kiểm soát linh hoạt nội dung của hình ảnh, hình dạng, kích thước và màu sắc của nó trên bề mặt hiển thị bằng các thiết bị điều khiển tương tác.

Về mặt lịch sử, các hệ thống tương tác đầu tiên được coi là hệ thống máy tính hỗ trợ thiết kế(CAD), xuất hiện vào những năm 60. Chúng đại diện cho một bước quan trọng trong sự phát triển của máy tính và phần mềm. Trong hệ thống đồ họa máy tính tương tác, người dùng cảm nhận được một hình ảnh trên màn hình đại diện cho một số đối tượng phức tạp và có thể thay đổi mô tả (mô hình) của đối tượng. Những thay đổi như vậy có thể là việc nhập và chỉnh sửa các thành phần riêng lẻ hoặc nhiệm vụ Giá trị kiểu sốđối với bất kỳ tham số nào, cũng như các thao tác khác để nhập thông tin dựa trên cảm nhận hình ảnh.

Đồ họa raster, thông tin chung

Hình ảnh raster của máy tính được biểu diễn dưới dạng ma trận hình chữ nhật, mỗi ô được biểu thị bằng một chấm màu.

Cơ sở của việc biểu diễn đồ họa raster là điểm ảnh(dấu chấm) biểu thị màu sắc của nó. Ví dụ, khi mô tả một hình elip màu đỏ trên nền trắng, cần chỉ ra màu sắc của từng điểm của hình elip và nền. Hình ảnh được trình bày dưới dạng một số lượng lớn các dấu chấm - càng có nhiều dấu chấm thì hình ảnh càng đẹp và kích thước lớn hơn tài liệu. Những thứ kia. một và thậm chí một bức tranh có thể được trình bày đẹp nhất hoặc chất lượng tệ nhất theo số chấm trên một đơn vị chiều dài - độ phân giải (thường là số chấm trên inch - dpi hoặc pixel trên inch - ppi).

Hình ảnh raster giống như một tờ giấy ca rô, trên đó bất kỳ ô nào được sơn màu đen hoặc trắng, cùng nhau tạo thành một hoa văn. Pixel là thành phần chính của hình ảnh raster. Chính những yếu tố này tạo nên một hình ảnh raster, tức là. Đồ họa raster mô tả hình ảnh bằng cách sử dụng các chấm màu (pixel) được sắp xếp trên lưới.

Khi chỉnh sửa đồ họa raster, bạn đang chỉnh sửa pixel chứ không phải dòng. Đồ họa raster phụ thuộc vào độ phân giải vì thông tin mô tả hình ảnh được gắn vào một lưới có kích thước cụ thể. Khi chỉnh sửa đồ họa raster, chất lượng trình bày của nó có thể thay đổi. Đặc biệt, việc thay đổi kích thước đồ họa raster có thể khiến các cạnh của hình ảnh bị sờn do các pixel được phân phối lại trên lưới. Xuất đồ họa raster sang các thiết bị có độ phân giải thấp hơn độ phân giải của chính hình ảnh sẽ làm giảm chất lượng của nó.

Ngoài ra, chất lượng còn được đặc trưng bởi số lượng màu sắc và sắc thái mà mỗi điểm trong ảnh có thể đảm nhận. Làm sao một lượng lớn các sắc thái được đặc trưng bởi hình ảnh thì số chữ số cần thiết để mô tả chúng càng lớn. Màu đỏ có thể là màu số 001 hoặc có thể là màu số 00000001. Như vậy, chất lượng hình ảnh càng cao thì kích thước tệp càng lớn.

Biểu diễn raster thường được sử dụng cho các loại hình ảnh có nhiều chi tiết hoặc bóng. Thật không may, việc chia tỷ lệ những hình ảnh như vậy theo bất kỳ hướng nào thường làm giảm chất lượng. Khi số lượng điểm giảm, các chi tiết nhỏ sẽ bị mất và dòng chữ bị biến dạng (mặc dù điều này có thể không đáng chú ý nếu kích thước hình ảnh của hình ảnh bị giảm - tức là độ phân giải được duy trì). Việc thêm pixel sẽ làm giảm độ sắc nét và độ sáng của hình ảnh, bởi vì các điểm mới phải có sắc thái trung bình giữa hai hoặc nhiều màu liền kề.

Sử dụng đồ họa raster, bạn có thể phản ánh và truyền tải toàn bộ gam màu và hiệu ứng tinh tế vốn có trong hình ảnh thực. Hình ảnh raster gần giống với một bức ảnh hơn, nó cho phép bạn tái tạo chính xác hơn các đặc điểm chính của bức ảnh: độ sáng, độ trong suốt và độ sâu trường ảnh.

Thông thường, hình ảnh raster thu được bằng cách quét ảnh và các hình ảnh khác, sử dụng máy ảnh kỹ thuật số hoặc bằng cách “chụp” một khung hình từ video. Hình ảnh raster cũng có thể được lấy trực tiếp trong raster hoặc đồ họa vector bằng cách chuyển đổi hình ảnh vector.

Các định dạng phổ biến là .tif, .gif, .jpg, .png, .bmp, .pcx, v.v.

Đồ họa vector, thông tin chung

Đồ họa vector mô tả hình ảnh bằng cách sử dụng các đường thẳng và đường cong gọi là vectơ, cũng như các thông số mô tả màu sắc và bố cục. Ví dụ: hình ảnh của một chiếc lá cây (xem Hình 1.) được mô tả bằng các điểm mà một đường thẳng đi qua, từ đó tạo ra đường viền của chiếc lá. Màu của lá được xác định bởi màu của đường viền và vùng bên trong đường viền đó.

Không giống như đồ họa raster, trong đồ họa vector, hình ảnh được xây dựng bằng cách sử dụng các mô tả toán học về các đối tượng, hình tròn và đường thẳng. Mặc dù thoạt nhìn điều này có vẻ phức tạp hơn so với việc sử dụng mảng raster, nhưng đối với một số loại hình ảnh sử dụng mô tả toán học là cách đơn giản hơn.

Điểm then chốtĐồ họa vector là nó sử dụng kết hợp các lệnh máy tính và các công thức toán học cho một đối tượng. Điều này cho phép thiết bị máy tính tính toán và đặt các điểm thực vào đúng vị trí khi vẽ các đồ vật này. Tính năng này của đồ họa vector mang lại cho nó một số lợi thế so với đồ họa raster, nhưng đồng thời cũng là nguyên nhân dẫn đến những nhược điểm của nó.

Đồ họa vector thường được gọi là đồ họa hướng đối tượng hoặc vẽ đồ họa. Các đối tượng đơn giản như hình tròn, đường thẳng, hình cầu, hình khối và những thứ tương tự được gọi là nguyên thủy và được sử dụng để tạo ra nhiều thứ hơn. vật thể phức tạp. Trong đồ họa vector, các đối tượng được tạo bằng cách kết hợp các đối tượng khác nhau.

Để tạo bản vẽ vector bạn phải sử dụng một trong nhiều gói minh họa. Ưu điểm của đồ họa vector là mô tả đơn giản và chiếm ít bộ nhớ máy tính. Tuy nhiên, nhược điểm là đối tượng vectơ chi tiết có thể quá phức tạp, có thể không in như người dùng mong đợi hoặc hoàn toàn không in được nếu máy in không diễn giải hoặc hiểu chính xác các lệnh vectơ.

Khi chỉnh sửa các phần tử đồ họa vector, các tham số đường thẳng và đường cong mô tả hình dạng của các phần tử này sẽ thay đổi. Bạn có thể di chuyển các phần tử, thay đổi kích thước, hình dạng và màu sắc của chúng nhưng điều này sẽ không ảnh hưởng đến chất lượng của chúng đại diện trực quan. Đồ họa vector độc lập với độ phân giải, tức là có thể được hiển thị trên nhiều thiết bị đầu ra với độ phân giải khác nhau mà không làm giảm chất lượng.

Biểu diễn vectơ bao gồm việc mô tả các phần tử hình ảnh bằng các đường cong toán học, biểu thị màu sắc và vị trí chiếm chỗ của chúng.

Một ưu điểm khác là mở rộng quy mô chất lượng cao theo bất kỳ hướng nào. Việc tăng hoặc giảm đối tượng được thực hiện bằng cách tăng hoặc giảm các hệ số tương ứng trong công thức toán học. Không may thay, định dạng vectơ trở nên bất lợi khi truyền hình ảnh có nhiều sắc thái hoặc chi tiết nhỏ (ví dụ: ảnh chụp). Xét cho cùng, mọi điểm nổi bật nhỏ nhất trong trường hợp này sẽ không xuất hiện dưới dạng tập hợp các chấm đơn màu mà là một tổ hợp công thức toán học hoặc nói chung đồ họa nguyên thủy, mỗi cái là một công thức. Điều này làm cho tập tin nặng hơn. Ngoài ra, việc chuyển đổi hình ảnh từ định dạng raster sang định dạng vector (ví dụ: sử dụng Adobe Streme Line hoặc Corel OCR-TRACE) sẽ dẫn đến việc sau này không có khả năng mở rộng quy mô một cách chính xác. Khi kích thước tuyến tính tăng lên, số lượng chi tiết hoặc sắc thái trên một đơn vị diện tích không tăng. Giới hạn này được áp đặt bởi độ phân giải của thiết bị đầu vào (máy quét, máy ảnh kỹ thuật số, v.v.).

Các yếu tố (đối tượng) của đồ họa vector. Đối tượng và thuộc tính của chúng

Chủ yếu phần tử logicđồ họa vector là một đối tượng hình học. Các đối tượng được chấp nhận là các hình dạng hình học đơn giản (còn gọi là hình nguyên thủy - hình chữ nhật, hình tròn, hình elip, đường thẳng), hình dạng tổng hợp hoặc hình dạng được xây dựng từ hình nguyên thủy, màu tô, bao gồm cả độ dốc.

Một đối tượng quan trọng trong đồ họa vector là đường spline. Spline là một đường cong mà qua đó cái này hay cái kia được mô tả hình hình học. Được xây dựng trên splines phông chữ hiện đại TryType và PostScript.

Các đối tượng đồ họa vector dễ dàng được chuyển đổi và sửa đổi, điều này hầu như không ảnh hưởng đến chất lượng hình ảnh. Tỷ lệ, xoay, độ cong có thể giảm xuống còn vài ba các phép biến đổi cơ bản trên các vectơ.

Nếu ở đồ họa raster yếu tố cơ bản Một hình ảnh là một điểm, nhưng trong đồ họa vector nó là một đường thẳng. Một đường được mô tả về mặt toán học như một đối tượng duy nhất và do đó lượng dữ liệu để hiển thị một đối tượng bằng đồ họa vector ít hơn đáng kể so với đồ họa raster.

Đường thẳng là một đối tượng cơ bản của đồ họa vector. Giống như bất kỳ đối tượng nào, một đường có các đặc tính: hình dạng (thẳng, đường cong), độ dày, màu sắc, kiểu dáng (rắn, chấm). Các đường khép kín có được đặc tính lấp đầy. Không gian mà chúng bao phủ có thể được lấp đầy bằng các đối tượng khác (kết cấu, bản đồ) hoặc một màu đã chọn. Đường mở đơn giản nhất được giới hạn bởi hai điểm gọi là nút. Các nút cũng có các thuộc tính mà các tham số của chúng ảnh hưởng đến hình dạng của phần cuối của đường dây và bản chất kết nối của nó với các đối tượng khác. Tất cả các đối tượng đồ họa vector khác đều được tạo thành từ các đường thẳng. Ví dụ, một khối lập phương có thể bao gồm sáu hình chữ nhật được kết nối, mỗi hình chữ nhật lần lượt được tạo thành bởi bốn đường nối.

Hầu như ngày nào chúng ta cũng bắt gặp các tệp văn bản (tài liệu). Tuy nhiên, trong vấn đề nàyĐừng nhầm lẫn giữa phần mở rộng tệp văn bản và định dạng dữ liệu văn bản, chúng là những thứ khác nhau. Chúng ta hãy thử xác định loại tệp này là gì và chúng trông như thế nào.

Phần mở rộng của tệp văn bản: nó là gì?

Hãy bắt đầu với thực tế là, theo quy luật, hầu hết các tệp thuộc loại này đều có phần mở rộng là ba chữ cái sau dấu phân cách (dấu chấm). Loại đơn giản và phổ biến nhất là các tệp có phần mở rộng .txt, được mở trong cùng một Hệ thống Windows sử dụng Notepad tiêu chuẩn.

Tuy nhiên, bất chấp các quy tắc được chấp nhận chung, phần mở rộng tệp cho tài liệu văn bản không thể chứa ba ký tự mà nhiều hơn (số lượng của chúng có thể lên tới mười hai, nhưng không nhiều hơn), ví dụ: tệp sách điện tử.djvu. Ngoài ra, phần mở rộng có thể chứa số.

Việc xem xét việc phân loại một tệp văn bản (tài liệu) mang lại cho chúng ta điều gì về mặt nhận dạng chúng? Và thực tế là chỉ cần nhìn thoáng qua là bạn có thể quyết định ngay lập tức Câu hỏi quan trọng: bất kỳ tệp văn bản có phần mở rộng nào, thì chương trình được liên kết với chúng để mở hoặc chỉnh sửa cũng vậy. Trong nhiều trường hợp, hầu như luôn có thể xác định được ứng dụng gốc mà tệp đó được tạo.


Tuy nhiên, chúng ta không nên quên rằng ngày nay bạn có thể tìm thấy khá nhiều con số lớn các tệp có cùng phần mở rộng nhưng được tạo trong các ứng dụng khác hoặc trùng khớp các chương trình khác nhau. Có vẻ như một tệp thông thường có phần mở rộng .doc (.docx) ban đầu tương ứng với trình soạn thảo văn bản Phần mềm soạn thảo văn bản. Nhưng bạn có thể mở hoặc lưu nó ở dạng này theo cách khác, ngay cả trên máy tính Apple. Có thể nói, điều này cũng bao gồm một loại hỗn hợp - các tệp ở định dạng .pdf, không chỉ chứa văn bản mà còn cả đồ họa. Nhưng cũng Tài liệu Word có thể chứa hình ảnh được chèn vào.

Đây chính xác là dấu hiệu cho thấy phần mở rộng của tệp văn bản cho biết tính phổ biến của chính định dạng đó, đây là định dạng “dễ đọc” nhất bất kể hệ điều hành. Điều tương tự cũng xảy ra với bất kỳ loại nào.

Các loại phần mở rộng tệp: văn bản

Nói chung, ngày nay người ta biết đến một con số khổng lồ như vậy định dạng văn bản và các phần mở rộng của chúng, mà có lẽ hầu như không có chuyên gia nào đảm nhận việc đếm đầy đủ số lượng của chúng.


Có, tất nhiên, tính phổ biến của những tài liệu như vậy là không thể nghi ngờ, đặc biệt nếu chúng sử dụng tài liệu đơn giản nhất. Nhưng đôi khi vấn đề có thể là không phải mọi mã hóa đều được hỗ trợ một hệ thống nhất định hoặc chương trình. Đó là lý do tại sao một tập hợp các ký hiệu xuất hiện trên màn hình thay vì các chữ cái thông thường.

Còn về các loại file văn bản thì không thể liệt kê hết được. Phổ biến nhất là các loại sau: .txt, .doc, .tex, .text, .pdf, .log, .apt, .ttf, .err, .sub, .djvu, .odt, .rtf và nhiều loại khác. Danh sách này có thể được tiếp tục vô thời hạn.

Điều thú vị nhất là nhiều tệp loại này có các vai trò khác nhau trong hệ thống. Ví dụ, ngoại trừ tập tin thông thường phụ đề.sub, văn bản thông thường document.txt có thể chịu trách nhiệm xem chúng khi mở video và về mặt này, nhiều định dạng có thể thay thế cho nhau.


Lưu ý, thậm chí Các tập tin thực thi có thể có văn bản làm nội dung. Ví dụ đơn giản nhất- một tệp .bat được tạo trong Notepad thông thường và chứa văn bản dưới dạng một tập hợp lệnh. Khi khởi chạy, các lệnh sẽ được thực thi và menu “Mở bằng…” được sử dụng để chỉnh sửa, trừ khi ban đầu có một hành động khác được liên kết với quy trình này.


Tình huống tương tự cũng xảy ra với các tài liệu sử dụng ngôn ngữ đánh dấu hoặc lập trình, chẳng hạn như tệp .html, .htm, .xml, v.v. Ngay cả các trang web ban đầu cũng có thể được mở trong nhiều trình chỉnh sửa dưới dạng tệp văn bản chứa các phần tử của bên thứ ba.

Thay đổi phần mở rộng của tệp văn bản

Về việc thay đổi đuôi mở rộng, đôi khi có thể thay đổi được, chẳng hạn .txt thành .doc và ngược lại. Trình soạn thảo văn bản sẽ mở bất kỳ loại nào. Điều tương tự cũng áp dụng cho cặp .txt - .bat khi mở trong Notepad. Nhưng trong các trường hợp khác, tốt hơn là không nên thực hiện các thao tác như vậy, đơn giản là nó sẽ không dẫn đến kết quả gì và một ứng dụng khác sẽ không thể mở tệp đã đổi tên. Việc thay đổi định dạng sẽ phải được thực hiện bằng các chương trình chuyển đổi đặc biệt.

Thay vì lời bạt

Như đã rõ, phần mở rộng của tệp văn bản có thể có nhiều biến thể, tùy thuộc vào chương trình tạo tài liệu. Tuy nhiên, như trong các trường hợp khác, bằng chính tiện ích mở rộng, hầu như luôn có thể xác định được ứng dụng được liên kết ban đầu với nó; trong trường hợp nghiêm trọng, hãy mở nó bằng bất kỳ chương trình nào khác hỗ trợ làm việc với loại dữ liệu này, ngay cả khi ứng dụng gốc không có trên máy tính. Và như có lẽ đã rõ, trên thực tế, các tệp văn bản là loại phổ biến và phổ biến nhất trong thế giới máy tính, bất kể tệp được sử dụng là gì. gói phần mềm và hệ điều hành.

Ngày xửa ngày xưa, dữ liệu văn bản chỉ được đặt trong một loại vùng chứa - TXT. Không có người khác. Bây giờ số lượng của họ có thể đã lên tới năm mươi. Chúng tôi sử dụng một số trong số chúng mọi lúc, nhưng chúng tôi hiếm khi gặp những cái khác. Chúng tôi thậm chí không nghi ngờ sự tồn tại của cái thứ ba. Hãy xem xét các kho lưu trữ dữ liệu văn bản phổ biến nhất từ ​​quan điểm thuận tiện trong sử dụng.
<<>>

TXT ("văn bản đơn giản")

Người sáng lập ra “thể loại”. Tích cực sử dụng cho đến ngày nay. Vì văn bản được lưu trữ dưới dạng một chuỗi ký tự nên kích thước tệp tính bằng byte bằng số ký tự cộng với các ký tự không in được (dấu cách, tab, cuối đoạn văn và các ký tự khác - chúng còn được gọi là dấu định dạng). Điều này dẫn đến kích thước tập tin nhỏ. Tuy nhiên, khả năng định dạng các tài liệu như vậy rất hạn chế. Về cơ bản nó chỉ là văn bản. Dữ liệu văn bản không chỉ có thể được lưu trữ trong các thùng chứa có phần mở rộng TXT. Về cơ bản, những phần mở rộng này là tùy chọn. Đổi tên TXT thành DOC, không có gì thay đổi. Cấu trúc bên trong sẽ vẫn giữ nguyên. Tương tự như vậy, việc thay đổi Phần mở rộng DOC trên TXT, bạn sẽ nhận được cùng một tệp “Word”. Tại sao lại cần ba chữ cái này sau dấu chấm? Để giải thích chính xác bởi các chương trình mở chúng theo mặc định.

RTF (“Định dạng văn bản có định dạng”)

Một định dạng đa nền tảng miễn phí để lưu trữ các tài liệu văn bản được đánh dấu, được Microsoft tạo ra vào năm 1987. Ngày nay nó phổ biến nên hầu hết các trình soạn thảo văn bản hiện đại đều hỗ trợ nó. Bằng cách tạo RTF trên Nền tảng Windows, nó sẽ hoàn toàn có thể đọc và chỉnh sửa được trên các nền tảng khác (Apple, Linux và các nền tảng khác). Tiêu chuẩn thực tế trong in ấn. Tuy nhiên, không phải tất cả các chương trình đều tạo ra nó một cách chính xác như nhau. Người ta nhận thấy rằng trong một tài liệu được tạo trong OpenOffice, định dạng đôi khi biến mất và một số văn bản biến thành các ký tự không thể đọc được.

RTF cho phép bạn tạo và lưu định dạng khá phức tạp, chèn chú thích cuối trang, tiêu đề, số liệu, bảng và công thức, mặc dù về mặt này nó vẫn kém hơn định dạng DOC. Nó cũng thua kém DOC về kích thước tệp: các tài liệu phức tạp được lưu trữ gọn gàng hơn trong tệp DOC (các tài liệu đơn giản thì ngược lại). Tuy nhiên, RTF thắng trong cuộc tranh luận với DOC về vấn đề bảo mật vì nó không sử dụng macro. Vì vậy, bị nhiễm macrovirus Tập tin Word có thể được “chữa khỏi” bằng cách lưu ở định dạng RTF. Ngoài ra, định dạng RTF có khả năng chống hỏng tập tin. Nếu bạn thay đổi dù chỉ một byte trong tệp DOC, nó sẽ không mở được trong Word nữa. Và việc làm hỏng tệp ở định dạng RTF chỉ có thể dẫn đến mất một đoạn văn bản bị hỏng.

DOC (từ tiếng Anh “tài liệu”)

Lúc đầu, tiện ích mở rộng này được sử dụng để biểu thị các tệp văn bản đơn giản không có định dạng, nhưng vào đầu những năm 90, Microsoft đã thực sự “tư nhân hóa” nó. Vì vậy, hiện nay DOC chỉ được liên kết với các sản phẩm của công ty này. Định dạng này cung cấp những khả năng tuyệt vời cho việc định dạng văn bản (bao gồm cả tập lệnh và macro). Do đó, khả năng tương thích với các trình soạn thảo văn bản đã kém đi. nhà phát triển bên thứ ba. Định dạng tệp này chứa một lượng lớn thông tin về phông chữ, kiểu ký tự, thụt lề đoạn văn và khoảng cách, ngay cả khi bạn không cần tất cả những thứ này. Chính vì điều này thông tin thêm tệp chỉ có văn bản lớn hơn tệp RTF. Tuy nhiên, khi bạn đưa nhiều đồ họa và hình ảnh khác nhau vào tài liệu, DOC sẽ có lợi về kích thước và mang lại khả năng tương thích cao hơn. Không giống như TXT và RTF, DOC là định dạng nhị phân, khiến nó không thể đọc được một cách đơn giản. soạn thảo văn bản. Ví dụ: Notepad có thể xem một số tệp RTF. Phổ biến cùng với RTF.

DOCX

Với sự ra đời của Office 2007, Microsoft đã chuyển sang các định dạng mới dựa trên Office Open XML (được phân biệt trực quan bằng cách thêm chữ “x” ở cuối phần mở rộng). Định dạng này là một kho lưu trữ zip chứa văn bản XML, đồ họa và dữ liệu khác. Để giảm kích thước tệp, nén Zip được sử dụng. Tài liệu chỉ tương thích ngược với Office 2000/XP/2003 nếu được cài đặt Microsoft Office Gói tương thích (bạn có thể tìm và tải xuống từ trang web chính thức của Microsoft, kích thước tệp 27,8 MB). Nếu bạn cần chuyển đổi gấp DOCX sang định dạng khác, hãy sử dụng các dịch vụ của trang http://docx-converter.com/. Nếu bạn dùng phiên bản mới nhất Office và có kế hoạch chuyển tập tin cho ai đó, lưu tài liệu ở định dạng RTF hoặc DOC.

ODT/ODF (" Mở tài liệuĐịnh dạng")

ODF - tên chung định dạng mở tài liệu cho các ứng dụng văn phòng (văn bản, bảng biểu, hình ảnh, cơ sở dữ liệu, bản trình bày). Dữ liệu văn bản được lưu trữ trong các tệp có phần mở rộng ODT. Tiêu chuẩn này được phát triển bởi cộng đồng công nghiệp OASIS và dựa trên định dạng XML. Ngày 1 tháng 5 năm 2006 được thông qua là tiêu chuẩn quốc tế ISO/IEC 26300. ODF có sẵn cho tất cả mọi người và có thể được sử dụng mà không bị hạn chế. đại loại thế thay thế miễn phí các định dạng độc quyền của Microsoft. Để đọc và ghi định dạng ODF Sản phẩm của Microsoft, Plugin Sun ODF đã được phát hành cho Microsoft Văn phòng. Hỗ trợ ODF trong Microsoft Office 2007 sẽ được giới thiệu cùng với việc phát hành Gói Dịch vụ 2. Thật không may, nó vẫn kém phổ biến hơn so với RTF và DOC.

HTML

(từ Ngôn ngữ đánh dấu siêu văn bản tiếng Anh - “ngôn ngữ đánh dấu siêu văn bản”)

Ngôn ngữ đánh dấu tiêu chuẩn cho các tài liệu trên Internet (phần mở rộng .htm/html). Các trang web được tạo bằng ngôn ngữ HTML (hoặc XHTML). HTML được phát triển bởi nhà khoa học người Anh Tim Berners-Lee vào năm 1991 như một ngôn ngữ trao đổi khoa học và tài liệu kỹ thuật, thích hợp sử dụng cho những người không phải là chuyên gia trong lĩnh vực bố trí. Nhắn tin với đánh dấu HTML lẽ ra phải được sao chép mà không làm biến dạng cấu trúc và phong cách trên nhiều thiết bị khác nhau. Tuy nhiên, sau này sự ra đời tích cực của đa phương tiện và thiết kế đồ họa phá hỏng những kế hoạch này. Để xem tài liệu HTML bạn không cần các trình soạn thảo đặc biệt, chỉ cần phương tiện chuẩn, được tích hợp trong hệ điều hành. Nó vượt trội hơn bất kỳ định dạng nào khác về tính mở, khả năng lập chỉ mục, khả năng chuyển đổi và khả năng đọc. Thật không may, đồ họa được lưu trong thư mục riêng. trình duyệt web IE cho phép bạn lưu văn bản và đồ họa vào một tài liệu ở định dạng MNT, nhưng các trình duyệt khác có thể không mở tệp như vậy.

CHM (HTML đã biên dịch)

CHM về cơ bản là một tập hợp các tài liệu HTML được biên dịch, giống như một kho lưu trữ các trang web, do kích thước của nó nhỏ hơn. Để xem, hãy sử dụng tiện ích được tích hợp sẵn trong Windows 98/NT trở lên. Ngoài ra còn có người xem bên thứ ba. Để tạo tệp CHM, bạn có thể sử dụng công cụ miễn phí Trợ giúp HTML Xưởng. Bây giờ nó được sử dụng tích cực làm tài liệu tham khảo cho các ứng dụng khác nhau.

PDF

(Định Dạng Tài Liệu Di Động - định dạng tài liệu di động)

Một định dạng tài liệu điện tử đa nền tảng được tạo bởi Adobe Systems bằng cách sử dụng một số tính năng của ngôn ngữ PostScript. Chủ yếu nhằm mục đích trình bày trong ở dạng điện tử sản phẩm in ấn. Để xem bạn có thể sử dụng miễn phí chính thức chương trình adobe Reader, cũng như các chương trình từ các nhà phát triển khác. Thật thuận tiện vì vấn đề thiếu định dạng, hiển thị không chính xác các phần tử đồ họa nhúng và thiếu một số phông chữ nhất định đã được giải quyết. Tệp sẽ được hiển thị trên bất kỳ nền tảng nào ở cùng dạng mà nó được tạo. Cách tạo tài liệu PDF truyền thống như sau: bản thân tài liệu được chuẩn bị trong chương trình riêng và sau đó được xuất sang PDF. Một số chương trình có khả năng xuất trực tiếp (không cần sử dụng máy in ảo). Ví dụ: OpenOffice.org. Không có tùy chọn như vậy trong MS Word. Tiêu chuẩn thực tế cho hầu hết các tài liệu.

DjVu ("deja vu")

Công nghệ nén hình ảnh bị mất dữ liệu được thiết kế đặc biệt để lưu trữ các tài liệu được quét - sách, tạp chí, bản thảo, v.v., trong đó sự hiện diện của các công thức, sơ đồ, hình vẽ và ký tự viết tay khiến việc nhận dạng đầy đủ chúng trở nên vô cùng khó khăn. Cũng là giải pháp hiệu quả, nếu cần truyền tải tất cả các sắc thái của thiết kế, chẳng hạn như của các tài liệu lịch sử. Rất phổ biến, nhiều thư viện sử dụng nó để lưu trữ sách khoa học được quét. DjVu đôi khi được gọi là định dạng "đồ họa văn bản". Bản chất của công nghệ DjVu là tự động chia hình ảnh thành nhiều phần (ví dụ: văn bản, logo công ty và chụp ảnh raster), cho mỗi thuật toán nén tối ưu được chọn. Ngoài ra, tệp DjVu có thể chứa mục lục tương tác tích hợp sẵn và các khu vực hoạt động - liên kết, cho phép bạn triển khai điều hướng thuận tiện. Nó mang lại mức tăng kích thước tệp trung bình so với định dạng GIF từ một đến rưỡi đến hai chục lần.

XMLđịnh dạng

(“Ngôn ngữ đánh dấu mở rộng”)

Có khá nhiều định dạng văn bản được tạo cho một thiết bị cụ thể hoặc các chương trình. Ví dụ, sách điện tử. Chúng bao gồm sách điện tử Rocket (.rb), Microsoft Reader (.lit), PalmDoc, MobiPocket (.pro), v.v. Theo quy định, tất cả chúng đều được tạo bằng cách sử dụng ngôn ngữ XML. Thành công nhất và phổ biến nhất trong số đó là định dạng FictionBook (FB2). TRÊN khoảnh khắc nàyĐây là định dạng tiến bộ và hứa hẹn nhất cho sách điện tử. Hạn chế duy nhất của nó là mất nhiều thời gian để chuẩn bị văn bản ban đầu. Mà trả hết trong dễ đọc. Trong FictionBook, điểm nhấn là cấu trúc tài liệu: sử dụng các thẻ bạn có thể đánh dấu khu vực khác nhau văn bản (chương, tiêu đề, trích dẫn, hộp). Mọi thứ sẽ trông như thế nào trên màn hình tùy thuộc vào chương trình đọc. Nếu bạn muốn định dạng tài liệu của mình theo một cách nhất định, bạn có thể đính kèm một biểu định kiểu.

Mỗi người dùng PC liên tục phải đối mặt định dạng khác nhau các tệp văn bản, nhưng hầu như không ai nghĩ đến lịch sử phong phú của các định dạng và chương trình này, điều này đã mang lại cho một người cơ hội đọc sách, làm việc với văn bản và tạo tất cả các tài liệu cần thiết trực tiếp trên máy tính.

Lịch sử của các file văn bản cũng không trẻ hơn mình bao nhiêu những máy tính cá nhân- những kiệt tác của họ đã được viết theo dạng tương tự đầu tiên của “sổ ghi chép” hiện đại. Vậy các định dạng và chương trình tệp văn bản khác nhau để làm việc với chúng là gì? Trước tiên, bạn cần hiểu tệp văn bản dùng để làm gì, sự khác biệt giữa chúng là gì và chúng có điểm gì chung. Tuyệt đối tất cả các định dạng văn bản đều có điểm chung là nhiệm vụ chính - lưu thông tin văn bản. Chúng khác nhau về khả năng xử lý cũng như khả năng truy cập thông tin được lưu trữ trong tệp về khả năng tương thích với các chương trình khác.

Định dạng văn bản đơn giản nhất theo truyền thống là định dạng TXT. Nó cũng có khả năng khiêm tốn nhất và là định dạng văn bản lâu đời nhất. Do tính đơn giản của nó (khả năng của TXT bị giới hạn trong việc nhập văn bản và chia nó thành các đoạn văn), định dạng này thường được sử dụng bởi một số lượng lớn các ứng dụng và chương trình. nền tảng khác nhau.

Với sự phổ biến của máy tính cá nhân và sự gia tăng doanh số bán hàng của chúng, Microsoft tạo ra một định dạng phổ biến khác gọi là Rich Text Format (hay đơn giản là RTF). Đó là văn bản được đánh dấu bằng cách sử dụng một số "từ kiểm soát" nhất định cho phép bạn không chỉ tạo mà còn lưu các phần tử định dạng phức tạp và chèn công thức, bảng, hình, đầu trang và chân trang vào văn bản.

Tuy nhiên, RTF có khả năng khá kém so với định dạng DOC, cũng được Microsoft tạo riêng cho gói phần mềm dành cho tên là Microsoft Văn phòng. Được tạo ra cách đây hơn mười lăm năm, DOC bao gồm một số lượng lớn các khả năng định dạng và xử lý văn bản, tạo, chỉnh sửa và đặt hình ảnh, biểu đồ, bảng và các thành phần khác. Cần lưu ý rằng các chức năng này sẽ chỉ hoạt động chính xác nhất trong MS Word. Điều này chủ yếu là do Microsoft không có thông số kỹ thuật hiện tại định dạng DOC và không cho phép các đối thủ cạnh tranh và nhà phát triển độc lập sử dụng đầy đủ các khả năng của định dạng này. Thực tế này là một trong những lý do chính khiến ngoài định dạng DOC, các định dạng tệp văn bản khác được sử dụng rộng rãi trong thời đại chúng ta.

Sự khác biệt chính giữa định dạng DOC và văn bản và định dạng TXT là bản chất nhị phân của nó, khiến nó không thể đọc được ở các định dạng đơn giản như Wordpad, Lexicon, Atlantis. Hơn nữa, trong một số trường hợp, người ta có thể quan sát thấy sự không tương thích của các tệp DOC được tạo trong phiên bản khác nhau các chương trình MS Word.

Các định dạng tệp văn bản có thể được mở và chỉnh sửa trong một con số khổng lồ các chương trình. Ngoài MS Word đã đề cập ở trên, phổ biến nhất trong số đó là StarOffice do Sun Microsystems sản xuất, WordPerfect của Corel và gói miễn phí OpenOffice.org.

Với sự phổ biến của các thiết bị đọc điện tử, các định dạng tệp văn bản khác cũng đang trở nên phổ biến, chẳng hạn như FB2 và LRF.

Để có thể sử dụng các định dạng văn bản khác nhau trên các nền tảng khác nhau, một số lượng lớn các chương trình được gọi là trình chuyển đổi đã được tạo ra. Trình chuyển đổi tập tin văn bản cho phép bạn lưu văn bản gốc từ định dạng này sang định dạng khác và sử dụng nó sau này trên nhiều thiết bị và nền tảng khác nhau.

Bộ chuyển đổi không chỉ được sử dụng để lưu văn bản từ định dạng này sang định dạng khác mà còn để tạo các tệp, không giống như nguồn của chúng, có thể được sử dụng trên các thiết bị không có khả năng “đọc” tập tin gốc. Ví dụ: một số thiết bị đọc sách điện tử không hỗ trợ các định dạng tệp văn bản phổ biến có thể dễ dàng nhận dạng các định dạng LRF hoặc FB2 thu được từ tệp nguồn bằng chương trình chuyển đổi.