Mở Gzip hoạt động với các tài liệu văn bản. Phần mở rộng tệp GZIP là gì? Thông tin kỹ thuật về tệp GZIP

Đốt não

So sánh các trình lưu trữ trong Linux

Từ lâu, tôi đã muốn tiến hành một cuộc thử nghiệm so sánh các công cụ lưu trữ phổ biến có sẵn ở Linux và cuối cùng tôi đã có thời gian rảnh để làm việc đó. Tôi không kiểm tra các trình lưu trữ kỳ lạ hoặc lỗi thời mà tôi đã tham gia thử nghiệm; 7z, xz, zip, bzip2, gzip và thậm chí đã tải xuống phiên bản dùng thử của trình lưu trữ rar. Tất cả các trình lưu trữ đều được thử nghiệm với ba cài đặt nén khác nhau - nén nhanh nhất, trung bình (mặc định) và nén tốt nhất. Tôi sẽ nói ngay rằng tôi đã không thử nghiệm các tùy chọn bổ sung như kích thước của từ điển - tôi để tất cả những điều này theo mặc định, nếu không việc so sánh các trình lưu trữ sẽ được mở rộng nhiều lần và sẽ trở nên kém rõ ràng hơn. Hơn nữa, các thủ thuật khác nhau với các tùy chọn nén không phải lúc nào cũng dẫn đến kết quả như mong đợi; 7z, chỉ cần sử dụng tùy chọn -mx=9 và đừng lo lắng về điều đó :)

Bây giờ tôi có một số tập tin dày với văn bản mở trước mặt, từ đó tôi cần tập hợp một bài báo mà không quên bất cứ thứ gì cần thiết và vứt đi những thứ rác rưởi không cần thiết. Đây là điều khó khăn nhất :) Tôi sẽ cố gắng trình bày tất cả những điều này ở dạng dễ đọc hơn hoặc ít hơn. Đi!

Trình lưu trữ và giải nén đã được thử nghiệm

  • Gzip 1.4
  • Bzip2 1.0.5
  • RAR 3,93
  • ZIP 3.0
  • giải nén 6.0
  • tar 1.22 (phiên bản này đã thêm hỗ trợ cho xz-utils)
  • xz-utils 4.999
  • p7zip 9.04
  • Thời gian thực hiện được đo như thế nào?
    Tiện ích thời gian. Tiện ích này có thể hiển thị số giây thực tế mà bộ xử lý dành để hoàn thành một tác vụ. Điều này rất quan trọng để thử nghiệm các trình lưu trữ. Ví dụ: nếu tôi quyết định nén các nguồn nhân Linux bằng trình lưu trữ ZIP và tính thời gian cho tác vụ bằng đồng hồ bấm giờ thông thường, tôi sẽ thấy rằng lần nén đầu tiên mất khoảng 2 phút, lần thứ hai - khoảng 30 giây, lần thứ ba - 10 giây. Tôi nghĩ không cần thiết phải nói tại sao điều này lại xảy ra. Tiện ích thời gian cho phép bạn tránh những vấn đề như vậy và trong mọi trường hợp đều hiển thị cùng một kết quả - số giây mà CPU dành để hoàn thành tác vụ (Tổng số giây CPU mà quá trình đã sử dụng ở chế độ người dùng.) Nói một cách đại khái, kết quả kiểm tra không phụ thuộc vào tốc độ đọc dữ liệu từ ổ cứng.

    Những loại tập tin đã được nén?

  • Một lượng lớn tệp phương tiện về cơ bản đã được nén. Đây là tất cả các loại mp3, jpeg, pdf và avi.
  • Tệp nhị phân
  • hình ảnh đĩa CD
  • Nguồn nhân Linux
  • Tài liệu, tệp txt và doc không nén
  • Số lượng lớn các tập tin nhỏ
  • Các thử nghiệm được tiến hành trong môi trường nào?
    CPU 32-bit, RAM 4GB DDR2. Bản phân phối Gentoo Linux, hệ thống tập tin ext4fs. Tất cả các thử nghiệm được thực hiện trong bảng điều khiển với Xs đã tắt, những con quỷ không cần thiết đã dừng lại và nói chung, mọi thứ có thể đều đã bị tắt, kể cả đèn :) Tức là vậy. máy tính được sử dụng riêng để kiểm tra các kho lưu trữ và không có gì hơn thế.

    Những gì đã được tính đến trong thử nghiệm

  • Loại dữ liệu nén và số lượng tập tin
  • Tốc độ lưu trữ
  • Kích thước của tài liệu lưu trữ nhận được
  • Tốc độ giải nén tài liệu lưu trữ nhận được
  • Mức nén được chỉ định trong cài đặt lưu trữ
  • Một chương trình giáo dục nhỏ
    LZMA- thuật toán nén dữ liệu mới, được sử dụng để tạo kho lưu trữ ở định dạng 7z. Các tính năng: tỷ lệ nén cao, sử dụng từ điển có kích cỡ khác nhau, mã nguồn mở. - tiện ích và thuật toán mã nguồn mở để nén dữ liệu. Theo hệ tư tưởng Unix, bzip2 chỉ thực hiện một nhiệm vụ - nén tệp. Để lưu trữ nhiều tập tin hoặc thư mục phải sử dụng kèm theo tiện ích TAR. Tar lưu trữ các tệp thành một và bzip2 nén chúng. Đó là lý do tại sao phần mở rộng cho các kho lưu trữ như vậy là .tar.bz2
    Gzip- Tiện ích và thuật toán nén và giải nén dữ liệu. Giống như bzip2, nó chỉ thực hiện một nhiệm vụ - nén hoặc giải nén một tệp. Có tốc độ hoạt động cao.
    Xì hơi- thuật toán nén dữ liệu.
    TAR- (lưu trữ băng từ, lưu trữ trên băng từ) - định dạng lưu trữ, tiện ích để làm việc với các kho lưu trữ cùng tên. Tar không nén dữ liệu, nó tạo một trong số nhiều tệp, sau đó thường được lưu trữ bằng thuật toán gzip hoặc bzip2.
    RAR- Định dạng và chương trình nén dữ liệu phổ biến phải trả phí để làm việc với nhiều loại kho lưu trữ khác nhau. Tác giả - Evgeniy Roshal.
    Giải nén- trình giải nén kho lưu trữ RAR miễn phí.
    Mã ZIP- Định dạng nén dữ liệu chuẩn, phổ biến.
    xx- Định dạng nén dữ liệu sử dụng thuật toán nén LZMA. Được tạo ra để thay thế cho lzma. Xperia-utils là một triển khai định dạng Xperia trên Linux. Trình lưu trữ TAR, bắt đầu từ phiên bản 1.22, cho phép bạn tạo các bản lưu trữ ở định dạng xz.
    7z- định dạng nén dữ liệu bằng thuật toán nén LZMA.
    p7zip- triển khai trình lưu trữ 7-Zip cho Linux.
    7-Zip- một trình lưu trữ tệp hỗ trợ nhiều thuật toán nén. Tác giả - Igor Pavlov. Định dạng chính là 7z sử dụng thuật toán LZMA.
    q7z- GUI cho trình lưu trữ p7zip

    Các nhà lưu trữ đã đưa ra những lựa chọn nào?

    Tạo một kho lưu trữ RAR. Nén mặc định.rar a -r tập tin archive.rar
    Tạo một kho lưu trữ RAR. Nén nhanhrar a -r -m1 tập tin archive.rar
    Tạo một kho lưu trữ RAR. nén tối đarar a -r -m5 tập tin archive.rar
    Tạo một kho lưu trữ ZIP. Nén mặc địnhzip -r tập tin archive.zip
    Tạo một kho lưu trữ ZIP. Nén nhanhzip -r -1 tập tin archive.zip
    Tạo một kho lưu trữ ZIP. nén tối đazip -r -9 tập tin archive.zip
    Tạo một kho lưu trữ 7z. Nén mặc định7z một tập tin archive.7z
    Tạo một kho lưu trữ 7z. Nén nhanh7z a -mx=1 tập tin archive.7z
    Tạo một kho lưu trữ 7z. nén tối đa7z a -mx=9 tập tin archive.7z
    Tạo một kho lưu trữ bzip2. Nén tối đa (mặc định)tập tin tar cfj archive.tar.bz2
    Tạo một kho lưu trữ bzip2. Nén trung bìnhtập tin tar cf archive.tar
    bzip2 -vc4 archive.tar > archive.tar.bz2
    Tạo một kho lưu trữ bzip2. Nén nhanhtập tin tar cf archive.tar
    bzip2 -vc1 archive.tar > archive.tar.bz2
    Tạo một kho lưu trữ gzip. Nén mặc địnhtập tin tar cfz archive.tar.gz
    Tạo một kho lưu trữ gzip. nén tối đatập tin tar cf archive.tar
    gzip -vc9 archive.tar > archive.tar.gz
    Tạo một kho lưu trữ gzip. Nén nhanhtập tin tar cf archive.tar
    gzip -vc1 archive.tar > archive.tar.gz
    Tạo kho lưu trữ Xperia. Nén mặc địnhxuất Hz_OPT=""
    Tạo kho lưu trữ Xperia. Nén nhanhxuất Hz_OPT="-1"
    tập tin tar cfJ archive.tar.xz
    Tạo kho lưu trữ Xperia. nén tối đaxuất XX_OPT="-9 --extreme"
    tập tin tar cfJ archive.tar.xz

    Thêm vào. thông tin
    Để đo thời gian, tiện ích thời gian đã được sử dụng: % /usr/bin/time -f "%U" Bzip2 theo mặc định lưu trữ ở chế độ nén tối đa (9), do đó, nén mặc định được lấy là tốt nhất và nén 4 là được sử dụng làm mức trung bình (1 - nhanh nhất, 9 - tốt nhất).
    Trong một số thử nghiệm, tôi quyết định sử dụng ZIP, RAR và 7z cùng với trình lưu trữ TAR. Bạn sẽ thấy kết quả :)
    Kết quả của 7z và Xperia khác nhau rõ rệt. Mặc dù 7z sử dụng LZMA, giống như Xperia, tôi đã thử nghiệm chúng dưới dạng các trình lưu trữ riêng biệt.
    Để tạo kho lưu trữ Xperia, TAR 1.21 sử dụng lzma và TAR 1.22 sử dụng Xperia.
    Để TAR tự động phát hiện loại lưu trữ, hãy sử dụng phím Một: % tar xaf archive.tar.bz2 Khi tạo kho lưu trữ Xperia trong TAR, các tùy chọn nén có thể được chỉ định thông qua biến môi trường XX_OPT: %exportXZ_OPT="-9 --extreme"

    Bài kiểm tra số 1. Nén các tập tin media.

    Trong lần thử nghiệm đầu tiên, tôi đã thu thập một lượng lớn tệp về cơ bản đã được nén. Đó là mp3, wav, jpg, png, pdf, avi. Tất cả đều nén gần như nhau :)
    Kết quả là tôi đã có được một danh mục đầy đủ các loại quà tặng:
  • Một album nhạc ở định dạng MP3 (60 MB)
  • Một tệp nhạc WAV (60MB)
  • Hai tệp video thông thường (230 MB)
  • Năm tệp DJVU và PDF (130MB)
  • Nhiều (20) tệp JPEG và PNG (50MB)
  • Tổng cộng 537 MB.



    Ở mức nén tối đa, RAR có kết quả tốt nhất - nó nén dữ liệu tốt hơn và nhanh hơn các dữ liệu khác một cách bất ngờ. Mặc dù bạn khó có thể muốn dành 1029 giây để tiết kiệm 40MB. Gzip và ZIP cũng không nén được nhưng nhanh hơn RAR và Xperia 10 lần.
    Ở mức nén trung bình, RAR giành chiến thắng ở hạng mục “chậm nhưng tốt”, trong khi Gzip và ZIP giành chiến thắng ở hạng mục “không tốt lắm nhưng rất nhanh”. Bzip2 có kết quả trung bình - nó có vẻ nén khá nhanh, nhưng chỉ tốt hơn Gzip một chút.
    Ở chế độ nhanh, kích thước của các kho lưu trữ gần như giống nhau, nhưng thời gian không hoàn toàn giống nhau. Dẫn đầu rõ ràng ở đây là ZIP thông thường, nén dữ liệu giống như gzip và rar, nhưng thực hiện nhanh hơn nhiều. Nói chung, kết luận là thế này: nếu bạn nén các tệp phương tiện, tức là. các tệp đã được nén và bạn không có nhiều thời gian - hãy sử dụng Gzip hoặc Zip. Nếu bạn có đủ thời gian - Rar hoặc 7z/xz.
    Nhân tiện, Bzip2 mất rất nhiều thời gian để giải nén các kho lưu trữ của nó so với các kho lưu trữ khác và RAR có lẽ có kết quả tốt nhất về tốc độ/chất lượng.

    Bài kiểm tra số 2. Nén tập tin nhị phân

    Ở lần thử nghiệm thứ 2, các tệp nhị phân sẽ được nén. Tôi vừa sao chép những cái nặng nhất từ ​​thư mục /usr/bin/ của mình.
    Có sẵn: 100 tệp nhị phân với tổng kích thước 167MB

    Ở mức nén tối đa, 7z hoạt động tốt hơn nhiều so với Xperia - nó nén nhanh hơn và tốt hơn. Zip hóa ra là nhanh nhất - nhanh hơn Gzip cho cùng kích thước lưu trữ.
    Ở chế độ nén trung bình, mọi thứ đều giống nhau, nhưng không có ích gì khi sử dụng Bzip2 - nó chỉ nén tốt hơn một chút so với Gzip/ZIP nhưng chậm hơn đáng kể.
    Ở chế độ nhanh, 7z lại tốt hơn so với Xperia. (Tại sao? Cả hai đều sử dụng LZMA!)
    Nhân tiện, 7z ở chế độ nhanh tạo ra bản lưu trữ 56 MB trong 35 giây và Bzip2 ở chế độ nén tối đa (mặc định) tạo ra bản lưu trữ 64 MB trong 65 giây. Những thứ kia. 7z vượt trội hơn Bzip2 về mọi mặt :)

    Bài kiểm tra số 3. Nén hình ảnh CD

    Riêng biệt, vì lý do nào đó, tôi quyết định nén ảnh CD. Nó có thể được coi là nội dung của bài kiểm tra số 1 một cách an toàn, nhưng tôi quyết định đặt nó riêng, đề phòng :)
    Có sẵn: 1 CD ảnh kích thước 614MB

    Ở chế độ nén tốt nhất, 7z thực hiện công việc của nó kém hơn một chút, nhưng nhanh hơn Xperia, nhưng RAR lại chậm nhất. Tôi đã có ấn tượng về Bzip2 - nó có vẻ nén nhanh hơn nhiều so với rar/7z/xz, nhưng chậm hơn nhiều so với gzip/zip và kích thước lưu trữ cũng không lớn hơn nhiều so với gzip/zip. Nếu tôi muốn nén tốt thứ gì đó và có thời gian cho nó, rất có thể tôi sẽ chọn 7z. Nếu cần nén file nhanh nhất có thể, tôi sẽ chọn Gzip hoặc ZIP. Nhân tiện, Gzip có một điểm cộng lớn so với ZIP - nó lưu tất cả thông tin về chủ sở hữu và quyền của tệp, điều mà ZIP không làm được (nhân tiện, như 7z, nhưng sẽ nói thêm về điều đó sau).
    Ở cài đặt trung bình, kích thước của kho lưu trữ (cũng như thời gian) gần như giống với các cài đặt trước đó.
    Nhưng ở chế độ nén nhanh, RAR làm tôi ngạc nhiên - nó nén nhanh hơn và tốt hơn tất cả các chế độ nén khác. Bzip2 ở chế độ nhanh được nén thậm chí còn tệ hơn Gzip/ZIP. Bzip2 mất nhiều thời gian hơn để giải nén kho lưu trữ so với tất cả các trình lưu trữ khác. Và Xperia giải nén kho lưu trữ nhanh hơn đáng kể so với 7z.

    Bài kiểm tra số 4. Nén nguồn hạt nhân Linux

    Một trong những cách tiêu chuẩn để kiểm tra chất lượng của thuật toán nén dữ liệu là mã nguồn kernel.
    Có sẵn:
    Nguồn linux-2.6.33. Đây là khoảng 31 nghìn tệp với tổng dung lượng 432MB.
    Vì có rất nhiều tệp nên tôi đã sử dụng tùy chọn RAR rắn (lưu trữ liên tục). 7z tạo một kho lưu trữ vững chắc theo mặc định. Người ta cũng quyết định sử dụng tar+rar và tar+zip. Nhân tiện, kết quả thật bất ngờ :)

    Chế độ nén tối đa: RAR cho kết quả tốt. Đúng, với tùy chọn TAR+RAR, các kho lưu trữ sẽ nhẹ hơn so với RAR với tùy chọn "rắn" =)
    Nén trung bình: Bzip2 đột nhiên hoạt động tốt hơn RAR, vượt trội hơn rất nhiều về tốc độ và khả năng nén gần như tốt.
    Chế độ nén nhanh: Ở đây Bzip2 lại nén tốt hơn RAR, mặc dù nó (Bzip2) thực hiện chậm nhất. Theo tôi, kết quả tốt nhất là từ 7z.
    Giải nén các kho lưu trữ: Các kho lưu trữ được nén đến mức tối đa, RAR mất rất nhiều thời gian để giải nén so với các kho lưu trữ khác. 7z/XZ giải nén nhanh hơn 10 lần so với RAR và Gzip nhanh như chớp.

    Bài kiểm tra số 5. Tài liệu không nén

    Các tài liệu văn bản như TXT, ODF, DOC. Tôi cho rằng kết quả sẽ tương tự như bài kiểm tra số 4 :)
    Có sẵn:
    Chủ yếu là file DOC. Tôi không lưu trữ tài liệu trên máy tính này nên tôi phải tải chúng xuống từ Internet và ODF khó tìm hơn. Ngoài ra còn có một số tệp từ điển TXT nặng, tệp RTF và HTML. Tổng cộng 66 MB.


    Chế độ nén tốt nhất: RAR hoạt động tốt nhất. Bzip2, như mọi khi, nằm đâu đó ở giữa.
    Chế độ nén trung bình: Tệp 7z/XZ được nén tốt nhất nhưng mất nhiều thời gian để thực hiện được điều đó. Bzip2 nén nhanh hơn nhiều và gần như tốt bằng RAR
    Chế độ nén nhanh nhất: Lần đầu tiên Bzip2 nén tốt hơn (mặc dù không nhanh hơn) 7z/XZ.
    Giải nén các kho lưu trữ: Một kho lưu trữ được nén ở chế độ tối đa mất rất nhiều thời gian để giải nén khỏi RAR. Thực ra đây không phải là lần đầu tiên. Chà, Bzip2, như mọi khi, không phải là cách nhanh nhất để giải nén các kho lưu trữ.

    Bài kiểm tra số 6. Số lượng lớn các tập tin văn bản nhỏ - Gentoo Portage

    Có sẵn: 116 nghìn tệp với tổng dung lượng 600 MB.


    Chế độ nén tối đa: Tệp lưu trữ nhỏ nhất thu được với 7z và xét về thời gian, nó hoàn thành nhanh hơn 2 lần so với Xperia. Bzip2 có lẽ có kết quả tốt nhất về tốc độ/nén
    Chế độ nén trung bình: Bzip2 theo tôi cho kết quả tốt hơn RAR. Mức nén tốt nhất vẫn là 7z.
    Nén nhanh: Xperia có kết quả tốt nhất. 7z nén 6 MB tốt hơn Xperia Z nhưng cũng chậm hơn 21 giây. Giải nén các kho lưu trữ: Tôi nghĩ Xperia đã làm tốt nhất ở đây. RAR, như mọi khi, giải nén các kho lưu trữ được nén tối đa rất chậm.

    Vì vậy, hãy tóm tắt. Ai là người lưu trữ giỏi nhất thế giới?
    Tôi sẽ không đưa ra câu trả lời cho câu hỏi này :P Tôi sẽ nói một điều - nếu tốc độ nén là quan trọng đối với bạn, hãy sử dụng Gzip, nếu bạn cần nén tệp nhiều nhất có thể, hãy sử dụng Hz hoặc 7z. Cá nhân tôi sẽ chọn 7z, vì... Về cơ bản nó lưu trữ nhanh hơn một chút so với Xperia. Tuy nhiên, đừng quên rằng các trình lưu trữ như RAR, ZIP và 7z không lưu thông tin đầy đủ về chủ sở hữu tệp, quyền, v.v. Bạn có thể chỉ định cài đặt thích hợp cho RAR khi tạo và giải nén tệp lưu trữ, nhưng việc tạo và nén tệp lưu trữ TAR sẽ dễ dàng hơn. Hướng dẫn sử dụng 7z nêu rõ rằng để sao lưu hệ thống, trước tiên hãy tạo một kho lưu trữ TAR, sau đó nén nó thành 7z.
    Thật thú vị khi thấy sự kết hợp TAR+RAR thường hoạt động tốt hơn RAR riêng lẻ :) Nói chung, TAR tạo một tệp (kho lưu trữ) trong số nhiều tệp nhanh chóng chính xác như ổ cứng của bạn cho phép, trong khi hầu như không gây căng thẳng cho bộ xử lý.

    Gzip hay ZIP? Gzip! Kết quả giống nhau nhưng Gzip giữ lại tất cả thông tin bổ sung về các tệp.
    XX hoặc 7z? Nếu bạn không cần lưu thông tin quyền sở hữu tệp, hãy sử dụng 7z. Nếu cần, hãy tạo kho lưu trữ Xperia qua TAR.
    RAR?. Thành thật mà nói, tôi đã mong đợi kết quả tồi tệ hơn từ nó, nhưng về nguyên tắc RAR hoạt động tốt. Trừ khi nó được trả tiền;)
    Bzip2?. Người lưu trữ này đã cho tôi cảm giác trái ngược nhau. Một mặt, nó nén nhanh hơn Gzip/7z/RAR, nhưng mặt khác, nó chỉ nén tốt hơn một chút so với Gzip/ZIP và chậm hơn đáng kể so với Gzip/RAR. Trong một số thử nghiệm, nó hoạt động tốt, trong một số thử nghiệm khác, nó nén chậm hơn và kém hơn 7z ở cài đặt nhanh nhất. Chính vì sự mâu thuẫn này mà cá nhân tôi sẽ từ chối sử dụng nó để chuyển sang sử dụng 7z/XZ.

    Nhưng cuối cùng thì điều đó tùy thuộc vào bạn. Chúc may mắn!

    Có lẽ những tài liệu này sẽ làm bạn quan tâm.

    Người dùng hệ thống máy tính đôi khi gặp phải các tệp có phần mở rộng GZ hoặc TGZ. Một câu hỏi hoàn toàn hợp lý được đặt ra: làm thế nào bạn có thể mở một tập tin như vậy? Tôi không muốn sớm làm phiền những độc giả làm việc với hệ điều hành Windows, nhưng khả năng mở tệp trong môi trường này được giảm thiểu. Và đây là điều...


    Giấy phép GZ là gì?

    Các tệp có phần mở rộng GZ xuất hiện lần đầu tiên vào năm 1993, sau khi tiện ích GZip để đóng gói và giải nén tệp được phát hành. Các tệp được chương trình này xử lý bằng thuật toán nén sẽ nhận được phần mở rộng này. Nhiều người có lẽ đã nhận ra rằng ứng dụng GZip thuộc danh mục trình lưu trữ. Các tệp được tạo với sự trợ giúp của họ là các kho lưu trữ thông thường. Nhưng có một điểm tinh tế ở đây. Vấn đề là các kho lưu trữ như vậy chỉ được sử dụng trong các hệ thống giống UNIX.

    Bản thân tiện ích GZip được tích hợp sẵn vào môi trường phần mềm hệ điều hành theo mặc định. Điều thú vị nhất là trình lưu trữ này không chỉ có trong hệ điều hành Linux mà còn có trong hệ điều hành Mac OS X. Tất nhiên, bạn có thể mở các tệp có phần mở rộng GZ trong hệ điều hành Windows, nhưng ở đây hoàn toàn hợp lý. câu hỏi đặt ra: tôi có nên làm điều này không? Quả thực, trong hầu hết các trường hợp, dữ liệu giải nén vẫn không thể đọc được trong hệ điều hành Windows. Mặc dù cũng có phiên bản GZip dành cho Windows.

    Nén và giải nén tập tin: thuật toán

    Nhiều người dùng có thể lầm tưởng rằng chương trình nén và giải nén file GZip hoạt động giống hệt như gói WinZIP nổi tiếng. Nhưng điều này không đúng chút nào. Ban đầu, việc kiểm tra chương trình được thực hiện dựa trên thuật toán DEFLATE của chúng tôi. Thuật toán này ban đầu được xây dựng trên sự kết hợp của hai loại mã hóa: Huffman và LZ77. Như bạn đã hiểu, khi nén thông tin bạn đang tìm kiếm, hậu tố gz sẽ được thêm vào tên chính. Nhưng điều này chỉ áp dụng cho các tập tin duy nhất. Vấn đề là chương trình này ban đầu không hỗ trợ làm việc với nhiều tệp, điều này có thể xảy ra trong các ứng dụng WinRaR hoặc WinZIP.

    Nói cách khác, đơn giản là không thể gói hai hoặc nhiều gói dữ liệu vào một kho lưu trữ. Điều này là do tiện ích này sử dụng ứng dụng TAR bổ sung để nén và giải nén. Kết quả là, khi tạo kho lưu trữ, đầu ra không phải là một tệp có phần mở rộng GZ mà là một đối tượng có phần mở rộng TGZ. Biến thể tar.gz đôi khi cũng được tìm thấy. Nói cách khác, tiện ích TAR trước tiên nén nhiều tệp thành một, sau đó được ứng dụng GZip xử lý. Nói một cách nhẹ nhàng thì sự kết hợp các hành động này không thuận tiện lắm. Điều tương tự cũng áp dụng cho quá trình giải nén dữ liệu. Tệp lưu trữ chính được giải nén trước tiên, sau đó tất cả các đối tượng khác được giải nén bằng tiện ích TAR bổ sung.

    Làm cách nào để mở tệp có phần mở rộng GZ?

    Bây giờ hãy nói về cách bạn có thể mở tệp bằng phần mở rộng GZ. Tất nhiên, bạn có thể sử dụng tiện ích “bản địa” có tên GZip cho những mục đích này. Có các phiên bản của chương trình này cho cả hệ thống UNIX và Windows. Vì chúng tôi chủ yếu sử dụng hệ điều hành Windows nên chúng tôi có thể giải nén các tệp có tiện ích mở rộng này bằng trình lưu trữ WinZIP tích hợp sẵn. Ngoài ra, các gói phần mềm WinRAR, 7-ZIP, Corel WinZIP, E-merge WinAce cũng khá hiệu quả.

    Vi-rút

    Đôi khi có những tình huống vi-rút và các đối tượng độc hại được ngụy trang dưới dạng kho lưu trữ với phần mở rộng GZ. Trong hầu hết các trường hợp, vi-rút thay thế phần mở rộng GZ bằng một phần mở rộng tương tự, chẳng hạn như GAZ. Có trường hợp phần mềm độc hại và vi-rút xâm nhập vào hệ thống dưới dạng tệp có phần mở rộng GZ. Các chương trình chống vi-rút được thiết kế để hoạt động với hệ điều hành Windows không phải lúc nào cũng có thể phát hiện được mối đe dọa tiềm ẩn trong trường hợp này. Vì vậy, khi xác định các đối tượng khả nghi, bạn cần phải hết sức cẩn thận. Tốt hơn hết bạn nên sử dụng các gói mạnh mẽ để kiểm tra vi-rút thay vì sử dụng các phần mềm diệt vi-rút miễn phí như Avast. Biện pháp cuối cùng là quét máy tính của bạn bằng tiện ích di động như KVRT để tìm các mối đe dọa.

    Phần kết luận

    Đó là tất cả thông tin liên quan đến việc làm việc với kho lưu trữ GZ. Nhiều người dùng có thể đã hiểu cách làm việc với những dữ liệu đó. Nhưng trước tiên chúng ta cần làm rõ tình hình. Bạn có thể mở một kho lưu trữ như vậy ngay cả trong hệ điều hành Windows, nhưng liệu nó có đáng làm không? Rốt cuộc, thông tin được đóng gói trong đó chỉ liên quan đến hệ thống UNIX. Sau này sẽ không thể làm việc với những tập tin như vậy. Ví dụ: hãy xem một tệp hình ảnh có phần mở rộng DMG được tạo trong hệ điều hành Mac OS X. Bạn có thể trích xuất nội dung của tệp đó bằng chương trình UltraISO. Nhưng sau đó phải làm gì với thông tin được trích xuất? Tình huống tương tự cũng xảy ra với định dạng dữ liệu GZ. Ngay cả khi người dùng làm việc với hệ điều hành LINUX và Mac OS X, việc cài đặt Win RAR sẽ dễ dàng hơn, có thể sử dụng mà không cần sử dụng các chương trình bổ sung.

    gzip (viết tắt của GNU zip) là tiện ích nén và phục hồi (giải nén) file máy tính sử dụng thuật toán DEFLATE. Nó được sử dụng chủ yếu trong các hệ thống UNIX, trong một số hệ thống nó là tiêu chuẩn thực tế để nén dữ liệu. Nó được tạo ra bởi Jean-loup Gailly và Mark Adler. Phiên bản 0.1 được phát hành lần đầu tiên vào ngày 31 tháng 10 năm 1992 và phiên bản 1.0 được phát hành vào tháng 2 năm 1993.

    Theo truyền thống của lập trình Unix, gzip chỉ thực hiện hai chức năng: nén và giải nén một tệp; nó không thể đóng gói nhiều tệp vào một kho lưu trữ. Khi được nén, hậu tố .gz sẽ được thêm vào phần mở rộng tệp gốc. Để đóng gói nhiều tệp, trước tiên chúng thường được lưu trữ thành một tệp bằng tiện ích tar, sau đó tệp này được nén bằng gzip. Do đó, các kho lưu trữ nén thường có phần mở rộng kép là .tar.gz hoặc .tgz rút gọn.

    Mặt khác, tính năng này mang lại cho gzip khả năng hoạt động với luồng dữ liệu liên tục, đóng gói/giải nén nó một cách nhanh chóng. Điều này được sử dụng rộng rãi trong các hệ thống UNIX: với sự trợ giúp của chuyển hướng luồng, bạn có thể làm việc với các tệp được đóng gói dễ dàng như với các tệp đã được giải nén (giải nén chúng trong bộ nhớ khi đọc và đóng gói chúng khi ghi); nhiều tiện ích Unix có hỗ trợ tích hợp cho cơ chế này. Gần đây, gzip đã được sử dụng tích cực để nén lưu lượng truy cập Internet. gzip hiện được hỗ trợ bởi hầu hết các trình duyệt hiện đại.

    Ngoài ra còn có bộ tiện ích tìm kiếm, hiển thị, so sánh dữ liệu dạng gzip: zcat, zdiff, zfgrep, zless, zcmp, zegrep, zgrep, zmore.

    Điều chỉnh tốc độ nén, trong đó -1 (một) là phương pháp nén tốc độ cao nhất (nén ít nhất) và -9 – phương pháp nén với tốc độ thấp nhất (nén tối ưu).

    Sự miêu tả:

    Tính thiết thực gzip giảm kích thước của các tệp được chỉ định bằng thuật toán mã hóa Lempel-Ziv (LZ77). Nếu có thể, mỗi tệp sẽ được thay thế bằng một tệp có phần mở rộng .gz khi lưu dữ liệu về chế độ, quyền sở hữu, thời gian truy cập và thay đổi. (Sự mở rộng -z được sử dụng cho VMS, z – dành cho MSDOS, OS/2 và Atari.) Nếu không có tệp nào được chỉ định, đầu vào tiêu chuẩn sẽ được nén thành đầu ra tiêu chuẩn. Nếu tên file mới quá dài, tiện ích gzip cắt bớt nó trong khi vẫn giữ nguyên tên tệp gốc trong tệp nén. Tính thiết thực gzip chỉ cố gắng nén các tập tin tiêu chuẩn. Đặc biệt, nó bỏ qua các liên kết tượng trưng.

    Các tiện ích được sử dụng để khôi phục các tệp nén về dạng ban đầu. gzip -d , súng ngắn hoặc zcat .

    Ghi chú . Những tiện ích này tuân theo các điều khoản của Giấy phép Công cộng GNU (GPL). Chúng được thiết kế để sử dụng trong các hệ thống phát triển phần mềm.

    Tính thiết thực súng ngắn thay thế mọi tệp được liệt kê trên dòng lệnh có tên kết thúc bằng .gz , .GZ hoặc -z , nhưng bắt đầu bằng số "ma thuật" chính xác, một tệp không nén không có phần mở rộng gốc. Tiện ích này cũng nhận dạng các biểu thức đặc biệt .tgz .taz như biểu tượng cho .tar.gz hoặc .tar.GZ .

    Tính thiết thực súng ngắn hiện tại có thể giải nén các tập tin được tạo bằng tiện ích gzip , zip , nén hoặc đóng gói . Định dạng đầu vào được xác định tự động. Khi sử dụng hai định dạng đầu tiên, tiện ích súng ngắn kiểm tra CRC 32 bit. Đối với định dạng đóng gói súng ngắn kiểm tra độ dài không nén. Định dạng nén không cung cấp kiểm tra tính toàn vẹn. Tuy nhiên, trong một số trường hợp, tiện ích súng ngắn có thể phát hiện một tập tin bị hỏng .GZ . Nếu xảy ra lỗi khi giải nén file .GZ không nên cho rằng tập tin .GZ chỉ đúng do thiếu cảnh báo từ tiện ích tiêu chuẩn giải nén . Thông thường điều này có nghĩa là tiện ích tiêu chuẩn giải nén không xác thực dữ liệu đầu vào và tạo ra đầu ra không chính xác.

    Tính thiết thực gzip được sử dụng để giải nén các tập tin được tạo bởi zip , chỉ khi những tệp này bao gồm một thành phần được nén bằng phương pháp "giảm phát". Chức năng này chỉ dành cho chuyển đổi tập tin tar.zip thành định dạng tar.gz . Để giải nén tập tin zip với nhiều thành phần nên được sử dụng thay thế súng ngắn tính thiết thực giải nén . (Xin lưu ý rằng tiện ích giải nén không có trong QNX Neutrino.)

    Tính thiết thực zcat giống hệt nhau súng zip -c . (Trên một số hệ thống, tiện ích zcat có thể được đặt là gzcat đồng thời giữ nguyên link gốc của tiện ích nén .) Tính thiết thực zcat giải nén các tệp từ danh sách trên dòng lệnh hoặc từ đầu vào tiêu chuẩn và ghi dữ liệu được trích xuất vào đầu ra tiêu chuẩn. Nó giải nén các tập tin có số "ma thuật" chính xác, bất kể sự hiện diện của hậu tố .gz .

    Tính thiết thực gzip sử dụng thuật toán Lempel-Ziv được sử dụng trong zip PKZIP . Việc nén tổng thể phụ thuộc vào kích thước của tệp đầu vào và sự phân bố của các chuỗi con chung. Thông thường, văn bản (văn bản gốc hoặc văn bản tiếng Anh) bị giảm 60–70%. Chất lượng nén nhìn chung cao hơn so với sử dụng thuật toán mã hóa LZW ( nén ), phương pháp Huffman ( đóng gói ) hoặc phương pháp Huffman thích ứng ( gọn nhẹ ).

    Quá trình nén xảy ra ngay cả khi tệp nén lớn hơn tệp gốc. Kết quả trường hợp xấu nhất là tăng thêm vài byte được sử dụng cho tiêu đề tệp gzip , cộng thêm 5 byte trên mỗi khối 32 KB hoặc, đối với các tệp lớn, mức tăng 0,015%. Khi nén và giải nén tiện ích gzip lưu dữ liệu chế độ và quyền sở hữu, cũng như dấu thời gian của tệp.

    Bạn có thể nối nhiều tập tin nén. Trong trường hợp này, tiện ích súng ngắn trích xuất tất cả các thành phần cùng một lúc. Ví dụ: