Những quan niệm sai lầm phổ biến nhất về âm thanh kỹ thuật số. Mp3 Hãy sắp xếp theo thứ tự Chế độ mã hóa Stereo cho chất lượng tốt hơn Joint Stereo

Làm sáng tỏ những lầm tưởng phổ biến về âm thanh kỹ thuật số.

2017-10-01T15:27

2017-10-01T15:27

Phần mềm Audiophile

Ghi chú: Để hiểu rõ hơn về văn bản bên dưới, tôi thực sự khuyên bạn nên tự làm quen với những kiến ​​​​thức cơ bản về âm thanh kỹ thuật số.

Ngoài ra, nhiều điểm nêu ra dưới đây cũng được đề cập trong ấn phẩm của tôi “Một lần nữa về sự thật đáng buồn: âm thanh hay thực sự đến từ đâu?” .

Tốc độ bit càng cao thì chất lượng của bản nhạc càng tốt.

Đây không phải là luôn luôn như vậy. Đầu tiên, hãy để tôi nhắc bạn bitray là gì T(tốc độ bit, không phải bitraid). Đây thực sự là tốc độ dữ liệu tính bằng kilobit trên giây trong khi phát lại. Nghĩa là, nếu chúng ta lấy kích thước của một bản nhạc tính bằng kilobit và chia nó cho thời lượng tính bằng giây, chúng ta sẽ nhận được tốc độ bit của nó - cái gọi là. tốc độ bit dựa trên tệp (FBR), thông thường nó không quá khác biệt so với tốc độ bit của luồng âm thanh (lý do cho sự khác biệt là sự hiện diện của siêu dữ liệu trong bản nhạc - thẻ, hình ảnh “nhúng”, v.v.).

Bây giờ hãy lấy một ví dụ: tốc độ bit của âm thanh PCM không nén được ghi trên CD Âm thanh thông thường được tính như sau: 2 (kênh) × 16 (bit trên mỗi mẫu) × 44100 (mẫu trên giây) = 1411200 (bps) = 1411,2 kbps . Bây giờ, hãy lấy và nén bản nhạc bằng bất kỳ codec không mất dữ liệu nào (“lossless” - “lossless”, tức là một loại không dẫn đến mất bất kỳ thông tin nào), ví dụ như codec FLAC. Kết quả là, chúng tôi sẽ nhận được tốc độ bit thấp hơn tốc độ bit ban đầu, nhưng chất lượng sẽ không thay đổi - đây là lời bác bỏ đầu tiên của bạn.

Có một điều nữa đáng nói thêm ở đây. Tốc độ bit đầu ra với tính năng nén không mất dữ liệu có thể rất khác nhau (nhưng theo quy luật, nó thấp hơn tốc độ bit của âm thanh không nén) - điều này phụ thuộc vào độ phức tạp của tín hiệu nén hoặc chính xác hơn là vào độ dư thừa dữ liệu. Do đó, các tín hiệu đơn giản hơn sẽ được nén tốt hơn (tức là chúng ta có kích thước tệp nhỏ hơn trong cùng thời lượng => tốc độ bit thấp hơn) và các tín hiệu phức tạp hơn sẽ bị nén kém hơn. Đây là lý do tại sao nhạc cổ điển lossless có tốc độ bit thấp hơn nhạc rock. Nhưng cần phải nhấn mạnh rằng tốc độ bit ở đây không phải là thước đo chất lượng của vật liệu âm thanh.

Bây giờ hãy nói về nén mất dữ liệu. Trước hết, bạn cần hiểu rằng có nhiều bộ mã hóa và định dạng khác nhau, thậm chí trong cùng một định dạng, chất lượng mã hóa của các bộ mã hóa khác nhau có thể khác nhau (ví dụ: QuickTime AAC mã hóa tốt hơn nhiều so với FAAC đã lỗi thời), chưa kể tính ưu việt của các định dạng hiện đại (OGG Vorbis, AAC, Opus) so với MP3. Nói một cách đơn giản, trong số hai bản nhạc giống hệt nhau được mã hóa bởi các bộ mã hóa khác nhau có cùng tốc độ bit, một bản nhạc sẽ nghe hay hơn và bản nhạc khác sẽ nghe tệ hơn.

Ngoài ra còn có một thứ như phong bì. Nghĩa là, bạn có thể lấy một bản nhạc ở định dạng MP3 với tốc độ bit 96 kbps và chuyển đổi nó thành MP3 320 kbps. Chất lượng không những không được cải thiện (xét cho cùng, dữ liệu bị mất trong quá trình mã hóa 96 kbit/s trước đó không thể quay lại được) mà thậm chí còn trở nên tồi tệ hơn. Điều đáng nói ở đây là ở mỗi giai đoạn mã hóa bị mất (với bất kỳ tốc độ bit và bất kỳ bộ mã hóa nào), âm thanh sẽ có một lượng biến dạng nhất định.

Va thậm chi nhiêu hơn. Có một sắc thái nữa. Giả sử, nếu tốc độ bit của luồng âm thanh là 320 kbps, điều này không có nghĩa là tất cả 320 kbps đã được sử dụng để mã hóa ngay trong giây đó. Đây là điển hình cho việc mã hóa với tốc độ bit không đổi và trong những trường hợp khi một người hy vọng đạt được chất lượng tối đa, buộc tốc độ bit không đổi quá cao (ví dụ: đặt CBR 512 kbps cho Nero AAC). Như đã biết, số lượng bit được phân bổ cho một khung cụ thể được điều chỉnh bởi mô hình âm thanh tâm lý. Nhưng trong trường hợp số lượng được phân bổ thấp hơn nhiều so với tốc độ bit đã đặt, ngay cả kho chứa bit cũng không được lưu (đọc về các thuật ngữ trong bài viết “ CBR, ABR, VBR là gì?”) - kết quả là chúng ta trở nên vô dụng “zero bit” chỉ đơn giản là “kết thúc” » kích thước khung hình theo kích thước mong muốn (tức là tăng kích thước luồng lên kích thước được chỉ định). Nhân tiện, điều này rất dễ kiểm tra - nén tệp kết quả bằng bộ lưu trữ (tốt nhất là 7z) và xem tỷ lệ nén - tỷ lệ nén càng cao thì càng có nhiều bit 0 (vì chúng dẫn đến dư thừa), càng lãng phí dung lượng.

Các codec lossy (MP3 và các loại khác) có thể xử lý âm nhạc điện tử hiện đại, nhưng không có khả năng mã hóa chất lượng cao của nhạc cổ điển (học thuật), trực tiếp, nhạc cụ

“Điều trớ trêu của số phận” ở đây là thực tế mọi chuyện hoàn toàn ngược lại. Như đã biết, âm nhạc hàn lâm trong phần lớn các trường hợp đều tuân theo các nguyên tắc du dương và hòa âm, cũng như cách sáng tác nhạc cụ. Từ quan điểm toán học, điều này dẫn đến một bản hòa âm tương đối đơn giản. Do đó, ưu thế của các phụ âm tạo ra số lượng hài âm thứ cấp nhỏ hơn: ví dụ, trong một phần năm (khoảng trong đó tần số cơ bản của hai âm thanh khác nhau một lần rưỡi), mỗi hài âm thứ hai sẽ chung cho hai âm thanh. , trong phần tư, trong đó các tần số chênh lệch một phần ba - một phần ba, v.v. Ngoài ra, sự hiện diện của các tỷ lệ tần số cố định, do sử dụng tính chất bình đẳng, cũng đơn giản hóa thành phần quang phổ của âm nhạc cổ điển. Thành phần nhạc cụ trực tiếp của các tác phẩm kinh điển quyết định việc không có tiếng ồn đặc trưng của âm nhạc điện tử, độ méo tiếng, biên độ nhảy vọt, cũng như việc không có quá nhiều thành phần tần số cao.

Các yếu tố được liệt kê ở trên dẫn đến thực tế là âm nhạc cổ điển dễ nén hơn nhiều, trước hết là thuần túy về mặt toán học. Nếu bạn còn nhớ, nén toán học hoạt động bằng cách loại bỏ sự dư thừa (mô tả các phần thông tin tương tự bằng cách sử dụng ít bit hơn) và cũng bằng cách đưa ra dự đoán (hay còn gọi là dự đoán). người dự đoán dự đoán hành vi của tín hiệu và sau đó chỉ mã hóa độ lệch của tín hiệu thực so với tín hiệu dự đoán - chúng càng khớp chính xác thì càng cần ít bit để mã hóa). Trong trường hợp này, thành phần quang phổ tương đối đơn giản và sự hài hòa dẫn đến độ dư thừa cao, việc loại bỏ nó mang lại mức độ nén đáng kể và một số lượng nhỏ các cụm và thành phần nhiễu (là các tín hiệu ngẫu nhiên và không thể đoán trước) xác định khả năng dự đoán toán học tốt của phần lớn thông tin. Và tôi thậm chí còn không nói về âm lượng trung bình tương đối thấp của các bản nhạc cổ điển và khoảng thời gian im lặng thường xuyên mà thực tế không cần thông tin để mã hóa. Kết quả là, chúng ta có thể nén một cách dễ dàng, chẳng hạn như một số nhạc cụ độc tấu ở tốc độ bit dưới 320 kbps (bộ mã hóa TAK và OFR hoàn toàn có khả năng làm được điều này).

Vì vậy, trước tiên, thực tế là việc nén toán học dựa trên mã hóa lossless cũng là một trong những giai đoạn của mã hóa lossy (đọc Tìm hiểu về mã hóa MP3). Và thứ hai, vì lossy sử dụng phép biến đổi Fourier (phân tách tín hiệu thành sóng hài), nên sự đơn giản của thành phần quang phổ thậm chí còn khiến công việc của bộ mã hóa trở nên dễ dàng hơn gấp đôi. Kết quả là, khi so sánh các mẫu nhạc cổ điển gốc và được mã hóa trong một thử nghiệm mù, chúng tôi rất ngạc nhiên khi thấy rằng chúng tôi không thể tìm thấy bất kỳ sự khác biệt nào, ngay cả ở tốc độ bit tương đối thấp. Và điều buồn cười là khi chúng tôi bắt đầu giảm hoàn toàn tốc độ bit mã hóa, điều đầu tiên bộc lộ sự khác biệt là tiếng ồn xung quanh trong bản ghi.

Đối với âm nhạc điện tử, các lập trình viên gặp rất nhiều khó khăn với nó: các thành phần tiếng ồn có độ dư thừa tối thiểu và cùng với những bước nhảy sắc nét (một số loại xung răng cưa), chúng là những tín hiệu cực kỳ khó đoán (đối với những lập trình viên “điều chỉnh” theo âm thanh tự nhiên hoạt động hoàn toàn khác), phép biến đổi Fourier trực tiếp và nghịch đảo với việc loại bỏ các sóng hài riêng lẻ bằng mô hình âm thanh tâm lý chắc chắn tạo ra các hiệu ứng trước và sau tiếng vang, khả năng nghe của nó không phải lúc nào cũng dễ dàng để bộ mã hóa đánh giá... Thêm vào đó, mức độ cao của các thành phần HF - và bạn nhận được một số lượng lớn các mẫu sát thủ, mà ngay cả những bộ mã hóa tiên tiến nhất cũng không thể đối phó được ở tốc độ bit trung bình-thấp, thật kỳ lạ, đặc biệt là trong âm nhạc điện tử.

Cũng thú vị là ý kiến ​​​​của “những người nghe có kinh nghiệm” và các nhạc sĩ, những người hoàn toàn thiếu hiểu biết về các nguyên tắc mã hóa mất dữ liệu, bắt đầu khẳng định rằng họ nghe thấy các nhạc cụ trong âm nhạc sau khi mã hóa bắt đầu lạc nhịp như thế nào, tần số nổi lên , v.v. Điều này vẫn có thể đúng đối với các máy nghe băng cassette thời xưa có khả năng phát nổ, nhưng trong âm thanh kỹ thuật số, mọi thứ đều chính xác: thành phần tần số vẫn còn hoặc bị loại bỏ, đơn giản là không cần phải thay đổi âm sắc. Hơn nữa: sự hiện diện của tai nghe nhạc của một người hoàn toàn không có nghĩa là người đó có thính giác tần số tốt (ví dụ: khả năng cảm nhận các tần số >16 kHz, khả năng này sẽ biến mất theo tuổi tác) và hoàn toàn không giúp anh ta nghe nhạc dễ dàng hơn. tìm kiếm các tạo phẩm mã hóa bị mất, vì hiện tượng méo. Chúng có đặc điểm rất cụ thể và yêu cầu trải nghiệm so sánh mù quáng về âm thanh bị mất - bạn cần biết phải tìm gì và ở đâu.

DVD-Audio có âm thanh tốt hơn Audio CD (24 bit so với 16, 96 kHz so với 44.1, v.v.)

Thật không may, mọi người thường chỉ nhìn vào những con số và rất hiếm khi nghĩ đến tác động của một thông số cụ thể đến chất lượng khách quan.

Đầu tiên chúng ta hãy xem xét độ sâu bit. Tham số này không chịu trách nhiệm gì ngoài dải động, tức là sự khác biệt giữa âm thanh nhỏ nhất và âm thanh to nhất (tính bằng dB). Trong âm thanh kỹ thuật số, mức tối đa là 0 dBFS (FS - thang đo đầy đủ) và mức tối thiểu bị giới hạn bởi mức nhiễu, tức là trên thực tế, dải động ở giá trị tuyệt đối bằng mức nhiễu. Đối với âm thanh 16 bit, dải động được tính là 20 × log 10 2 16, bằng 96,33 vB. Đồng thời, dải động của một dàn nhạc giao hưởng lên tới 75 dB (chủ yếu là khoảng 40-50 dB).

Bây giờ hãy tưởng tượng các điều kiện thực tế. Độ ồn trong phòng khoảng 40 dB (đừng quên dB là giá trị tương đối. Trong trường hợp này, ngưỡng nghe được lấy là 0 dB), âm lượng nhạc tối đa đạt 110 dB (để tránh khó chịu) - chúng tôi nhận được sự khác biệt là 70 dB. Vì vậy, hóa ra dải động hơn 70 dB trong trường hợp này đơn giản là vô dụng. Tức là ở tầm cao hơn, âm thanh lớn sẽ đạt đến ngưỡng đau, hoặc âm thanh yên tĩnh sẽ bị tiếng ồn xung quanh hấp thụ. Rất khó để đạt được mức tiếng ồn xung quanh dưới 15 dB (vì âm lượng hơi thở của con người và các tiếng ồn khác do sinh lý con người gây ra đều ở mức này), do đó, phạm vi nghe nhạc là 95 dB. là hoàn toàn đủ.

Bây giờ về tần số lấy mẫu (tần số lấy mẫu, tốc độ lấy mẫu). Tham số này kiểm soát tần số lấy mẫu thời gian và ảnh hưởng trực tiếp đến tần số tín hiệu tối đa có thể được mô tả bằng biểu diễn âm thanh nhất định. Theo định lý Kotelnikov, nó bằng một nửa tần số lấy mẫu. Nghĩa là, đối với tần số lấy mẫu thông thường là 44100 Hz thì tần số tối đa của các thành phần tín hiệu là 22050 Hz. Tần số tối đa. mà tai con người cảm nhận được là trên 20.000 Hz một chút (và sau đó khi chúng ta sinh ra; khi chúng ta lớn lên, ngưỡng này giảm xuống còn 16.000 Hz).

Chủ đề này được đề cập rõ nhất trong bài viết Tải xuống ở định dạng 24/192 - tại sao chúng không có ý nghĩa.

Các trình phát phần mềm khác nhau có âm thanh khác nhau (ví dụ: foobar2000 tốt hơn Winamp, v.v.)

Để hiểu tại sao lại không như vậy, bạn cần hiểu trình phát phần mềm là gì. Về cơ bản, đây là bộ giải mã, trình xử lý (tùy chọn), plugin đầu ra (tới một trong các giao diện: ASIO, DirectSound, WASAPI, v.v.) và tất nhiên là GUI (giao diện người dùng đồ họa). Vì bộ giải mã trong 99,9% trường hợp hoạt động theo thuật toán tiêu chuẩn và plugin đầu ra chỉ là một phần của chương trình truyền luồng tới card âm thanh thông qua một trong các giao diện, nên lý do duy nhất cho sự khác biệt có thể là do trình xử lý. Nhưng thực tế là bộ xử lý thường bị tắt theo mặc định (hoặc nên tắt, vì điều quan trọng nhất đối với một người chơi giỏi là có thể truyền tải âm thanh ở dạng “nguyên sơ”). Kết quả là, chủ đề so sánh duy nhất ở đây có thể là khả năng nhân tiện, việc xử lý và đầu ra thường không cần thiết chút nào. Nhưng ngay cả khi có nhu cầu như vậy thì đây là sự so sánh giữa bộ xử lý chứ không phải so sánh giữa người chơi.

Các phiên bản trình điều khiển khác nhau có âm thanh khác nhau

Tuyên bố này dựa trên sự thiếu hiểu biết tầm thường về nguyên tắc hoạt động của card âm thanh. Trình điều khiển là phần mềm cần thiết để thiết bị tương tác hiệu quả với hệ điều hành, cũng thường cung cấp giao diện đồ họa cho người dùng để có khả năng quản lý thiết bị, các thông số của thiết bị, v.v. Trình điều khiển card âm thanh đảm bảo rằng card âm thanh được nhận dạng là Windows thiết bị âm thanh, thông báo cho HĐH về những định dạng mà thẻ hỗ trợ, cung cấp khả năng truyền luồng PCM không nén (trong hầu hết các trường hợp) tới thẻ và cũng cấp quyền truy cập vào cài đặt. Ngoài ra, nếu có xử lý phần mềm (sử dụng các công cụ CPU), trình điều khiển có thể chứa nhiều DSP (bộ xử lý) khác nhau. Do đó, trước hết, khi các hiệu ứng và quá trình xử lý bị vô hiệu hóa, nếu trình điều khiển không cung cấp đường truyền PCM chính xác tới thẻ, đây được coi là một lỗi nghiêm trọng, một lỗi nghiêm trọng. Và điều này xảy ra hiếm khi. Mặt khác, sự khác biệt giữa các trình điều khiển có thể nằm ở việc cập nhật các thuật toán xử lý (bộ lấy mẫu lại, hiệu ứng), mặc dù điều này cũng không xảy ra thường xuyên. Ngoài ra, để đạt được chất lượng cao nhất, các hiệu ứng và mọi quá trình xử lý trình điều khiển vẫn phải được loại trừ.

Vì vậy, các bản cập nhật trình điều khiển chủ yếu tập trung vào việc cải thiện độ ổn định và loại bỏ các lỗi xử lý. Cả cái này lẫn cái kia trong trường hợp của chúng tôi đều không ảnh hưởng đến chất lượng phát lại, do đó, trong 999 trường hợp trong số 1000 trường hợp, trình điều khiển không ảnh hưởng đến âm thanh.

Đĩa CD âm thanh được cấp phép có âm thanh tốt hơn bản sao của chúng

Nếu không xảy ra lỗi đọc/ghi (nghiêm trọng) trong quá trình sao chép và ổ đĩa quang của thiết bị mà đĩa sao chép sẽ được phát không gặp vấn đề gì khi đọc nó, thì tuyên bố này là sai và dễ dàng bị bác bỏ.

Chế độ mã hóa âm thanh nổi cho chất lượng tốt hơn Joint Stereo

Quan niệm sai lầm này chủ yếu liên quan đến LAME MP3, vì tất cả các bộ mã hóa hiện đại (AAC, Vorbis, Musepack) đều sử dụng chỉ một Chế độ âm thanh nổi chung (và điều này đã nói lên điều gì đó)

Để bắt đầu, điều đáng nói là chế độ Joint Stereo được sử dụng thành công với tính năng nén không mất dữ liệu. Bản chất của nó nằm ở chỗ trước khi mã hóa, tín hiệu được phân tách thành tổng của các kênh bên phải và bên trái (Mid) và sự khác biệt của chúng (Side), sau đó xảy ra quá trình mã hóa riêng biệt các tín hiệu này. Trong giới hạn (đối với cùng một thông tin ở các kênh bên phải và bên trái), sẽ đạt được mức tiết kiệm dữ liệu gấp đôi. Và vì trong hầu hết âm nhạc, thông tin ở kênh phải và trái khá giống nhau nên phương pháp này tỏ ra rất hiệu quả và cho phép bạn tăng đáng kể tỷ lệ nén.

Trong lossy nguyên tắc là như nhau. Nhưng ở đây, ở chế độ tốc độ bit không đổi, chất lượng của các đoạn có thông tin tương tự ở hai kênh sẽ tăng lên (trong giới hạn, gấp đôi) và đối với chế độ VBR ở những nơi như vậy, tốc độ bit sẽ chỉ giảm (đừng quên rằng nhiệm vụ chính là của chế độ VBR là duy trì ổn định chất lượng mã hóa được chỉ định, sử dụng tốc độ bit thấp nhất có thể). Vì trong quá trình mã hóa bị mất, mức độ ưu tiên (khi phân phối bit) được dành cho tổng số kênh, để tránh làm hỏng toàn cảnh âm thanh nổi, chuyển đổi động giữa âm thanh nổi dựa trên khung hình chung (Giữa/Bên) và âm thanh nổi dựa trên khung thông thường (Trái/Phải). các chế độ được sử dụng. Nhân tiện, lý do cho quan niệm sai lầm này là sự không hoàn hảo của thuật toán chuyển đổi trong các phiên bản LAME cũ hơn, cũng như sự hiện diện của chế độ Khớp cưỡng bức, trong đó không có chuyển đổi tự động. Trong các phiên bản LAME mới nhất, chế độ Khớp được bật theo mặc định và không nên thay đổi chế độ này.

Phổ càng rộng thì chất lượng ghi càng tốt (về biểu đồ phổ, auCDtect và dải tần)

Thật không may, ngày nay trên các diễn đàn, việc đo chất lượng của một bản nhạc “bằng thước đo sử dụng quang phổ” là điều rất phổ biến. Rõ ràng là do sự đơn giản của phương pháp này. Tuy nhiên, như thực tế cho thấy, trên thực tế mọi thứ phức tạp hơn nhiều.

Và đây là điều. Biểu đồ phổ thể hiện trực quan sự phân bố công suất tín hiệu theo tần số, nhưng không thể đưa ra bức tranh hoàn chỉnh về âm thanh của bản ghi, sự hiện diện của các biến dạng và hiện tượng nén trong đó. Nghĩa là, về cơ bản tất cả những gì có thể được xác định từ biểu đồ phổ là dải tần số (và một phần là mật độ phổ trong vùng HF). Nghĩa là, trong trường hợp tốt nhất, bằng cách phân tích biểu đồ phổ, có thể xác định được sự chuyển đổi ngược. Việc so sánh biểu đồ phổ của các bản nhạc thu được bằng cách mã hóa bằng các bộ mã hóa khác nhau với bản gốc là hoàn toàn vô lý. Có, bạn có thể xác định sự khác biệt trong quang phổ, nhưng việc xác định xem tai người có cảm nhận được chúng hay không (và ở mức độ nào) là điều gần như không thể. Chúng ta không được quên rằng nhiệm vụ của mã hóa tổn thất là đảm bảo một kết quả không thể phân biệt được tai người từ bản gốc (không phải bằng mắt).

Điều tương tự cũng áp dụng cho việc đánh giá chất lượng mã hóa bằng cách phân tích các bản nhạc đầu ra bằng chương trình auCDtect (Audiochecker, auCDtect Task Manager, Tau analyzer, fooCDtect - đây chỉ là các lớp vỏ cho chương trình bảng điều khiển có một không hai auCDtect). Thuật toán auCDtect cũng thực sự phân tích dải tần số và chỉ cho phép bạn xác định (với một mức độ xác suất nhất định) liệu nén MPEG có được áp dụng ở bất kỳ giai đoạn mã hóa nào hay không. Thuật toán được thiết kế riêng cho MP3 nên rất dễ bị “đánh lừa” với sự trợ giúp của codec Vorbis, AAC và Musepack, nên ngay cả khi chương trình ghi “100% CDDA”, điều này không có nghĩa là âm thanh được mã hóa là 100% giống hệt với bản gốc.

Và quay trở lại trực tiếp với quang phổ. Một số “người đam mê” cũng có mong muốn phổ biến là vô hiệu hóa bộ lọc thông thấp trong bộ mã hóa LAME bằng mọi giá. Ở đây rõ ràng là thiếu sự hiểu biết về các nguyên tắc mã hóa và âm thanh tâm lý. Đầu tiên, bộ mã hóa cắt tần số cao chỉ với một mục đích - lưu dữ liệu và sử dụng dữ liệu đó để mã hóa dải tần số dễ nghe nhất. Dải tần số mở rộng có thể có tác động nghiêm trọng đến chất lượng âm thanh tổng thể và dẫn đến các hiện tượng giả mã hóa âm thanh. Hơn nữa, việc tắt giới hạn ở tần số 20 kHz nói chung là hoàn toàn không hợp lý, vì một người đơn giản là không thể nghe thấy tần số cao hơn.

Có một cài đặt sẵn bộ chỉnh âm “ma thuật” nhất định có thể cải thiện đáng kể âm thanh

Điều này không hoàn toàn đúng, trước hết, vì mỗi cấu hình riêng lẻ (tai nghe, âm thanh, card âm thanh) đều có các thông số riêng (đặc biệt là đáp ứng biên độ-tần số riêng). Và do đó, mỗi cấu hình phải có cách tiếp cận riêng, độc đáo. Nói một cách đơn giản, cài đặt sẵn bộ chỉnh âm như vậy tồn tại, nhưng nó khác nhau đối với các cấu hình khác nhau. Bản chất của nó nằm ở việc điều chỉnh đáp ứng tần số của đường truyền, cụ thể là “cân bằng” các mức tăng và giảm không mong muốn.

Ngoài ra, đối với những người không trực tiếp làm việc với âm thanh, việc thiết lập bộ cân bằng đồ họa bằng dấu “tích tắc” là rất phổ biến, điều này thực sự thể hiện sự gia tăng mức độ của các thành phần tần số thấp và tần số cao, nhưng đồng thời dẫn đến hiện tượng bóp nghẹt. của giọng hát và nhạc cụ, phổ âm thanh nằm ở vùng tần số trung bình.

Trước khi chuyển đổi nhạc sang định dạng khác, bạn nên giải nén nó sang WAV

Hãy để tôi lưu ý ngay rằng WAV có nghĩa là dữ liệu PCM (điều chế mã xung) trong vùng chứa WAVE (tệp có phần mở rộng *.wav). Dữ liệu này không gì khác hơn là một chuỗi các bit (số 0 và số 1) theo nhóm 16, 24 hoặc 32 (tùy thuộc vào độ sâu bit), mỗi nhóm biểu thị mã nhị phân của biên độ của mẫu tương ứng (ví dụ: đối với 16 bit theo ký hiệu thập phân, đây là các giá trị từ -32768 đến +32768).

Vì vậy, thực tế là bất kỳ bộ xử lý âm thanh nào - dù là bộ lọc hay bộ mã hóa - thường hoạt động chỉ một với những giá trị này, nghĩa là chỉ một với dữ liệu không nén. Điều này có nghĩa là để chuyển đổi âm thanh từ FLAC sang APE, bạn chỉ cần cần thiếtĐầu tiên giải mã FLAC thành PCM, sau đó mã hóa PCM thành APE. Giống như việc đóng gói lại file từ ZIP sang RAR, trước tiên bạn phải giải nén ZIP.

Tuy nhiên, nếu bạn sử dụng một bộ chuyển đổi hoặc chỉ một bộ mã hóa bảng điều khiển nâng cao, quá trình chuyển đổi trung gian sang PCM sẽ diễn ra nhanh chóng, đôi khi thậm chí không cần ghi vào tệp WAV tạm thời. Đây là điều khiến mọi người hiểu lầm: có vẻ như các định dạng được chuyển đổi trực tiếp từ định dạng này sang định dạng khác, nhưng trên thực tế, một chương trình như vậy phải có bộ giải mã định dạng đầu vào thực hiện chuyển đổi trung gian sang PCM.

Do đó, việc chuyển đổi thủ công sang WAV sẽ chẳng mang lại cho bạn điều gì ngoài việc lãng phí thời gian.

Một trong những quan niệm sai lầm phổ biến và sâu xa nhất trong thế giới của những người yêu âm nhạc là gì?

Lưu và đọc sau -

Ghi chú dịch:Đây là bản dịch phần thứ hai (trong số bốn) phần của một bài viết mở rộng của Christopher "Monty" Montgomery (người tạo ra Phần mềm miễn phí Ogg và Vorbis) về điều mà ông tin là một trong những quan niệm sai lầm phổ biến và sâu xa nhất trong thế giới phần mềm. những người yêu thích âm nhạc.

Tần số 192 kHz được coi là có hại

Các tệp nhạc kỹ thuật số ở tần số 192 kHz không mang lại bất kỳ lợi ích nào nhưng chúng vẫn có một số tác động. Trong thực tế, chất lượng phát lại của chúng kém hơn một chút và sóng siêu âm xuất hiện trong quá trình phát lại.

Cả bộ chuyển đổi âm thanh và bộ khuếch đại công suất đều dễ bị biến dạng và độ méo có xu hướng tăng nhanh ở tần số cao và thấp. Nếu cùng một loa tái tạo siêu âm cùng với các tần số trong dải âm thanh thì bất kỳ phản hồi phi tuyến nào cũng sẽ chuyển một phần dải siêu âm thành phổ âm thanh dưới dạng biến dạng phi tuyến không kiểm soát được, rối loạn trải rộng trên toàn bộ dải âm thanh nghe được. Tính phi tuyến trong bộ khuếch đại công suất sẽ có tác dụng tương tự. Những hiệu ứng này rất khó nhận thấy, nhưng các thử nghiệm đã xác nhận rằng có thể nghe thấy cả hai loại biến dạng.

Biểu đồ trên cho thấy độ méo do âm thanh 30 kHz và 33 kHz xuyên điều chế trong bộ khuếch đại lý thuyết có độ méo hài tổng không đổi (THD) khoảng 0,09%. Sự biến dạng có thể nhìn thấy được trên toàn bộ quang phổ, ngay cả ở tần số thấp hơn.

Sóng siêu âm không nghe được góp phần làm biến dạng xuyên điều chế trong phạm vi nghe được (vùng màu xanh nhạt). Các hệ thống không được thiết kế để tái tạo siêu âm thường có mức độ méo cao hơn, khoảng 20 kHz, góp phần tạo ra sự xuyên điều chế. Việc mở rộng dải tần để bao gồm siêu âm đòi hỏi phải có sự thỏa hiệp để giảm tiếng ồn và hoạt động biến dạng trong phổ âm thanh, nhưng trong mọi trường hợp, việc tái tạo thành phần siêu âm không cần thiết sẽ làm giảm chất lượng tái tạo.

Có một số cách để tránh biến dạng bổ sung:

  1. Một loa được thiết kế để chỉ tái tạo siêu âm, bộ khuếch đại và bộ tách phổ tín hiệu để tách và tái tạo độc lập siêu âm mà bạn không thể nghe thấy, để không ảnh hưởng đến các âm thanh khác.
  2. Bộ khuếch đại và bộ chuyển đổi được thiết kế để tái tạo dải tần số rộng hơn sao cho siêu âm không gây ra hiện tượng méo sóng hài âm thanh. Do chi phí bổ sung và độ phức tạp của việc triển khai, dải tần số bổ sung sẽ làm giảm chất lượng tái tạo ở phần âm thanh của phổ.
  3. Loa và bộ khuếch đại được thiết kế tốt hoàn toàn không tái tạo siêu âm.
  4. Để bắt đầu, bạn có thể tránh mã hóa một dải tần số rộng như vậy. Bạn không thể (và không nên) nghe thấy sóng hài siêu âm trong dải tần số nghe được trừ khi có thành phần siêu âm trong đó.

Tất cả các phương pháp này đều nhằm mục đích giải quyết một vấn đề, nhưng chỉ có phương pháp 4 là có ý nghĩa.

Nếu bạn quan tâm đến những gì hệ thống của riêng bạn có thể làm, các mẫu sau chứa: âm thanh 30 kHz và 33 kHz ở định dạng WAV 24/96, phiên bản dài hơn ở định dạng FLAC, một vài giai điệu và một đoạn cắt các bài hát thông thường ở 24 kHz sao cho chúng nằm hoàn toàn trong dải siêu âm từ 24 kHz đến 46 kHz.

Các thử nghiệm đo độ méo phi tuyến:

  • Âm thanh 30 kHz + âm thanh 33 kHz (24 bit / 96 kHz)
  • Nhạc chuông 26 kHz – 48 kHz (24 bit/96 kHz)
  • Nhạc chuông 26 kHz – 96 kHz (24 bit/192 kHz)
  • Một đoạn cắt của bài hát giảm xuống 24 kHz (24 bit / 96 kHz WAV) (phiên bản cắt gốc) (16 bit / 44,1 kHz WAV)

Giả sử hệ thống của bạn có khả năng phát tất cả các định dạng ở tốc độ lấy mẫu 96 kHz. Khi phát các file trên, bạn sẽ không nghe thấy bất cứ điều gì, không có tiếng ồn, không có tiếng huýt sáo, tiếng click hay bất kỳ âm thanh nào khác. Nếu bạn nghe thấy điều gì đó thì hệ thống của bạn có phản hồi phi tuyến tính và gây ra hiện tượng méo siêu âm phi tuyến tính có thể nghe được. Hãy cẩn thận khi tăng âm lượng; nếu bạn nhấn vào phần cắt kỹ thuật số hoặc analog, thậm chí là phần mềm, nó có thể gây ra tiếng ồn xuyên điều chế lớn.

Nói chung, thực tế không phải là có thể nghe thấy được các biến dạng phi tuyến do siêu âm trên một hệ thống cụ thể. Biến dạng được đưa ra có thể nhỏ hoặc khá đáng chú ý. Trong mọi trường hợp, thành phần siêu âm không bao giờ là một điều tốt và trong nhiều hệ thống âm thanh sẽ dẫn đến chất lượng tái tạo âm thanh bị giảm sút nghiêm trọng. Trong các hệ thống không bị nó gây hại, khả năng xử lý siêu âm có thể được giữ nguyên hoặc thay vào đó, tài nguyên có thể được sử dụng để cải thiện chất lượng âm thanh của phạm vi âm thanh.

Hiểu sai quy trình lấy mẫu

Lý thuyết lấy mẫu thường không thể hiểu được nếu không có bối cảnh xử lý tín hiệu. Và không có gì đáng ngạc nhiên khi hầu hết mọi người, ngay cả những bác sĩ khoa học xuất sắc trong các lĩnh vực khác, thường không hiểu được điều đó. Cũng không có gì đáng ngạc nhiên khi nhiều người thậm chí không nhận ra rằng họ đã làm sai.

Các tín hiệu được lấy mẫu thường được mô tả dưới dạng một thang lởm chởm, giống như thang ở trên (màu đỏ), trông giống như một tín hiệu gần đúng gần đúng với tín hiệu gốc. Tuy nhiên, cách biểu diễn này chính xác về mặt toán học và khi được chuyển đổi thành tín hiệu tương tự, đồ thị của nó sẽ trở nên mượt mà (đường màu xanh lam trong hình).

Quan niệm sai lầm phổ biến nhất là lấy mẫu là một quá trình khó khăn và dẫn đến mất thông tin. Một tín hiệu rời rạc thường được mô tả như một bản sao lởm chởm, góc cạnh, giống như bước sóng của làn sóng hoàn toàn trơn tru ban đầu. Nếu bạn nghĩ như vậy, thì bạn có thể giả định rằng tốc độ lấy mẫu càng cao (và càng nhiều bit trên mỗi mẫu), các bước sẽ càng nhỏ và phép tính gần đúng sẽ càng chính xác. Tín hiệu số sẽ ngày càng giống tín hiệu tương tự về hình dạng cho đến khi nó có hình dạng giống như tốc độ lấy mẫu có xu hướng vô cùng.

Bằng cách tương tự, nhiều người không liên quan đến xử lý tín hiệu số sẽ nhìn vào hình ảnh bên dưới và nói: “Ugh!” Có vẻ như tín hiệu được lấy mẫu không thể hiện tốt tần số cao của sóng analog, hay nói cách khác, khi tần số âm thanh tăng, chất lượng lấy mẫu giảm và đáp ứng tần số kém đi hoặc trở nên nhạy cảm với pha của tín hiệu đầu vào.

Nó chỉ trông như vậy thôi. Những niềm tin này là sai lầm!

Nhận xét từ ngày 04/04/2013: Để phản hồi tất cả thư liên quan đến tín hiệu kỹ thuật số và các bước mà tôi nhận được, tôi sẽ trình bày hoạt động thực tế của tín hiệu kỹ thuật số trên thiết bị thực trong video Digital Show & Tell của chúng tôi, để bạn không phải tin lời tôi.

Tất cả các tín hiệu dưới tần số Nyquist (một nửa tốc độ lấy mẫu) sẽ được ghi lại một cách hoàn hảo và trọn vẹn trong quá trình lấy mẫu và không cần tốc độ lấy mẫu cao vô hạn cho việc này. Lấy mẫu không ảnh hưởng đến đáp ứng tần số hoặc pha. Tín hiệu analog có thể được khôi phục mà không bị mất - mượt mà và đồng bộ như ban đầu.

Bạn không thể tranh luận với toán học, nhưng khó khăn là gì? Nổi tiếng nhất là yêu cầu giới hạn băng tần. Tín hiệu có tần số cao hơn tần số Nyquist phải được lọc trước khi lấy mẫu để tránh méo do khử răng cưa. Bộ lọc này là bộ lọc khử răng cưa khét tiếng. Trong thực tế, việc khử nhiễu lấy mẫu không thể hoàn hảo, nhưng các công nghệ hiện đại có thể đạt được kết quả rất gần với kết quả lý tưởng. Và chúng ta đến với việc lấy mẫu quá mức.

Lấy mẫu quá mức

Tốc độ lấy mẫu trên 48 kHz không liên quan đến khả năng tái tạo âm thanh có độ trung thực cao nhưng chúng cần thiết đối với một số công nghệ hiện đại. Oversampling (oversampling) là quan trọng nhất trong số đó.

Ý tưởng đằng sau việc lấy mẫu lại rất đơn giản và thanh lịch. Bạn có thể nhớ đến video của tôi “Đa phương tiện kỹ thuật số. Hướng dẫn dành cho người mới bắt đầu" rằng tốc độ mẫu cao tạo ra khoảng cách lớn hơn nhiều giữa tần số cao nhất mà chúng tôi quan tâm (20 kHz) và tần số Nyquist (một nửa tốc độ mẫu). Điều này cho phép bạn sử dụng các bộ lọc khử răng cưa đơn giản và đáng tin cậy hơn, đồng thời tăng độ trung thực. Khoảng trống bổ sung giữa 20 kHz và tần số Nyquist này về cơ bản chỉ là bộ đệm cho bộ lọc tương tự.

Hình trên hiển thị sơ đồ từ video “Đa phương tiện kỹ thuật số. Hướng dẫn dành cho người mới bắt đầu,” minh họa băng thông chuyển tiếp cho DAC hoặc ADC ở 48 kHz (trái) và 96 kHz (phải).

Đây mới chỉ là một nửa trận chiến, vì bộ lọc kỹ thuật số có ít hạn chế thực tế hơn bộ lọc tương tự và chúng ta có thể hoàn thành việc khử răng cưa với độ chính xác và hiệu quả cao hơn. Tín hiệu khô tần số cao đi qua bộ lọc khử răng cưa kỹ thuật số, điều này không gặp vấn đề gì khi lắp dải chuyển tiếp của bộ lọc vào không gian chật hẹp. Sau khi quá trình làm mịn hoàn tất, các phần rời rạc bổ sung trong không gian đệm sẽ được gấp lại một cách đơn giản. Việc phát lại tín hiệu được lấy mẫu lại tiến hành theo thứ tự ngược lại.

Điều này có nghĩa là các tín hiệu có tốc độ mẫu thấp (44,1 kHz hoặc 48 kHz) có thể có cùng độ trung thực, độ mượt và độ răng cưa thấp như các tín hiệu có tốc độ mẫu từ 192 kHz trở lên, nhưng sẽ không xuất hiện bất kỳ nhược điểm nào (sóng siêu âm) gây biến dạng xuyên điều chế, tăng kích thước tập tin). Hầu như tất cả các DAC và ADC hiện đại đều lấy mẫu quá mức ở tốc độ rất cao và ít người biết về điều đó vì nó diễn ra tự động bên trong thiết bị.

DAC và ADC không phải lúc nào cũng có thể lấy mẫu lại. Ba mươi năm trước, một số bảng điều khiển ghi âm đã sử dụng tốc độ lấy mẫu cao để ghi âm chỉ bằng bộ lọc analog. Tín hiệu tần số cao này sau đó được sử dụng để tạo đĩa chính. Quá trình làm mịn và phân tách kỹ thuật số (lấy mẫu lại ở tần số thấp hơn cho CD và DAT) diễn ra ở giai đoạn cuối cùng của quá trình tạo bản ghi. Đây có thể là một trong những lý do ban đầu khiến tốc độ mẫu 96 kHz và 192 kHz trở nên gắn liền với quá trình sản xuất ghi âm chuyên nghiệp.

16bit so với 24bit

Được rồi, bây giờ chúng ta biết rằng việc lưu nhạc ở tần số 192 kHz là vô nghĩa. Chủ đề đã đóng. Nhưng còn âm thanh 16 bit và 24 bit thì sao? Cái gì tốt hơn?

Âm thanh PCM 16 bit không bao phủ đầy đủ dải âm thanh động theo lý thuyết mà con người có thể nghe thấy trong điều kiện lý tưởng. Ngoài ra còn có (và sẽ luôn có) lý do để sử dụng nhiều hơn 16 bit để ghi âm.

Không có lý do nào trong số này liên quan đến việc phát lại âm thanh - trong tình huống này, âm thanh 24 bit cũng vô dụng như việc lấy mẫu 192 kHz. Tin vui là việc sử dụng lượng tử hóa 24-bit không gây hại cho chất lượng âm thanh, đơn giản là nó không làm chất lượng âm thanh tệ hơn hoặc chiếm thêm dung lượng.

Ghi chú cho Phần 2

6. Nhiều hệ thống không thể phát các mẫu 96 kHz sẽ không từ chối phát chúng mà sẽ âm thầm giảm mẫu xuống 48 kHz. Trong trường hợp này, âm thanh sẽ không được tái tạo chút nào và sẽ không có gì trong bản ghi, bất kể mức độ phi tuyến tính của hệ thống.

7. Lấy mẫu quá mức không phải là cách duy nhất để giải quyết tốc độ lấy mẫu cao trong xử lý tín hiệu. Có một số cách về mặt lý thuyết để thu được âm thanh có giới hạn băng tần ở tốc độ mẫu cao và tránh giảm âm, ngay cả khi sau đó nó được lấy mẫu xuống để ghi vào đĩa. Không rõ liệu những phương pháp như vậy có được sử dụng trong thực tế hay không, vì việc phát triển hầu hết các cơ sở chuyên nghiệp đều được giữ bí mật.

8. Dù lịch sử hay không, nhiều chuyên gia ngày nay vẫn sử dụng độ phân giải cao vì họ lầm tưởng rằng âm thanh có nội dung được giữ nguyên trên 20 kHz sẽ nghe hay hơn. Cũng giống như người tiêu dùng.

Bài viết này đã được đọc 33.932 lần.

Định dạng tệp MP3 được gọi là “định dạng mở” được hầu hết các nhà sản xuất hỗ trợ.

Định dạng MP3 là một trong những định dạng mã hóa âm thanh kỹ thuật số phổ biến nhất. Một tính năng của mã hóa âm thanh MP3 là mã hóa bị mất. Tuy nhiên, việc mã hóa dựa trên một mô hình đặc biệt có tính đến các đặc điểm của nhận thức thính giác. Do đó, sự hiện diện của tổn thất không dẫn đến sự suy giảm âm thanh nghiêm trọng.

Các tệp MP3 đã trở thành tiêu chuẩn trên thực tế và được hỗ trợ bởi hầu hết các hệ điều hành phổ biến, nhiều đầu đĩa CD và DVD cũng như các thiết bị khác.

Điều thú vị là tiêu chuẩn này mô tả chính định dạng lưu trữ chứ không phải phương pháp mã hóa âm thanh. Nhờ đó, có rất nhiều công cụ để phát âm thanh ở định dạng MP3.

Codec đặc biệt được sử dụng để mã hóa âm thanh ở định dạng MP3.
Codec âm thanh có thể là một trong hai loại - codec phần cứng và codec phần mềm.

Mã hóa phần cứng được thực hiện bằng cách sử dụng các chip đặc biệt.
Mã hóa phần mềm được thực hiện bằng các chương trình máy tính đặc biệt.

Chất lượng âm thanh ở định dạng MP3 (tất cả những thứ khác đều bằng nhau) phụ thuộc vào mức độ nén (đọc lượng hao hụt) và chương trình mã hóa. Đó là lý do tại sao các đầu phát có thương hiệu sử dụng codec và hệ thống xử lý tín hiệu âm thanh của các thương hiệu nổi tiếng vượt trội đáng kể về chất lượng phát lại của các thiết bị thông thường được lắp ráp từ các linh kiện tiêu chuẩn.

Bản thân chất lượng phát lại phụ thuộc vào lượng luồng dữ liệu từ phương tiện. Đôi khi kích thước của luồng dữ liệu được gọi là độ rộng luồng. Có một thuật ngữ đặc biệt - tốc độ bit. Tốc độ luồng dữ liệu được xác định bằng kilobit trên giây và được ký hiệu là kbs, kbps, kb/s. Bản ghi có thể được mã hóa theo nhiều cách - với tốc độ bit không đổi và tốc độ bit thay đổi. Tốc độ bit thay đổi giúp bảo toàn chi tiết bằng cách tăng lượng dữ liệu.

phát nhạc chất lượng cao Không phải tốc độ luồng dữ liệu nào cũng phù hợp, xem Bảng 1

Tốc độ bit MP3 và ứng dụng

Bảng 1

Dữ liệu hiển thị trong Bảng 1 chỉ có thể dùng làm hướng dẫn. Thực tế là vào thời điểm định dạng MP3 xuất hiện, chất lượng của thiết bị âm thanh có nhu cầu đại chúng không cao lắm. Nhiều ấn phẩm có thẩm quyền lập luận nghiêm túc rằng luồng dữ liệu 128 kb/s là khá đủ để tái tạo âm thanh chất lượng cao.

Hiện tại, tốc độ bit ít nhất 192 kb/s được coi là chất lượng cao. Hơn nữa, việc áp dụng rộng rãi các hệ thống hi-fi, cao cấp và rạp hát tại nhà đã dẫn đến sự thay đổi lớn theo hướng tái tạo âm thanh chất lượng cao.

Do đó, những sai sót trong việc tái tạo âm thanh, vốn không được chú ý trên các thiết bị bình dân trước đây, sẽ trở nên đáng chú ý đối với “người nghe chưa chuẩn bị” sử dụng thiết bị chất lượng cao hiện đại. Nhân tiện, trình độ của “người nghe không chuẩn bị trước” này đã tăng lên đáng kể.

Nhìn chung, ý tưởng về nén (và đặc biệt là nén lossy) đang dần trở nên lỗi thời. Xuất hiện trong thời đại phương tiện lưu trữ đắt tiềnkênh truyền dữ liệu dung lượng thấp, ý tưởng nén dữ liệu đã hoàn thành xuất sắc nhiệm vụ chính của nó. Tuy nhiên, những người yêu thích âm thanh đang dần chuyển sang tốc độ bit cao hơn (nén ít hao hụt hơn) hoặc thậm chí sang các định dạng nén “không mất dữ liệu” hoặc thậm chí không nén.

Tính thực tế của các định dạng nén và đặc biệt là định dạng MP3 đã dẫn đến sự ra đời của máy nghe nhạc MP3 nhỏ gọn, được tích hợp trên chip nhớ hoặc trên các ổ cứng thu nhỏ.

Khi chọn một hoặc một mẫu máy nghe nhạc khác, một câu hỏi đặt ra liên quan đến dung lượng bộ nhớ của nó. Đương nhiên, người dùng muốn ước tính trước lượng tài liệu âm nhạc mà mình có thể lưu trữ trên máy nghe nhạc MP3 của mình tại một thời điểm.

Dữ liệu gần đúng về kích thước của tệp và thời lượng âm thanh được thu thập trong Bảng 2. Khi sử dụng Bảng 2, cần lưu ý rằng đây là những dữ liệu gần đúng cho phép bạn ước tính dung lượng bộ nhớ cần thiết của đầu phát hoặc phương tiện di động.

Thời lượng của tệp MP3 và mức độ nén

ban 2

Tốc độ bit,
kb/s

ghi âm 1 phút,
K.B.

Tiêu chuẩn
sáng tác 3 phút,
M.B.

Tiêu chuẩn
sáng tác 4 phút,
M.B.

Tiêu chuẩn
sáng tác 5 phút,
M.B.

Ghi chú vào Bảng 2
Mức độ nén cao tương ứng với 56 kb/s, mức độ nén thấp và chất lượng âm thanh cao tương ứng với 320 kb/s

Bảng 3 cung cấp dữ liệu biểu thị về tổng thời lượng của bản ghi âm - thời gian chơi của người chơi với một lượng bộ nhớ cụ thể.

Tổng thời gian phát của máy nghe nhạc MP3 tùy thuộc vào kích thước bộ nhớ

bàn số 3

Thời lượng chơi

Kích thước bộ nhớ,
G.B.

Tốc độ bit, kb/s

phút
Giờ

phút
Giờ

phút
Giờ

phút
Giờ

phút
Giờ

phút
Giờ

Theo như có thể đánh giá từ Bảng 3, 8 GB là đủ để lưu trữ các bản ghi âm ở định dạng MP3 chất lượng cao nhất với số lượng phù hợp để nghe 8 giờ mỗi ngày trong một tuần (7 ngày). Không có sự lặp lại! Hầu như không có ai thực sự có nhu cầu như vậy.

Ngay cả trong trường hợp này, bạn có thể cập nhật bản ghi trên trình phát không quá một lần một tuần.

trang web năm 2013. Đã đăng ký Bản quyền.

Hẹn gặp lại bạn trên Web!

Cách bật Wi-Fi trên máy tính xách tay Asus
Vista - cách giải phóng dung lượng ổ đĩa
Kết nối modem 3G MTS
Khối lượng và chất lượng của tập tin MP3
Phương pháp và thực hành chọn máy nghe nhạc MP3, phần 1
Phương pháp và thực hành chọn máy nghe nhạc MP3, phần 2
Vista - cách mở dấu nhắc lệnh trong một thư mục
Cách in tên tệp từ một thư mục
Cách lưu tên file dưới dạng văn bản
Cách sao chép tên file trong MS Excel
Đèn pin USB LED
Thiết bị và thiết kế của tai nghe
Làm thế nào để chọn tai nghe?
Làm thế nào để tai nghe ở đúng vị trí?
Thiết bị cấp nguồn - pin
Kích thước thẻ SIM
Thiết bị cấp nguồn - phích cắm và ổ cắm
Nguồn điện cho các thiết bị - adapter

Tốc độ bit được chỉ định là một trong những đặc điểm chính của bản ghi video và âm thanh. Hầu hết người dùng đều quen với suy nghĩ rằng nó quyết định chất lượng của file tải xuống. Nhưng tốc độ bit là gì và chúng thực sự mô tả đặc điểm của các tệp nhạc và video như thế nào? Hãy xem xét điều này chi tiết hơn.

Tốc độ bit là gì?

Tốc độ bit là giá trị hiển thị số đơn vị thông tin (megabit hoặc kilobit) có trong một giây phát lại tệp. Theo đó, nó được đo bằng megabit trên giây (Mbps) hoặc kilobit trên giây (Kbps). Mặt khác, tốc độ bit có thể được mô tả là băng thông. Đặc điểm này rất quan trọng đối với những người muốn chuyển đổi tệp vì với cùng thời lượng, tốc độ bit cao hơn sẽ dẫn đến tệp lớn hơn. Ngoài kích thước, chất lượng âm thanh cũng thay đổi. Giảm kích thước khi tốc độ bit giảm được gọi là nén.

Một tệp nhạc phổ biến là một tệp âm thanh được nén đến mức có thể chứa tối đa 12 giờ nhạc trên một đĩa tiêu chuẩn. Đồng thời, chất lượng vẫn khá cao nhờ khả năng nén âm thanh tâm lý: âm thanh có tần số và mức âm lượng mà tai người không thể thu được sẽ bị loại bỏ khỏi toàn bộ dải. Các âm thanh được chọn sẽ được tạo thành các khối riêng biệt gọi là khung. Các khung hình có cùng thời lượng âm thanh và được nén theo một thuật toán nhất định. Khi nhạc được phát, tín hiệu được tái tạo từ các khối được giải mã theo một trình tự cụ thể.

Cách nén nào thường được sử dụng?

Tốc độ bit âm thanh thường là 256 Kbps. Ở giá trị này, bản ghi âm thanh được nén với kích thước khoảng 6 lần, cho phép bạn ghi nhạc trên một đĩa nhiều hơn 6 lần so với trước khi nén. Nếu tốc độ bit giảm xuống 128 Kbps, thì một đĩa sẽ chứa nhiều nhạc hơn gấp 12 lần, nhưng chất lượng âm thanh sẽ thấp hơn đáng kể. Nhạc được ghi ở chất lượng 128 Kbps thường được cung cấp để nghe trên Internet, vì để tăng tốc độ tải trang, chủ sở hữu tài nguyên sẽ phải hy sinh. Nhiều người dùng lưu ý rằng chất lượng của nó không còn lý tưởng nữa.

Bây giờ đã rõ bitrate là gì, đã đến lúc xác định mức tối ưu của chúng. Cả người nghiệp dư và chuyên nghiệp đều tranh luận không ngừng về việc tốc độ bit ảnh hưởng như thế nào đến chất lượng âm thanh, nếu có. Trên các album nhạc, theo quy định, tốc độ bit được chỉ định. Cùng một đĩa ghi ở tốc độ 128 Kbit/s và 256 Kbit/s sẽ đắt gấp đôi.

Tốc độ bit tối ưu trong các điều kiện nghe khác nhau

Đối với nhiều người, nén 12x không gây hại gì, trong khi những người khác cho rằng họ không thể nghe nhạc có tốc độ bit thấp hơn 320 Kbps. Nghịch lý thay, cả hai đều đúng. Thực tế là chất lượng phát lại cuối cùng không phụ thuộc vào điều kiện phát lại và thậm chí cả loại nhạc.

Ví dụ, một bài hát được phát trên máy ghi âm lắp trên ô tô nội địa. Trong trường hợp này, chất lượng 192 Kbps sẽ khá đủ. Tốc độ bit cao hơn sẽ cải thiện chất lượng âm thanh, nhưng sự khác biệt sẽ không đáng chú ý do độ ồn cao trong suốt chuyến đi. Nếu nhạc được phát trên máy tính ở nhà hoặc máy nghe nhạc di động thì cần ít nhất 256 Kbps. Nếu tín hiệu không bị thay đổi, được truyền đến các thiết bị bên ngoài và xuất ra các loa nhập khẩu đắt tiền, thì nếu có thể, bạn nên sử dụng phương pháp nén tối thiểu. Có thể ở tốc độ bit 320 Kbps.

Tốc độ bit tối ưu cho nhiều phong cách âm nhạc khác nhau

Âm nhạc có tốc độ bit cao không phải lúc nào cũng cần thiết. Âm nhạc phổ biến thường có âm thanh khá tốt ở tốc độ bit 192-256 Kbps. Bạn có thể đặt chất lượng cao hơn, nhưng làm như vậy chẳng ích gì: các bài hát nhạc pop không tồn tại lâu, vì vậy việc tiết kiệm dung lượng ổ đĩa phải là ưu tiên hàng đầu. Ngoài ra, chất lượng của bản ghi nguồn cũng ở mức trung bình nên việc tăng tốc độ bit có thể không ảnh hưởng đến chất lượng của tệp được phát. Để nghe trong giao thông và các bữa tiệc thân mật, chất lượng trung bình là khá đủ.

Nếu chúng ta đang nói về âm nhạc cổ điển, tác phẩm của các ban nhạc rock huyền thoại hay những bài hát gốc hiếm hoi thì chất lượng phải là trên hết. Khi mua những bản nhạc như vậy, bạn cần xem tốc độ bit ghi trên bao bì đĩa. Nếu bài hát được tải xuống từ Internet thì thông tin đó sẽ xuất hiện trên trang tải xuống. Ngoài ra, tốc độ bit được hiển thị trong trình phát trong khi phát lại.

Tốc độ bit của tệp video

Ở trên chúng ta đã thảo luận về tốc độ bit của bản ghi âm. Nhưng tốc độ bit của video là gì? Xét rằng video được phát dưới dạng một chuỗi âm thanh và hình ảnh, định nghĩa về tốc độ bit sẽ tương tự. Sự hiện diện của video làm cho tệp nặng hơn, nhưng cuối cùng, hình ảnh đối với bộ xử lý cũng giống như số 0 và số 1 như âm thanh. Nguyên tắc mã hóa thông tin là giống nhau đối với tất cả các loại tệp.

Tốc độ bit thường được sử dụng để đo tốc độ truyền hiệu quả của luồng dữ liệu qua kênh, nghĩa là kích thước tối thiểu của kênh có thể truyền luồng này mà không bị trễ.

Tốc độ bit được biểu thị bằng số bit trên giây (bit/s, bps), cũng như các đại lượng dẫn xuất có tiền tố kilo- (kbit/s, kbps), mega- (Mbit/s, Mb/giây) vân vân.

Tốc độ dữ liệu sử dụng bit trên khối giây (ký hiệu: "bit/s"), thường được sử dụng kết hợp với các tiền tố của Hệ thống đo lường quốc tế (SI) như "kilo" (1 kbit/s = 1024 bit/s), "mega" (1 Mbit/s = 1024 kbit/s), "giga" (1 Gbit/s = 1024 Mbit/s) hoặc "tera" (1 Tbit/s = 1024 Gbit/s). Chữ viết tắt không chuẩn "bps" thường được sử dụng để thay thế ký hiệu "bit/s" tiêu chuẩn, do đó, ví dụ: "1 Mbit" được sử dụng để biểu thị một triệu bit mỗi giây. Một byte trên giây (1 B/s) tương ứng với 8 bit/s.

YouTube bách khoa toàn thư

  • 1 / 5

    Trong các định dạng video và âm thanh phát trực tuyến (chẳng hạn như MPEG và MP3) sử dụng tính năng nén bị mất, tham số tốc độ bit biểu thị mức độ nén của luồng và từ đó xác định kích thước của kênh mà luồng dữ liệu được nén. Thông thường, tốc độ bit âm thanh và video được đo bằng kilobit trên giây (kilobit trên giây, kbps), ít thường xuyên hơn - tính bằng megabit trên giây (chỉ dành cho video).

    Có ba chế độ nén để truyền dữ liệu:

    • CBR(eng. Tốc độ bit không đổi) - với tốc độ bit không đổi;
    • VBR(eng. Tốc độ bit có thể thay đổi) - với tốc độ bit có thể thay đổi;
    • ABR(eng. Tốc độ bit trung bình) - với tốc độ bit trung bình.

    Tốc độ truyền thông tin

    Tốc độ bit ròng của lớp vật lý, tốc độ bit thông tin, tần số tải trọng, tần số tải trọng, tốc độ bit mạng, tốc độ bit được mã hóa, tốc độ bit hiệu dụng hoặc tốc độ cấp dây (ngôn ngữ không chính thức) của kênh truyền thông kỹ thuật số là khả năng mà không tính đến giao thức lớp phủ lớp vật lý, dành cho một ví dụ ghép kênh, các bit đóng khung mô hình phân chia thời gian (TDM), mã sửa lỗi chuyển tiếp dành riêng (FEC), bộ cân bằng ký hiệu huấn luyện và mã hóa kênh khác. Mã chống nhiễu rất phổ biến, đặc biệt là trong các hệ thống truyền thông không dây, tiêu chuẩn modem băng thông rộng hoặc mạng cục bộ dựa trên đồng tốc độ cao hiện đại. Tốc độ bit thuần của lớp vật lý là tốc độ dữ liệu được đo tại điểm tham chiếu tại giao diện giữa lớp liên kết và lớp vật lý và do đó có thể bao gồm đường dữ liệu cũng như lớp tải.

    Trong các modem và hệ thống không dây, việc thích ứng liên kết (tự động thích ứng tốc độ dữ liệu và điều chế và/hoặc các lỗi sơ đồ mã hóa, chất lượng tín hiệu) thường được sử dụng. Trong ngữ cảnh này, thuật ngữ tốc độ bit cao nhất có nghĩa là tốc độ bit thuần túy của chế độ truyền nhanh nhất và kém tin cậy nhất, được sử dụng chẳng hạn [khi khoảng cách rất ngắn] giữa người gửi và người phát. Một số hệ điều hành và thiết bị mạng có thể phát hiện "tốc độ liên kết" (ngôn ngữ không chính thức) của một công nghệ truy cập mạng hoặc thiết bị liên lạc cụ thể, từ đó gợi ý tốc độ truyền dữ liệu mạng hiện tại. Cần lưu ý rằng thuật ngữ tốc độ đường truyền được định nghĩa trong một số sách giáo khoa là tốc độ bit tổng và ở các sách khác là tốc độ bit ròng.

    Mối quan hệ giữa tốc độ bit tổng hợp và tốc độ dữ liệu ròng phụ thuộc vào tốc độ mã FEC như sau.

    Tốc độ không đổi

    Tốc độ không đổi- một biến thể của mã hóa dữ liệu phát trực tuyến, trong đó ban đầu người dùng đặt tốc độ bit cần thiết, tốc độ này không thay đổi trong toàn bộ tệp.

    Ưu điểm chính của nó là khả năng dự đoán khá chính xác kích thước của tệp cuối cùng.

    Tuy nhiên, tùy chọn tốc độ bit không đổi không phù hợp lắm với các tác phẩm âm nhạc có âm thanh thay đổi linh hoạt theo thời gian vì nó không cung cấp tỷ lệ kích thước/chất lượng tối ưu.

    Tốc độ bit thay đổi

    VỚI tốc độ bit thay đổi Bộ giải mã chọn giá trị tốc độ bit dựa trên các tham số (mức chất lượng mong muốn) và tốc độ bit có thể thay đổi trong đoạn được mã hóa. Khi nén âm thanh, tốc độ bit yêu cầu được xác định dựa trên mô hình âm thanh tâm lý. Phương pháp này cho tỷ lệ kích thước tệp đầu ra/chất lượng tốt nhất, nhưng kích thước chính xác của nó rất khó dự đoán. Tùy thuộc vào bản chất của âm thanh (hoặc hình ảnh, trong trường hợp mã hóa video), kích thước của tệp kết quả có thể khác nhau nhiều lần.

    Tốc độ bit trung bình

    Tốc độ bit trung bình là sự kết hợp giữa tốc độ bit không đổi và biến đổi: giá trị tính bằng kbit/s do người dùng đặt và chương trình thay đổi giá trị đó trong một số giới hạn nhất định. Tuy nhiên, không giống như VBR, codec sử dụng các giá trị tối đa và tối thiểu có thể một cách thận trọng mà không có nguy cơ vượt quá giá trị trung bình do người dùng chỉ định. Phương pháp này cho phép bạn đặt tốc độ xử lý linh hoạt nhất (đối với âm thanh, tốc độ này có thể là bất kỳ số nào trong khoảng từ 8 đến 320 kbps, so với bội số của 16 trong phương pháp CBR) và dự đoán kích thước của tệp đầu ra với độ chính xác cao hơn nhiều (so với VBR ).

    MP3

    Định dạng nén âm thanh lossy MP3. Chất lượng âm thanh được cải thiện khi tốc độ bit tăng:

    • 32 kbps - thường chỉ chấp nhận được cho giọng nói
    • 96 kbps - thường được sử dụng cho giọng nói hoặc âm thanh truyền phát chất lượng thấp
    • 128 hoặc 160 kbps - mã hóa âm nhạc cấp cơ bản
    • 192 kbps - chất lượng mã hóa nhạc chấp nhận được
    • 256 kbps - mã hóa nhạc chất lượng cao
    • 320 kbps - chất lượng mã hóa cao nhất được hỗ trợ bởi tiêu chuẩn MP3