Làm chủ ngược: Có thể tăng phạm vi động của bản ghi nén không? Âm thanh sống động ở các cấp độ có thể phá hủy của Rainbow Six: Siege

VOLOGDIN E.I.

PHẠM VI ĐỘNG

ÂM THANH KỸ THUẬT SỐ

Ghi chú bài giảng

Saint Petersburg

Dải âm thanh và âm nhạc sống động.................................................. ............................

Dải động của bản ghi âm................................................................. ................................................................. ..........

Dải động âm thanh kỹ thuật sốđường................................................................. .........

Mở rộng dải động bằng công nghệ Dithering.....

Mở rộng dải động bằng công nghệ Noise Shaping

.......................................................................................................................................................

Thư mục................................................ . ................................................................. ..................

1. Dải âm thanh và âm nhạc sống động

Một người nghe thấy âm thanh một cách cực kỳ phạm vi rộngáp lực âm thanh. Phạm vi này kéo dài từ ngưỡng nghe tuyệt đối đến ngưỡng đau 140 dB SPL so với mức 0, được coi là áp suất 0,00002 Pa (Hình 1). Vùng rủi ro trong hình này biểu thị vùng áp suất âm thanh khi

Ngưỡng nghe tuyệt đối

Tần số âm, kHz

Cơm. 1. Vùng thính giác

tiếp xúc lâu dài có thể dẫn đến mất thính giác hoàn toàn. Ngưỡng đau đối với âm thanh phụ thuộc vào tần số; đối với âm thanh có phổ tùy ý, mức áp suất 120 dB SPL được lấy làm ngưỡng đau. Đồ thị ngưỡng nghe tuyệt đối được mô tả khá chính xác bằng đẳng thức thực nghiệm

Trong im lặng, thính giác của một người tăng lên, và trong môi trường có âm thanh lớn, thính giác của con người giảm đi; do đó thính giác thích nghi với môi trường âm thanh xung quanh. phạm vi năng động thính giác không quá lớn - khoảng 70,80 dB. Từ trên cao, nó bị giới hạn bởi áp suất 100 dB SPL và từ bên dưới bởi tiếng ồn với mức -30...35 dB SPL. Dải động này có thể được dịch chuyển lên xuống tới 20 dB. Để cảm nhận âm nhạc thoải mái, áp suất âm thanh không được vượt quá 104 dB SPL ở nhà và 112 dB SPL trong các phòng được trang bị đặc biệt.

Phạm vi âm nhạc năng độngđược xác định bằng tỷ số decibel của âm thanh lớn(fortissimo) và chính anh ấy âm thanh yên tĩnh(Rất nhẹ nhàng). Phạm vi năng động của âm nhạc giao hưởng là 65...75 dB, và tại các buổi hòa nhạc nhạc rock, nó tăng lên

lên tới 105 dB, trong khi đỉnh áp suất âm thanh có thể đạt tới 122...130 dB SPL.

Dải động của người biểu diễn giọng hát không vượt quá 35...45 dB (Bảng 1).

Phạm vi năng động của âm nhạc phụ thuộc đáng kể vào việc lựa chọn mức tối đa

áp suất âm thanh P max, vì nó bị giới hạn từ bên dưới bởi ngưỡng tuyệt đối

khả năng nghe được. Sự phụ thuộc này thể hiện rõ nhất ở các rìa của dải âm thanh.

Trong bộ lễ phục. 2

ví dụ về những thay đổi trong dải động của âm thanh được đưa ra. TRONG

Ngưỡng đau 120dB

Pmax

80dB

DR 40 dB

50dB

80dB

50dB

Ngưỡng tuyệt đối

khả năng nghe được

Tần số âm, kHz

Cơm. 2. Phạm vi âm nhạc và ngưỡng nghe động

tùy thuộc vào sự lựa chọn của P max

và tần số của âm thanh

năng động

phạm vi

Giảm 80 dB ở các cạnh

dải âm thanh lên tới 40

Đó là lý do tại sao

Người ta thường đo dải động của âm thanh ở tần số 1 kHz, trên đó anh ấy có thể

đạt 117 dB.

phòng che giấu âm thanh và do đó làm giảm dải động của nó

âm nhạc từ bên dưới. Hình 3. thể hiện khi áp suất âm thanh giảm từ 120 xuống 80 dB

Dải động SPL của âm nhạc do tiếng ồn trong phòng giảm từ 90 xuống 50 dB.

120 dB SPL

DR 90 dB

Ảnh hưởng

đầy đủ

sao nhãng

chỉ khi

90dB

90dB

mức tối thiểu của âm thanh âm nhạc.

70dB

Trong phòng thu âm, độ ồn không

90dB

vượt quá

căn hộ

50dB

nói chuyện

tăng mức độ

tiếng ồn lên tới 60dB SPL.

Đây là lý do tại sao âm nhạc êm dịu thường bị át đi

Tiếng ồn trong căn hộ

cơ sở

buổi thử giọng

không tự nguyện

phát sinh

tăng

âm lượng.

Tiếng ồn lượng tử hóa có màu trắng

tiếng ồn, tai có thể cảm nhận được khi nó

Tiếng ồn trong studio

cường độ thấp tới 4 dB SPL, ngay cả khi

tiếng ồn chung của thiết bị âm thanh trong phòng

đạt tới

Cơm. 3. Dải động của âm nhạc

phải được so sánh với thực tế là toàn bộ

thang đo FS Đồng hồ số mức độ

tương ứng với mức từ 105 đến 112 dB SPL. Vì vậy đối với

mặt bằng hộ gia đình

Dải động của âm nhạc không được vượt quá 101 - 108 dB.

Phạm vi hoạt động của microđược xác định theo cách tương tự như thường được thực hiện trong đường dẫn điện. Giới hạn trên bị giới hạn bởi giá trị cho phép của biến dạng phi tuyến và giới hạn dưới bị giới hạn bởi mức nhiễu nội tại. Micro phòng thu hiện đại cho phép áp suất âm thanh tối đa là 125...145 dB SPL, trong khi biến dạng phi tuyến không vượt quá 0,5%...3%. Mức ồn riêng của micrô là 15...20 dBA, dải động từ 90 đến 112 dBA và tỷ lệ tín hiệu trên tạp âm là 70 đến 80 dBA. Những micrô này bao phủ toàn bộ phạm vi nghe của con người từ 120 dB SPL đến mức tiếng ồn phòng thu là 20 dB SPL. Trong các studio hiện đại, việc ghi âm được thực hiện bằng cách sử dụng ADC 22 hoặc 24 bit, đôi khi sử dụng lượng tử hóa dấu phẩy động, do đó không có vấn đề gì với dải động. Thiết bị như vậy là cực kỳ đắt tiền.

2. Dải động của bản ghi âm

Tín hiệu âm nhạc và giọng nói là một chuỗi các xung âm thanh tăng nhanh và giảm dần chậm hơn (Hình 4.). Tín hiệu như vậy được đặc trưng RMS và giá trị mức cao nhất, sự khác biệt giữa các mức này được gọi là hệ số đỉnh. Sóng vuông (sóng vuông) có hệ số đỉnh đơn vị là 0 dB và sóng hình sin có hệ số đỉnh đơn vị là 3 dB. Bản ghi âm của tín hiệu âm nhạc và lời nói có hệ số cực đại lên tới 20 dB trở lên. Thời gian xác định Hệ số đỉnh liên quan đến thời gian tích phân khi tính giá trị bình phương trung bình gốc của tín hiệu và thường bằng 50 ms.

Dải động và hệ số đỉnh của bản ghi âm âm nhạc được xác định bằng cách xử lý thống kê các giá trị tín hiệu tức thời. Các đặc điểm thống kê chi tiết nhất được tính toán trong biên tập âm thanh Buổi thử giọng 3 (Hình 4).

Hình 4. Các mảnh bản ghi âm của các đoạn trích âm nhạc có thời lượng khác nhau

Trong số này, những cái chính như sau: Biên độ đỉnh (L pic), Công suất RMS tối đa (L max), Công suất RMS tối thiểu (L phút) và Công suất RMS trung bình (L avr) (mức tối đa,

giá trị công suất tín hiệu gốc trung bình (hiệu quả) tối thiểu và trung bình).

Dải động của bản ghi âm theo bảng này được xác định là

DR mL picL phút,

hệ số đỉnh được tính bằng công thức

PF mL picL avr

Phạm vi động cũng có thể được xác định từ biểu đồ phân bố các mức ghi âm được hiển thị trong Hình 5. Thật thuận tiện để thực hiện nhanh chóng các thao tác như vậy trước và sau khi xử lý động bản ghi âm.

Hình 4. Đặc điểm thống kê bản ghi âm bản nhạc “Elise” của Beethoven

Hình.5. Biểu đồ phân bố bản nhạc "Elise" của Beethoven

tùy theo nhiệm vụ nghiên cứu. Ví dụ: nếu phạm vi động của các giá trị tức thời của mức ghi âm là quan trọng thì thời gian tích hợp sẽ là 1-5 ms. Nếu dải động của âm nhạc được đo có tính đến cảm nhận thính giác thì thời gian tích hợp được chọn là 60 ms, đây là hằng số thời gian nghe.

cho phép bạn xác định phạm vi động và hệ số đỉnh với xác suất nhất định tại thời điểm tích hợp đã chọn. Trong trình chỉnh sửa âm thanh Adobe thử giọng 3, chuẩn hóa biểu đồ được sử dụng, trong đó xác suất tối đa của các sự kiện luôn tương ứng với giá trị 100. Biểu đồ như vậy mô tả phân bố xác suất của các mức tín hiệu ghi âm so với giá trị tối đa. Khi xây dựng nó, thang đo dọc theo trục X được chọn tự động nên rất khó so sánh biểu đồ của các bản ghi âm khác nhau.

Công dụng thực tế. Ai cần nó và tại sao? thông tin thống kê và biểu đồ của bản ghi âm. Trước hết, dữ liệu này cung cấp sự hỗ trợ vô giá trong quá trình xử lý động của bản ghi âm, vì nó cho phép người ta lựa chọn hợp lý các đặc tính của bộ nén và bộ mở rộng. Kết quả thống kê việc xử lý bản ghi âm với âm nhạc thuộc nhiều thể loại khác nhau giúp có thể xác định dải động cần thiết của đường dẫn điện âm và đưa ra các yêu cầu về công suất cực đại và trung bình của đầu loa. Chúng đóng một vai trò quan trọng trong việc phát triển các thuật toán nén tín hiệu âm thanh.

Âm nhạc giàu cảm xúc với dải động rộng và đỉnh cao

yếu tố chỉ có thể được nghe trên thiết bị đắt tiền chất lượng cao với chất lượng tốt

âm học

các đơn vị.

tai nghe và trong ô tô do tiếng ồn động

Tầm 15 bị giảm và cô ấy

thật kinh tởm.

Vì vậy, những hồ sơ như vậy không có nhu cầu rộng rãi và,

tất yếu, hàng năm phạm vi năng động và đỉnh cao

Hình 7. Bản ghi âm bài hát “I'll Be There For You”

Cơm. 6. Yếu tố đỉnh CD

bản ghi âm được các nhà sản xuất cố tình giảm bớt (Hình 6.). Trên đĩa CD hiện đại

Trên đĩa, trong hầu hết các trường hợp, dải động không vượt quá 20 dB và hệ số đỉnh là

hơn 3 dB một chút, khá đủ cho nhạc dance. Trong hình 7. được cho

hình ảnh của một bản ghi âm hiện đại từ đĩa CD.

3. Dải động của đường dẫn âm thanh kỹ thuật số

Đường dẫn kỹ thuật số thông thường

bao gồm ADC và DAC.

Cái đầu tiên thực hiện

lượng tử hóa tín hiệu tương tự và chuyển đổi chúng thành dòng kỹ thuật số. Thứ hai

đảo ngược chuyển đổi luồng kỹ thuật số thành tín hiệu tương tự.

Lượng tử hóa

làm tròn

trình tự mẫu

sang số nguyên nhị phân

ý nghĩa. Với điều chế mã xung (PCM), điều này

hoạt động

đã tiến hành

tuyến tính

bộ lượng tử hóa, được gọi trong tài liệu kỹ thuật Mid-

Bước đi. bạn

tỷ số truyền của anh ấy

có hình dạng

"cầu thang" có các bậc giống hệt nhau

Nhất thiết,

một số lẻ các mức lượng tử hóa. Làm tròn

dữ liệu số trong bộ lượng tử hóa này được tạo ra

gần nhất

giá trị nhị phân (Hình 8).

Thuật toán này

thường được gọi là làm tròn.

thuật toán

ngày nghỉ

bộ lượng tử hóa

đối xứng qua trục thời gian và lượng tử hóa

Cơm. 8. Bánh răng

được thực hiện với ngưỡng bằng

0,5 bước lượng tử hóa

hàm lượng tử hóa

Miễn là tín hiệu đầu vào nhỏ hơn ngưỡng này thì tín hiệu đầu ra

Mid-Tread và Mid-Riser

tín hiệu lượng tử hóa bằng 0, nó có nghĩa là

lượng tử hóa được thực hiện với một điểm cắt trung tâm.

tín hiệu đầu vào cao hơn ngưỡng lượng tử hóa một chút, tín hiệu đầu ra có dạng

chuỗi các xung có chu kỳ hoạt động tùy thuộc vào

từ cấp độ

Khi mức GS tiếp tục tăng, tín hiệu đầu ra dạng bậc thang sẽ được hình thành.

Việc làm tròn dữ liệu số trong bộ lượng tử hóa Mid-Riser được thực hiện đến giá trị nhỏ hơn gần nhất (Hình 8), vì vậy thuật toán này thường được gọi là cắt bớt. Mid-Riser Quantizer khác biệt ở chỗ không có ngưỡng lượng tử hóa nên truyền tín hiệu âm thanh ở mức rất nhỏ, thậm chí thấp hơn

tiếng ồn. Tuy nhiên, trong trường hợp không có ES, bất kỳ nhiễu không đáng kể nào cũng tạo ra ở đầu ra một chuỗi xung ngẫu nhiên có biên độ 1 lượng tử, có nghĩa là bộ lượng tử hóa như vậy sẽ khuếch đại nhiễu.

Dải động của ADC với bộ lượng tử hóa Mid-Tread được xác định thông qua logarit của tỷ số cực đại và giá trị tối thiểu tín hiệu hình sin ở đầu vào lượng tử hóa

DR A tối đa 20 logA,

Amin

Q 2 (q 1), A

Q – bước lượng tử hóa, q – số bit. Đó là lý do tại sao

DRA

Câu 2 (q 1)

) 6,02q (1)

Câu 2

Ở q = 8, dải động này là 48 dB và ở q = 16, nó tăng lên 96 dB. Giá trị DR A xác định giới hạn dưới của dải động dựa trên mức tín hiệu đầu vào của bộ lượng tử hóa Mid-Tread.

Dải động DACđược đo theo khuyến nghị của tiêu chuẩn EIAJ thông qua tỷ số giữa giá trị rms cực đại của tín hiệu

hình sin Tối đa ở đầu ra của nó đến giá trị bình phương trung bình gốc của nhiễu lượng tử hóa được đo trong dải từ 0 đến tần số Nyquist F N

Amax

Câu 2 (q 1)

Amax

q 1, 76;q

Tại q = 16

DR R = 98 dB, trong đó

decibel

phạm vi năng động

lượng tử hóa được xác định theo công thức (1). Dải động của DAC được đo theo cách này được xác định bằng giá trị SNR của nó.

Nếu dải tần trên bị giới hạn bởi giá trị F max F N thì công thức tính SNR và DR R có dạng

SNR R DR R 6,02q 1,76 10 log

2 F tối đa

trong đó f s - tần số lấy mẫu, F max - tần số tối đa phạm vi âm thanh. Tại

f s = 44,1 kHz và F max = 20 kHz và SNR R =DR R = 98,5 dB. Như bạn có thể thấy, tỷ lệ tín hiệu trên tạp âm chỉ lớn hơn dải động 2 decibel. Cần lưu ý rằng giá trị SNR phụ thuộc vào tần số fs và F max, trong khi DR không phụ thuộc vào các tham số này.

Tuy nhiên, hầu hết các ấn phẩm kỹ thuật đều đánh đồng dải động với tỷ lệ tín hiệu trên nhiễu. Điều này được xác nhận bởi cả AES 17 và

IEC 61606.

Tiêu chuẩn IEC 61606 khuyến nghị đo SNR và DR khi tín hiệu hình sin có tần số 997 Hz và mức âm 60 dB FS được đưa vào đầu vào của ADC với việc bắt buộc sử dụng công nghệ TPDF Dithering. Trong trường hợp này, tỷ lệ tính toán cho SNR do nhiễu bổ sung được đưa vào được đề xuất ở dạng

SNR T DR T 6,02q 3,01 10 log

2 F tối đa

Trong cùng điều kiện, DR = SNR = 93,7 dB chứ không phải 96 dB như thường thấy trong tài liệu kỹ thuật. Do đó, phạm vi động được tính toán cũng giảm. Thay vì SNR, nghịch đảo của nó thường được sử dụng để xác định mức nhiễu lượng tử hóa tích phân

LnTSNR T.

Theo tiêu chuẩn IEC 61606, phép đo DR R dải động được thực hiện theo sơ đồ trong Hình 9. Trong sơ đồ này, bài kiểm tra

Hình..9. Mạch đo dải động DAC

tín hiệu số có tần số 1 kHz và mức âm 60 dB, được tạo bằng công nghệ phối màu TPDF, được đưa đến đầu vào của DAC. Tín hiệu tương tự từ DAC được đưa đến đầu vào của bộ lọc thông thấp có tần số cắt là 20 kHz, hạn chế phổ nhiễu lượng tử hóa. Tiếp theo, quá trình lọc được thực hiện bằng bộ lọc trọng số loại A, có tính đến các đặc điểm nhận thức thính giác về tiếng ồn lượng tử hóa, làm tăng dải động thêm 2-3 dB. Tín hiệu kiểm tra và nhiễu được khuếch đại 60 dB và đưa đến máy đo mức THD+N. Trong đồng hồ đo này, tín hiệu âm thanh bị triệt tiêu bởi bộ lọc notch và độ ồn được đo bằng decibel bằng vôn kế hiệu dụng. Giá trị mức nhiễu đo được này được xác định, với dấu ngược lại, với dải động của DAC.

Khi lượng tử hóa tín hiệu ở mức tối thiểu, sẽ xảy ra hiện tượng biến dạng rất lớn, đạt tới 100% (Hình 10). Về vấn đề này, trong thực tế người ta phải tuân theo dải động thực ADC. Khi xác định dải này cần tính đến: hệ số đỉnh của tín hiệu âm nhạc đạt 12...20 dB, cần phải nâng mức giới hạn dưới của dải động ít nhất lên trên mức nhiễu lượng tử hóa. 20 dB và có biên độ bổ sung ở phần trên của dải động khoảng 10...12 dB để ngăn chặn tình trạng quá tải do tai nạn.

Kết quả là, phạm vi động thực sự

ghi ADC PCM 16 bit

không vượt quá 48...54 dB. Cái này

thậm chí còn không gần tốt

phòng thu

các bản ghi âm.

điều chỉnh mức độ tự động, trong đó

xảy ra khi ghi đĩa CD,

phạm vi có thể được mở rộng đến 74

16 bit, 1000 Hz, 93 dB

đáng chú ý

giảm giá trị

chất lượng âm thanh của tín hiệu cấp thấp.

Hình 10. Trình tự các mẫu bị bóp méo

Khoảng không gian động trên đầu

dạng sóng sin

bảo vệ chống lại khả năng quá tải,

quá

gia trị được ki vọng. Khi ghi nhạc dance, khoảng không 6 dB là đủ.

Khi thu âm nhạc giao hưởng, đôi khi bạn phải để biên độ lên tới 20...30 dB. Việc dự trữ dải động ở phía dưới giúp ngăn chặn khả năng các đoạn yên tĩnh giảm xuống dưới mức tiếng ồn và hơn nữa là dưới ngưỡng nghe được.

Trong đường dẫn kỹ thuật số giới hạn trên của dải động giới hạn ở mức tín hiệu 0 dB FS . Không sử dụng công nghệ Phối màu giới hạn dưới của dải động giới hạn ở cấp độ

LA 1/DRA.

Ở q = 8 bit, nó bằng âm 48 dB và ở q = 16 bit, nó bằng âm 96 dB. Tiếng ồn đường không thể tránh khỏi làm tăng mức độ này.

Mức ồn tích hợp âm 93,7 dB là nhiều hay ít. Điều quan trọng là mức này vượt quá ngưỡng nghe bao nhiêu. Sử dụng công nghệ phối màu tiếng ồn

Hình 11. Ngưỡng nghe được của nhiễu lượng tử hóa phụ thuộc vào số bit

lượng tử hóa trở thành nhiễu trắng, ngưỡng nghe được là 4 dB SPL. Điều này có nghĩa là ở gần 3 kHz, nhiễu lượng tử hóa ở q = 16 bit sẽ vượt quá ngưỡng nghe được 22,3 dB (Hình 11). Như bạn có thể thấy trong hình này, để nhiễu lượng tử hóa không thể nghe được thì cần phải lượng tử hóa 20 bit.

4. Mở rộng dải động bằng công nghệ Dithering

Để mở rộng phạm vi động Đường dẫn PCM với loại lượng tử hóa MeadTread mà không tăng số bit và tần số lấy mẫu, nhiều

tín hiệu tương tự, một nhiễu tương tự nhỏ được thêm vào ES. Thông thường công nghệ này được sử dụng khi định lượng lại vệ tinh số khi sản xuất

được thực hiện với 24 bit, sau đó việc lượng tử hóa lại được thực hiện, thường lên tới 16 bit, như thông lệ trong tiêu chuẩn CD. Đồng thời, chất lượng tiếng ồn của đĩa CD như vậy tương ứng với việc ghi 20 bit.

Trong quá trình lượng tử hóa lại, thao tác cắt bớt thường được sử dụng nhiều nhất, trong đó các bit có ý nghĩa nhỏ nhất sẽ bị loại bỏ. từ mã. Trong trường hợp này, tín hiệu đầu ra

Những người đam mê âm thanh gia đình có một nghịch lý thú vị. Họ sẵn sàng dọn dẹp phòng nghe, chế tạo những chiếc loa với củ loa kỳ lạ, nhưng lại rụt rè rút lui trước những bản nhạc đóng hộp, như một con sói trước lá cờ đỏ. Nhưng thực ra, tại sao bạn không thể đứng lên bảo vệ cờ và thử nấu món gì đó dễ ăn hơn từ đồ hộp?

Thỉnh thoảng, những câu hỏi ai oán nảy sinh trên diễn đàn: “Đề xuất những album được thu âm tốt”. Điều này có thể hiểu được. Các ấn phẩm đặc biệt dành cho giới audiophile, tuy làm vui tai phút đầu tiên nhưng không ai nghe đến cuối, tiết mục quá buồn tẻ. Đối với phần còn lại của thư viện nhạc, vấn đề có vẻ hiển nhiên. Bạn có thể tiết kiệm, hoặc không thể tiết kiệm và đổ hàng tấn tiền vào linh kiện. Tuy nhiên, rất ít người thích nghe nhạc yêu thích của họ trên mở to và khả năng của bộ khuếch đại không liên quan gì đến nó.

Ngày nay, ngay cả trong các album Hi-Res, phần cao nhất của nhạc nền bị cắt đi và âm lượng bị cắt bớt. Người ta cho rằng đa số nghe nhạc đủ loại, nên cần phải “nhấn ga”, tạo ra một kiểu bù lớn.


Tất nhiên, điều này không được thực hiện nhằm mục đích gây khó chịu cho những người đam mê âm thanh. Rất ít người nhớ đến họ. Có lẽ họ đã nghĩ đến việc cung cấp cho họ các tập tin chính để sao chép bản lưu hành chính - đĩa CD, MP3, v.v. Đương nhiên, chủ nhân đã bị máy nén san phẳng từ lâu, sẽ không có người cố ý nấu nướng. phiên bản đặc biệt cho các bản nhạc HD. Trừ khi một quy trình nhất định được thực hiện đối với phương tiện vinyl, vì lý do này nghe có vẻ nhân đạo hơn. Va cho đường dẫn kỹ thuật số tất cả đều kết thúc theo cùng một cách - với một máy nén lớn chất béo.

Vì vậy, hiện tại, 100% bản ghi âm đã xuất bản, trừ nhạc cổ điển, đều phải chịu sự nén trong quá trình làm chủ. Một số thực hiện thủ tục này ít nhiều một cách khéo léo, trong khi những người khác thực hiện nó hoàn toàn một cách ngu ngốc. Kết quả là, chúng tôi có những người hành hương trên các diễn đàn với một loạt plugin DR trong ngực, những so sánh đau đớn giữa các phiên bản, chuyến bay đến vinyl, nơi chúng tôi cũng cần khai thác những lần nhấn đầu tiên.

Những người tê cóng nhất khi nhìn thấy tất cả những sự phẫn nộ này đã biến thành những người theo chủ nghĩa Satan âm thanh theo đúng nghĩa đen. Không đùa đâu, họ đang đọc ngược kinh thánh của kỹ sư âm thanh! Chương trình hiện đại Trình chỉnh sửa âm thanh có một số công cụ để khôi phục sóng âm thanh bị cắt.

Ban đầu, chức năng này được dành cho các studio. Khi trộn, có những tình huống trong đó phần cắt được đưa vào bản ghi và vì một số lý do, không thể làm lại phiên nữa và ở đây, kho vũ khí của trình chỉnh sửa âm thanh sẽ ra tay giải cứu - bộ giải mã, bộ giải nén, v.v. .

Và giờ đây, những thính giả bình thường, những người đang nóng tai sau sản phẩm mới tiếp theo, đang ngày càng tiếp cận với những phần mềm như vậy một cách táo bạo hơn. Một số người thích iZotope, những người khác thích Adobe Audition, những người khác chia hoạt động giữa một số chương trình. Điểm khôi phục động lực trước đó là sửa phần mềm các đỉnh tín hiệu bị cắt bớt, nằm ở mức 0 dB, giống như một bánh răng.

Đúng, không có chuyện nói về việc khôi phục 100% mã nguồn, vì quá trình nội suy diễn ra bằng cách sử dụng các thuật toán khá suy đoán. Tuy nhiên, một số kết quả xử lý có vẻ thú vị đối với tôi và đáng để nghiên cứu.

Ví dụ: album “Lust For Life” của Lana Del Rey, liên tục chửi thề, ugh, chửi thề! Bài hát gốc “Khi thế giới có chiến tranh, chúng tôi vẫn nhảy múa” là như thế này.


Và sau một loạt các lần giải mã và giải nén thì nó đã thành ra như thế này. Hệ số DR đã thay đổi từ 5 thành 9. Bạn có thể tải xuống và nghe mẫu trước và sau khi xử lý.


Tôi không thể nói rằng phương pháp này là phổ biến và phù hợp với tất cả các album bị hỏng, nhưng trong trong trường hợp này Tôi đã chọn giữ phiên bản này trong bộ sưu tập, được xử lý bởi nhà hoạt động theo dõi root, thay vì phiên bản 24-bit chính thức.

Ngay cả khi việc trích xuất các đỉnh từ nội dung âm thanh một cách giả tạo không mang lại độ động thực sự của màn trình diễn âm nhạc, DAC của bạn vẫn sẽ cảm ơn bạn. Rốt cuộc, anh ta rất khó có thể làm việc mà không mắc lỗi ở mức cực cao, nơi có khả năng cao xảy ra cái gọi là đỉnh giữa các mẫu (ISP). Và bây giờ chỉ có những tín hiệu nhấp nháy hiếm hoi mới nhảy lên 0 dB. Ngoài ra, bản nhạc im lặng khi được nén thành FLAC hoặc một codec lossless khác giờ đây sẽ có dung lượng nhỏ hơn. Nhiều “không khí” hơn trong tín hiệu giúp tiết kiệm dung lượng ổ cứng.

Cố gắng hồi sinh những album bị ghét nhất của bạn đã bị giết trong “cuộc chiến ồn ào”. Để dự trữ động lực, trước tiên bạn cần giảm mức độ theo dõi xuống -6 dB, sau đó chạy bộ giải mã. Những người không tin tưởng vào máy tính có thể chỉ cần cắm thiết bị mở rộng phòng thu giữa đầu đĩa CD và bộ khuếch đại. Thiết bị này về cơ bản cũng thực hiện điều tương tự - nó khôi phục và kéo dài các đỉnh của tín hiệu âm thanh được nén động ở mức tốt nhất có thể. Các thiết bị tương tự từ những năm 80-90 không đắt lắm và sẽ rất thú vị nếu bạn dùng thử chúng như một cuộc thử nghiệm.


Bộ điều khiển dải động DBX 3BX xử lý tín hiệu riêng biệt ở ba băng tần - LF, MF và HF

Ngày xửa ngày xưa, bộ chỉnh âm là một thành phần tất yếu của hệ thống âm thanh và không ai sợ chúng. Ngày nay không cần phải san bằng đống đổ nát tần số cao băng từ nhưng cần phải làm gì đó với động lực xấu quá anh em ơi.

Phạm vi năng động là gì?

Dải động có thể được định nghĩa là khoảng cách giữa mức tín hiệu yên tĩnh nhất và lớn nhất có thể. Ví dụ: nếu hướng dẫn dành cho bộ xử lý chỉ ra rằng mức tín hiệu đầu vào tối đa trước khi bị méo tiếng là +24 dB và mức nhiễu đầu ra là -92 dB thì tổng dải động của bộ xử lý là 24 + 92 = 116 dB.

Dải động trung bình của một dàn nhạc dao động từ -50 dB đến +10 dB. Cộng thêm tới 60 dB. Mặc dù bạn có thể nghĩ rằng dải động 60 dB là thấp, nhưng sau khi thực hiện một số phép tính đơn giản, hóa ra +10 dB lớn hơn 1000 lần so với -50 dB!

Dải động trong nhạc rock nhỏ hơn nhiều, thường là -10 dB đến +10 dB hoặc tổng cộng là 20 dB. Vì vậy, việc trộn các tín hiệu khác nhau trong nhạc rock thành một bản phối duy nhất là một công việc khá tẻ nhạt.

Tại sao chúng ta cần nén?

Giả sử bạn đang trộn một bản ghi nhạc rock có dải động trung bình là 20 dB. Và bạn muốn thêm giọng hát không nén vào bản phối. Dải động trung bình của giọng hát là khoảng 40 dB. Điều này có ý nghĩa gì đối với sự pha trộn? Những phần giọng quá nhỏ sẽ không được nghe thấy và những phần giọng quá lớn sẽ nổi bật so với bức tranh tổng thể. Trong tình huống này, cần có một máy nén để giảm (nén) dải động của giọng hát trong phạm vi 10 dB.

Trong trường hợp này, giọng hát sẽ ở mức khoảng +5 dB. Phạm vi - từ 0 dB đến +10 dB. Các cụm từ yên tĩnh bây giờ sẽ cao hơn mức tín hiệu thấp nhất trong danh sách kết hợp và các cụm từ lớn sẽ không bị phát ra. Hóa ra giọng hát chiếm vị trí của họ trong bản phối.

Nguyên tắc tương tự áp dụng cho bất kỳ nhạc cụ nào trong bản phối. Mỗi nhạc cụ đều có vị trí riêng trong hỗn hợp và một máy nén tốt sẽ giúp kỹ sư trộn chúng đúng cách.

Máy nén có cần thiết cho mọi thứ không?

Thông thường, để trả lời câu hỏi này, bạn sẽ nghe thấy: "Tất nhiên là không! Các bản nhạc bị nén quá mức nghe rất tệ." Tuyên bố này chỉ đúng trong một trường hợp - nếu bạn có thể nghe rõ cách máy nén hoạt động trong bản ghi âm. Một máy nén chất lượng cao, đắt tiền, khi được cấu hình đúng cách, sẽ không thể nhận ra âm thanh! Âm thanh bị nén quá mức là hậu quả của lỗi trong quá trình xử lý các nhạc cụ cụ thể , tất nhiên trừ khi việc này được thực hiện có chủ ý nhằm đạt được hiệu ứng đặc biệt .

Bạn nghĩ tại sao tất cả các bàn trộn âm thanh đắt tiền đều có máy nén riêng trên mỗi kênh? Câu trả lời rất đơn giản - hầu hết các nhạc cụ đều cần nén, ngay cả khi nó rất nhỏ. Điều này giúp họ được lắng nghe trong bản phối.

Tại sao chúng ta cần cổng tiếng ồn?

Hãy xem một ví dụ với giọng hát. Giả sử bạn đặt phạm vi của nó là 20 dB. Sự cố bắt đầu khi máy nén tăng tín hiệu yên tĩnh nhất trong bản nhạc. Tất cả các loại tiếng ồn không mong muốn đều xuất hiện trong nền, các đoạn nhạc nền lọt vào micrô từ tai nghe, v.v. Bạn có thể thử chỉ cần giảm âm lượng trong khi tạm dừng, nhưng điều này thường dẫn đến thất bại hoàn toàn. Một cách tốt hơn nhiều là sử dụng cổng chống ồn. Ví dụ: chúng ta có thể đặt ngưỡng cổng tiếng ồn thành -10 dB, tương ứng với giới hạn dưới của dải động của giọng hát trong trường hợp của chúng ta. Bằng cách này, cổng sẽ tự động xóa tất cả các tín hiệu không mong muốn giữa các cụm từ về 0.

Nếu bạn đã từng thử trộn một bản ghi âm trực tiếp, bạn sẽ biết có bao nhiêu rắc rối xảy ra với bộ trống, cụ thể là với phần cứng đi vào micrô gắn trên toms. Ngay sau khi bạn thêm âm cao vào EQ để làm cho âm toms sáng hơn, chũm chọe bắt đầu tăng lên. Và điều này đặc biệt có thể nghe được qua loa tần số cao trong màn hình. Nếu chúng tôi sử dụng các cổng trên micrô ghi âm toms để phần cứng không còn phát ra âm thanh qua chúng khi tạm dừng, chúng tôi sẽ làm sạch đáng kể bản phối tổng thể và làm cho nó dễ hiểu hơn nhiều.

Các kiểu xử lý động

Xử lý động là quá trình thay đổi dải động của tín hiệu để nâng cao khả năng của thiết bị mà qua đó tín hiệu được ghi hoặc phát lại. Nói cách khác, chúng ta có cơ hội ghi hoặc phát lại tín hiệu đã ghi mà không bị biến dạng và/hoặc nhiễu, từ đó đơn giản hóa tác vụ trộn.

Máy nén và bộ hạn chế

Mạnh mẽ, nghe rõ, hiện diện tốt - đây đều là những mô tả về tín hiệu âm thanh thu được bằng cách xử lý chúng bằng máy nén và bộ hạn chế.

Nén và giới hạn là các hình thức kiểm soát dải động (âm lượng) của tín hiệu. Tín hiệu âm thanh có phạm vi âm lượng khá rộng. Tín hiệu đỉnh có thể gây ra tình trạng quá tải trong mạch ghi, từ đó sẽ gây ra hiện tượng méo tín hiệu.

Bộ nén/bộ giới hạn là một loại bộ khuếch đại trong đó mức âm lượng phụ thuộc vào mức tín hiệu âm thanh đi qua nó. Bằng việc lựa chọn giá trị nhất định máy nén/bộ giới hạn, tín hiệu sẽ tự động bị suy giảm trên mức hoặc mức ngưỡng được chỉ định.

Về bản chất, nén là quá trình làm suy yếu tín hiệu đầu vào theo một tỷ lệ nhất định. Được sử dụng để thu hẹp phạm vi động của giọng nói hoặc nhạc cụ, cho phép ghi âm không bị méo tiếng. Cũng được sử dụng khi tạo bản phối, giảm sự khác biệt về tần số của từng bản nhạc.

Giả sử ca sĩ liên tục di chuyển trước micro và tín hiệu đầu ra dao động lên xuống, nghe có vẻ lạ. Trong trường hợp này, máy nén sẽ giải quyết vấn đề bằng cách giảm âm lượng của từng cụm từ để mang lại giọng hát mượt mà.

Mức độ suy giảm tín hiệu phụ thuộc vào tỷ lệ nén và mức ngưỡng. Tỷ lệ 2:1 hoặc nhỏ hơn được coi là nén yếu, trong đó tín hiệu đầu ra trên mức ngưỡng bị giảm đi một nửa. Tỷ lệ trên 10:1 có thể được gọi là giới hạn mạnh.

Mức ngưỡng càng thấp thì tín hiệu bị nén càng nhiều (ở một mức tín hiệu đầu vào nhất định). Điều quan trọng là phải biết khi nào nên dừng, vì quá nhiều lực nén sẽ giết chết động lực của bản ghi (và một số kỹ sư âm thanh đặc biệt loại bỏ nó như một hiệu ứng)!

Giới hạn là một kiểu xử lý tín hiệu nhằm ngăn chặn sự tăng vọt về âm lượng (bước nhảy biên độ).

Bộ nén/bộ giới hạn được sử dụng cho nhiều tác vụ xử lý âm thanh, chẳng hạn như:

Âm thanh của bộ trống có thể bị lạc giữa các cây guitar điện. Và dù bản nhạc có lớn đến đâu thì tiếng trống kick vẫn nghe rất bẩn. Việc nén sẽ làm thẳng âm thanh của trống kick đối với guitar.

Phạm vi giọng nói trong bản ghi âm khá rộng. Đỉnh âm lượng thực sự có thể nổi bật so với âm thanh tổng thể. Có thể có nhiều đỉnh như vậy và chúng đều khác nhau nên hầu như không thể cân bằng chúng thông qua máy trộn. Bộ nén/bộ giới hạn tự động điều khiển âm lượng mà không làm biến dạng sự tinh tế của giọng hát.

Tiếng guitar solo bị át đi bởi nhịp điệu. Đừng vặn fader lên hết cỡ, việc nén sẽ đặt guitar chính vào đúng vị trí của nó trong bản phối.

Guitar bass rất khó ghi âm. Âm thanh mượt mà với độ tấn công tốt đạt được nhờ khả năng nén thích hợp. Và không cần phải cắt bỏ phần cuối của bản phối - bộ nén/bộ giới hạn sẽ cho phép âm trầm xuất hiện ở bất kỳ tần số nào

Bộ mở rộng

Có hai loại mở rộng chính: động và hướng xuống. Mở rộng mở rộng phạm vi động của tín hiệu khi nó vượt quá giá trị ngưỡng. Mở rộng động về cơ bản là nén ngược. Mở rộng động được sử dụng trong TV và radio để hoàn tác quá trình nén ngay trước khi tín hiệu âm thanh được truyền đi. Nén theo sau là mở rộng được gọi là nén. khoảnh khắc này Sự mở rộng đi xuống thường được sử dụng nhất. Không giống như nén, làm giảm tín hiệu trên ngưỡng, mở rộng làm giảm tín hiệu xuống dưới ngưỡng mở rộng. Mức độ giảm được xác định bởi tỷ lệ mở rộng. Ví dụ: tỷ lệ 2:1 làm giảm tín hiệu đi một nửa (nghĩa là nếu tín hiệu thấp hơn ngưỡng 5dB thì thiết bị mở rộng sẽ giảm xuống 10dB), thường được sử dụng để giảm nhiễu, mở rộng là một cổng chống nhiễu rất mạnh và đơn giản. Sự khác biệt chính giữa thiết bị mở rộng và cổng chống ồn là việc mở rộng phụ thuộc vào mức độ tín hiệu đã đi “dưới ngưỡng”, trong khi với cổng chống ồn thì điều này không thành vấn đề.

Cách âm

Giảm nhiễu là quá trình loại bỏ nhiễu không mong muốn khỏi bản ghi bằng cách giới hạn tín hiệu dưới ngưỡng quy định. Như đã viết ở trên, hoạt động của cổng chống nhiễu không phụ thuộc vào mức tín hiệu dưới ngưỡng. Đầu ra của thiết bị được mở miễn là tín hiệu vượt quá ngưỡng.

Thời gian mở lối thoát được xác định bởi tốc độ tấn công. Khoảng thời gian hoạt động của thiết bị khi tín hiệu ở dưới ngưỡng được gọi là thời gian giữ. Tốc độ đóng đầu ra được xác định bởi thời gian quay trở lại. Mức ngăn chặn tín hiệu không mong muốn ở vị trí đóng xác định theo khoảng

Bảng chú giải thuật ngữ ngắn gọn

Khoa học đã chứng minh rằng nếu muốn học nhanh một môn học thì trước tiên bạn phải hiểu được các khái niệm cơ bản. Nguyên tắc tương tự cũng áp dụng cho việc ghi âm và công việc tiếp theo với âm thanh. Hầu hết các hướng dẫn và sách giáo khoa đều giả định kiến ​​thức cơ bản, nếu không có kiến ​​thức đó thì rất khó đọc. Tôi hy vọng rằng phần sau đây sẽ giúp bạn sắp xếp đầu óc và cuối cùng hiểu được những điều cơ bản.

Máy nén

Tấn công.

Tấn công xác định tốc độ mà máy nén tác động lên tín hiệu đầu vào. Cuộc tấn công dài (điều khiển theo chiều kim đồng hồ) trước tiên cho phép tín hiệu (hay còn gọi là thoáng qua ban đầu) đi qua máy nén mà không được xử lý, trong khi cuộc tấn công ngắn (ngược chiều kim đồng hồ) ngay lập tức xử lý tín hiệu theo tỷ lệ nén và ngưỡng đã đặt mức độ.

Tự động.

Máy nén hoạt động ở chế độ tấn công và quay trở lại tự động. Trong trường hợp này, bộ điều chỉnh không ảnh hưởng đến quy trình nhưng các giá trị tham số đã lập trình sẽ được sử dụng.

Sidechain máy nén.

Đầu vào kênh bên làm gián đoạn tín hiệu mà máy nén sử dụng để xác định mức nén mong muốn. Khi kênh bên bị tắt, tín hiệu đầu vào sẽ đi trực tiếp vào mạch máy nén chính. Khi bật lên, không có tín hiệu nào được gửi đến mạch chính. Giờ đây, bạn có thể xử lý tín hiệu điều khiển bằng bộ chỉnh âm, chẳng hạn như sử dụng tính năng khử âm (hiệu chỉnh tần số giọng nói). Sau khi xử lý, tín hiệu điều khiển được gửi trở lại máy nén thông qua đầu ra kênh. Cách sử dụng điển hình cho kênh bên là sử dụng máy nén để tắt tiếng nhạc nền trong phần trình diễn của người hát chính hoặc giảm âm lượng của nhịp điệu guitar trên nền giọng hát. Bây giờ giọng nói có thể dễ dàng phân biệt được. Trong trường hợp này, bản nhạc sẽ chuyển sang kênh phụ, trong khi nhạc nền sẽ chuyển sang mạch nén chính. Bây giờ, bộ nén sẽ giảm mức nhạc nền (một quá trình được gọi là giảm âm lượng) khi ca sĩ bắt đầu hát hoặc nói.

Nén cứng và mềm (Đầu gối cứng/mềm)

Với nén cứng, sự suy giảm tín hiệu xảy ra nhanh nhất có thể khi vượt quá giá trị ngưỡng. Với chế độ mềm, tín hiệu sẽ bị suy giảm mượt mà hơn sau khi vượt qua ngưỡng đặt trước, mang lại âm thanh tự nhiên hơn cho bản nhạc.

Bộ hạn chế.

Bộ giới hạn là một bộ nén ngăn tín hiệu tăng lên trên mức ngưỡng. Ví dụ: nếu ngưỡng được đặt thành 0 dB, tham số “Tỷ lệ” được xoay hết chiều kim đồng hồ, máy nén sẽ bắt đầu hoạt động ở chế độ giới hạn ở mức 0 dB và tín hiệu đầu ra sẽ không bao giờ vượt quá giá trị này.

Tăng bù (Makeup Gain).

Với tính năng nén, việc nén tín hiệu thường ảnh hưởng đến mức âm lượng tổng thể. Kiểm soát khuếch đại cho phép bạn khôi phục mức bị mất trong quá trình nén.

Tỉ lệ.

Tỷ lệ là mối quan hệ giữa tín hiệu đầu ra và đầu vào, tham số này thiết lập tốc độ nén. Ví dụ: bằng cách đặt tỷ lệ thành 2:1, mọi tín hiệu vượt quá ngưỡng sẽ được nén ở tỷ lệ 2:1. Đối với mỗi decibel ở đầu vào máy nén, có 0,5 dB ở đầu ra, do đó tạo ra lực nén làm nén tín hiệu một nửa. Khi tỷ lệ tăng lên, máy nén dần dần chuyển sang chế độ giới hạn.

Thời gian phát hành.

Thời gian giải phóng là khoảng thời gian trôi qua giữa thời điểm mức tín hiệu đầu vào giảm xuống dưới ngưỡng và thời điểm mức nén trở về 0 (máy nén dừng làm suy giảm tín hiệu). Khoảng phản hồi ngắn tạo ra âm thanh không đồng đều, “cắt nhỏ”, đặc biệt là ở guitar bass. Khoảng lùi dài sẽ “ép” âm thanh quá nhiều, làm phẳng nó. Có một cách sử dụng cho bất kỳ giá trị thời gian trả về nào - hãy chọn bằng tai.

Ngưỡng.

Mức nén ngưỡng (ngưỡng nén) xác định giá trị trên đó tín hiệu bắt đầu suy giảm. Thông thường, việc xoay điều khiển ngưỡng sang trái sẽ làm tăng tín hiệu đang bị nén (ở tỷ lệ lớn hơn 1:1).

Bộ mở rộng

Mở rộng xuống dưới.

Khai triển hướng xuống thường được sử dụng nhiều nhất trong ghi âm chuyên nghiệp. Tín hiệu bị suy giảm dưới giá trị ngưỡng. Cái này cách tiêu chuẩn cách âm.

Tỉ lệ.

Tỷ lệ mở rộng xác định mức tín hiệu bị suy giảm khi nó giảm xuống dưới ngưỡng. Ví dụ: với tỷ lệ mở rộng là 2:1, mỗi decibel dưới ngưỡng sẽ bị suy giảm một nửa. Với tỷ lệ 4:1 trở lên, thiết bị mở rộng hoạt động gần giống như một cổng chống ồn, chỉ khác là không có khả năng điều chỉnh thời gian tấn công, độ trễ và quay lại.

Cổng chống ồn

Tấn công.

Tham số "thời gian tấn công" đặt giá trị tại đó cổng sẽ mở. Tấn công nhanh phù hợp với nhạc cụ gõ, trong khi giọng hát và âm trầm đòi hỏi phải mở đầu mượt mà. Áp dụng một đòn tấn công quá nhanh vào chúng sẽ dẫn đến hiện tượng “làm mờ” đáng chú ý khi trộn. Tiếng click khi mở vốn có ở bất kỳ cổng nào, nhưng khi cài đặt đúng Tôi không thể nghe thấy anh ấy.

Giữ thời gian.

Thời gian giữ là khoảng thời gian cố định trong đó cổng mở khi mức tín hiệu dưới ngưỡng. Giá trị của tham số này đóng một vai trò khi kiểm soát, chẳng hạn như trống bẫy - sau khi đánh nó, một thời gian nhất định trôi qua, sau đó cổng đột ngột đóng lại.

Phạm vi.

Phạm vi cổng là mức suy giảm tín hiệu khi cổng đóng. Do đó, khi tham số này được đặt thành 0 dB thì không có sự suy giảm tín hiệu nào cả. Giá trị -60 dB có nghĩa là khi cổng đóng, tín hiệu sẽ bị suy giảm (gated) 60 dB, v.v.

Thời gian phát hành.

Thời gian đặt lại cổng xác định tốc độ cổng chuyển từ mở sang đóng hoàn toàn. Thời gian nhả phím thường được điều chỉnh để duy trì độ phân rã tự nhiên của nhạc cụ hoặc âm thanh của giọng hát. Tốc độ cao Tốc độ quay trở lại giúp loại bỏ tiếng ồn, nhưng có thể gây ra tình trạng "nói lắp" trên trống, điều này được loại bỏ bằng tốc độ quay lại thấp. Điều chỉnh cài đặt này một cách cẩn thận để có hiệu ứng tự nhiên nhất.

Mức ngưỡng.

Mức ngưỡng cổng đặt giá trị tại đó cổng sẽ mở. Nguyên tắc rất đơn giản - mọi tín hiệu trên ngưỡng đều được truyền nguyên vẹn và tín hiệu bên dưới bị suy giảm một lượng tùy thuộc vào cài đặt phạm vi. Nếu bạn xoay núm hoàn toàn sang trái, cổng sẽ bị tắt (tức là luôn mở) và mọi tín hiệu sẽ đi qua mà không bị suy giảm.

Dưới đây là các cài đặt trước nén được sử dụng trong PreSonus BlueMax. Những cài đặt trước này - cài đặt tiêu chuẩn, một loại điểm khởi đầu để làm việc với âm thanh.

Giọng hát

Giọng hát ấm áp.Đây là các cài đặt để nén ánh sáng với tỷ lệ thấp và phạm vi mở rộng, chủ yếu dành cho bài hát trữ tình trong buổi biểu diễn trực tiếp. Giọng hát “ở đúng chỗ”.

La hét.Tùy chọn cho giọng hát lớn. Độ nén khá khắc nghiệt đối với những ca sĩ không chú ý đến khoảng cách đến micro. Giọng hát nổi bật mạnh mẽ khi hòa âm, tạo hiệu ứng hiện diện.

Chi phí trái/phải (âm thanh nổi). Các tham số "tỷ lệ" và "ngưỡng" ở đây thấp, mang lại phạm vi rộng mà ngay cả chũm chọe cũng phù hợp. Âm trầm sâu, âm thanh tổng thể sống động với độ vang thấp. Âm thanh mạnh mẽ hơn, hiệu ứng phòng ít hơn.

Đàn guitar acoustic.Giá trị đặt trước nhấn mạnh sự tấn công của ghi-ta acoustic và cung cấp âm thanh đồng đều cho phép duy trì âm thanh của ghi-ta.

Nhạc cụ bàn phím

Đàn piano.Một cài đặt trước đặc biệt để cân bằng toàn bộ phạm vi của đàn piano - từ âm thanh thấp hơn đến quãng tám thứ năm. Có thể nghe rõ các bộ phận của cả hai tay.

Dàn nhạc.Các cài đặt phù hợp cho cả dây và các “bộ” tổng hợp dàn nhạc khác. Phạm vi động tổng thể được giảm bớt để dễ dàng thêm vào hỗn hợp.

Mạch.Các cài đặt mở rộng phạm vi của hỗn hợp chính.

Ngưỡng Tỉ lệ Tấn công Giải phóng
-13,4 dB 1.2:1 0,002 mili giây 182 mili giây

Emmanuel Deruty

“Tại sao âm nhạc nghe tệ hơn?” "Người hâm mộ phàn nàn rằng Death Magnet trên Guitar Hero nghe hay hơn trên CD." “Ngay cả những người hâm mộ kim loại nặng cũng nghĩ rằng âm nhạc ngày nay quá ồn ào!” "Ngày Dynamic Range công bố phong trào chống ồn ào mới." "Cái chết của Hi-Fi"... Ngày càng có nhiều phong trào trên báo chí và trực tuyến chống lại "cuộc chiến tranh về âm lượng", một phong trào mà mọi người cố gắng để âm lượng to nhất có thể trên bản nhạc của mình để khiến người nghe cảm thấy nóng hơn hơn so với các bản phát hành cạnh tranh. Theo những bài báo này, các phương pháp làm chủ không khôn ngoan và cụ thể hơn là lạm dụng các bộ giới hạn của bức tường gạch, sẽ khiến âm nhạc gặp nguy hiểm. TRONG sản xuất hiện đại nó thiếu chi tiết và hy sinh chất lượng cho cấp độ. Bob Dylan đã nói trong một cuộc phỏng vấn năm 2006 rằng “Bạn nghe những album hiện đại này và chúng có vẻ tàn bạo. Họ có âm thanh giống nhau ở mọi nơi. Không có sự rõ ràng hay chi tiết, cả trong giọng hát cũng như bất cứ điều gì khác. Mọi thứ đều tĩnh."

Nhưng nhận xét của Dylan chẳng phải phản ánh mâu thuẫn lâu đời giữa cha và con sao? Đây không phải là lần đầu tiên người bảo vệ cũ coi thường những gì thế hệ mới đang làm. Mặc dù vậy, cũng đúng khi có nhiều kỹ sư âm thanh tham gia vào xã hội thích âm nhạc “năng động hơn”. Nhưng họ khách quan cho rằng thể loại nhạc này hay hơn hay đơn giản là họ thích một loại âm thanh nào đó hơn? Nghiên cứu của tôi sẽ cố gắng trả lời những câu hỏi này. Chúng ta sẽ tìm hiểu xem liệu âm nhạc hiện đại có thực sự trở nên to hơn hay không và liệu nó có trở nên kém năng động hơn hay không. Chúng tôi cũng sẽ xem xét giả thuyết rằng âm lượng lớn có thể là một đặc điểm phong cách của các thể loại âm nhạc cụ thể, chứ không phải là "cách cư xử tồi tệ" được thúc đẩy bởi sự hèn hạ. Lợi ích thương mại. Cuối cùng, chúng ta hãy xem xét kỹ hơn album Death Magnet khét tiếng của Metallica và tìm hiểu lý do tại sao nhiều người cho rằng nó nghe tệ.

Bây giờ âm nhạc có thực sự to hơn không?

Vâng, điều này là đúng và không còn nghi ngờ gì nữa. Hãy lấy một số lượng lớn các bài hát nhạc pop nổi tiếng được thu âm từ năm 1969 đến năm 2010, chuẩn hóa chúng sao cho mức cực đại ở mức 0 dBFS và đo giá trị RMS. Bây giờ hãy sắp xếp tất cả các giá trị theo năm phát hành của từng bài hát. Sơ đồ đầu tiên (ở trên) cho thấy kết quả của thí nghiệm và chúng thực sự rất thú vị! Đường màu đỏ hiển thị giá trị RMS trung bình theo từng năm và các ô hiển thị mức phân bổ: màu càng đậm thì càng có nhiều bài hát có cùng cấp độ. Chắc chắn đã có sự gia tăng đều đặn ở mức trung bình từ năm 1982 đến năm 2005, và các bản ghi âm ngày nay to hơn khoảng 5 dB so với những năm 70.

Phải thừa nhận rằng, RMS chỉ cung cấp thông tin về mức độ “điện” hoặc “vật lý” của một tệp âm thanh chứ không cho chúng ta biết bất cứ điều gì về âm lượng mà chúng ta thực sự cảm nhận được. Để làm được điều này, theo hướng dẫn quy định của EBU 3341, chúng tôi đánh giá “âm lượng tích hợp”. Như bạn có thể thấy trong biểu đồ thứ hai, giá trị này có mối tương quan khá cao với RMS và hai biểu đồ rất giống nhau. Vì vậy, tập kết quả thứ hai xác nhận kết quả đầu tiên.

Hãy sử dụng các tiêu chí khác và lặp lại thí nghiệm. Ví dụ, để mô tả đặc tính động của âm nhạc, một tiêu chí như hệ số đỉnh thường được sử dụng. Nói nói một cách đơn giản, nó cho thấy sự khác biệt giữa mức cao nhất và mức RMS trong suốt bài hát. Đây là một điểm đánh dấu tốt để đánh giá mức độ nén được áp dụng cho âm nhạc: nói chung, độ nén càng nhiều thì hệ số đỉnh càng thấp. Một số chuyên gia coi việc xử lý cẩn thận yếu tố đỉnh là chìa khóa để thành công. Nói chung, một lần nữa, hệ số đỉnh càng thấp thì âm nhạc càng to.

Sơ đồ thứ ba cho thấy sự phát triển của yếu tố đỉnh. Dựa trên 4.500 bài hát giống nhau, biểu đồ trung bình này kể từ những năm 80 cho thấy mức giảm 3 dB. Điều này củng cố niềm tin của chúng tôi rằng sự gia tăng âm lượng rõ ràng bắt đầu từ những năm 90 được tạo ra bằng cách nén. Dễ dàng nhận thấy quá trình tiến hóa của yếu tố đỉnh có thể chia làm 3 giai đoạn. Lần đầu tiên, từ năm 1969 đến năm 1980, cho thấy sự gia tăng hệ số đỉnh, có thể là do sự cải tiến của thiết bị phòng thu, sự cải thiện về tỷ lệ tín hiệu trên tạp âm và do đó, dải động của nó được mở rộng. Từ năm 1980 đến năm 1990, hệ số đỉnh vẫn khá ổn định. Sau đó, từ năm 1990 đến năm 2010 – thời kỳ của cuộc chiến về độ ồn – hệ số đỉnh giảm đi đáng kể.

Cuối cùng, một tiêu chí hữu ích và mang tính thông tin khác là tỷ lệ các mẫu, sau khi chuẩn hóa, đạt gần đến mức trần 0 dBFS. Mật độ cao của các mẫu rất lớn cho thấy rằng bản gốc đã bị cắt bớt hoặc sử dụng bộ giới hạn tường gạch kỹ thuật số. Biểu đồ thứ tư theo dõi mật độ của các mẫu cao điểm trong cùng một bộ sưu tập gồm 4.500 rãnh. Hai bảng xếp hạng đầu tiên cho thấy âm nhạc ngày càng to hơn; thứ ba chỉ ra rằng điều này có thể là do nén dải động; và điều này minh họa rằng việc nén rất có thể đi kèm với giới hạn tường gạch kỹ thuật số.

Phạm vi năng động của âm nhạc là gì?

Bạn sẽ ngạc nhiên nhưng câu hỏi này khá khó trả lời. Bằng trực giác, chúng tôi cảm thấy rằng dải động là thước đo mức độ thay đổi Tác phẩm âm nhạc. Hãy cố gắng hiện thực hóa những phỏng đoán này. Biểu đồ đầu tiên so sánh giá trị RMS của hai bài hát: "Fuk" của Plastikman và "Smells Like Teen Spirit" của Nirvana. Rõ ràng, cấp độ trong Smells Like Teen Spirit linh hoạt hơn trong Fuk. Và điều này không có gì đáng ngạc nhiên, vì Plastikman là tín đồ của kỹ thuật tối giản, trong khi Nirvana được đặc trưng bởi những câu thơ nhẹ nhàng và những đoạn điệp khúc ồn ào.

Tuy nhiên, kết quả sẽ thay đổi hoàn toàn nếu sử dụng cửa sổ 100 mili giây thay vì 2 giây để phân tích. Với cửa sổ lớn hơn, âm nhạc của Plastikman thể hiện mức RMS ổn định hơn, nhưng như bạn có thể thấy trong sơ đồ thứ hai, với thời gian tích hợp ngắn hơn, các biến thể mạnh hơn sẽ xuất hiện trong đó. Điều này là do tiếng trống to và khô. Do đó, nếu chúng ta muốn đo lường một cách khách quan “mức độ linh hoạt”, chúng ta phải suy nghĩ cẩn thận về việc sử dụng thang đo nào.

Ngoài ra còn có một câu hỏi về cách thực sự tính toán mức độ linh hoạt này. Nói cách khác, làm thế nào để có được giá trị số sẽ là thước đo "dải động". Rõ ràng, chúng ta có thể đo tổng biên độ dọc của đường cong RMS ở một thang thời gian nhất định bằng cách tính tổng biên độ của từng chuyển động thẳng đứng. Thoạt nhìn, điều này mang lại một bức tranh lý tưởng: hãy nhìn lại sơ đồ đầu tiên, trong đó đường cong màu xanh lam có vẻ linh hoạt hơn đường màu đỏ và có biên độ dọc tổng thể lớn hơn.

Tuy nhiên, trong thực tế, phương pháp này không đáng tin cậy. Ví dụ, một đỉnh cô lập ở giữa đường cong RMS phẳng sẽ làm sai lệch phép đo, đưa ra dấu hiệu sai lệch về mức độ linh động. Có một phương pháp đáng tin cậy hơn được EBU sử dụng để ước tính phạm vi âm lượng. Nó bao gồm việc tính toán phân phối các giá trị RMS. Sự phân phối này được thể hiện trong sơ đồ thứ ba. Sau đó, chúng tôi đo mức độ "chênh lệch" của phân phối bằng cách sử dụng thủ thuật tương tự như phương pháp lấy mẫu xác suất trong thống kê mô tả, chỉ để lại 5% trên cùng và 10% dưới cùng. Kết quả phân tích trong khoảng thời gian hai giây cho thấy mức độ lan truyền RMS rộng hơn đối với Smells Like Teen Spirit.

Bây giờ chúng ta hãy thay đổi thang đo và đo mức chênh lệch RMS trong cửa sổ 0,1 giây. Kết quả của thí nghiệm được hiển thị trong biểu đồ thứ tư và một lần nữa kết quả hoàn toàn ngược lại: mức độ lan truyền ở Fuk lớn hơn nhiều so với Smells Like Teen Spirit. Bây giờ, hãy thực hiện thí nghiệm tương tự với các kích thước cửa sổ khác. Kết quả được trình bày ở biểu đồ cuối cùng. Điều thú vị là sự chênh lệch cấp độ trong Smells Like Teen Spirit luôn lớn hơn, ngoại trừ khoảng thời gian dưới 0,18 giây. Đây chính là khoảng thời gian mà trống Phúc có ảnh hưởng quyết định.

Những gì được thể hiện trong sơ đồ thứ năm là một ứng cử viên sáng giá để đo “dải động” của âm nhạc. Bây giờ, giả sử rằng thay vì sử dụng các giá trị RMS, chúng ta sẽ xử lý một số loại đơn vị đo âm lượng cảm nhận được, chẳng hạn như đơn vị được đề cập trong khuyến nghị ITU BS 1770. Đây là “phạm vi âm lượng”. Những kiến ​​thức cơ bản về cách EBU định nghĩa “phạm vi âm lượng” được tìm thấy trong EBU Tech 3342 và được chúng tôi giải thích trong chương “Đo phạm vi âm lượng bằng phương pháp EBU”.

Bây giờ câu hỏi duy nhất còn lại là liệu thuật ngữ như "phạm vi động" có nên được sử dụng hay không. Không có định nghĩa chính thức cho nó và khái niệm này có thể bị nhầm lẫn với dải động của phương tiện ghi, đó là sự khác biệt giữa mức nhỏ nhất và lớn nhất. cấp độ lớn, mà anh ấy có thể làm việc. Vì vậy, trong bài viết này tôi sẽ không nói về “dải động” của âm nhạc. Thay vào đó, tôi sẽ sử dụng các thuật ngữ như "độ biến thiên RMS" hoặc rộng hơn là "độ biến thiên động". Chúng tôi sẽ bảo lưu thuật ngữ “dải động” để xác định tỷ lệ tín hiệu trên tạp âm của phương tiện ghi. Tôi sẽ sử dụng thuật ngữ "phạm vi âm lượng" theo đúng EBU 3342 và thuật ngữ "biến thiên âm lượng" trong tất cả các trường hợp khác liên quan đến khái niệm âm lượng thay vì RMS.

Nguồn rung động âm thanh tỏa năng lượng vào không gian xung quanh. Lượng năng lượng âm thanh truyền trong mỗi giây qua diện tích 1 m2 nằm vuông góc với hướng truyền dao động của âm thanh được gọi là cường độ (cường độ) của âm thanh.

Khi chúng ta trò chuyện bình thường, công suất của dòng năng lượng xấp xỉ 10 µW. Âm thanh violin lớn nhất có thể có công suất 60 μW, trong khi công suất của âm thanh organ có thể dao động từ 140 đến 3200 μW.

Một người nghe thấy âm thanh ở một phạm vi áp suất âm thanh (cường độ) cực kỳ rộng. Một trong những giá trị tham chiếu cho phạm vi này là ngưỡng nghe tiêu chuẩn - giá trị hiệu dụng của áp suất âm thanh được tạo ra bởi rung động âm thanh hài hòa có tần số 1000 Hz, mà người có độ nhạy thính giác trung bình hầu như không nghe thấy được.

Ngưỡng nghe tương ứng với cường độ âm thanh Is0 = 10-12 W/m2 hoặc áp suất âm thanh ps0 = 2Х10-5 Pa.

Giới hạn trên được xác định bởi các giá trị của Is. Tối đa. = 1 W/m2 hoặc psv. Tối đa. = 20 Pa. Khi một người cảm nhận được âm thanh có cường độ như vậy, cơn đau sẽ xuất hiện.

Trong phạm vi áp suất âm thanh vượt quá đáng kể ngưỡng nghe tiêu chuẩn, cường độ của cảm giác không tỷ lệ với biên độ áp suất âm thanh psv mà tỷ lệ với logarit của tỷ lệ psv/psv0. Do đó, áp suất âm thanh và cường độ âm thanh thường được đo bằng đơn vị logarit của decibel (dB) so với ngưỡng nghe tiêu chuẩn.

Phạm vi thay đổi của áp suất âm thanh từ ngưỡng nghe tuyệt đối đến ngưỡng đau là tần số khác nhau từ 90 dB đến 130 dB.

Nếu tai con người cảm nhận được đồng thời hai hoặc nhiều âm thanh có âm lượng khác nhau thì âm thanh to hơn sẽ át đi (hấp thụ) những âm thanh yếu hơn. Cái gọi là sự che giấu âm thanh xảy ra và tai chỉ cảm nhận được một âm thanh to hơn. Ngay sau khi tiếp xúc với âm thanh lớn, độ nhạy của tai với âm thanh yếu sẽ giảm đi. Khả năng này được gọi là khả năng thích ứng thính giác.

Như vậy ngưỡng nghe là đến một mức độ lớn phụ thuộc vào điều kiện nghe: trong im lặng hoặc trên nền có tiếng ồn (hoặc âm thanh khó chịu khác). Trong trường hợp sau, ngưỡng nghe tăng lên. Điều này chỉ ra rằng nhiễu đang che khuất tín hiệu hữu ích.

Hệ thống thính giác của con người có một quán tính nhất định: cảm giác bắt đầu âm thanh cũng như sự kết thúc của âm thanh không xuất hiện ngay lập tức.

Tín hiệu âm thanh là một quá trình ngẫu nhiên. Đặc tính âm thanh hoặc điện của nó thay đổi liên tục theo thời gian. Cố gắng theo dõi những thay đổi ngẫu nhiên trong quá trình triển khai sự hỗn loạn này là một hoạt động ít có ý nghĩa. Bạn có thể hạn chế cơ hội của Bệ hạ và cung cấp cho nó các tính năng xác định bằng cách sử dụng các thông số trung bình, chẳng hạn như mức tín hiệu âm thanh.

Mức tín hiệu âm thanh đặc trưng cho tín hiệu tại một thời điểm nhất định và biểu thị điện áp tín hiệu âm thanh, được biểu thị bằng decibel, được chỉnh lưu và lấy trung bình trong một khoảng thời gian nhất định trước đó.

Dải động của tín hiệu âm thanh được hiểu là tỷ số giữa áp suất âm thanh tối đa và tối thiểu hoặc tỷ lệ của các điện áp tương ứng. Trong định nghĩa này không có thông tin về áp suất và điện áp nào được coi là tối đa và tối thiểu. Đây có lẽ là lý do tại sao dải động của tín hiệu được xác định theo cách này được gọi là lý thuyết. Cùng với điều này, dải động của tín hiệu âm thanh có thể được xác định bằng thực nghiệm là sự khác biệt giữa mức tối đa và mức tối thiểu trong một thời gian khá dài. Giá trị này phụ thuộc đáng kể vào thời gian đo đã chọn và loại máy đo mức.

Phạm vi động của các loại tín hiệu âm nhạc và lời nói thuộc nhiều loại khác nhau, được đo bằng các dụng cụ, trung bình là:

80 dB cho dàn nhạc giao hưởng

45 dB cho dàn hợp xướng

35 dB cho nhạc pop và ca sĩ solo

25 dB cho lời nói của người nói

Khi ghi âm, cần phải điều chỉnh mức độ. Điều này được giải thích là do tín hiệu gốc (thô) thường có dải động lớn (ví dụ: lên tới 80 dB đối với nhạc giao hưởng) và các chương trình âm thanh tại nhà được nghe trong phạm vi khoảng 40 dB.

Có một nhược điểm cố hữu khi điều chỉnh mức độ theo cách thủ công. Thời gian phản ứng của kỹ sư âm thanh là khoảng 2 giây, ngay cả khi anh ta biết trước điểm của tác phẩm. Điều này dẫn đến sai sót trong việc duy trì mức tối đa chương trình âm nhạc lên tới 4 dB theo cả hai hướng.

Bộ khuếch đại, Hệ thống âm học và tai người cần được bảo vệ khỏi tình trạng quá tải do tác động đột ngột thay đổi đột ngột biên độ tín hiệu âm thanh - giới hạn biên độ tín hiệu.

Dải động của tín hiệu phải được phối hợp với dải động của các thiết bị ghi, khuếch đại và truyền dẫn.

Để tăng phạm vi của đài FM, dải động của tín hiệu âm thanh phải được nén. Để giảm độ ồn khi tạm dừng, bạn nên tăng dải động.

Cuối cùng, thời trang, vốn quy định các thuật ngữ của nó trong mọi lĩnh vực hoạt động của con người, bao gồm cả ghi âm, đòi hỏi âm thanh phong phú, dày đặc của âm nhạc hiện đại, điều này đạt được bằng cách thu hẹp đáng kể dải động của nó.

Sóng âm thanh (đường bao âm lượng) của một đoạn trong vở opera "Aleko" của S. Rachmaninov,

và âm nhạc múa đương đại.

Trong âm nhạc cổ điển sắc thái rất quan trọng, nhạc dance phải “mạnh”.

Điều này cho thấy nhu cầu sử dụng các thiết bị xử lý tự động các mức tín hiệu.