Что представляет собой образец аудиоданных?

Я хочу знать, что представляет собой один образец аудиоданных (несжатый PCM).

Это число, но что это за число и как его можно преобразовать обратно в звук?

Например, если это 4-битная выборка, представляет ли 0 абсолютную тишину, а 15 - максимальную громкость?

Если это громкость, о какой частоте идет речь? Как хранится информация о частоте?

В песнях мы можем слышать разные инструменты (частоты) одновременно, то есть каждая частота каким-то образом хранится в одном сэмпле. Как это сделать?


person tioubxancur    schedule 24.03.2016    source источник
comment
не по теме, но вот ссылка: en.wikipedia.org/wiki/Pulse-code_modulation   -  person jaket    schedule 24.03.2016


Ответы (1)


Аудио - это просто кривая, которая колеблется вверх / вниз со временем влево / вправо. В заданный момент времени Образец является мерой высоты кривой. Тишина - это когда кривая не колеблется ... она просто идет ровной линией ... при нулевом значении с нулевым значением образца (точнее, среднее значение диапазона от максимального до минимального) ... когда кривая достигает максимальной высоты вверх или вниз этот отрезок звука самый громкий из возможных

Понятие нормализации важно ... абсолютный диапазон значений кривой (максимум вверх или вниз) произвольный ... может быть любым ... допустим, максимум 15, а минимум 0 ... помните, что тишина - это не колебание, поэтому в середине максимума тишина вверх / вниз будет около 7

Кривые могут быть закодированы в любое количество бит ... это примерно соответствует количеству горизонтальных линий, на которые вы нарезаете кривую ... больше линий, больше битов, поэтому большая точность в значении вашего образца высоты кривой

волна греха

Кривая sin или cos считается чистым тоном ... Джозеф Фурье доказал произвольную кривую ( аудио или иным образом) могут быть сохранены в виде набора кривых sin (A) различной громкости (макс. вверх / вниз) (B) различных частот (C) различных фазовых сдвигов ... что интересно, это преобразование работает в любом направлении: от кривую произвольной формы в набор выше (A / B / C) или из набора (A / B / C) обратно в синтез кривой произвольной формы (так работают синтезаторы звука)

Информация о хранении частоты запечена в форме кривой ... все дело в том, как часто кривая качается вверх / вниз ... ленивые колебания, требующие много времени, чтобы пересечь нижнюю и верхнюю среднюю линию, являются низкочастотными ... растяжка плотно расположенных волнистых линий подразумевает высокочастотный крик

Когда микрофон записывает, как несколько человек говорят одновременно или разные инструменты издают свои собственные звуки, у нас есть много одновременных частот, но запись каким-то образом просто работает - Как? подумайте, что происходит внутри микрофона (или с вашей плоской барабанной перепонкой) ... его катушку можно рассматривать как плоскую поверхность (2D-поверхность), которая может колебаться только вверх или вниз ... либо только движется вперед и назад ... это произвольная кривая ... одна кривая, которая в определенный момент времени имеет значение своей высоты при переходе от максимума к минимуму

person Scott Stensland    schedule 08.04.2016