Как кодируется звуковая информация в компьютере?


Как кодируется звуковая информация в компьютере?

  • Внутри каждого компьютера сидит африканец-кастрат. Это он может запомнить любую мелодию а потом напеть. А если серьёзно, то в сути разобраться без понимания преобразования Фурье — не выйдет. А потом понеслось — кратковременное, дискретное, ковариационная функция — ну и т. д.
  • При помощи той же двоичной системы Просто в виде специального кода записываются интерсивность и частота звука. Важно, что эти величины представляют собой усредненную характеристику за некоторый момент времени. чем меньше этот момент тем ближе записанный звук к реальному. Для начала думаю зватит. более подробно посмотри любой учебник.
  • Странно, почему то все сразу начинают говорить про сжатие, тогда как сначала для записи в компьютер звука с микрофона требуется аналогово-цифровое преобразование. Упрощенно говоря, можно описать этот процесс как измерение напряжения или тока микрофона и запись в память измеренных значений как цифр (двоичных). Чтобы не потерять качество делается более 20 000 таких измерений в секунду и получается 20 000 чисел по 16 бит(2 байта) каждое. Так что пятиминутная песенка потребует 12 мегабайт памяти в моно звучании. В общем, немного звука в компьютер можно записать и без преобразования Фурье, и это легко может сделать любой пользователь стандартной программы «звукозапись». То, о чем говорится в предыдущих ответах, придумано для того, чтобы раз в 5 сократить потребность в памяти. Для воспроизведения звука процесс идет в обратном направлении. Это делает ЦАП (цифро-аналоговый преобразователь), кстати такое же устройство необходимо и для вывода изображения на экран .. Отдельный вопрос про кодирование звуков, взятых не с микрофона а синтезированных компьютером. В частности, существует формат midi, представляющий собой запись команд для «электронного оркестра».
  • Вообще любая информация кодируется с помощью 0 и 1, и графическая, и звуковая. Просто в случае с текстом в начало файла вставляется автоматически код, который говорит компьютеру, что этот файл нужно перевести в буквы. Со звуком тоже самое. Ещё есть зависимость от формата. Несжатый файл (например, wav, цифровое сжатие не используется) занимает много места, за то не требует никаких кодеков или времени на расшифровку и подготовки к воспроизведению. В mp3 история другая — файл делется на части. Допустим там 100 раз под ряд поввторяется комбинация 01101001. Чтобы сэкономить место, просто это записывается код который объясняет компьютеру как (переведу в слова) «Повторить 100 раз 01101001″. Это уменьшает объём но требует программу или подпрограмму для расшифровки.
  • Существуют две основных схемы сжатия с потерями: В трансформирующих кодеках берутся фреймы изображений или звука, разрезаются на небольшие сегменты, трансформируются в новое базисное пространство и производится квантизация. Результат затем сжимается энтропийными методами. В предсказывающих кодеках предыдущие и/или последующие данные используются для того, чтобы предсказать текущий фрейм изображения или звука. Ошибка между предсказанными данными и реальными вместе с добавочной информацией необходимой для производства предсказания затем квантизуется и кодируется. В некоторых системах эти две техники комбинируются путём использования трансформирующих кодеков для сжатия ошибочных сигналов сгенерированных на стадии предсказания.



Предыдущий:

Следующий: