к библиотеке   к мультимедиа технологиям   высокоуровн. языки - 3GL   визуальные среды - 4GL   технологии программирования

Аудиоинформация в мультимедийных технологиях

Звуковая информация (аудиоинформация) в мультимедийных системах технологически обычно представляется в виде аудиоряда, то есть последовательности значений амплитуды звукового давления, записанных в цифровой форме.

Аудиоряд может включать речь, музыку, эффекты (звуки типа шума, грома, скрипа и т.д.). Файлы, содержащие цифровую запись аудиоданных (голоса, музыкальных произведений или их фрагментов и других звуков любой природы).

Существуют два основных типа звуковых файлов: с оцифрованным звуком и нотной записью.

Файлы с оцифрованным звуком

Звуковые файлы, в которых исходная непрерывная ("аналоговая") форма сигнала записана в виде последовательности коротких дискретных значений амплитуд звукового сигнала, измеренных ("выбранных") через одинаковые промежутки времени и имеющих между собой весьма малый интервал. Процесс замены непрерывного сигнала последовательностью его значений называют дискретизацией, а такую форму записи - импульсно-кодовой модуляцией, ИКМ (англ. Pulse Code Modulation – PCM). Аппаратная реализация обработки оцифрованного звука состоит в том, что АЦП преобразует аналоговый сигнал во множество цифровых замеров, а при воспроизведении ЦАП осуществляет обратный процесс - преобразование цифрового сигнала в аналоговый. Файлы с оцифрованным звуком бывают двух видов: с заголовком и без заголовка.

Основные понятия, термины и другие данные, связанные с оцифровкой звука

Выборка, отсчет (звукового сигнала) - дискретное ("мгновенное") значение, соответствующее минимальному фрагменту исходного звукового сигнала. Выборка характеризует амплитуду звукового сигнала и обычно представляет собой целое число (8 или 16 бит). Может производиться по одному каналу (моно), двум (стерео) или большему числу каналов. Процесс разделения сигнала на выборки называется квантованием.

Разрядность дискретизации - величина, определяющая количество бит на один канал. Чем выше разрядность дискретизации, тем выше качество записи и воспроизведения звука.

Частота дискретизации - величина, которая определяет, сколько раз в секунду производится считывание выборок из аналогового сигнала. При цифровой записи звуков частота дискретизации измеряется в герцах и килогерцах. Чем выше частота дискретизации, тем выше качество звука.

Некоторые форматы звуковых файлов поддерживают произвольную частоту дискретизации (например, VOC-файлы в диапазоне от 5000 до 44100 Гц); другие - только определенные частоты дискретизации (WAV-файлы могут быть оцифрованы с частотами 11 025, 22050, 44100 Гц). Поэтому конвертирование (преобразование) файла одного формата в другой не всегда возможно.

Файлы с заголовком

В заголовке указываются параметры, которые характеризуют оцифрованный звук, включая: частоту дискретизации; количество битов на отсчет (8 или 16); количество каналов - моно (1) или стерео (2); ASCII-символы, описывающие тип файла; длину записанных данных в байтах; номер версии формата; метод компрессии; величину смещения блока данных относительно начала файла и др.

Перечень и области применения наиболее распространенных форматов звуковых файлов с заголовком:

Расширение

Краткие сведения о форматах

*.aiff, *.aif

AIF, AIFF [Audio Interchange File Format] - данный формат распространен в системах Apple Macintosh и Silicon Graphics;

AIFC, AIFF-С [Audio Interchange File Format-Compressed] - тот же AIFF, только с заданными параметрами сжатия (компрессии); используются в ПК фирмы Apple.

*.au
*.snd

AU - звуковой формат предназначен для работы со звуком в рабочих системах SUN, NeXT, DEC, Linux и FreeBSD; обеспечивает экономию памяти, благодаря чему нашел широкое распространение в Интернете.

*.iff

IFF [Interchange File Format] - формат, который имеет сходство с RIFF [Resource Interchange File Format], являющимся универсальным для записи любых структурированных данных. Основное отличие заключается в поддержке им так называемой программно-сэмплерной эмуляции музыкальных инструментов. Звук в файле делится на две части: то, что должно звучать вначале, и элемент того, что идет за началом. В результате вторая часть звукового фрагмента повторяется за начальной столько раз, сколько нужно пользователю и нота может звучать сколь угодно долго. Используется в системах типа IFF/8SVX на компьютерах фирмы Amiga.

*.mp3

MР3 - формат, в котором использованы параметры сжатия, имеющие сходство с форматом jpeg для изображений. Коэффициент сжатия составляет 10 - 12 раз, однако специалистами он считается достаточно сложным и не обеспечивающим высокое качество звука.

*.voc

VOC [Voice File] - 8-битный моно-формат семейства звуковых карт SoundBlaster фирмы Creative Labs. Широко используется в старых немузыкальных программах.

HСОМ - то же самое, что и VOC (8 бит, моно), но только для ПК фирмы Apple Macintosh.

*.wav

WAVE [Waveform Audio File] - формат, разработанный фирмой Microsoft и зарекомендовавший себя одним из простейших для записи и хранения дискретных данных. Относится к одному из вариантов файлов семейства RIFF [Resource Interchange File Format] и является жестко структурированным. В заголовке помимо обычных значений (в том числе разрядность, уровни громкости и т.п.) в wav могут быть указаны и многие другие параметры, например, метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также текстовая информация.

Перечень и области применения наиболее распространенных форматов звуковых файлов без заголовка

Расширение

Краткие сведения о форматах

*.pcm

PCM* [Pulse Code Modulation] - буквально: "Импульсно-кодовая модуляция - ИКМ". Хотя файлы с таким расширением встречаются редко (в основном на аудио-CD), ИКМ является основополагающей для всех звуковых файлов. Метод записи и хранения аудиоинформации в этом формате неэкономный, однако объемы современных устройств внешней памяти (в том числе винчестеров и оптических дисков) позволяют его использовать несмотря на связанные с этим потери, которые могут составлять десятки мегабайт.

*.dpcm

DPCM* [Difference Pulse Code Modulation] - вариант формата PCM, в котором с целью повышения экономии хранения звуковых данных на диске использован метод сжатия записи, получивший наименования "Разностного РСМ". Данная схема сжатия с фиксированной скоростью преобразовывает последовательность измерений, сохраняя только разницу между последующим и предыдущим значениями сигналов. Сохранение дискового пространства происходит за счет того, что значение разности меньше самих измерений

*.adpcm

ADPCM [Adaptive DPCM] - "Адаптивный DPCM": формат DPCM, дополненный использованием так называемого коэффициента масштабируемости. Необходимость этой меры обусловлена требованием исключения искажений звука, вызванных ошибками измерения разности амплитуд сигналов, которые связаны со значительными перепадами громкости отдельных составляющих звука.

Форматы семейства PCM используются не только для записи звука, но и сейсмограмм, где неприемлемы способы сжатия по времени, не дающие возможность осуществить прецизионную службу времени (точность записи по временной шкале).

Файлы с нотной записью

Звуковые файлы, которые содержат последовательность команд, сообщающих какую ноту и каким инструментом и как долго нужно воспроизводить в тот или иной момент времени. Формат может предусматривать одновременную игру нескольких музыкальных инструментов, в этом случае говорят о соответствующем количестве голосов. Например, плата Sound Blaster 16 поддерживает 20-голосный синтез.

При воспроизведении файлов с нотной записью могут использоваться следующие виды синтеза звука:

FM-синтез - синтез с использованием частотной модуляции, при которой формируется частота звучания соответствующей ноты. Данный метод позволяет успешно имитировать реальные музыкальные инструменты (пианино, гитару и т.п.);

wavetable-синтез - "Табличный синтез": использует оцифровку нот реальных инструментов. Получение требуемой ноты производится путем оцифровки одной ноты реального инструмента. Исходные оцифровки содержатся в файле с нотной записью или в отдельном файле (такие файлы одновременно являются файлами с нотной записью и содержат оцифрованный звук).

Перечень стандартов и форматов звуковых файлов с нотной записью

Расширение

Область применения/фирма разработчик

*.mid

MID - формат файла, который содержит сообщения о MIDI-системе, установленной на ПК или в устройстве. Имеет следующие разновидности:

Roland LA (разработан фирмой Roland Corporation);

GM (General MIDI) - стандарт MIDI-сообщений. Определяет соответствие 128 номеров патчей звукового банка данных конкретным инструментам. Для ударных инструментов зарезервирован 10-й MIDI-канал. Стандартизирует также номера основных контроллеров.

Использует все 16 каналов. Преимущество обмена файлами MIDI по сравнению с файлами оцифрованного звука состоит в том, что файлы MIDI намного меньше по размеру, так как они хранят ноты, а не детальную запись звука.

Basic MIDI - использует каналы с 13-го по 16-й;

Extended MIDI - использует каналы с 1-го по 10-й;

GS (General Sound) - расширенная версия стандарта GM, разработанная фирмой Roland; допускается использование иерархии многих звуковых банков данных; предусмотрено до десяти переключаемых наборов ударных инструментов; расширен список контроллеров;

XG - наиболее развитый по состоянию на 1999 г. стандарт MIDI-сообщений, предложенный фирмой Yamaha.

*.mod

MOD - формат, который поддерживая "понотный подход" хранения данных, на самом деле хранит образцы звука. Первоначально использовался программами SoundTracker, NoiseTracker (ПК Amiga). Поддерживается многими программами IBM-совместимых ПК (4 канала, есть варианты до 32 каналов). Файлы с нотной записью .mod и аналогичные (с оцифровками инструментов) можно послушать с помощью разнообразных программ-проигрывателей, которые обычно позволяют воспроизводить один формат файлов. В этом одно из его преимуществ по отношению к формату MIDI.

 

к библиотеке   к мультимедиа технологиям   высокоуровн. языки - 3GL   визуальные среды - 4GL   технологии программирования

Знаете ли Вы, что "гравитационное линзирование" якобы наблюдаемое вблизи далеких галактик (но не в масштабе звезд, где оно должно быть по формулам ОТО!), на самом деле является термическим линзированием, связанным с изменениями плотности эфира от нагрева мириадами звезд. Подробнее читайте в FAQ по эфирной физике.

НОВОСТИ ФОРУМА

Форум Рыцари теории эфира


Рыцари теории эфира
 10.11.2021 - 12:37: ПЕРСОНАЛИИ - Personalias -> WHO IS WHO - КТО ЕСТЬ КТО - Карим_Хайдаров.
10.11.2021 - 12:36: СОВЕСТЬ - Conscience -> РАСЧЕЛОВЕЧИВАНИЕ ЧЕЛОВЕКА. КОМУ ЭТО НАДО? - Карим_Хайдаров.
10.11.2021 - 12:36: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от д.м.н. Александра Алексеевича Редько - Карим_Хайдаров.
10.11.2021 - 12:35: ЭКОЛОГИЯ - Ecology -> Биологическая безопасность населения - Карим_Хайдаров.
10.11.2021 - 12:34: ВОЙНА, ПОЛИТИКА И НАУКА - War, Politics and Science -> Проблема государственного терроризма - Карим_Хайдаров.
10.11.2021 - 12:34: ВОЙНА, ПОЛИТИКА И НАУКА - War, Politics and Science -> ПРАВОСУДИЯ.НЕТ - Карим_Хайдаров.
10.11.2021 - 12:34: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Вадима Глогера, США - Карим_Хайдаров.
10.11.2021 - 09:18: НОВЫЕ ТЕХНОЛОГИИ - New Technologies -> Волновая генетика Петра Гаряева, 5G-контроль и управление - Карим_Хайдаров.
10.11.2021 - 09:18: ЭКОЛОГИЯ - Ecology -> ЭКОЛОГИЯ ДЛЯ ВСЕХ - Карим_Хайдаров.
10.11.2021 - 09:16: ЭКОЛОГИЯ - Ecology -> ПРОБЛЕМЫ МЕДИЦИНЫ - Карим_Хайдаров.
10.11.2021 - 09:15: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Екатерины Коваленко - Карим_Хайдаров.
10.11.2021 - 09:13: ВОСПИТАНИЕ, ПРОСВЕЩЕНИЕ, ОБРАЗОВАНИЕ - Upbringing, Inlightening, Education -> Просвещение от Вильгельма Варкентина - Карим_Хайдаров.
Bourabai Research - Технологии XXI века Bourabai Research Institution