Информационный объем аудиофайла. Урок "решение задач на кодирование звуковой информации"


При решении задач учащиеся опираются на следующие понятия:

Временная дискретизация – процесс, при котором, во время кодирования непрерывного звукового сигнала, звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды. Чем больше амплитуда сигнала, тем громче звук.

Глубина звука (глубина кодирования) - количество бит на кодировку звука.

Уровни громкости (уровни сигнала) - звук может иметь различные уровни громкости. Количество различных уровней громкости рассчитываем по формуле N = 2 I где I – глубина звука.

Частота дискретизации – количество измерений уровня входного сигнала в единицу времени (за 1 сек). Чем больше частота дискретизации, тем точнее процедура двоичного кодирования. Частота измеряется в герцах (Гц). 1 измерение за 1 секунду -1 ГЦ.

1000 измерений за 1 секунду 1 кГц. Обозначим частоту дискретизации буквой D . Для кодировки выбирают одну из трех частот: 44,1 КГц, 22,05 КГц, 11,025 КГц.

Считается, что диапазон частот, которые слышит человек, составляет от 20 Гц до 20 кГц .

Качество двоичного кодирования – величина, которая определяется глубиной кодирования и частотой дискретизации.

Аудиоадаптер (звуковая плата) – устройство, преобразующее электрические колебания звуковой частоты в числовой двоичный код при вводе звука и обратно (из числового кода в электрические колебания) при воспроизведении звука.


Характеристики аудиоадаптера: частота дискретизации и разрядность регистра.).

Разрядность регистра - число бит в регистре аудиоадаптера. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического тока в число и обратно. Если разрядность равна I , то при измерении входного сигнала может быть получено 2 I = N различных значений.

Размер цифрового моноаудиофайла (A ) измеряется по формуле:

A = D * T * I /8 , где D частота дискретизации (Гц), T – время звучания или записи звука, I разрядность регистра (разрешение). По этой формуле размер измеряется в байтах.

Размер цифрового стереоаудиофайла (A ) измеряется по формуле:

A =2* D * T * I /8 , сигнал записан для двух колонок, так как раздельно кодируются левый и правый каналы звучания.

Учащимся полезно выдать таблицу 1 , показывающую, сколько Мб будет занимать закодированная одна минута звуковой информации при разной частоте дискретизации:

1. Размер цифрового файла

Уровень «3»

1. Определить размер (в байтах) цифрового аудиофайла, время звучания которого составляет 10 секунд при частоте дискретизации 22,05 кГц и разрешении 8 бит. Файл сжатию не подвержен. (, стр. 156, пример 1)

Решение:

Формула для расчета размера (в байтах) цифрового аудио-файла: A = D * T * I /8.

Для перевода в байты полученную величину надо разделить на 8 бит.

22,05 кГц =22,05 * 1000 Гц =22050 Гц

A = D * T * I /8 = 22050 х 10 х 8 / 8 = 220500 байт.

Ответ: размер файла 220500 байт.

2. Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 бит. (, стр. 157, №88)

Решение :

A = D * T * I /8. – объем памяти для хранения цифрового аудиофайла.

44100 (Гц) х 120 (с) х 16 (бит) /8 (бит) = 10584000 байт= 10335,9375 Кбайт= 10,094 Мбайт.

Ответ: ≈ 10 Мб

Уровень «4»

3. В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретизации и разрядность? (, стр. 157, №89)

Решение:

Формула для расчета частоты дискретизации и разрядности: D* I =А/Т

(объем памяти в байтах) : (время звучания в секундах):

2, 6 Мбайт= 2726297,6 байт

D* I =А/Т= 2726297,6 байт: 60 = 45438,3 байт

D=45438,3 байт: I

Разрядность адаптера может быть 8 или 16 бит. (1 байт или 2 байта). Поэтому частота дискретизации может быть либо 45438,3 Гц = 45,4 кГц ≈ 44,1 кГц –стандартная характерная частота дискретизации, либо 22719,15 Гц = 22,7 кГц ≈ 22,05 кГц - стандартная характерная частота дискретизации

Ответ:

Частота дискретизации

Разрядность аудиоадаптера

1 вариант

22,05 КГц

16 бит

2 вариант

44,1 КГц

8 бит

4. Объем свободной памяти на диске - 5,25 Мб, разрядность звуковой платы - 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 22,05 кГц? (, стр. 157, №90)


Решение:

Формула для расчета длительности звучания: T=A/D/I

(объем памяти в байтах) : (частота дискретизации в Гц) : (разрядность звуковой платы в байтах):

5,25 Мбайт = 5505024 байт

5505024 байт: 22050 Гц: 2 байта = 124,8 сек
Ответ: 124,8 секунды

5. Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой платы - 8. С какой частотой дискретизации записан звук? (, стр. 157, №91)

Решение:

Формула для расчета частоты дискретизации: D =А/Т/I

(объем памяти в байтах) : (время записи в секундах) : (разрядность звуковой платы в байтах)

1,3 Мбайт = 1363148,8 байт

1363148,8 байт: 60: 1 = 22719,1 Гц

Ответ: 22,05 кГц

6. Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мб. Частота дискретизации - 22050 Гц. Какова разрядность аудиоадаптера? (, стр. 157, №94)

Решение:

Формула для расчета разрядности: (объем памяти в байтах) : (время звучания в секундах): (частота дискретизации):

5, 1 Мбайт= 5347737,6 байт

5347737,6 байт: 120 сек: 22050 Гц= 2,02 байт =16 бит

Ответ: 16 бит

7. Объем свободной памяти на диске - 0,01 Гб, разрядность звуковой платы - 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44100 Гц? (, стр. 157, №95)

Решение:

Формула для расчета длительности звучания T=A/D/I

(объем памяти в байтах) : (частота дискретизации в Гц) : (разрядность звуковой платы в байтах)

0,01 Гб = 10737418,24 байт

10737418,24 байт: 44100: 2 = 121,74 сек =2,03 мин
Ответ: 20,3 минуты

8. Оцените информационный объем моноаудиофайла длительностью звучания 1 мин. если "глубина" кодирования и частота дискретизации звукового сигнала равны соответственно:
а) 16 бит и 8 кГц;
б) 16 бит и 24 кГц.

(, стр. 76, №2.82)

Решение:

а).
16 бит х 8 000 = 128000 бит = 16000 байт = 15,625 Кбайт/с
15,625 Кбайт/с х 60 с = 937,5 Кбайт

б).
1) Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 24 000 = 384000 бит = 48000 байт = 46,875 Кбайт/с
2) Информационный объем звукового файла длительностью 1 минута равен:
46,875 Кбайт/с х 60 с =2812,5 Кбайт = 2,8 Мбайт

Ответ: а) 937,5 Кбайт; б) 2,8 Мбайт

Уровень «5»

Используется таблица 1

9. Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты? (, стр. 157, №92)

Решение:

Высокое качество звучания достигается при частоте дискретизации 44,1КГц и разрядности аудиоадаптера, равной 16.
Формула для расчета объема памяти: (время записи в секундах) x (разрядность звуковой платы в байтах) x (частота дискретизации):
180 с х 2 х 44100 Гц = 15876000 байт = 15,1 Мб
Ответ: 15,1 Мб

10. Цифровой аудиофайл содержит запись звука низкого качества (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб? (, стр. 157, №93)

Решение:

Для мрачного и приглушенного звука характерны следующие параметры: частота дискретизации - 11, 025 КГц, разрядности аудиоадаптера - 8 бит (см. таблицу 1). Тогда T=A/D/I. Переведем объем в байты: 650 Кб = 665600 байт

Т=665600 байт/11025 Гц/1 байт ≈60.4 с

Ответ: длительность звучания равна 60,5 с

Решение:

Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 48 000 х 2 = 1 536 000 бит = 187,5 Кбайт (умножили на 2, так как стерео).

Информационный объем звукового файла длительностью 1 минута равен:
187,5 Кбайт/с х 60 с ≈ 11 Мбайт

Ответ: 11 Мб

Ответ: а) 940 Кбайт; б) 2,8 Мбайт.

12. Рассчитайте время звучания моноаудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен:
а) 700 Кбайт;
б) 6300 Кбайт

(, стр. 76, №2.84)

Решение:

а).
1) Информационный объем звукового файла длительностью в 1 секунду равен:

700 Кбайт: 62,5 Кбайт/с = 11,2 с

б).
1) Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 32 000 = 512000 бит = 64000 байт = 62,5 Кбайт/с
2) Время звучания моноаудиофайла объемом 700 Кбайт равно:
6300 Кбайт: 62,5 Кбайт/с = 100,8 с = 1,68 мин

Ответ: а) 10 сек; б) 1,5 мин.

13. Вычислить, сколько байт информации занимает на компакт-диске одна секунда стереозаписи (частота 44032 Гц, 16 бит на значение). Сколько занимает одна минута? Какова максимальная емкость диска (считая максимальную длительность равной 80 минутам)? (, стр. 34, упражнение №34)

Решение:

Формула для расчета объема памяти A = D * T * I :
(время записи в секундах) * (разрядность звуковой платы в байтах) * (частота дискретизации). 16 бит -2 байта.
1) 1с х 2 х 44032 Гц = 88064 байт (1 секунда стереозаписи на компакт-диске)
2) 60с х 2 х 44032 Гц = 5283840 байт (1 минута стереозаписи на компакт-диске)
3) 4800с х 2 х 44032 Гц = 422707200 байт=412800 Кбайт=403,125 Мбайт (80 минут)

Ответ: 88064 байт (1 секунда), 5283840 байт (1 минута), 403,125 Мбайт (80 минут)

2. Определение качества звука.

Для определения качества звука надо найти частоту дискретизации и воспользоваться таблицей №1

256 (28) уровней интенсивности сигнала - качество звучания радиотрансляции, использованием 65536 (216) уровней интенсивности сигнала - качество звучания аудио-CD. Самая качественная частота соответствует музыке, записанной на компакт-диске. Величина аналогового сигнала измеряется в этом случае 44 100 раз в секунду.

Уровень «5»

13. Определите качество звука (качество радиотрансляции, среднее качество, качество аудио-CD) если известно, что объем моноаудиофайла длительностью звучания в 10 сек. равен:
а) 940 Кбайт;
б) 157 Кбайт.

(, стр. 76, №2.83)

Решение:

а).
1) 940 Кбайт= 962560 байт = 7700480 бит
2) 7700480 бит: 10 сек = 770048 бит/с
3) 770048 бит/с: 16 бит = 48128 Гц –частота дискретизации – близка к самой высокой 44,1 КГц
Ответ: качество аудио-CD

б).
1) 157 Кбайт= 160768 байт = 1286144 бит
2) 1286144 бит: 10 сек = 128614,4 бит/с
3) 128614,4 бит/с: 16 бит = 8038,4 Гц
Ответ: качество радиотрансляции

Ответ: а) качество CD; б) качество радиотрансляции.

14. Определите длительность звукового файла, который уместится на гибкой дискете 3,5”. Учтите, что для хранения данных на такой дискете выделяется 2847 секторов объемом 512 байт.
а) при низком качестве звука: моно, 8 бит, 8 кГц;
б) при высоком качестве звука: стерео, 16 бит, 48 кГц.

(, стр. 77, №2.85)

Решение:

а).

8 бит х 8 000 = 64 000 бит = 8000 байт = 7,8 Кбайт/с
3) Время звучания моноаудиофайла объемом 1423,5 Кбайт равно:
1423,5 Кбайт: 7,8 Кбайт/с = 182,5 с ≈ 3 мин

б).
1) Информационный объем дискеты равен:
2847 секторов х 512 байт = 1457664 байт = 1423,5 Кбайт
2) Информационный объем звукового файла длительностью в 1 секунду равен:
16 бит х 48 000 х 2= 1 536 000 бит = 192 000 байт = 187,5 Кбайт/с
3) Время звучания стереоаудиофайла объемом 1423,5 Кбайт равно:
1423,5 Кбайт: 187,5 Кбайт/с = 7,6 с

Ответ: а) 3 минуты; б) 7,6 секунды.

3. Двоичное кодирование звука.

При решении задач пользуется следующим теоретическим материалом:

Для того, чтобы кодировать звук, аналоговый сигнал, изображенный на рисунке,

плоскость разбивается на вертикальные и горизонтальные линии. Вертикальное разбиение –это дискретизация аналогового сигнала (частота измерения сигнала), горизонтальное разбиение - квантование по уровню. Т. е. чем мельче сетка – тем качественнее приближен аналоговый звук с помощью цифр. Восьмибитное квантование применяется для оцифровки обычной речи (телефонного разговора) и радиопередач на коротких волнах. Шестнадцатибитное – для оцифровки музыки и УКВ (ультро-коротко-волновые) радиопередач.

Уровень «3»

15. Аналоговый звуковой сигнал был дискретизирован сначала с использованием 256 уровней интенсивности сигнала (качество звучания радиотрансляции), а затем с использованием 65536 уровней интенсивности сигнала (качество звучания аудио-CD). Во сколько раз различаются информационные объемы оцифрованного звука? (, стр. 77, №2.86)

Решение:

Длина кода аналогового сигнала с использованием 256 уровней интенсивности сигнала равна 8 битам, с использованием 65536 уровней интенсивности сигнала равна 16 битам. Так как длина кода одного сигнала увеличилась вдвое, то информационные объемы оцифрованного звука различаются в 2 раза.

Ответ: в 2 раза.

Уровень «

16. Согласно теореме Найквиста-Котельникова, для того чтобы аналоговый сигнал можно было точно восстановить по его дискретному представлению (по его отсчетам), частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты этого сигнала.

· Какова должна быть частота дискретизации звука, воспринимаемого человеком?

· Что должно быть больше: частота дискретизации речи или частота дискретизации звучания симфонического оркестра?

Цель: познакомить учащихся с характеристиками аппаратных и программных средств работы со звуком. Виды деятельности: привлечение знаний из курса физики (или работа со справочниками). (, стр. ??, задача 2)

Решение:

Считается, что диапазон частот, которые слышит человек, составляет от 20 Гц до 20 кГц. Таким образом, по теореме Найквиста-Котельникова, для того чтобы аналоговый сигнал можно было точно восстановить по его дискретному представлению (по его отсчетам), частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты этого сигнала. Максимальная звуковая частота которую слышит человек -20 КГц, значит, аппарату ра и программные средства должны обеспечивать частоту дискретизации не менее 40 кГц, а точнее 44,1 КГц. Компьютерная обработка звучания симфонического оркестра предполагает более высокую частоту дискретизации, чем обработка речи, поскольку диапазон частот в случае симфонического оркестра значительно больше.

Ответ: не меньше 40 кГц, частота дискретизации симфонического оркестра больше.

Уровень»5»

17. На рисунке изображено зафиксированное самописцем звучание 1 секунды речи. Закодируйте его в двоичном цифровом коде с частотой 10 Гц и длиной кода 3 бита. (, стр. ??, задача 1)

Решение:

Кодирование с частотой 10 Гц означает, что мы должны измерить высоту звука 10 раз за секунду. Выберем равноотстоящие моменты времени:

Длина кода в 3 бита означает 23 = 8 уровней квантования. То есть в качестве числового кода высоты звука в каждый выбранный момент времени мы можем задать одну из следующих комбинаций: 000, 001, 010, 011, 100, 101, 110, 111. Их всего 8, следовательно, высоту звука можно измерять на 8 «уровнях»:

«Округлять» значения высоты звука будем до ближайшего нижнего уровня:

Используя данный способ кодирования, мы получим следующий результат (пробелы поставлены для удобства восприятия): 100 100 000 011 111 010 011 100 010 110.

Примечание. Целесообразно обратить внимание учащихся на то, насколько неточно код передает изменение амплитуды. То есть частота дискретизации 10 Гц и уровень квантования 23 (3 бита) слишком малы. Обычно для звука (голоса) выбирают частоту дискретизации 8 кГц, т. е. 8000 раз в секунду, и уровень квантования 28 (код длиной 8 бит).

Ответ: 100 100 000 011 111 010 011 100 010 110.

18. Объясните, почему уровень квантования относится, наряду с частотой дискретизации, к основным характеристикам представления звука в компьютере. Цели: закрепить понимание учащимися понятий «точность представления данных», «погрешность измерения», «погрешность представления»; повторить с учащимися двоичное кодирование и длину кода. Вид деятельности: работа с определениями понятий. (, стр. ??, задача 3)

Решение:

В геометрии, физике, технике есть понятие «точность измерения», тесно связанное с понятием «погрешность измерения». Но есть еще и понятие «точность представления». Например, про рост человека можно сказать, что он: а) около. 2 м, б) чуть больше 1,7 м, в) равен 1 м 72 см, г) равен 1 м 71 см 8 мм. То есть для обозначения измеренного роста можно использовать 1, 2, 3 или 4 цифры.
Так же и для двоичного кодирования. Если для записи высоты звука в конкретный момент времени использовать только 2 бита, то, даже если измерения были точны, передать можно только 4 уровня: низкий (00), ниже среднего (01), выше среднего (10), высокий (11). Если использовать 1 байт, то можно передать 256 уровней. Чем выше уровень квантования , или, что то же самое, чем больше битов отводится для записи измеренного значения, тем точнее передается это значение.

Примечание. Следует отметить, что измерительный инструмент тоже должен поддерживать выбранный уровень квантования (длину, измеренную линейкой с дециметровыми делениями, нет смысла представлять с точностью до миллиметра).

Ответ: чем выше уровень квантования тем точнее передается звук.

Литература:

[ 1] Информатика. Задачник-практикум в 2 т. /Под ред. , : Том 1. – Лаборатория Базовых Знаний, 1999 г. – 304 с.: ил.

Практикум по информатике и информационным технологиям . Учебное пособие для общеобразовательных учреждений / , . – М.: Бином. Лаборатория Знаний, 2002. 400 с.: ил.

Информатика в школе: Приложение к журналу «Информатика и образование». №4 - 2003. - М.: Образование и Информатика, 2003. - 96 с.: ил.

И др. Информационная культура: одирование информации. Информационные модели. 9-10 класс: Учебник для общеобразовательных учебных заведений. - 2-е изд. - М.: Дрофа, 1996. - 208 с.: ил.

Сенокосов по информатике для школьников. - Екатеринбург: «У-Фактория», 2003. - 346. с54-56.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Практическое занятие

Работа со звуковой системой ПК. Вычисление информационного объёма закодированного звука

Цель работы: Ознакомиться с компьютерными акустическими системами. Научиться находить информационный объём закодированного звука.

уметь :

Выбирать рациональную конфигурацию оборудования в соответствии с решаемой задачей;

Определять совместимость аппаратного и программного обеспечения;

Осуществлять модернизацию аппаратных средств.

В результате выполнения практической работы обучающийся должен знать :

Основные конструктивные элементы средств вычислительной техники;

Периферийные устройства вычислительной техники;

Нестандартные периферийные устройства.

Теоретическая часть

Звуковое оборудование - обязательный элемент каждого аудиовизуального комплекса. Система звукового сопровождения обязательно включает в себя источники звука и акустические системы. В её состав также может входить оборудование для усиления, микширования и обработки звуковых сигналов. К системе звукового сопровождения могут быть отнесены элементы систем конференцсвязи, конгресс-систем, системы протоколирования.

Источниками аудиоинформации могут служить:

· аппараты воспроизведения (DVD-проигрыватели, TV-тюнеры и т.д.);

· компьютерная техника (ноутбуки, медиа серверы и т.д.);

· проводные и радиомикрофоны, микрофонные пульты конгресс-систем, оборудование для синхронного перевода;

· системы аудио - и видеоконференцсвязи;

· устройства протоколирования.

Для корректной записи и воспроизведения звука в состав системы звукового сопровождения входят устройства для усиления сигналов, микширования и обработки.

Цифровая аудио платформа представляет собой небольшой модуль, который заменяет целый шкаф с аналогичными аналоговыми устройствами, избавляет от сложной системы коммутации, имеет удобный интерфейс настройки и управления, и значительно дешевле аналогового решения.

Тюнер - персональное абонентское устройство, служащее для выделения и демодуляции сигнала. ТВ-тюнер - род тюнера, предназначенный для приёма телевизионного сигнала в различных форматах вещания с показом на компьютере или просто на отдельном мониторе.

По конструктивному исполнению ТВ-тюнеры бывают внешние (подключаются к компьютеру либо через USB, либо между компьютером и дисплеем через видеокабель) и внутренние (вставляются в слот ISA, или PCI, или PCI-Express).

Звуковая карта - дополнительное оборудование ПК, позволяющее обрабатывать звук. В современных компьютерах звуковые карты представлены интегрированного в материнскую плату кодека.

Звуковые файлы - файлы, содержащие цифровую запись аудиоданных. Существует два основных типа звуковых файлов: с оцифрованным звуком и нотной записью . Звуковые файлы представляют собой составную часть мультимедиа.

Существуют звуковые файлы различных форматов:

· MIDI - запись музыкальных произведений в виде команд синтезатору; музыкальные файлы компактны, голос человека не воспроизводят.

· WAV - универсальный звуковой формат, в котором хранится полная информация об оцифрованном звуке.

· MP 3 - формат сжатия аудиоинформации с регулируемой потерей информации, позволяющий сжимать файлы в несколько раз в зависимости от заданного битрейта. Даже при самом высоком битрейте - 320Кби/с - обеспечивает четырёхкратное сжатие по сравнению с компакт-дисками.

· APE -формат сжатия аудиоинформации без потери информации.

Файлы с оцифрованным звуком - звуковые файлы, в которых исходная непрерывная (аналоговая) форма сигнала записана в виде последовательности коротких дискретных значений амплитуд звукового сигнала, измеренных через одинаковые промежутки времени и имеющих между собой весьма малый интервал. Процесс замены непрерывного сигнала последовательностью его значений называют дискретизацией, а такую форму записи - импульсно-кодовой. Файлы с оцифрованным звуком бывают двух видов: с заголовком и без заголовка.

Файлы с нотной записью - звуковые файлы, которые содержат последовательность команд, сообщающих, какую ноту, каким инструментом и как долго нужно воспроизводить в тот или иной момент времени.

Рассмотрим основные стандарты многоканального звука .

DolbyStereo - стандарт на технологию цифровой записи звукового сопровождения фильмов для кинотеатров, позволяющий кодировать на двух звуковых дорожках киноплёнки четыре канала: левый, центральный, правый и тыловой. Считанный с киноплёнки сигнал преобразуется декодером в четырёхканальный, дающий эффект окружающего звука. Без декодера звук воспроизводиться как обычный двухканальный стерео.

DolbySurround (DSS) - система, позволяющая из закодированного двухканального сигнала выделять три звуковых канала: левый, правый и тыловой. Считанный с киноплёнки сигнал декодируется в трёхканальный. При отсутствии декодера воспроизводится обычный двухканальный стереозвук.

DolbyPro-Logic (DPL) - система, позволяющая из закодированного двухканального сигнала выделять четыре звуковых канала: левый, центральный, правый и тыловой. Система использует дополнительный громкоговоритель центрального канала, который «привязывает» диалоги к экрану, а эффект окружающего звучания воспроизводится через тыловые каналы.

DolbyDigital -- это стандарт для декодирования многоканального звука, в котором звук представляется шестью отдельными каналами: пятью каналами окружающего звука (левым, правым, центральным и двумя фронтальными) и одним низкочастотным каналом (сабвуфером). Представление звука изначально было цифровым, а частотный диапазон был расширен с 20 Гц до 20 кГц (на данный момент частотный диапазон составляет от 3 Гц до 20 кГц для пяти каналов и от 3 Гц до 120 кГц для канала сабвуфера). Данный стандарт является сегодня одним из самых распространенных.

DolbiDigital (AC-3) - самый популярный на сегодняшний день формат многоканального звука, принятый в качестве звукового стандарта для видеодисков формата DVD. Этот полностью цифровой формат содержит 6 независимых каналов звука, из них 5 полно диапазонных (30 - 20 000 Гц): три фронтальных (левый, центральный и правый) и два тыловых, плюс один низкочастотный (20-120 Гц) канал сабвуфера. Звучание фонограмм, записанное в формате DolbiDigital, характеризуется очень высоким качеством звука - полностью отсутствует шум носителя (как это явно присутствует, например, в аудио кассетах).

DolbySurround AC3 -- упрощенный вариант стандарта DolbyDigital, предназначенный для систем домашних кинотеатров. От стандарта DolbyDigital данный стандарт отличается сниженными скоростями потока данных.

DTS (DigitalTheaterSystem) представляет собой стандарт шестиканального звука, только с гораздо более высоким качеством. Коэффициент сжатия составляет здесь 4:1, а скорость потока данных (битрейт) -- 882 Кбит/с (алгоритм apt-X100). Благодаря меньшей степени сжатия и более совершенному алгоритму, качество звука, закодированного в DTS, гораздо выше, чем у DolbyDigital, однако последний стандарт более распространен в связи с широким распространением DVD.

DolbyProLogic II , представляет собой дальнейшее развитие стандартов DolbyStereoProLogic, позволяет декодеру раскладывать обычный стереозвук на шесть каналов.

DolbyProLogicIIx -- это следующий шаг в развитии стандарта DolbyProLogic II. В данном случае подразумевается возможность разложения стереозвука на семь или на восемь каналов. Возможны три режима декодирования:

* фильм (Movie) -- дублирование центрального канала или тыловых каналов;

* игра (Play) -- сигнал всего лишь дополнительно направляется на «новые каналы»;

* музыка (Music).

Ни в одном из режимов не используется информация с фронтальных каналов (только с центрального и тыловых).

DolbyDigital EX - вариант стандарта DolbyProLogicIIx, предназначенный для домашних кинотеатров.

DolbyDigitalSurround EX -- это относительно новый, расширенный до 7 каналов вариант стандарта DolbyDigitalSurround. В данном стандарте имеется еще один задний канал, который дублирует существующий центральный канал, если исходный звук записан в формате 5+1. Если же исходный файл представлен в формате 6+1, то дополнительный канал становится еще одним полноценным каналом окружающего звука.

DTS-ES -- это полноценный аналог стандарта DolbyDigital EX, но от компании DTS. Данный стандарт также позволяет кодировать звук в форматах 6+1 и 7+1 и раскладывать звук формата 5+1, закодированный в DTS, соответственно на семь или восемь каналов.

Звук - это волновые колебания в упругой среде. Звук характеризуется частотой (измеряется в герцах, 1 Гц=1колебание в секунду, человек воспринимает звуки в диапазоне от 16 Гц до 20 кГц) и амплитудой (сила звука, звуковое давление измеряется в Паскалях, воспринимаемая человеком громкость звука - от 20мкПа до 200 Па).

Временная дискретизация - это процесс, при котором звуковая волна разбивается на отдельные маленькие временные участки, причём для каждого устанавливается определённая амплитуда.

Частота дискретизации показывает, сколько раз в секунду измеряется моментальное значение сигнала. Если сигнал оцифровывается при частоте дискретизации 44 кГц, то измерения производятся 44 000 раз в секунду.

Количество уровней громкости выражается глубиной звука - количеством бито, используемых для кодирования одного уровня.

Битрейт - скорость передачи данных, задаваемая при кодировании. Может изменяться от 8 до 320Кбит/с. Чем больше битов информации записано в секунду, тем с меньшими потерями будет воспроизведён исходный материал - тем больше места в памяти компьютера занимает MP3 - файл. Уменьшение битрейта ведёт к ухудшению качества звучания и уменьшению информационного объёма звукового файла.

1 кГц=1000 Гц

1 мГц=1000000 Гц

Количество уровней громкости

где i - глубина звука (бит).

Рассмотрим пример расчёта информационного объёма закодированного звука моно звукового файла.

Решение.

Для расчёта информационного объёма закодированного звука будем использовать следующую формулу:

где D - частота дискретизации, Гц; i - глубина звука, бит; T - время звучания, с.

Получаем: звук аудиоинформация компьютер закодированный

V=5Гц*4бит*1с=20бит

Рассмотрим пример расчёта информационного объёма закодированного звука стерео файла.

V = DiNT ,

где D - частота дискретизации, Гц; i - глубина звука, бит; N - число каналов (1 - моно, 2 - стерео);T - время звучания, с.

Практическая часть

1. Перерисуйте структуру звуковой системы ПК в тетрадь и отметьте на ней основные модули.

2. Заполните таблицу, описав модули звуковой системы ПК.

Модуль звуковой системы

Описание, основные характеристики

Записи и воспроизведения

a) Частота дискретизации . Определяет максимальную частоту записываемого или воспроизводимого сигнала. Человеческий голос - 6-8 КГц. Музыка невысокого качества - 20-25 КГц. Высококачественное звучание - не менее 44 КГц, в идеале 48 КГц;

b) Тип и разрядность АЦП и ЦАП . Определяет разрядность представления цифрового сигнала (8, 16, 18, 20 или 24 бит), динамический диапазон (в децибелах от 90 дБА) и уровень шумов квантования. Разрядность АЦП и ЦАП от 16 и больше бит позволяет обеспечить студийное качественное звучание;

c) Способ кодирования аудиоданных , т.е. точность воспроизведения исходного звука, уровень искажения, качество сжатия звукового сигнала;

d) Возможность работы в режиме FullDuplex . Т.е. возможность одновременной записи и воспроизведения звукового сигнала. Существует три режима передачи данных по какому либо каналу определяющие направление передачи сигнала: симплекс (и), полу дуплекс (иили з) и дуплекс (полный дуплекс FullDuplex ).

Синтезатора

a) Метод синтеза звука . Определяет не только качество звука, но и ее состав. Звуковая система ПК может содержать несколько синтезаторов. Выделяют 2 метода синтеза звука:

·FM-синтез (FrequencyModulationSynthesis- частотная модуляция ) - синтезатор используется во всех недорогих звуковых картах. Обеспечивает приемлемое качество звука. Полифония составляет 20 голосов. Звуковые эффекты не реализуются.

·WT-синтез (WaveTableSynthesis- таблица синтеза звуковых волн ). Звук генерируется с высоким качеством, так как для его генерации используется специальная таблица, в которой содержатся предварительно оцифрованные образцы звучания реальных музыкальных инструментов и других звуков. Полифония - от 20 и больше голосов ?

b) Объем памяти . Зависит от модели звуковой карты. Используется для хранения патчей. Может быть изменен за счет установки дополнительных модулей памяти (RAMили ROM). Это позволяет загружать дополнительные банки инструментов, что может значительно изменить звучание MIDI-файлов, как в лучшую, так и в худшую сторону.

c) Возможность аппаратной обработки сигнала для создания звуковых эффектов . Для создания звуковых эффектов используется специальный эффект-процессор . В зависимости от типа эффект-процессора можно осуществлять обработку всех звуковых каналов синтезатора одновременно, обработку отдельных MIDI-каналов или звучание отдельных голосов синтезатора (общие, поканальные и голосовые эффект-процессоры ).

Данный эффект-процессор позволяет снять с центрального процессора большую нагрузку по обработке звука.

d) Полифония - максимальное количество одновременно воспроизводимых элементарных звуков. Для каждого типа звуковой карты значение полифонии может быть свое. (от 20 и больше голосов).

Интерфейсов

Обеспечивает обмен данными между звуковой системой и другими устройствами - как внешними, так и внутренними. Включает в себя следующие типы интерфейсов:

a) Системный интерфейс . Подключение звуковой карты может осуществляться через шину ISA(8-и разрядная, пропускная способность 2-6 Мбит/с) и через шину PCI(16-ти разрядная, пропускная способность от 100 до 260 Мбит/с).

Звуковые карты с интерфейсом ISAна сегодняшний день уже устарели, так как они не обеспечивают реализации нестандартных функций обработки и передачи звуковых данных и имеют низкую пропускную способность.

Шина PCIимеет достаточно широкую полосу пропускания и обеспечивает параллельную передачу потока звуковых данных.

b) MIDI-интерфейс. (MusicalInstrumentDigitalInterface) - это цифровой интерфейс музыкальных инструментов. Позволяет MIDI-инструментам подключаться друг к другу, а также обмениваться информацией и работать совместно.

На самой звуковой карте MIDI-порты отсутствуют, поэтому подключение к ПК MIDI-инструментов и устройств осуществляется с помощью специального MIDI-адаптера.

c) Интерфейс для подключения дочерних карт. Звуковая система ПК может иметь специальный интерфейс для подключения дочерних плат. Путем установки дочерней платы можно увеличивать полифонию звуковой системы и качественно изменять метод синтеза. Например, если раньше применялся только FM-синтез, то можно добавить WT-синтез. Дочерняя плата обычно устанавливается в специальный 26-контактный разъем расположенный на звуковой карте.

d) Интерфейс для подключения приводов CD-ROM . Входит в состав звуковой карты. Через специальный разъем на звуковой карте и специальный выход на приводе CD-ROMа они соединяются с помощью гибкого кабеля. Совсем недавно - это был единственный способ подключения привода CD-ROMк компьютеру.

Модуль микшера звуковой карты производит:

a) Коммутацию (подключение/отключение) источников и приемников звуковых сигналов;

b) Регулирование уровня входных и выходных звуковых сигналов;

Микширование (смешивание) нескольких звуковых сигналов и регулирование уровня результирующего сигнала.

Управление микшером осуществляется программно средствами Windows или с помощью специальных программ-микшеров.

Включает в себя наушники и колонки. Они непосредственно преобразуют звуковой электрический сигнал в акустические колебания и, тем самым, в значительной степени влияют на качество звука.

Акустической системы

По количеству каналов звучания акустическая система может быть:

Монофоническая (1 канал);

Стереофоническая (2 канальная);

DolbyDigital(от 6 и более каналов).

3. Решите задачи по вариантам.

4. Ответьте на контрольные вопросы.

Вариант 1

1. Рассчитайте информационный объём закодированного звука, если записано звучание 3 секунд речи с частотой дискретизации 5 Гц и глубиной звука 4 бит.

Вариант 2

1. Рассчитайте информационный объём закодированного стерео звука, если записано звучание 10 с с частотой дискретизации 20 Гц и глубиной звука 5 бит.

2. Определите объем памяти для хранения цифрового аудиофайла, время звучания которого составляет 2 минуты при частоте дискретизации 44,1 кГц и разрешении 16 бит.

Вариант 3

1. Рассчитайте информационный объём закодированного звука, если записано звучание 7 с речи с частотой дискретизации 5 Гц и глубиной звука 4 бит.

2. Объем звукового файла 5,25 Мб, разрядность звуковой платы - 16. Какова длительность звучания этого файла, записанного с частотой дискретизации 22,05 кГц?

Вариант 4

1. Рассчитайте информационный объём закодированного стерео звука, если записано звучание 15 с с частотой дискретизации 15 Гц и глубиной звука 4 бит.

2. Одна минута записи цифрового аудиофайла занимает на диске 1,3 Мб, разрядность звуковой платы - 8. С какой частотой дискретизации записан звук?

Вариант 5

1. Рассчитайте информационный объём закодированного звука, если записано звучание 3 с речи с частотой дискретизации 5 Гц и глубиной звука 3 бит.

2. Рассчитайте время звучания звукового файла объемом 3.5 Мбайт, содержащего стерео запись с частотой дискретизации 44 100 Гц и разрядностью кода 16 бит.

Вариант 6

1. Рассчитайте информационный объём закодированного стерео звука, если записано звучание 10 секунд с частотой дискретизации 25 Гц и глубиной звука 6 бит.

2. Определить размер (в байтах) цифрового аудиофайла, время звучания которого составляет 10 секунд при частоте дискретизации 22,05 кГц и разрешении 8 бит.

13-П Оле гВариант 7

1. Рассчитайте информационный объём закодированного звука, если записано звучание 5 секунд речи с частотой дискретизации 3 Гц и глубиной звука 4 бит.=60 бит.

2. Рассчитайте информационный объём закодированного стерео звука, если записано звучание 20 секунд с частотой дискретизации 15 Гц и глубиной звука 3 бит.=900 бит.

Вариант 8

1. Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 бит.

2. Рассчитайте информационный объём закодированного звука, если записано звучание 12 секунд речи с частотой дискретизации 5 Гц и глубиной звука 4 бит.

Вариант 9

1. Рассчитайте информационный объём закодированного стерео-звука, если записано звучание 30 секунд с частотой дискретизации 15 Гц и глубиной звука15 бит.

2. Две минуты записи цифрового аудиофайла занимают на диске 5,1 Мб. Частота дискретизации -- 22050 Гц. Какова разрядность аудио адаптера.

Вариант 10

1. Рассчитайте информационный объём закодированного звука, если записано звучание 17 секунд речи с частотой дискретизации 16 Гц и глубиной звука 14 бит.

3. 16 бит и 8 кГц.

Вариант 11

1. Рассчитайте информационный объём закодированного стереозвука, если записано звучание 150 секунд с частотой дискретизации 20 Гц и глубиной звука 4 бит.

Вариант 12

1. Рассчитайте информационный объём закодированного звука, если записано звучание 13 с речи с частотой дискретизации 8 Гц и глубиной звука 12 бит.

2. Рассчитайте время звучания моно аудиофайла, если при 16-битном кодировании и частоте дискретизации 32 кГц его объем равен 6300 Кбайт.

Вариант 13

1. Рассчитайте информационный объём закодированного стереозвука, если записано звучание 25 секунд с частотой дискретизации 25 Гц и глубиной звука 16 бит.

2. Рассчитайте информационный объём закодированного звука, если записано 55 секунд речи с частотой дискретизации 15 Гц и глубиной звука 5 бит.

Вариант 14

1. Чему равно время звучания при 16-битном кодировании, частоте дискретизации 32 кГц и объёме моно аудиофайла 700 Кбайт.

2. Рассчитайте информационный объём закодированного стереозвука, если записано звучание 120 секунд с частотой дискретизации 15 Гц и глубиной звука 23 бит.

2. Рассчитайте информационный объём закодированного звука, если записано звучание 38 с речи с частотой дискретизации 15 Гц и глубиной звука 3 бит.

Вариант 16

1. Рассчитайте информационный объём закодированного стереозвука, если записано звучание 100 секунд с частотой дискретизации 27 Гц и глубиной звука 15 бит.

2. Рассчитайте объём монофонического аудиофайла длительностью 10 с при 16-битном кодировании и частоте дискретизации 44,1 к Гц.

Вариант 17

1. Рассчитайте информационный объём закодированного звука, если записано звучание 70 с речи с частотой дискретизации 25 Гц и глубиной звука 4 бит.

Вариант 18

1. Рассчитайте информационный объём закодированного стереозвука, если записано звучание 215 секунд с частотой дискретизации 5кГц и глубиной звука 3 бит.

Вариант 19

1. Рассчитайте информационный объём закодированного звука, если записано звучание 34 с речи с частотой дискретизации 45 Гц и глубиной звука 7 бит.

2. Рассчитайте время звучания моно аудиофайла, если при 4-битном кодировании и частоте дискретизации 16 кГц его объем равен 350 Кбайт.

Вариант 20

1. Рассчитайте информационный объём закодированного стереозвука, если записано звучание 126 секунд с частотой дискретизации 32 Гц и глубиной звука 6 бит.

2. Определить объем памяти для хранения цифрового аудиофайла, время звучания которого составляет 4 минуты при частоте дискретизации 55 кГц и расширении 32 бит.

Вариант 21

1. Рассчитайте информационный объём закодированного звука, если записано звучание 14 с речи с частотой дискретизации 13 Гц и глубиной звука 12 бит.

2. Объем свободной памяти на диске - 512 Мбайт, разрядность звуковой платы - 32. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 66100 Гц.

Вариант 22

1. Рассчитайте информационный объём закодированного стереозвука, если записано звучание 25 секунд с частотой дискретизации 15 Гц и глубиной звука 16 бит.

2. Определить объем памяти для хранения стерео-аудиофайла, время звучания которого составляет 2 минуты, если известно, что частота дискретизации равна 40 000 Гц, а глубина кодирования звука равна 16 бит.

Контрольные вопросы

1. Дайте определения понятиям «звук» и «звуковая система ПК»?

2. Какие основные функции выполняет звуковая система ПК?

3. Каковы основные этапы аналого-цифрового и цифроаналогового преобразования?

4. Какие применяют методы синтеза звука?

5. Какие функции выполняет модуль микшера и что относится к числу его основных характеристик?

6. Дайте определения понятиям «временная дискретизация» и «битрейт»?

Размещено на Allbest.ru

Подобные документы

    Исследование понятия звука, его скорости, длины волны, порогов слышимости. Описание программ для обработки звука, позволяющих записывать музыку, менять тембр звучания, высоту, темп. Особенности звуковых редакторов, реставраторов и анализаторов аудио.

    реферат , добавлен 03.11.2013

    Формат звукового файла wav, способ его кодирования. Реализация возможностей воспроизведения звука в среде программирования MATLAB. Составление функциональной схемы программы. Апробирование информационной технологии воспроизведения звуковых файлов.

    курсовая работа , добавлен 13.02.2016

    Цифровое представление звуковых сигналов. Устройства вывода звуковой информации: колонки, динамик и наушники. Устройства ввода звуковой информации. Частота и интенсивность звука. Амплитуда звуковых колебаний, мощность источника звука, диапазон колебаний.

    реферат , добавлен 08.02.2011

    Анализ процесса оцифровки зависимости интенсивности звукового сигнала от времени. Характеристика технологии создания музыкальных звуков в современных электромузыкальных цифровых синтезаторах. Изучение основных звуковых форматов, способов обработки звука.

    курсовая работа , добавлен 23.11.2011

    Рассмотрение основ поддержки звука в современных компьютерах и основных аудиоустройств. Изучение правил установки звуковой карты и драйверов, выбор колонок. Описание проблем, связанных с аппаратным и программным обеспечением. Алгоритм обработки звука.

    курсовая работа , добавлен 16.03.2014

    Восприятие звуковых раздражений. Частота, амплитуда, фаза как характеристики звука. Представление и способы передачи цифровой информации. Особенности дискретизации звука. Способы записи информации: бит в бит; сжатие; структура болванки CD-R; запись CD-R.

    реферат , добавлен 10.11.2009

    Генерирование и сохранение мелодии в виде звукового файла формата wav. Проведение частотного анализа полученного сигнала. Зависимость объема wav-файлов от разрядности кодирования сигнала. Спектр нот записанного wav-файла с заданной разрядностью.

    лабораторная работа , добавлен 30.03.2015

    Модели звуковых карт, их возможности, качество звука и размеры. Устройство звуковых карт и принципы их функционирования. Методы генерации звука, применяющиеся в звуковых платах. Особенности системы пространственного звуковоспроизведения Dolby Digital.

    реферат , добавлен 13.03.2011

    Техническая характеристика сигналов в системах цифровой обработки. Описание программ для обработки цифровой и синтезированной звуковой информации, шумоподавление звука. Профессиональная обработка звука и звуковой волны: сжатие, запись, сэмплирование.

    курсовая работа , добавлен 01.03.2013

    История компьютеризации музыкального обучения. Функциональные возможности компьютера по организации обмена музыкальной информацией. Рассмотрение технологий и средств обработки звуковой информации. Применение технологии создания позиционируемого 3D звука.

Кодирование звуковой информации

Звук – это распространяющиеся в воздухе, воде или другой среде волны с непрерывно меняющейся интенсивностью и частотой.

Чем больше амплитуда сигнала, тем он громче для человека; чем больше частота сигнала, тем выше тон.

Типичные значения громкости:

Оцифровка звука

Цифровой звук – это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды.

Оцифровка звука - технология преобразования аналогового звукового сигнала в цифровой вид.


Заключается в осуществлении замеров амплитуды сигнала с определенным временным шагом и последующей записи полученных значений в численном виде. Другое название оцифровки звука - аналогово-цифровое преобразование звука.

Частота дискретизации звука - это количество измерений громкости звука за одну секунду.

Частота дискретизации звука может лежать в диапазоне от 8000 до 48 000 измерений громкости звука за одну секунду.

Глубина кодирования звука - это количество информации, которое необходимо для кодирования дискретных уровней громкости цифрового звука.

Если известна глубина кодирования, то количество уровней громкости цифрового звука можно рассчитать по формуле N = 2 R . Пусть глубина кодирования звука составляет 16 битов, тогда количество уровней громкости звука равно:

N = 2 R = 2 16 = 65 536.

В процессе кодирования каждому уровню громкости звука присваивается свой 16-битовый двоичный код, наименьшему уровню звука будет соответствовать код 0000000000000000, а наибольшему - 1111111111111111.

Размер звукового файла

I=f×R×N×t , где

f - частота дискретизации (Гц)

R – глубина кодирования (разрядность)

N – количество каналов (1 – моно, 2 – стерео …)

t – время звучания (с)

Можно оценить информационный объем стереоаудиофайла длительностью 1 секунда при высоком качестве звука 16 бит, 48 кГц.

48000 Гц ×16 бит ×2×1=1536000бит=192000 байт=187,5 кБайт

Домашняя работа:

1. Производится одноканальная (моно) звукозапись с частотой дискретизации 22 кГц и глубиной кодирования 16 бит. Запись длится 2 минуты, ее результаты записываются в файл, сжатие данных не производится. Каков размер файла?

2. Двухканальная (стерео) звукозапись с частотой дискретизации 16 кГц и 32-битным разрешением велась в течение 5 минут. Сжатие данных не производилось. Каков размер полученного файла?

3. Производилась двухканальная (стерео) звукозапись с частотой дискретизации 64 кГц и 24-битным разрешением. В результате был получен файл размером 72 Мбайт, сжатие данных не производилось. Определите приблизительно, сколько времени (в минутах) проводилась запись. В качестве ответа укажите ближайшее к времени записи целое число.

С меняющейся амплитудой и частотой. Чем выше амплитуда сигнала, тем он громче воспринимается человеком. Чем больше частота сигнала, тем выше его тон.

Рисунок 1. Амплитуда колебаний звуковых волн

Частота звуковой волны определяется количеством колебаний в одну секунду. Данная величина измеряется в герцах (Гц, Hz).

Ухо человека воспринимает звуки в диапазоне от $20$ Гц до $20$ кГц, данный диапазон называют звуковым . Количество бит, которое при этом отводится на один звуковой сигнал, называют глубиной кодирования звука . В современных звуковых картах обеспечивается $16-$, $32-$ или $64-$битная глубина кодирования звука. В процессе кодирования звуковой информации непрерывный сигнал заменяется дискретным , то есть преобразуется в последовательность электрических импульсов, состоящих из двоичных нулей и единиц.

Частота дискретизации звука

Одной из важных характеристик процесса кодирования звука является частота дискретизации, которая представляет собой количество измерений уровня сигнала за $1$ секунду:

  • одно измерение в одну секунду соответствует частоте $1$ гигагерц (ГГц);
  • $1000$ измерений в одну секунду соответствует частоте $1$ килогерц (кГц) .

Определение 2

Частота дискретизации звука - это количество измерений громкости звука за одну секунду.

Количество измерений может находиться в диапазоне от $8$ кГц до $48$ кГц, причем первая величина соответствует частоте радиотрансляции, а вторая - качеству звучания музыкальных носителей.

Замечание 1

Чем выше частота и глубина дискретизации звука, тем более качественно будет звучать оцифрованный звук. Самое низкое качество оцифрованного звука, которое соответствует качеству телефонной связи, получается, когда частота дискретизации равна 8000 раз в секунду, глубина дискретизации $8$ битов, что соответствует записи одной звуковой дорожки (режим «моно»). Самое высокое качество оцифрованного звука, которое соответствует качеству аудио -CD, достигается, когда частота дискретизации равна $48000$ раз в секунду, глубина дискретизации $16$ битов, что соответствует записи двух звуковых дорожек (режим «стерео»).

Информационный объем звукового файла

Следует отметить, что чем выше качество цифрового звука, тем больше информационный объем звукового файла .

Оценим информационный объём моноаудиофайла ($V$), это можно сделать, используя формулу:

$V = N \cdot f \cdot k$,

где $N$ - общая длительность звучания, выражаемая в секундах,

$f$ - частота дискретизации (Гц),

$k$ - глубина кодирования (бит).

Пример 1

Например, если длительность звучания равна $1$ минуте и имеем среднее качество звука, при котором частота дискретизации $24$ кГц, а глубина кодирования $16$ бит, то:

$V=60 \cdot 24000 \cdot 16 \ бит=23040000 \ бит=2880000 \ байт = 2812,5 \ Кбайт=2,75 \ Мбайт.$

При кодировании стереозвука процесс дискретизации производится отдельно и независимо для левого и правого каналов, что, соответственно, увеличивает объём звукового файла в два раза по сравнению с монозвуком.

Пример 2

Например, оценим информационный объём цифрового стереозвукового файла, у котрого длительность звучания равна $1$ секунде при среднем качестве звука ($16$ битов, $24000$ измерений в секунду). Для этого глубину кодирования умножим на количество измерений в $1$ секунду и умножить на $2$ (стереозвук):

$V=16 \ бит \cdot 24000 \cdot 2 = 768000 \ бит = 96000 \ байт = 93,75 \ Кбайт.$

Основные методы кодирования звуковой информации

Существуют различные методы кодирования звуковой информации двоичным кодом, среди которых выделяют два основных направления: метод FM и метод Wave-Table .

Метод FM (Frequency Modulation ) основан на том, что теоретически любой сложный звук можно разложить на последовательность простейших гармонических сигналов разных частот, каждый из которых будет представлять собой правильную синусоиду, а это значит, что его можно описать кодом. Процесс разложения звуковых сигналов в гармонические ряды и их представление в виде дискретных цифровых сигналов происходит в специальных устройствах, которые называют «аналогово-цифровые преобразователи» (АЦП).

Рисунок 2. Преобразование звукового сигнала в дискретный сигнал

На рисунке 2а изображен звуковой сигнал на входе АЦП, а на рисунке 2б изображен уже преобразованный дискретный сигнал на выходе АЦП.

Для обратного преобразования при воспроизведении звука, который представлен в виде числового кода, используют цифро-аналоговые преобразователи (ЦАП). Процесс преобразования звука изображен на рис. 3. Данный метод кодирования не даёт хорошего качества звучания, но обеспечивает компактный код.

Рисунок 3. Преобразование дискретного сигнала в звуковой сигнал

На рисунке 3а представлен дискретный сигнал, который мы имеем на входе ЦАП, а на рисунке 3б представлен звуковой сигнал на выходе ЦАП.

Таблично-волновой метод (Wave-Table ) основан на том, что в заранее подготовленных таблицах хранятся образцы звуков окружающего мира, музыкальных инструментов и т. д. Числовые коды выражают высоту тона, продолжительность и интенсивность звука и прочие параметры, характеризующие особенности звука. Поскольку в качестве образцов используются «реальные» звуки, качество звука, полученного в результате синтеза, получается очень высоким и приближается к качеству звучания реальных музыкальных инструментов.

Примеры форматов звуковых файлов

Звуковые файлы имеют несколько форматов. Наиболее популярные из них MIDI, WAV, МРЗ.

Формат MIDI (Musical Instrument Digital Interface) изначально был предназначен для управления музыкальными инструментами. В настоящее время используется в области электронных музыкальных инструментов и компьютерных модулей синтеза.

Формат аудиофайла WAV (waveform) представляет произвольный звук в виде цифрового представления исходного звукового колебания или звуковой волны. Все стандартные звуки Windows имеют расширение WAV.

Формат МРЗ (MPEG-1 Audio Layer 3) - один из цифровых форматов хранения звуковой информации. Он обеспечивает более высокое качество кодирования.

Цель. Осмыслить процесс преобразования звуковой информации, усвоить понятия необходимые для подсчета объема звуковой информации. Научиться решать задачи по теме.

Цель-мотивация. Подготовка к ЕГЭ.

План урока

1. Просмотр презентации по теме с комментариями учителя. Приложение 1

Материал презентации: Кодирование звуковой информации.

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией. Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию.

Процесс преобразования звуковых волн в двоичный код в памяти компьютера :

Процесс воспроизведения звуковой информации, сохраненной в памяти ЭВМ :

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда, тем он громче для человека, чем больше частота сигнала, тем выше тон. Программное обеспечение компьютера в настоящее время позволяет непрерывный звуковой сигнал преобразовывать в последовательность электрических импульсов, которые можно представить в двоичной форме. В процессе кодирования непрерывного звукового сигнала производится его временная дискретизация . Непрерывная звуковая волна разбивается на отдельные маленькие временные участки, причем для каждого такого участка устанавливается определенная величина амплитуды.

Таким образом, непрерывная зависимость амплитуды сигнала от времени A(t) заменяется на дискретную последовательность уровней громкости. На графике это выглядит как замена гладкой кривой на последовательность «ступенек».Каждой «ступеньке» присваивается значение уровня громкости звука, его код(1, 2, 3 и так

далее). Уровни громкости звука можно рассматривать как набор возможных состояний, соответственно, чем большее количество уровней громкости будет выделено в процессе кодирования, тем большее количество информации будет нести значение каждого уровня и тем более качественным будет звучание.

Аудиоадаптер (звуковая плата) - специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины. Затем полученный код из регистра переписывается в оперативную память компьютера. Качество компьютерного звука определяется характеристиками аудиоадаптера:

  • Частотой дискретизации
  • Разрядностью(глубина звука).

Частота временной дискретизации

Это количество измерений входного сигнала за 1 секунду. Частота измеряется в герцах (Гц). Одно измерение за одну секунду соответствует частоте 1 Гц. 1000 измерений за 1 секунду – 1 килогерц (кГц). Характерные частоты дискретизации аудиоадаптеров:

11 кГц, 22 кГц, 44,1 кГц и др.

Разрядность регистра (глубина звука) число бит в регистре аудиоадаптера, задает количество возможных уровней звука.

Разрядность определяет точность измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно. Если разрядность равна 8 (16) , то при измерении входного сигнала может быть получено 2 8 = 256 (2 16 =65536) различных значений. Очевидно, 16 разрядный аудиоадаптер точнее кодирует и воспроизводит звук, чем 8-разрядный. Современные звуковые карты обеспечивают 16-битную глубину кодирования звука. Количество различных уровней сигнала (состояний при данном кодировании) можно рассчитать по формуле:

N = 2 I = 2 16 = 65536, где I - глубина звука.

Таким образом, современные звуковые карты могут обеспечить кодирование 65536 уровней сигнала. Каждому значению амплитуды звукового сигнала присваивается 16-битный код. При двоичном кодировании непрерывного звукового сигнала он заменяется последовательностью дискретных уровней сигнала. Качество кодирования зависит от количества измерений уровня сигнала в единицу времени, то есть частоты дискретизации. Чем большее количество измерений производится за 1 секунду (чем больше частота дискретизации тем точнее процедура двоичного кодирования.

Звуковой файл - файл, хранящий звуковую информацию в числовой двоичной форме.

2. Повторяем единицы измерения информации

1 байт = 8 бит

1 Кбайт = 2 10 байт=1024 байт

1 Мбайт = 2 10 Кбайт=1024 Кбайт

1 Гбайт = 2 10 Мбайт=1024 Мбайт

1 Тбайт = 2 10 Гбайт=1024 Гбайт

1 Пбайт = 2 10 Тбайт=1024 Тбайт

3. Закрепить изученный материал, просмотрев презентацию, учебник

4. Решение задач

Учебник , показ решения на презентации.

Задача 1. Определить информационный объем стерео аудио файла длительностью звучания 1 секунда при высоком качестве звука(16 битов, 48 кГц).

Задача (самостоятельно). Учебник , показ решения на презентации.
Определить информационный объем цифрового аудио файла длительностью звучания которого составляет 10 секунда при частоте дискретизации 22,05 кГц и разрешении 8 битов.

5. Закрепление. Решение задач дома, самостоятельно на следующем уроке

Определить объем памяти для хранения цифрового аудио­файла, время звучания которого составляет две минуты при частоте дискретизации 44,1 кГц и разрешении 16 битов.

В распоряжении пользователя имеется память объемом 2,6 Мб. Необходимо записать цифровой аудиофайл с длительностью звучания 1 минута. Какой должна быть частота дискретиза­ции и разрядность?

Объем свободной памяти на диске - 5,25 Мб, разрядность звуковой платы - 16. Какова длительность звучания цифро­вого аудиофайла, записанного с частотой дискретизации 22,05 кГц?

Одна минута записи цифрового аудиофайла занимает на дис­ке 1,3 Мб, разрядность звуковой платы - 8. С какой частотой дискретизации записан звук?

Какой объем памяти требуется для хранения цифрового аудиофайла с записью звука высокого качества при условии, что время звучания составляет 3 минуты?

Цифровой аудиофайл содержит запись звука низкого качест­ва (звук мрачный и приглушенный). Какова длительность звучания файла, если его объем составляет 650 Кб?

Две минуты записи цифрового аудиофайла занимают на дис­ке 5,05 Мб. Частота дискретизации - 22 050 Гц. Какова раз­рядность аудиоадаптера?

Объем свободной памяти на диске - 0,1 Гб, разрядность зву­ковой платы - 16. Какова длительность звучания цифрового аудиофайла, записанного с частотой дискретизации 44 100 Гц?

Ответы

№ 92. 124,8 секунды.

№ 93. 22,05 кГц.

№ 94. Высокое качество звучания достигается при частоте дискретизации 44,1 кГц и разрядности аудиоадаптера, равной 16. Требуемый объем памяти - 15,1 Мб.

№ 95. Для мрачного и приглушенного звука характерны следующие параметры: частота дискретизации - 11 кГц, разрядность аудиоадаптера - 8. Длительность звучания равна 60,5 с.

№ 96. 16 битов.

№ 97. 20,3 минуты.

Литература

1. Учебник: Информатика, задачник-практикум 1 том, под редакцией И.Г.Семакина, Е.К. Хеннера)

2. Фестиваль педагогических идей «Открытый урок»Звук. Двоичное кодирование звуковой информации. Супрягина Елена Александровна, учитель информатики.

3. Н. Угринович. Информатика и информационные технологии. 10-11 классы. Москва. Бином. Лаборатория знаний 2003.