Данному образовательному сайту пришлось несколько раз менять свое имя. С 2011 года доступ к нему обеспечивается по URL
http://educomp.runnet.ru

emc.km.ru (2001-2007) ==> educomp.org.ru (2007-2011) ==> educomp.runnet.ru (2011-...)
Более подробно об истории сайта можно прочитать здесь.


Учебные модели компьютера



Модели (software):

"Е14" (parallel !!!)
"S9PU" (parallel)

Модели (hardware):






Награды сайта
Награды сайта
к экзамену
Материалы для ответа на билет
на выпускном экзамене по курсу информатики
(другие ответы на билеты)

Двоичное кодирование звуковой информации. Глубина кодирования и частота дискретизации.

Кодированию данного вида информации в учебной литературе пока уделяется не очень много внимания. По-видимому, это объясняется тем, что интенсивное использование компьютера для обработки звука началось позднее, нежели чисел, текстов и графики. Приятное исключение составляет учебник [1], который не просто традиционно излагает способ дискретизации звука, но и дополнительно демонстрирует простейшие приемы цифровой обработки звуковых файлов, а также содержит ряд других имеющих отношение к данному вопросу сведений. Еще одним источником информации, использованным при написании данных материалов, послужили несколько подробных популярных статей Д. Симаненкова, опубликованных в тематических выпусках журнала "Компьютерра" [2].

Итак, рассмотрим интересный и все чаще используемый на практике процесс кодирования звуковой информации подробнее.

Из курса физики известно, что звук есть колебания среды. Чаще всего средой является воздух, но это совсем не обязательно. Например, звук прекрасно распространяется по поверхности земли: именно поэтому в приключенческих фильмах герои, стараясь услышать шум погони, прикладывают ухо к земле. Напротив, существует весьма эффектный школьный физический опыт, который показывает, что при откачивании воздуха мы перестаем слышать звук находящегося под герметичным колпаком звонка. Важно также подчеркнуть, что существует определенный диапазон частот, к которому принадлежат звуковые волны: примерно от нескольких десятков герц до величины немного более 20 кГц. Значения этих границ определяются возможностями человеческого слуха.

Благодаря роли звуковых сигналов в практической жизни человека, процессы генерации и закономерности распространения звука изучены достаточно хорошо. Чаще всего звуковые колебания преобразуются в электрические, что легко осуществляется с помощью микрофона. Как правило, электрический сигнал от микрофона очень слаб и нуждается в усилении, что на современном уровне развития техники проблемы также не представляет. Форму полученных колебаний (т.е. зависимость интенсивности сигнала от времени) можно наблюдать на экране обычного осциллографа; к сожалению, для получения наглядной устойчивой картины сигнал должен быть периодическим.

Важную роль в анализе звуковых (или полученных из них электрических) колебаний играет также спектральный анализ, т.е. нахождение распределения интенсивности различных частот в исходном сигнале. Математической основой такой процедуры служит разложение изучаемой функции в ряд по гармоническим функциям (синусам или косинусам) – так называемый Фурье-анализ. Полученные в результате обработки спектры также обычно представляются графически в координатах частота (абсцисса) – интенсивность (ордината). Чтобы представить себе, как выглядит спектр звукового сигнала, достаточно взглянуть на информационный дисплей современного высококачественного аудиокомплекса. Спектральные характеристики сигналов и технических звуковых устройств имеют огромное теоретическое и практическое значение.

Наблюдать примерную форму сигналов и их спектральные характеристики на современном компьютере не только не представляет никакого труда, но, напротив, доступно каждому. Сделать это можно, даже не используя специализированного программного обеспечения (примеры такого ПО можно посмотреть в [2]). Достаточно запустить стандартную мультимедийную программу Windows под названием Звукозапись и распространенный универсальный проигрыватель звуковых файлов Winamp. Первая программа будет показывать форму сигнала, а вторая – его спектр.

Подготавливая данные материалы, автор не поленился подобрать для иллюстрации несколько характерных примеров звуковых файлов. Так, на рис.1 представлен в качестве примера простейший "искусственный" звук – телефонный сигнал посылки вызова (уточню: речь идет о звуке, который мы слышим, когда ожидаем, пока абонент на другом конце провода возьмет трубку).

На верхней части рисунка изображено окно программы Звукозапись, показывающее форму сигнала. Отчетливо виден его гармонический характер (сигнал "похож на синусоиду"). В нижней части приведена картинка, снятая при воспроизведении этого же самого звукового файла в проигрывателе Winamp, который для нас сейчас замечателен только тем, что отображает спектр звучащего сигнала. А он очень специфичен: узкая вертикальная линия в районе низких частот (на рисунке слева). Такой спектр отчетливо говорит о том, что сигнал имеет всего одну характерную частоту.

А вот несколько более сложный звуковой сигнал – это затухающий велосипедный звонок (рис.2).

Его форма уже не гармонична, хотя некоторая периодичность присутствует, а спектр имеет два пика, возле которых группируются основные частоты сигнала. Поскольку этот звук в отличие от предыдущего является естественным, его спектр заметно сложнее.

Наконец, на последнем рисунке из этой серии приведены картинки воспроизведения аплодисментов в зрительном зале.

Как мы видим, форма сигнала еще более сложная, он выглядит почти хаотично, а его спектр практически сплошной.

Таким образом, звуковые сигналы в окружающем нас мире необычайно разнообразны. Для их записи с целью последующего воспроизведения необходимо как можно точней сохранить форму кривой зависимости интенсивности звука от времени. При этом возникает одна очень важная и принципиальная трудность: звуковой сигнал непрерывен, а компьютер способен хранить в памяти только дискретные величины (подробнее об этом см. билет 10 [3]). Отсюда следует, что в процессе сохранения звуковой информации она должна быть "оцифрована", т.е. из аналоговой непрерывной формы переведена в цифровую дискретную. Данную функцию выполняет специальный блок, входящий в состав звуковой карты, который называется аналого-цифровой преобразователь – АЦП.

Каковы основные принципы работы АЦП?

Во-первых, он производит дискретизацию записываемого звукового сигнала по времени. Это означает, что измерение уровня интенсивности звука ведется не непрерывно, а, напротив, в определенные фиксированные моменты времени (удобнее, разумеется, через равные временные промежутки). Частоту, характеризующую периодичность измерения звукового сигнала принято называть частотой дискретизации. Вопрос о ее выборе далеко не праздный и ответ в значительной степени зависит от спектра сохраняемого сигнала: существует специальная теорема Найквиста, согласно которой частота "оцифровки" звука должна как минимум в 2 раза превышать максимальную частоту, входящую в состав спектра сигнала. Считается, что редкий человек слышит звук частотой более 20 000 Гц (20 кГц). Поэтому для высококачественного воспроизведения звука верхнюю границу обычно с некоторым запасом принимают равной 22 кГц. Отсюда немедленно следует, что частота звукозаписи в таких случаях должна быть не ниже 44 кГц. Названная частота используется, в частности, при записи музыкальных компакт-дисков. Однако часто такое высокое качество не требуется, и частоту дискретизации можно значительно снизить. Например, при записи речи вполне достаточно частоты дискретизации 8 кГц. Заметим, что результат при этом получается хотя и не блестящий, но легко разборчивый – вспомните, как вы слышите голоса своих друзей по телефону.

Во-вторых, АЦП производит дискретизацию амплитуды звукового сигнала. Это следует понимать так, что при измерении имеется "сетка" стандартных уровней (например, 256 или 65536 – это количество характеризует глубину кодирования), и текущий уровень измеряемого сигнала округляется до ближайшего из них. Напрашивается линейная зависимость между величиной входного сигнала и номером уровня. Иными словами, если громкость возрастает в 2 раза, то интуитивно ожидается, что и соответствующее ему число возрастет вдвое. В простейших случаях так и делается, но, как показывает более детальное изучение, это не самое лучшее решение. Проблема в том, что в широком диапазоне громкости звука человеческое ухо не является линейным. Например, при очень громких звуках (когда "уши закладывает"), увеличение или уменьшение интенсивности звука почти не дает эффекта, в то время как при восприятии шепота очень незначительное падение уровня может приводить к полной потере разборчивости. Поэтому при записи цифрового звука, особенно при 8-битном кодировании, часто используют различные неравномерные распределения уровней громкости, в основе которых лежит логарифмический закон (μ-law, A-law и другие; впечатляющие формулы для них можно посмотреть в дополнительной книге [1]).

Итак, в ходе оцифровки звука мы получаем поток целых чисел, представляющих собой стандартные амплитуды сигналов через равные промежутки времени. На рис.4 приведенное выше описание процесса дискретизации проиллюстрировано графически:


Рис.4.

На рисунке представлен процесс "оцифровки" зависимости интенсивности звукового сигнала I от времени t. Отчетливо видна дискретизация по времени (равномерные отсчеты на горизонтальной оси) и по интенсивности сигнала (требуемое при этом округление схематически изображено "изломами" горизонтальных линий разметки). Подчеркнем, что на рисунке степень дискретизации для наглядности сознательно утрирована: реально различие между соседними уровнями дискретизации по обеим осям значительно меньше и, следовательно, форма сигнала передается гораздо точнее.

Мы рассмотрели лишь наиболее общие принципы записи цифрового звука. На практике для получения качественных звуковых файлов используется целый ряд дополнительных технических приемов. Их интересное и подробное описание дается в серии статей [2], на которую мы уже ссылались ранее.

Изложенный метод преобразования звуковой информации для хранения в памяти компьютера в очередной раз подтверждает уже неоднократно обсуждавшийся ранее тезис: любая информация для хранения в компьютере приводится к цифровой форме и затем переводится в двоичную систему. Теперь мы знаем, что и звуковая информация не является исключением из этого фундаментального правила.

Остается рассмотреть обратный процесс – воспроизведение записанного в компьютерный файл звука. Здесь имеет место преобразование в противоположном направлении – из дискретной цифровой формы представления сигнала в непрерывную аналоговую, поэтому вполне естественно соответствующий узел компьютерного устройства называется ЦАП – цифро-аналоговый преобразователь. Процесс реконструкции первоначального аналогового сигнала по имеющимся дискретным данным нетривиален, поскольку никакой информации о форме сигнала между соседними отсчетами не сохранилось. В разных звуковых картах для восстановления звукового сигнала могут использоваться различные способы. Наиболее наглядный и понятный из них состоит в том, что по имеющимся точкам рассчитывается степенная функция, проходящая через заданные точки, которая и принимается в качестве формы аналогового сигнала. Ваших математических знаний вполне хватит, чтобы понять, как это делается. Возьмем, например, интерполяцию параболой I = at2 + bt + c по трем заданным точкам. Подставив в эту формулу известные значения времени и приравняв их к сохраненным в файле значениям интенсивности звука I, получим три линейных уравнения с тремя неизвестными a, b и c. Решить такую систему в состоянии любой добросовестный ученик. Качественный вид результата представлен на рис.5


Рис.5

Видно, что на интерполируемом участке даже для параболы совпадение получается вполне удовлетворительное. Кроме того, технические возможности современных микросхем позволяют значительно увеличить степень полинома, а вместе с ней и точность реконструкции формы сигнала.

Подробно описанный нами метод восстановления является не единственным. К сожалению, другие, не менее эффективные, для своего понимания требуют глубоких специальных технических знаний [2].

Итак, мы подробно рассмотрели процессы преобразования естественных звуков к виду, пригодному для хранения в компьютере, и последующего их восстановления при воспроизведении. Разумеется, не следует требовать от учеников на экзамене большего. Тем не менее, назовем некоторые интересные вопросы, связанные с компьютерной обработкой звуковой информации, которые полезно знать любому грамотному пользователю. Это, прежде всего, сжатие (кто ни разу не использовал файлы MP3?), MIDI-запись музыки в виде необычайно компактных "нотных" команд для инструментов, форматы звуковых файлов и их особенности, возможности компьютеров в редактировании фонограмм (фильтрация, удаление помех и т.п.) и другие не менее важные темы.

Основная литература

  1. Информационная культура: Кодирование информации. Информационные модели. 9-10 классы. М.: Дрофа, 2000, 208 с.
  2. Симаненков Д. Тема номера. Компьютерра, 1998, N 30-31, с.20-33; N 32, с.20-28
    (http://www.computerra.ru/offline/1998/258 и http://www.computerra.ru/offline/1998/260)
  3. Еремин Е.А., Шестаков А.П. Материалы для подготовки к устной итоговой аттестации по информатике в 11-м классе. Билет N 10, вопрос 1. Информатика, 2003, N 9, с.6-9.

Дополнительная литература

  1. Кенцл Т. Форматы файлов Internet. СПб.: Питер, 1997, 320 с.


© Е.А.Еремин, А.П.Шестаков. 2003
Публикация:
Еремин Е.А., Шестаков А.П. Материалы для подготовки к устной итоговой аттестации по информатике в 11-м классе.
"Информатика", 2003, N 14, с. 3-8.


Автор сайта - Евгений Александрович Еремин (Пермский государственный педагогический университет). e_eremin@yahoo.com