Рефераты

Старая пластинка: Что такое цифровой звук и реставрация звука с помощью цифровой обработки

Старая пластинка: Что такое цифровой звук и реставрация звука с помощью цифровой обработки

МИНИСТЕРСТВО ОБРАЗОВАНИЯ

РОССИЙСКОЙ ФЕДЕРАЦИИ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ

РАДИОТЕХНИКИ ЭЛЕКТРОНИКИ И АВТОМАТИКИ

(ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)

Курсовая работа по информатике

Тема :

Старая пластинка: Что такое цифровой звук и реставрация звука с помощью

цифровой обработки.

Студент Чистяков И.А.

Группа ОТО 4-04

Преподователь Андрианова Е. Г.

Работа допущена к защите_____________________________

Курсовая работа защищена с оценкой ___________________

Москва 2005

Содержание

1.Введение………………………………………………………………..3

2. Часть первая, теоретическая……..………………………………..3

А. Теория цифрового звука……………………………….……3

Б. Оцифровка звука и его хранение на цифровом носителе.7

В. Как сохранить оцифрованный

звук?..................................11

Г. Преимущества и недостатки цифрового звука………….14

Д. К вопросу об обработке звука……………..……………….17

Е. Аппаратура………………………………………..…………18

Ж. Программное обеспечение………………………….……..22

3.Часть вторая: больше практическая……………..…………………25

1. Подключение проигрывателя к компьютеру…..……….25

2. Настройка возможностей звуковой карты……..………..26

3. Реставрация……………………………………….…………26

4. Подготовка файлов…………………………………………32

5. Разделение файла wave на отдельные композиции........32

6. Перспективы и проблематика……………………………33

7. Глоссарий терминов……………………………………….34

1.Введение

В последнее время возможности мультимедийного оборудования

претерпели значительный рост, и этой области уделяется достаточное

количество внимания, но все же рядовой пользователь никак не может

составить себе четкого представления о том, какие возможности скрывает его

железный друг в области воспроизведения звука, писка, шумов, бинаруальных

волн и т.д. Все ограничивается воспроизведением криков и взрывов в играх и

фильмах (благо технический прогресс докатился уже до такого уровня) и

прослушивания домашней фонотеки (или уже пора придумать другое название,

что-нибудь типа «цифротеки»?).

Попробуем в данном труде разобраться в основных аспектах данной

проблемы. Поговорим немного об анатомии, теории цифрового звука и что можно

извлечь из старой виниловой пластинки и аудиокассеты.

Что именно мы знаем о звуковых возможностях компьютера, кроме того,

что в нашем домашнем компьютере установлена звуковая плата и две колонки? К

сожалению, вероятно из-за недостаточности литературы или по каким-либо

другим причинам, но пользователь, чаще всего, не знаком ни с чем, кроме

встроенного в Windows микшера аудио входов/выходов и Recorder’а. Для того

чтобы узнать что же умеет компьютер в области звука, нужно только

поинтересоваться и перед вами откроются возможности, о которых вы, может

быть, даже не догадывались. И все это не так сложно, как может показаться

на первый взгляд.

2.Часть первая: больше теоретическая.

Все процессы записи, обработки и воспроизведения звука так или иначе

работают на один орган, которым мы воспринимаем звуки - ухо. Две штуки :).

Без понимания того, что мы слышим, что нам важно, а что нет, в чем причина

тех или иных музыкальных закономерностей - без этих и других мелочей

невозможно спроектировать хорошую аудио аппаратуру, нельзя эффективно сжать

или обработать звук. То, что здесь описано - лишь самые основы.

Снаружи мы видим так называемое внешнее ухо. Ничего особенного нас тут не

интересует. Затем идет канал - примерно 0.5 см в диаметре и около 3 см в

длину. Далее - барабанная перепонка, к которой присоединены кости - среднее

ухо. Эти косточки передают вибрацию барабанной перепонки далее - на другую

перепонку, во внутреннее ухо - трубку с жидкостью, около 0.2 мм диаметром и

еще целых 3-4 см длинной, закрученная как улитка. Смысл наличия среднего

уха в том, что колебания воздуха слишком слабы, чтобы напрямую колебать

жидкость, и среднее ухо вместе с барабанной перепонкой и перепонкой

внутреннего уха составляют гидравлический усилитель - площадь барабанной

перепонки во много раз больше перепонки внутреннего уха, поэтому давление

(которое равно F/S) усиливается в десятки раз.

Во внутреннем ухе по всей его длине натянута некая штука, напоминающая

струну - еще одна вытянутая мембрана, жесткая к началу уха и мягкая к

концу. Определенный участок этой мембраны колеблется в своём диапазоне,

низкие частоты - в мягком участке ближе к концу, самые высокие - в самом

начале. Вдоль этой мембраны расположены нервы, которые воспринимают

колебания и передают их в мозг, используя два принципа:

Первый - ударный принцип. Поскольку нервы еще способны передавать колебания

(бинарные импульсы) с частотой до 400-450 Гц, именно этот принцип влоб

используется в области низкочастотного слуха. Там сложно иначе - колебания

мембраны слишком сильны и затрагивают слишком много нервов. Ударный принцип

немного расширяется до примерно 4 кГц с помощью трюка - несколько (до

десяти) нервов ударяют в разных фазах, складывая свою пропускную

способность. Этот способ хорош тем, что мозг воспринимает информацию более

полно - с одной стороны, мы всё таки имеем легкое частотное разделение, а с

другой - можем еще смотреть сами колебания, их форму и особенности, а не

просто частотный спектр. Этот принцип продлен на самую важную для нас часть

- спектр человеческого голоса. Да и вообще, до 4 кГц находится вся наиболее

важная для нас информация.

Ну и второй принцип - просто местоположение возбуждаемого нерва,

применяется для звуков более 4 кГц. Тут уже кроме факта нас вообще ничего

не волнует - ни фаза, ни скважность.. Голый спектр.

Таким образом, в области высоких частот мы имеем чисто спектральный слух не

очень высокого разрешения, а для частот близких к человеческому голосу -

более полный, основанный не только на разделении спектра, а еще и на

дополнительном анализе информации самим мозгом, давая более полную стерео -

картину, например. Об этом - ниже.

Основное восприятие звука происходит в диапазоне 1 - 4 кГц, в этом же

диапазоне заключено человеческий голос (да и звуки, издаваемые большинством

важных нам процессов в природе). Корректная передача этого частотного

отрезка - первое условие естественности звучания.

О чувствительности (по мощности и частотной)

Теперь о децибелах. Вкратце - аддитивная относительная логарифмическая мера

громкости (мощности) звука, наиболее хорошо отражающая человеческое

восприятие громкости, и в то же время достаточно просто вычисляемая.

В акустике принято измерять громкость в дБ SPL (Sound Power Level - не знаю

как это звучит у нас). Ноль этой шкалы находится примерно на минимальном

звуке, который слышит человек. Соответственно отсчет ведется в

положительную сторону. Человек может осмысленно слышать звуки громкостью

примерно до 120 дБ SPL. При 140 дБ ощущается сильная боль, при 150 дБ

наступает повреждение ушей. Нормальный разговор - примерно 60 - 70 дБ SPL.

Далее в этом разделе при упоминании дБ подразумевается дБ от нуля по SPL.

Чувствительность уха к разным частотам очень сильно различна. Максимальна

чувствительность в районе 1 - 4 кГц, основные тона человеческого голоса.

Звук 3 кГц - это и есть тот звук, который слышен при 0 дБ. Чувствительность

сильно падает в обе стороны - например для звука в 100 Гц нам нужно уже

целых 40 дБ (в 100 раз большая амплитуда колебаний), для 10 кГц - 20 дБ.

Обычно мы можем сказать, что два звука отличаются по громкости, при разнице

примерно в 1 дБ. Несмотря на это, 1 дБ - это скорее много, чем мало. Просто

у нас очень сильно компрессированное, выровненное восприятие громкости.

Зато весь диапазон - 120 дБ - воистину огромен, по амплитуде это миллионы

раз!

Кстати, увеличение амплитуды в два раза соответствует увеличению громкости

на 6 дБ. Внимание! не путайте: 12 дБ - в 4 раза, но разница 18 дБ - уже 8

раз! а не 6, как могло подуматься. дБ - логарифмическая мера)

Аналогична по свойствам и спектральная чувствительность. Мы можем сказать,

что два звука (простых тона) отличаются по частоте, если разница между ними

составляет около 0.3% в районе 3 кГц, а в районе 100 Гц требуется различие

уже на 4%! Для справки - частоты нот (если брать вместе с полутонами, то

есть две соседние клавиши фортепьяно, включая черные) отличаются на

примерно 6%.

В общем, в районе 1 - 4 кГц чувствительность уха по всем параметрам

максимальна, и составляет не так уж и много, если брать не

логарифмированные значения, с которыми приходится работать цифровой

технике. Примите на заметку - многое из того, что происходит в цифровой

обработке звука, может выглядеть ужасно в цифрах, и при этом звучать

неотличимо от оригинала.

В цифровой обработке понятие дБ считается от нуля и вниз, в область

отрицательных значений. Ноль - максимальный уровень, представимый цифровой

схемой.

А. Собственно говоря, о самой цифре.

Некоторые факты и понятия, без которых тяжело обойтись.

В соответствии с теорией математика Фурье, звуковую волну можно

представить в виде спектра входящих в нее частот.

Частотные составляющие спектра - это синусоидальные колебания (так

называемые чистые тона), каждое из которых имеет свою собственную амплитуду

и частоту. Таким образом, любое, даже самое сложное по форме колебание

(например, человеческий голос), можно представить суммой простейших

синусоидальных колебаний определенных частот и амплитуд. И наоборот,

сгенерировав различные колебания и наложив их друг на друга (смикшировав,

смешав), можно получить различные звуки.

Справочка: человеческий слуховой аппарат/мозг способен различать

частотные составляющие звука в пределах от 20 Гц до ~20 КГц (верхняя

граница может колебаться в зависимости от возраста и других факторов).

Кроме того, нижняя граница сильно колеблется в зависимости от интенсивности

звучания.

Б. Оцифровка звука и его хранение на цифровом носителе

«Обычный» аналоговый звук представляется в аналоговой аппаратуре

непрерывным электрическим сигналом. Компьютер оперирует с данными в

цифровом виде. Это означает, что и звук в компьютере представляется в

цифровом виде. Как же происходит преобразование аналогового сигнала в

цифровой?

Цифровой звук – это способ представления электрического сигнала

посредством дискретных численных значений его амплитуды. Допустим, мы имеем

аналоговую звуковую дорожку хорошего качества (говоря «хорошее качество»

будем предполагать нешумную запись, содержащую спектральные составляющие из

всего слышимого диапазона частот – приблизительно от 20 Гц до 20 КГц) и

хотим «ввести» ее в компьютер (то есть оцифровать) без потери качества. Как

этого добиться и как происходит оцифровка? Звуковая волна – это некая

сложная функция, зависимость амплитуды звуковой волны от времени. Казалось

бы, что раз это функция, то можно записать ее в компьютер «как есть», то

есть описать математический вид функции и сохранить в памяти компьютера.

Однако практически это невозможно, поскольку звуковые колебания нельзя

представить аналитической формулой (как y=COSx, например). Остается один

путь – описать функцию путем хранения ее дискретных значений в определенных

точках. Иными словами, в каждой точке времени можно измерить значение

амплитуды сигнала и записать в виде чисел. Однако и в этом методе есть свои

недостатки, так как значения амплитуды сигнала мы не можем записывать с

бесконечной точностью, и вынуждены их округлять. Говоря иначе, мы будем

приближать эту функцию по двум координатным осям – амплитудной и временной

(приближать в точках – значит, говоря простым языком, брать значения

функции в точках и записывать их с конечной точностью). Таким образом,

оцифровка сигнала включает в себя два процесса - процесс дискретизации

(осуществление выборки) и процесс квантования. Процесс дискретизации - это

процесс получения значений величин преобразуемого сигнала в определенные

промежутки времени (рис. 1).

[pic]

рис.1

Квантование - процесс замены реальных значений сигнала приближенными с

определенной точностью (рис. 2). Таким образом, оцифровка – это фиксация

амплитуды сигнала через определенные промежутки времени и регистрация

полученных значений амплитуды в виде округленных цифровых значений (так как

значения амплитуды являются величиной непрерывной, нет возможности конечным

числом записать точное значение амплитуды сигнала, именно поэтому прибегают

к округлению). Записанные значения амплитуды сигнала называются отсчетами.

Очевидно, что чем чаще мы будем делать замеры амплитуды (чем выше частота

дискретизации) и чем меньше мы будем округлять полученные значения (чем

больше уровней квантования), тем более точное представление сигнала в

цифровой форме мы получим.

Рис.2

Оцифрованный сигнал в виде набора последовательных значений амплитуды

можно сохранить.

Теперь о практических проблемах. Во-первых, надо иметь в виду, что

память компьютера не бесконечна, так что каждый раз при оцифровке

необходимо находить какой-то компромисс между качеством (напрямую зависящим

от использованных при оцифровке параметров) и занимаемым оцифрованным

сигналом объемом.

Во-вторых, частота дискретизации устанавливает верхнюю границу частот

оцифрованного сигнала, а именно, максимальная частота спектральных

составляющих равна половине частоты дискретизации сигнала. Попросту говоря,

чтобы получить полную информацию о звуке в частотной полосе до 22050 Гц,

необходима дискретизация с частотой не менее 44.1 КГц.

Существуют и другие проблемы и нюансы, связанные с оцифровкой звука.

Не сильно углубляясь в подробности отметим, что в «цифровом звуке» из-за

дискретности информации об амплитуде оригинального сигнала появляются

различные шумы и искажения (под фразой «в цифровом звуке есть такие-то

частоты и шумы» подразумевается, что когда этот звук будет преобразован

обратно из цифрового вида в аналоговый, то в его звучании будут

присутствовать упомянутые частоты и шумы). Так, например, джиттер (jitter)

– шум, появляющийся в результате того, что осуществление выборки сигнала

при дискретизации происходит не через абсолютно равные промежутки времени,

а с какими-то отклонениями. То есть, если, скажем, дискретизация проводится

с частотой 44.1 КГц, то отсчеты берутся не точно каждые 1/44100 секунды, а

то немного раньше, то немного позднее. А так как входной сигнал постоянно

меняется, то такая ошибка приводит к «захвату» не совсем верного уровня

сигнала. В результате во время проигрывания оцифрованного сигнала может

ощущаться некоторое дрожание и искажения. Появление джиттера является

результатом не абсолютной стабильности аналогово-цифровых преобразователей.

Для борьбы с этим явлением применяют высокостабильные тактовые генераторы.

Еще одной неприятностью является шум дробления. Как мы говорили, при

квантовании амплитуды сигнала происходит ее округление до ближайшего

уровня. Такая погрешность вызывает ощущение «грязного» звучания.

Справочка: стандартные параметры записи аудио компакт-дисков

следующие: частота дискретизации - 44.1 КГц, уровень квантования – 16 бит.

Такие параметры соответствуют 65536 (2[pic]) уровням квантования амплитуды

при взятии ее значений 44100 раз в секунду.

На практике, процесс оцифровки (дискретизация и квантование сигнала)

остается невидимым для пользователя - всю черновую работу делают

разнообразные программы, которые дают соответствующие команды драйверу

(управляющая подпрограмма операционной системы) звуковой карты. Любая

программа (будь то встроенный в Windows Recorder или мощный звуковой

редактор), способная осуществлять запись аналогового сигнала в компьютер,

так или иначе оцифровывает сигнал с определенными параметрами, которые

могут оказаться важными в последующей работе с записанным звуком, и именно

по этой причине важно понять как происходит процесс оцифровки и какие

факторы влияют на ее результаты.

Поехали дальше. Как получить аналоговый звук опять из цифры?

Мы же его должны услышать, а цифорки нам слышать не дано.

2. Преобразование звука из цифрового вида в аналоговый

Как после оцифровки прослушивать звук? То есть, как преобразовывать

его обратно из цифрового вида в аналоговый?

Для преобразования дискретизованного сигнала в аналоговый вид,

пригодный для обработки аналоговыми устройствами (усилителями и фильтрами)

и последующего воспроизведения через акустические системы, служит

цифроаналоговый преобразователь (ЦАП). Процесс преобразования представляет

собой обратный процесс дискретизации: имея информацию о величине отсчетов

(амплитуды сигнала) и беря определенное количество отсчетов в единицу

времени, путем интерполирования происходит восстановление исходного сигнала

(рис. 3).

Рис. 3

Еще совсем недавно воспроизведение звука в домашних компьютерах было

проблемой, так как компьютеры не оснащались специальными ЦАП. Сначала в

качестве простейшего звукового устройства в компьютере использовался

встроенный динамик (PC speaker). Вообще говоря, этот динамик до сих пор

имеется почти во всех PC, но никто уже не помнит как его «раскачать», чтобы

он заиграл. Если вкратце, то этот динамик присоединен к порту на

материнской плате, у которого есть два положения – 1 и 0. Так вот, если

этот порт быстро-быстро включать и выключать, то из динамика можно извлечь

более-менее правдоподобные звуки. Воспроизведение различных частот

достигается за счет того, что диффузор динамика обладает конечной реакцией

и не способен мгновенно перескакивать с места на место, таким образом он

«плавно раскачивается» вследствие скачкообразного изменения напряжения на

нем. И если колебать его с разной скоростью, то можно получить колебания

воздуха на разных частотах. Естественной альтернативой динамику стал так

называемый Covox – это простейший ЦАП, выполненный на нескольких

подобранных сопротивлениях (или готовой микросхеме), которые обеспечивают

перевод цифрового представления сигнала в аналоговый – то есть в реальные

значения амплитуды. Covox прост в изготовлении и поэтому он пользовался

успехом у любителей вплоть до того времени, когда звуковая карта стала

доступной всем.

В современном компьютере звук воспроизводится и записывается с помощью

звуковой карты – подключаемой, либо встроенной в материнскую плату

компьютера. Задача звуковой карты в компьютере – ввод и вывод аудио.

Практически это означает, что звуковая карта является тем преобразователем,

который переводит аналоговый звук в цифровой и обратно. Если описывать

упрощенно, то работа звуковой карты может быть пояснена следующим образом.

Предположим, что на вход звуковой карты подан аналоговый сигнал и карта

включена (программно). Сначала входной аналоговый сигнал попадает в

аналоговый микшер, который занимается смешением сигналов и регулировкой

громкости и баланса. Микшер необходим, в частности, для предоставления

возможности пользователю управлять уровнями. Затем отрегулированный и

сбалансированный сигнал попадает в аналогово-цифровой преобразователь, где

сигнал дискретизуется и квантуется, в результате чего в компьютер по шине

данных направляется бит-поток, который и представляет собой оцифрованный

аудио сигнал. Вывод аудио информации почти аналогичен вводу, только

происходит в обратную сторону. Поток данных, направленный в звуковую карту,

преодолевает цифро-аналоговый преобразователь, который образует из чисел,

описывающих амплитуду сигнала, электрический сигнал; полученный аналоговый

сигнал может быть пропущен через любые аналоговые тракты для дальнейших

преобразований, в том числе и для воспроизведения. Надо отметить, что если

звуковая карта оборудована интерфейсом для обмена цифровыми данными, то при

работе с цифровым аудио никакие аналоговые блоки карты не задействуются.

В.Как сохранить оцифрованный звук?

Для хранения цифрового звука существует много различных способов. Как

мы говорили, оцифрованный звук являет собой набор значений амплитуды

сигнала, взятых через определенные промежутки времени. Таким образом, во-

первых, блок оцифрованной аудио информации можно записать в файл «как

есть», то есть последовательностью чисел (значений амплитуды). В этом

случае существуют два способа хранения информации.

Рис.4

Первый (рис. 4) - PCM (Pulse Code Modulation - импульсно-кодовая

модуляция) - способ цифрового кодирования сигнала при помощи записи

абсолютных значений амплитуд (бывают знаковое или беззнаковое

представления). Именно в таком виде записаны данные на всех аудио CD.

Второй способ (рис. 5) - ADPCM (Adaptive Delta PCM - адаптивная

относительная импульсно-кодовая модуляция) – запись значений сигнала не в

абсолютных, а в относительных изменениях амплитуд (приращениях).

Рис.5 [pic]

Во-вторых, можно сжать или упростить данные так, чтобы они занимали

меньший объем памяти, нежели будучи записанными «как есть». Тут тоже

имеются два пути.

Кодирование данных без потерь (lossless coding) - это способ

кодирования аудио, который позволяет осуществлять стопроцентное

восстановление данных из сжатого потока. К такому способу уплотнения данных

прибегают в тех случаях, когда сохранение оригинального качества данных

критично. Например, после сведения звука в студии звукозаписи, данные

необходимо сохранить в архиве в оригинальном качестве для возможного

последующего использования. Существующие сегодня алгоритмы кодирования без

потерь (например, Monkeys Audio) позволяют сократить занимаемый данными

объем на 20-50%, но при этом обеспечить стопроцентное восстановление

оригинальных данных из полученных после сжатия. Подобные кодеры – это

своего рода архиваторы данных (как ZIP, RAR и другие), только

предназначенные для сжатия именно аудио.

Имеется и второй путь кодирования, на котором мы остановимся чуть

подробнее, – кодирование данных с потерями (lossy coding). Цель такого

кодирования - любыми способами добиться схожести звучания восстановленного

сигнала с оригиналом при как можно меньшем объеме упакованных данных. Это

достигается путем использования различных алгоритмов «упрощающих»

оригинальный сигнал (выкидывая из него «ненужные» слабослышимые детали),

что приводит к тому, что декодированный сигнал фактически перестает быть

идентичным оригиналу, а лишь похоже звучит. Методов сжатия, а также

программ, реализующих эти методы, существует много. Наиболее известными

являются MPEG-1 Layer I,II,III (последним является всем известный MP3),

MPEG-2 AAC (advanced audio coding), Ogg Vorbis, Windows Media Audio (WMA),

TwinVQ (VQF), MPEGPlus, TAC, и прочие. В среднем, коэффициент сжатия,

обеспечиваемый такими кодерами, находится в пределах 10-14 (раз). Надо

особо подчеркнуть, что в основе всех lossy-кодеров лежит использование так

называемой психоакустической модели, которая как раз и занимается

«упрощением» оригинального сигнала. Говоря точнее, механизм подобных

кодеров выполняет анализ кодируемого сигнала, в процессе которого

определяются участки сигнала, в определенных частотных областях которых

имеются неслышные человеческому уху нюансы (замаскированные или неслышимые

частоты), после чего происходит их удаление из оригинального сигнала. Таким

образом, степень сжатия оригинального сигнала зависит от степени его

«упрощения»; сильное сжатие достигается путем «агрессивного упрощения»

(когда кодер «считает» ненужными множественные нюансы), такое сжатие,

естественно, приводит к сильной деградации качества, поскольку удалению

могут подлежать не только незаметные, но и значимые детали звучания.

Как мы сказали, современных lossy-кодеров существует достаточно много.

Наиболее распространенный формат – MPEG-1 Layer III (всем известный MP3).

Формат завоевал свою популярность совершенно заслуженно – это был первый

распространенный кодек подобного рода, который достиг столь высокого уровня

компрессии при отличном качестве звучания. Сегодня этому кодеку имеется

множество альтернатив, но выбор остается за пользователем. Преимущества

MP3 – широкая распространенность и достаточно высокое качество кодирования,

которое объективно улучшается благодаря разработкам различных кодеров MP3

энтузиастами (например, кодер Lame). Мощная альтернатива MP3 – кодек

Microsoft Windows Media Audio (Файлы .WMA и .ASF). По различным тестам этот

кодек показывает себя от «как MP3» до «заметно хуже MP3» на средних

битрейтах, и, чаще, «лучше MP3» на низких битрейтах. Ogg Vorbis (файлы

.OGG) – совершенно свободный от лицензирования кодек, создаваемый

независимыми разработчиками. Чаще всего ведет себя лучше MP3, недостатком

является лишь малая распространенность, что может стать критическим

аргументом при выборе кодека для длительного хранения аудио. Вспомним и еще

молодой кодек MP3 Pro, анонсированный в июле 2001 года компанией Coding

Technologies совместно с Thomson Multimedia. Кодек является продолжением,

или, точнее, развитием старого MP3 – он совместим с MP3 назад (полностью) и

вперед (частично). За счет использования новой технологии SBR (Spectral

Band Replication), кодек ведет себя заметно лучше других форматов на низких

битрейтах, однако качество кодирования на средних и высоких битрейтах чаще

уступает качеству почти всех описанных кодеков. Таким образом, MP3 Pro

пригоден больше для ведения аудио трансляций в Internet, а также для

создания превью песен и музыки.

Говоря о способах хранения звука в цифровом виде нельзя не вспомнить и

о носителях данных. Всем привычный аудио компакт-диск, появившийся в начале

80-х годов, широкое распространение получил именно в последние годы (что

связано с сильным удешевлением носителя и приводов). А до этого носителями

цифровых данных являлись кассеты с магнитной лентой, но не обычные, а

специально предназначенные для так называемых DAT-магнитофонов. Ничего

примечательного – магнитофоны как магнитофоны, однако цена на них всегда

была высокой, и такое удовольствие было не всем «по зубам». Эти магнитофоны

использовались, в основном, в студиях звукозаписи. Преимущество таких

магнитофонов было в том, что, не смотря на использование привычных

носителей, данные на них хранились в цифровом виде и практически никаких

потерь при чтении/записи на них не было (что очень важно при студийной

обработке и хранении звука). Сегодня появилось большое количество различных

носителей данных, кроме привычных всем компакт дисков. Носители

совершенствуются и с каждым годом становятся более доступными и

компактными. Это открывает большие возможности в области создания мобильных

аудио проигрывателей. Уже сегодня продается огромное количество различных

моделей переносных цифровых плееров. И, можно предположить, что это еще

далеко не пик развития такого рода техники.

Г. Преимущества и недостатки цифрового звука

С точки зрения обычного пользователя выгоды много - компактность

современных носителей информации позволяет ему, например, перевести все

диски и пластинки из своей коллекции в цифровое представление и сохранить

на долгие годы на небольшом трехдюймовом винчестере или на десятке-другом

компакт дисков; можно воспользоваться специальным программным обеспечением

и хорошенько «почистить» старые записи с бобин и пластинок, удалив из их

звучания шумы и треск; можно также не просто скорректировать звучание, но и

приукрасить его, добавить сочности, объемности, восстановить частоты.

Помимо перечисленных манипуляций со звуком в домашних условиях, Интернет

тоже приходит на помощь аудио-любителю. Например, сеть позволяет людям

обмениваться музыкой, прослушивать сотни тысяч различных Интернет-радио

станций, а также демонстрировать свое звуковое творчество публике, и для

этого нужен всего лишь компьютер и Интернет. И, наконец, в последнее время

появилась огромная масса различной портативной цифровой аудио аппаратуры,

возможности даже самого среднего представителя которой зачастую позволяют с

легкостью взять с собой в дорогу коллекцию музыки, равную по длительности

звучания десяткам часов.

С точки зрения профессионала цифровой звук открывает поистине

необъятные возможности. Если раньше звуковые и радио студии размещались на

нескольких десятках квадратных метров, то теперь их может заменить хороший

компьютер, который по возможностям превосходит десять таких студий вместе

взятых, а по стоимости оказывается многократно дешевле одной. Это снимает

многие финансовые барьеры и делает звукозапись более доступной и

профессионалу и простому любителю. Современное программное обеспечение

позволяет делать со звуком все что угодно. Раньше различные эффекты

звучания достигались с помощью хитроумных приспособлений, которые не всегда

являли собой верх технической мысли или же были просто устройствами

кустарного изготовления. Сегодня, самые сложные и просто невообразимые

раньше эффекты достигаются путем нажатия пары кнопок. Конечно,

вышесказанное несколько утрировано и компьютер не заменяет человека –

звукооператора, режиссера или монтажера, однако с уверенностью можно

сказать, что компактность, мобильность, колоссальная мощность и

обеспечиваемое качество современной цифровой техники, предназначенной для

обработки звука, уже сегодня почти полностью вытеснило из студий старую

аналоговую аппаратуру.

Впрочем, у цифрового представления данных есть одно неоспоримое и

очень важное преимущество – при сохранном носителе данные на нем не

искажаются с течением времени. Если магнитная лента со временем

размагничивается и качество записи теряется, если пластинка царапается и к

звучанию прибавляются щелчки и треск, то компакт-диск / винчестер /

электронная память либо читается (в случае сохранности), либо нет, а эффект

старения отсутствует. Важно отметить, мы не говорим здесь об Audio CD (CD-

DA – стандарт, устанавливающий параметры и формат записи на аудио компакт

диски) так как не смотря на то, что это носитель цифровой информации,

эффект старения его, все же, не минует. Это связано с особенностями

хранения и считывания аудио данных с Audio CD. Информация на всех типах

компакт-дисков хранится покадрово и каждый кадр имеет заголовок, по

которому его возможно идентифицировать. Однако различные типы CD имеют

различную структуру и используют различные методы маркировки кадров.

Поскольку компьютерные приводы CD-ROM рассчитаны на чтение в основном Data-

CD (надо сказать, что существуют различные разновидности стандарта Data-CD,

каждый из которых дополняет основной стандарт CD-DA), они часто не

способны правильно «ориентироваться» на Audio CD, где способ маркировки

кадров отличен от Data-CD (на аудио CD кадры не имеют специального

заголовка и для определения смещения каждого кадра необходимо следить за

информацией в кадре). Это означает, что если при чтении Data-CD привод

легко «ориентируется» на диске и никогда не перепутает кадры, то при чтении

с аудио компакт диска привод не может ориентироваться четко, что при

появлении, скажем, царапины или пыли может привести к чтению неправильного

кадра и, как следствие, скачку или треску звучания. Эта же проблема

(неспособность большинства приводов правильно позиционироваться на CD-DA)

является причиной еще одного неприятного эффекта: копирование информации с

Audio CD вызывает проблемы даже при работе с полностью сохранными дисками

вследствие того, что правильное «ориентирование на диске» полностью зависит

от считывающего привода и не может быть четко проконтролировано

программным путем.

Повсеместное распространение и дальнейшее развитие уже упомянутых

lossy-кодеров аудио (MP3, AAC и других) открыло широчайшие возможности

распространения и хранения аудио. Современные каналы связи уже давно

позволяют пересылать большие массивы данных за сравнительно небольшое

время, однако самой медленной остается передача данных между конечным

пользователем и поставщиком услуг связи. Телефонные линии, по которым

пользователи в большинстве своем связываются с Интернетом, не позволяют

осуществлять быструю передачу данных. Нечего и говорить, что такие объемы

данных, какие занимает несжатая аудио и видео информация, передавать по

привычным каналам связи придется очень долго. Однако появление lossy-

кодеров, обеспечивающих десяти-пятнадцати кратное сжатие, превратило

передачу и обмен аудио данными в повседневное занятие каждого пользователя

Интернета и сняло все преграды, образованные слабыми каналами связи.

Касательно этого нужно сказать, что развивающаяся сегодня семимильными

шагами цифровая мобильная связь во многом обязана именно lossy-кодированию.

Дело в том, что протоколы передачи аудио по каналам мобильной связи

работают на приблизительно тех же принципах, что и известные всем

музыкальные кодеры. Поэтому дальнейшее развитие в области кодирования аудио

неизменно ведет к уменьшению стоимости передачи данных в мобильных

системах, от чего конечный пользователь только выигрывает: дешевеет связь,

появляются новые возможности, продлевается время работы батарей мобильных

устройств и т.д. Не в меньшей степени lossy-кодирование помогает экономить

деньги на покупке дисков с любимыми песнями – сегодня стоит только зайти в

Интернет и там можно найти почти любую интересующую песню. Безусловно,

такое положение вещей давно «мозолит глаза» звукозаписывающим компаниям – у

них под носом люди вместо покупки дисков обмениваются песнями прямо через

Интернет, что превращает некогда золотое дно в малоприбыльный бизнес, но

это уже вопрос этики и финансов. Одно можно сказать с уверенностью: с таким

положением вещей уже ничего нельзя поделать и бум обмена музыкой через

Интернет, порожденный именно появлением lossy-кодеров, уже ничем не

Страницы: 1, 2


© 2010 Современные рефераты