РАБОТА КОМПЬЮТЕРА С ВИДЕОИЗОБРАЖЕНИЯМИ. СТАНДАРТЫ И ПРИНЦИПЫ ПОСТРОЕНИЯ ВИДЕОИЗОБРАЖЕНИЙ.

Работа компьютера с видеоизображениями. стандарты и принципы построения видеоизображений.

1. Преобразователи форматов.

TV-адаптеры (конверторы) или как их иногда называют преобразователи форматов позволяют на обычном телевизоре просматривать изображения созданные на компьютере и записывать эти изображения на видеомагнитофон. TV-адаптеры поддерживают телевизионные стандарты NTSC, PAL и европейский стандарт PAL/SECAM.

Преобразователи форматов (например, VGA-TV конвертор) могут представлять собой отдельные внешние устройства со стандартным интерфейсом компьютерного монитора на входе и каким-либо телевизионным сигналом на выходе. В простейшем варианте конвертор только преобразует сигналы из RGB в один из интерфейсов телеприемника, но при этом требуется установка разрешения и частот синхронизации графического адаптера, совпадающих со стандартом телеприемника. Для пользователя PC эти ограничения малоприятны, а иногда и невыполнимы. Более сложные конверторы имеют собственную буферную память, которая заполняется вновь оцифрованным видеосигналом, снятым с выхода графического адаптера. На телевизионный выход информация из буфера выдается уже с телевизионной частотой. Буфер может хранить одну, несколько или все строки экрана. От этого зависят ограничения на режим разрешения и соотношения частот регенерации графического адаптера и телевизионного монитора (в последнем случае они вообще могут быть не связанными). Естественно, эти три варианта сильно отличаются по сложности и цене (конвертор с полноэкранным буфером самый дорогой). Однако, когда графический адаптер выводит движущееся изображение, смена которого привязана к кадровой синхронизации, при несовпадении кадровых частот на телевизионном экране движение будет искажаться. Общей проблемой конверторов является необходимость борьбы с мерцанием (flickering): поскольку в телеприемниках используется чересстрочная развертка, горизонтальная полоса шириной в пиксел будет отображаться с частотой 25 или 30 Гц, что улавливается глазом. Возможны и варианты встроенных адаптеров (ISA-карта), подключаемых к шине расширения PC и внутреннему разъему графической карты (VFC или VAFC). Некоторые модели конверторов позволяют накладывать графическое изображение на внешний видеосигнал (например, для создания титров). Ввиду ограниченной горизонтальной разрешающей способности телеприемников (полоса пропускания шире 5 МГц для телевизора как такового бессмысленна), возможность замены монитора телевизором для регулярной работы сомнительна. В стандарте NTSC обеспечивается разрешение 640х480, в PAL и SECAM - 800х600. Однако такое разрешение реально достижимо только при использовании интерфейса S-Video. Композитный сигнал, как было сказано выше, не обеспечивает столь высокого разрешения. Microsoft рекомендует устанавливать на новых графических картах кроме стандартного интерфейса VGA (RGB-Analog) выход композитного сигнала и S-Video. Более того, рекомендуется предусмотреть возможность одновременной работы VGA-монитора и TV-приемника, что не так-то просто обеспечить из-за различия параметров синхронизации.

2. Видеооверлейные платы (overlay board).

Вывод видеоизображения на экран компьютерного монитора используется гораздо чаще. Видеоизображение выводится в окно, занимающее весь экран или его часть. Поскольку вывод видео перекрывает часть графического изображения, такой способ вывода называют видеооверлеем (Video Overlay), а платы, обеспечивающие данный режим, называют видеооверлейными (overlay board). Эти платы позволяют изменять размер окна видео так же, как и размер любого окна в Windows. В оверлейной плате для видеоизображения имеется специальный «слой» видеопамяти, независимой от видеобуфера графического адаптера. В этом слое содержится оцифрованное растровое отображение каждого кадра видеосигнала. Поскольку для видеосигнала принято цветовое пространство в координатах Y-U-V, в этом слое памяти пикселы также отображаются в этом пространстве, а не в R-G-B, свойственном графическим адаптерам. В такой системе движущееся видеоизображение, видимое на экране монитора, существует лишь в оверлейном буфере, но никак не попадает в видеопамять графического адаптера и не передается ни по каким внутренним цифровым шинам компьютера. В видеопамяти графического адаптера «расчищается» окно, через которое «выглядывает» видеоизображение из оверлейного буфера. Некоторый цвет (комбинация бит RGB) принимается за прозрачный. Оверлейная логика сравнивает цвет очередного пиксела графического буфера с этим прозрачным, и если он совпадает, вместо данного пиксела выводится соответствующий пиксел видеооверлея. Если цвет не совпадает с прозрачным, то выводится пиксел из графического буфера. Таким образом, имея доступ к пикселам графического буфера, можно на видеоизображение накладывать графику для организации видеоэффектов или вывода в видеоокне «всплывающих» (PopUp) меню. Наложение производится на уровне потока бит сканируемых пикселов, который может передаваться в оверлейную плату через разъем Feature Connector.

3. Фрейм-граббер (Frame Grabber или Video Capture).

Телевизионные сигналы от различных источников (наример от видеомагнитофона или видеокамеры) запоминаются в компьютере для их последующего воспроизведения или редактирования. Для того чтобы записывать и хранить телевизионное изображение в компьютере в виде файла, необходимы специальные устройства - видео оверлейными платами с средствами захвата видеоизображения. Такая оверлейная плата обычно имеет несколько входов для источников аналогового видеосигнала и программно-управляемые средства выбора одного из них. Такое устройство обычно имеет в своем составе и фрейм-граббер (Frame Grabber) - средство захвата видеокадра. Его другое название - Video Capture. По команде оператора движущееся изображение может быть мгновенно зафиксировано в оверлейном буфере, после чего захваченный кадр может быть записан на диск в каком-либо графическом формате для последующей обработки и использования. Для записи телепрограммы длительностью в две секунды требуется около 80 мегабайт на жестком диске. Поскольку файлы с телепрограммами занимают слишком много места на дисках их сжимают(упаковывают) аппаратными или программными средствами осуществляющими компрессию данных. Более совершенные устройства позволяют записывать в реальном времени последовательность видеокадров, выполняя их компрессию методами M-JPEG, DVI или INDEO (MPEG-кодирование требует слишком больших ресурсов для выполнения преобразования в реальном времени). Фрейм-граббер может и не иметь отношения к видеооверлею, а быть отдельным устройством, подключаемым к источнику видеосигнала и какому-либо интерфейсу компьютера. В этом случае видеоизображение наблюдается уже не на мониторе компьютера, а на обычном телевизоре, подключенном к тому же источнику видеосигнала или фрейм-грабберу. По команде оператора требуемый кадр фиксируется в буферной памяти фрейм-граббера, откуда по интерфейсу поступает в компьютер для обработки или (и) хранения.

4. TV-тюнер.

TV-тюнер - устройство приема видеосигналов с радиочастотного входа (антенны), в сочетании с оверлейной платой позволяет просматривать телепрограммы на обычном мониторе компьютера. Тюнер может поддерживать стандарты цветопередачи PAL, SECAM и NTSC, но из-за несовпадения стандартов на промежуточную частоту звукового сопровождения некоторые карты не принимают звуковое сопровождение отечественных телепрограмм.

5. Сжатие видеоизображений (кодек — компрессор-декомпрессор видеосигнала).

Передача видеоизображения в цифровом виде, естественном для графической системы компьютера (Bitmap), требует обеспечить поток данных 175 Мбит/с, или около 22 Мбайт/с. О том, чтобы записывать такой поток данных даже на самый быстрый винчестер, пока не может быть и речи - то, что интерфейс, например Ultra DMA, позволяет передавать данные со скоростью 33 Мб/с, вовсе не означает, что винчестер может поддерживать такой поток записи на физический носитель. Кроме того, этот поток заполнил бы диск емкостью 1 Гб всего за 44 секунды. Конечно, если пожертвовать количеством цветов и «опуститься», например, до режима High Color (16 бит на пиксел), то требуемый поток уменьшится до 116 Мбит/с. Но и такой поток не под силу выдержать компонентам современного компьютера. Выходом может быть только сжатие передаваемой информации. Выше уже отмечалось, что формат Bitmap является довольно расточительным способом описания изображений. Соседние (по вертикали и горизонтали) элементы реального изображения обычно между собой сильно взаимосвязаны (коррелированны), поэтому имеются богатые возможности сжатия описания. Иллюстрация этому - очень большой коэффициент сжатия файлов *.BMP любым архиватором. Если сжатие файлов данных при архивации обязательно требует возможности точного восстановления исходных данных при распаковке, то при сжатии изображений в большинстве случаев можно позволить некоторые вольности, когда восстановленное изображение будет не совсем точно соответствовать оригиналу. И наконец, соседние кадры движущегося изображения между собой в большинстве случаев тоже сильно связаны, что наводит на мысль о применении дифференциального описания кадров. Все эти рассуждения подводят нас к пониманию возможностей сжатия видеоинформации и принципов действия кодеков - компрессоров-декомпрессоров видеосигнала. Как и в случае программного сжатия и восстановления данных, задача компрессии оказывается сложнее задачи восстановления (легко заметить, что распаковка файлов, например архиватором ARJ, происходит гораздо быстрее упаковки). Процедура сжатия может выполняться как одноступенчатым, так и двухступенчатым способом. В первом случае сжатие выполняется одновременно с записью в реальном масштабе времени. Во втором случае поток несжатых данных интенсивностью в несколько десятков Мбайт/с записывается на специальный (очень большой и очень быстрый) диск. По окончании записи фрагмента выполняется его сжатие, которое может занимать на порядок больше времени, чем сама запись. Декомпрессия, естественно, представляет интерес лишь в том случае, если она выполняется в реальном масштабе времени (к счастью, она и реализуется проще). Ряд кодеков позволяет осуществлять декомпрессию в реальном времени чисто программными способами, используя стандартный графический адаптер SVGA. Однако программная декомпрессия сильно загружает процессор, что неблагоприятно сказывается на многозадачном использовании компьютера. Ряд современных дисплейных адаптеров имеют специальные аппаратные средства декомпрессии, разгружающие центральный процессор. На долю процессора остается лишь организация доставки сжатого потока данных к плате адаптера.

Сжатие движущихся изображений.

Сжатие движущихся изображений включает внутрикадровое (intraframe compression) и межкадровое (interframe compression) сжатие. Для внутрикадрового сжатия используются методы, применяемые для сжатия неподвижных изображений. В межкадровом сжатии применяется система ключевых фреймов (key frame), содержащих полную информацию о кадре, и дельта-фреймов (delta frame), содержащих информацию о последовательных изменениях кадров относительно ключевых. Благодаря корреляции соседних кадров дельта-фреймы в общем случае несут гораздо меньше информации, чем ключевые, и, следовательно, поток их данных не так интенсивен. Периодическое вкрапление ключевых кадров позволяет избежать накопления ошибки в изображении, а также начинать прием потока в любой момент (дождавшись ближайшего ключевого фрейма). При съемке различных сюжетов межкадровая корреляция, конечно же, будет существенно варьироваться. Поэтому, чтобы оценить качество работы кодека, применяют, например, сюжеты типа «говорящие головы» (Talking heads) с высокой степенью корреляции кадров и более сложные полнодвижущиеся изображения (Actions) - карусель, где все элементы перемещаются. Оценка качества ведется как по объективным показателям, так и по субъективному восприятию. Объективными показателями является максимальная частота кадров (Frame Rate), которая обеспечивается без отбрасывания кадров, и процент отбрасываемых кадров (Drop Frames) при обработке потока со стандартной частотой кадров. Эти показатели характеризует производительность декомпрессора, которая может оказаться и недостаточной для обработки потока данных без потерь. Интересен также и коэффициент загрузки центрального процессора (CPU Utilization) при отработке стандартного потока, по которому можно судить о возможности исполнения других задач во время видеовоспроизведения. В процессе декомпрессии может потребоваться масштабирование кадров, для того чтобы вписать изображение в окно заданного размера. В простейшем случае декомпрессия производится в масштабе 1:1, при этом видеоизображение обычно занимает лишь часть экрана. Примитивное масштабирование достигается дублированием пиксела - один пиксел видео копируется в несколько (например 4) смежных пикселов графического экрана. Однако при этом качество изображения заметно падает - крупные «кирпичики», из которых строится изображение, с небольшого расстояния выглядят плохо. Более тонкий механизм масштабирования выполняет интерполяцию цветов пикселов, при этом качество изображения заметно улучшается. Однако такое масштабирование уже требует значительных затрат вычислительных ресурсов, и если их недостаточно, то вывод видеоизображения в окно большого размера будет сопровождаться потерями кадров и, возможно, перебоями звукового сопровождения. Так что говоря о качестве вывода видео, следует всегда оговаривать масштаб или размер видеоэкрана.

Кодеки, применяемые для сжатия изображений

1) JPEG (Joint Photographic Expert Group) - метод сжатия неподвижных изображений, основанный на одновременной обработке информации матрицы пикселов (например, 8х8) в пространстве Y-U-V с приоритетом сохранения яркостной информации. Метод почти универсален: он позволяет обеспечивать и максимальную степень сжатия, правда при этом информация восстанавливается с некоторыми потерями, и обеспечивать сжатие без потерь, но, конечно, в меньшей степени. Кроме того, возможен послойный прием изображения, когда сначала приходит грубое описание всей картинки, затем следуют постепенные уточнения (утончения) деталей. Такая передача представляет ценность при использовании каналов связи с ограниченной производительностью, например в сети Интернет: быстро получив общий вид, можно отказаться от приема полного описания изображения, если оно не заинтересовало получателя. Конечно, все достоинства JPEG не могут использоваться одновременно - чем-то приходится жертвовать. Степень сжатия зависит от характера изображения - лучше всего сжимается цветное изображение, несколько хуже - полутоновое серое. Черно-белое изображение для JPEG должно представляться в полутоновом формате, что, конечно, снижает эффективность его сжатия. В соответствии с алгоритмом сжатия JPEG, исходный сигнал преобразуется в последовательность неподвижных изображений, которые затем можно отредактировать избыточная информация из каждого кадра удаляется. Средняя степень сжатия - 30:1.

2) M-JPEG (Motion JPEG) - метод сжатия движущихся изображений. Суть этого метода заключается в том, что каждый кадр обрабатывается как отдельное статическое изображение, то есть выполняется только внутри-кадровое сжатие. M-JPEG не получил широкого распространения из-за больших затрат времени на компрессию и декомпрессию.

3) DVI (Digital Video Interactive) - система аппаратного сжатия движущихся видеоизображений с коэффициентом сжатия до 160:1 и записи звукового сопровождения по методу ADPCM.

4) Indeo (INtel viDEO) - одноступенчатый кодек на базе набора микросхем i82750, развитие системы DVI. Позволяет воспроизводить видеозаписи и с программным декодированием (необходим PC не ниже 486SX-25, SVGA 256 цветов и звуковая карта с ADPCM для звукового сопровождения).

5) Cinepak - программный кодек для воспроизведения «живого» видео в окне 320х240 пикселов.

6) Кодеки MPEG. Кодеки, предназначенные для работы (по крайней мере, декомпрессии) в реальном масштабе времени, выпускаются MPEG (Motion Picture Expert Group - группа экспертов в области движущихся изображений). Поскольку видео без звука «живым» представить трудно, MPEG занимается и аудио-кодеками. Кодеки MPEG работают в пространстве Y-U-V, причем яркостная информация обрабатывается с большим разрешением, чем цветовая. В сжатом потоке данных присутствуют кадры нескольких типов:

I (intrа)-фреймы - ключевые кадры, кодированные без ссылок на другие (то есть содержащие полное описание статического изображения).
Р (predicted) - фреймы содержат описание различий текущего кадра с предыдущим.
В (bi-directional) - фреймы являются двунаправленными: они ссылаются и на кадр вперед, и на кадр назад.

Наличие двунаправленных кадров подразумевает, что декодер должен иметь буфер, по крайней мере, на три принятых кадра, а изображение будет выводиться с некоторым отставанием от входного потока. Для того чтобы кодек мог быстро включиться в работу с любого места потока, I-фреймы должны включаться в поток регулярно (в MPEG-1 - не реже, чем через 0,4 с). Степень сжатия примерно 30:1, но при использовании отбора опорных кадров степень сжатия возрастает до 200:1 при достаточно высоком качестве изображения. При использовании межкадрового сжатия записываются только отличия между двумя соседними последовательными кадрами. Но этот алгоритм не позволяет моделировать или редактировать отдельные элементы (фазы) движения.

MPEG-1 (стандарт ISO/IEC 11172).

MPEG-1 - стандарт ISO/IEC 11172, принятый еще в 1992 году. Полное название - «Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to about 1,5 MBit/s» - раскрывает его суть: кодек предназначен для записи и воспроизведения движущихся изображений и связанного с ними аудиосопровождения на цифровом носителе с потоком данных до 1,5 Мбит/с. При этом обеспечивается качество изображения на уровне кассетного видеомагнитофона VHS (Video Home System) со стереофоническим звуковым сопровождением. Исходное изображение - 352х240 пикселов, 30 кадров в секунду. В стандарт входит и программная реализация кодера и декодера на языке С. Скорость потока данных позволяет использовать в качестве носителя видеоинформации обыкновенный CD-ROM , и MPEG-1 используется в дисках CD-i. Однако декомпрессия требует большой мощности процессора, из-за чего диски CD-i без специальной платы может воспроизводить лишь очень мощный компьютер. Из-за ограничений производительности воспроизводящих систем, для того чтобы кадры не пропадали, а звук не прерывался, изображение на дисках CD-i записывается с очень низким разрешением.

MPEG-2 ( стандарт ISO/IEC 13818).

MPEG-2 (ISO/IEC 13818) - кодек для высококачественной передачи изображений (720х480 пикселов), аудиоинформации и данных при потоке 2-80 Мбит/с. Стандарт предусматривает одновременную передачу множества TV-каналов с возможностью шифрования для ограничения доступа к информации. Аудиокодек многоканальный - имеет 2 стереоканала (фронт и тыл), обеспечивающих объемное звучание (Surround), и один низкочастотный с полосой до 100 Гц. MPEG-2 обеспечивает несколько уровней качества. Основной уровень обеспечивает качество на уровне телеприемника, высокие уровни используются в профессиональной видеозаписи.

Уровни качества MPEG-2

Уровень	Размер изображения	Максимальный поток данных при частоте 30 кадров/с, Мбит/с
Low (низкий)	352х240	4
Main (основной)	720х480	15
High (высокий 1440)	1440х1152	60
High (высокий 1920)	1920х1080	80

MPEG-3.

То, что должно было стать MPEG-3, вылилось в высший уровень MPEG-2. Этот уровень обеспечивает качество телевидения высокой четкости ТВЧ (HDTV - High Definition TV).

MPEG-4.

MPEG-4 - стандарт, ориентированный на интерактивное использование мультимедиа и сетевых коммуникаций. За счет применения мощных аппаратных средств сжатия снижается скорость передачи данных с тем, чтобы видеоизображение можно было передавать по каналу с пропускной способностью 4800 - 64000 бит/с. Правда, при этом разрешение будет на уровне 176х144 пиксела при частоте до 10 кадров/с.

Стандарт MPEG-4 задает принципы работы с цифровым представлением медиаданных для трех областей: собственно интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через Сеть), графических приложений (синтетического контента) и цифрового телевидения — DTV. Фактически формат задает правила организации среды, причем среды объектно-ориентированной. Он имеет дело не просто с потоками и массивами медиаданных, а с медиаобъектами.

При одном и том же битрейте и определённых условиях кодирования, качество изображения фильма в MPEG-4 может быть сравнимо или даже лучше, чем в случае применения MPEG-1 или MPEG-2. Алгоритм компрессии видео в MPEG-4 работает по той же схеме, что и в предыдущих форматах. При кодировании исходного изображения кодек сохраняет ключевые кадры, а вместо сохранения промежуточных — прогнозирует и сохраняет лишь информацию об изменениях в текущем кадре по отношению к предыдущему. Полученная таким образом информация помещается в файл. Компрессия звука чаще всего производится в формат MP3, Ogg Vorbis, WMA. Однако возможно использование любого кодека, вплоть до применяемого в DVD шестиканального AC-3.

Звуковая дорожка в MPEG-4 может быть моно, стерео и даже многоканальной AC3, аналогично используемый в DVD. Поддерживаются форматы звука: MP3, Ogg Vorbis, WMA, ACC, VGF, AC3 и другие.

MPEG-плейер.

MPEG-плейер - аппаратный декодер MPEG, обеспечивающий воспроизведение с компакт-дисков форматов MPEG, CD-I, VideoCD, - является уже широко распространенным дополнением графического адаптера. В отличие от программных MPEG-декомпрессоров, он обеспечивает высокое качество воспроизведения с невысокой загрузкой процессора. В состав MPEG-плейера может входить и аудиодекодер, при этом на графической плате появляется немного неожиданный дополнительный разъем аудиовыхода. Видеосигнал в сжатом формате может быть сохранен на вполне рядовом носителе информации (винчестер, CD) и воспроизведен с него на мониторе компьютера. С этой цифровой записью могут выполняться любые операции нелинейного монтажа (монтажа с произвольным доступом к кадрам). Возможности такого монтажа определяются программным обеспечением и, по сути, безграничны (конечно, они определяются и производительностью компьютера, - если монтаж одной минуты потребует, скажем, недели, то мало кто им будет пользоваться). Для обмена видеоданными с другими устройствами cжатый поток может быть передан, например, по шине FireWire или через средства телекоммуникаций . Если компьютер оборудован телекамерой со средствами компрессии и передачи изображений по телекоммуникационным каналам, то появляется возможность организации видеотелефона и даже видеоконференций.

6. ПОДКЛЮЧЕНИЕ НЕСКОЛЬКИХ МОНИТОРОВ.

Операционная система Windows позволяет иметь в составе персонального компьютера до 9 мониторов, подключенных каждый к своему адаптеру. С помощью вкладки управления дисплеем можно отдельно настроить каждый дисплей. Операционная система Windows создает в видеопамяти виртуальный рабочий стол, причем этот стол по размерам может быть много больше изображения, которое можно отобразить на одном дисплее. Первичный дисплей отображает всегда левый верхний угол так называемого виртуального рабочего стола, а дополнительные дисплеи могут видеть любую область виртуального рабочего стола. Одновременное отображение различных областей и окон виртуального рабочего стола, для некоторого класса программ является единственной возможностью эффективной работы.

Статьи по:

РАБОТА КОМПЬЮТЕРА С ВИДЕОИЗОБРАЖЕНИЯМИ. СТАНДАРТЫ И ПРИНЦИПЫ ПОСТРОЕНИЯ ВИДЕОИЗОБРАЖЕНИЙ.