способ идентификации кадров-вставок в потоке мультимедийных данных

Классы МПК:G06T7/00 Анализ изображения, например из побитового к непобитовому изображению
Автор(ы):, ,
Патентообладатель(и):Государственное казенное образовательное учреждение высшего профессионального образования Академия Федеральной службы охраны Российской Федерации (Академия ФСО России) (RU)
Приоритеты:
подача заявки:
2012-03-12
публикация патента:

Изобретение относится к средствам обработки данных изображений. Техническим результатом является уменьшение количества ошибочных распознаваний кадров-вставок в потоке мультимедийных данных. В способе вычисляют суммарную дифференциальную яркость каждого кадра-разности и пороговое значение яркости трех предыдущих кадров-разностей, сравнивают яркостные характеристики кадра-разности с вычисляемым по ходу смены кадров видеопотока пороговым значением суммарной дифференциальной яркости, идентифицируют первую границу кадра-вставки и идентифицируют кадр-вставку указанного потока. 5 ил. способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640

способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640

Формула изобретения

Способ идентификации кадров-вставок в потоке мультимедийных данных, заключающийся в определении признаков яркости и сравнении их значений с пороговым, отличающийся тем, что дополнительно вычисляют суммарную дифференциальную яркость каждого кадра-разности и пороговое значение яркости трех предыдущих кадров-разностей, сравнивают яркостные характеристики кадра-разности с вычисляемым по ходу смены кадров видеопотока пороговым значением суммарной дифференциальной яркости, при этом, если суммарная дифференциальная яркостьспособ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , идентифицируют первую границу кадра-вставки, а если суммарная дифференциальная яркость способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , идентифицируют кадр-вставку указанного потока, где способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 являются кадрами указанного потока, а способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 является пороговым значением яркости сюжета.

Описание изобретения к патенту

Изобретение относится к области вычислительной техники, а именно к системам анализа изображений, и предназначено для использования в сфере обработки данных изображений.

Способ идентификации кадров-вставок в потоке мультимедийных данных необходим для предотвращения негативного воздействия на уровень бессознательного восприятия человека с помощью подпороговых стимулов. Указанное воздействие зачастую применяется скрытно в виде дополнительных кадров, вставленных в поток мультимедийных данных.

Под кадрами-вставками понимаются кадры количеством от 1 до 3, добавленные в любое место видеопотока и отличающиеся от кадров текущей сюжетной линии (сцены) визуально и статистически.

Концепция идентификации и сравнения кадров в потоке мультимедийных данных включает в себя ряд методов. Большинство из них в качестве статистического признака для выявления скрытых кадров-вставок в видеопотоке используют величину интегральной яркости кадров, сравнивая ее с некоторым эталонным значением.

Известны устройство для обработки изображений и способ определения линейного сдвига изображения (патент RU 2138851 С1, опубл. 05.08.1993 г. Авторы: Кристоф Айзенбарт (DE), Ира Финкельштайн (US), Дэннис Мак Ги (US), Эдвард Панофский (US)), которые позволяют обнаруживать несовпадение фактического изображения относительно опорного и обеспечивать их максимальное совпадение. Этот технический результат достигается благодаря тому, что воспринимают два участка фактического изображения, запоминают два аналогичных участка опорного изображения, сравнивают соответствующие участки фактического и опорного изображений и определяют наличие сдвига, причем повторяют сравнение для тех же участков после сдвига фактического изображения на заранее заданное число пикселей по осям Х и Y, при этом вычисляют абсолютные значения разностей между соответствующими участками фактического и опорного изображений для каждого сдвига и сохраняют в памяти как полученные абсолютные значения, так и их сумму.

Недостатком данного аналога является то, что при идентификации видеовставки в процессе сравнения невозможно выделить опорное изображение, участки кадра для сравнения и пороговое значение линейного сдвига, так как оно будет динамически изменяться в результате смены сюжетов в видеопотоке.

Наиболее близкими по технической сущности и выполняемым функциям к заявляемому изобретению (прототипом) являются способ идентификации подлинных серий изображений и устройство для его осуществления (патент RU 2216044 С2, опубл. 10.11.2003. Автор Шульце Клаус (DE)), которые позволяют получить технический результат в виде повышения эффективности процедур учета и хронометрирования рекламных сообщений, видеоклипов, политических выступлений.

Этот результат достигается за счет того, что для отдельных изображений из серий изображений определяют признаки яркости, преобразуют их в цифровую форму и сравнивают с эталоном, при этом признаки яркости декоррелируют квазистохастическим отбором по множеству изображений.

Недостатком прототипа является низкая эффективность определения кадров-вставок в видеопотоке, обусловленная тем, что по одному изображению, определяющему эталонные признаки яркости, невозможно получить полную статистическую информацию, характеризующую яркостные свойства каждой из наблюдаемых динамически меняющихся сцен видеопотока в силу их значительных отличий по цвету и яркости.

Задачей изобретения является создание способа идентификации кадров-вставок в потоке мультимедийных данных, позволяющего уменьшить количество ошибочных распознаваний как кадров-вставок, так и кадров отдельных сюжетных линий (сцен).

Эта задача решается тем, что способ идентификации кадров-вставок в потоке мультимедийных данных, включающий в себя операции определения яркости кадров, цифрового сравнения по яркостным составляющим двух кадров, согласно изобретению дополнены операции попиксельного сравнения двух изображений по определению кадра-разности и вычисления суммарной дифференциальной яркости каждого кадра-разности и порогового значения яркости трех предыдущих кадров-разностей, а также операции сравнения яркостных характеристик кадра-разности с вычисляемым по ходу смены кадров видеопотока пороговьм значением суммарной дифференциальной яркости предыдущих трех кадров-разностей.

Результат предлагаемого способа достигается за счет формирования и выполнения математического критерия R:

способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 ;

способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640

при ограничениях:

- количество кадров в визуальной вставке не превышает трех;

- первые четыре кадра сюжетной линии не являются вставкой;

- вставка не располагается на границе двух сюжетных линий, где

- способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 - множество кадров в видеопотоке, l=1(1)N; N - количество кадров; р=1(1)Р - количество сюжетов;

- способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 - множество кадров-разностей, l=1(1)N-1;

- способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 ={способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 1,способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 2} - множество классов кадров видеопотока, способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 1 - кадр-вставка; способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 2 - обычный кадр сюжетной линии.

Перечисленная новая совокупность операций обеспечивает возможность снижения количества ошибочно идентифицированных кадров-вставок и кадров отдельных сюжетных линий при различной скорости смены сцен в видеопотоке.

Проведенный анализ уровня техники позволил установить, что аналоги, характеризующиеся совокупностью признаков, тождественных всем признакам заявленного технического решения, отсутствуют, что указывает на соответствие заявленного способа условию патентоспособности "новизна".

Результаты поиска известных решений в данной и смежных областях техники с целью выявления признаков, совпадающих с отличительными от прототипа признаками заявленного объекта, показали, что они не следуют явным образом из уровня техники. Из уровня техники также не выявлена известность отличительных существенных признаков, обусловливающих тот же технический результат, который достигнут в заявляемом способе. Следовательно, заявленное изобретение соответствует условию патентоспособности "изобретательский уровень".

Заявленный способ поясняется чертежами, на которых показано:

фиг.1 - общая схема операций, реализующих в совокупности способ идентификации кадров-вставок;

фиг.2 - результат действия логической операции по формированию кадров-разностей;

фиг.3 - алгоритм вычисления порогового значения яркости Lp;

фиг.4 - алгоритм идентификации кадров видеопотока методом сравнения яркостных характеристик кадров-разностей с их пороговым значением Lp;

фиг.5 - принцип работы методики экстремальной суммарной дифференциальной яркости.

Общая схема последовательности операций заявленного способа, представленная на фиг.1, работает следующим образом.

На блок присвоения номеров кадрам видеопотока и сюжетам 2 подается упорядоченная последовательность видеокадров с блока преобразования видеопотока в кадры RGB 1. (Видеокадры из фильма Роберта Родригеса "От заката до рассвета" (From Durk Till Dawn).)

Цифровой кадр в видеопотоке представляет функцию распределения яркости или цвета на двумерной плоскости: f(i,j), где i и j - декартовы координаты, описывающие плоскость кадра. С математической точки зрения кадр представляет собой двумерную матрицу Im[i,j] размера (DimH×DimW), где i=1(1)H - целое число, описывающее номер элемента в строке, а j=1(1)W - номер строки матрицы, в которой расположен элемент. Элемент кадра (пиксель) имеет целочисленное значение, пропорциональное значению функции распределения яркости f(i,j) в данной точке плоскости. Обозначается пиксель кадра р-го сюжета с координатами (i,j) и цветовыми составляющими Red, Green, Blue в виде способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , где W - ширина кадра в пикселях, а H - его высота. Значения Н и W экспортируются в блок инициализации 3.

В блоке логической побитовой разности последовательно идущих кадров видеопотока 4 производится операция, которая в пикселях текущего кадра способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 оставляет единичными только те биты, которые отсутствуют в соответствующих пикселях последующего способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , в соответствии со значениями Н и W, поступающими с выхода блока инициализации, по правилу F,:

способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , l=1(1)N-1, p=1(1)P,

F - правило построения кадров разностей:

способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , i=1(1)H, j=1(1)W, p=1(1)P.

Результат действия данной операции показан на фиг.2. (Визильтер Ю.В., Желтов С.Ю., Князь В.А. и др. Обработка и анализ цифровых изображений с примерами на Lab VIEW IMAQ Vision. - M.: ДМК Пресс, 2007. - 464 с.).

В блоке 4, определяются кадры разности для способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 кадров видеопотока способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , поступающие в блок вычисления суммарной дифференциальной яркости каждого кадра разности - 5. В блоке 5 осуществляется вычисление суммарных яркостей способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 кадров разностей по выражению

способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 .

Исследование кадров видеопотока показало, что по одному статическому изображению проблематично получить всю необходимую информацию, характеризующую яркостные свойства наблюдаемых динамически меняющихся сцен, так как у всех они разные. Следовательно, возникает необходимость в определении среднего значения яркости, свойственного каждой сюжетной линии.

В блоке 6 осуществляется вычисление порогового значения яркости Lp p-го сюжета трех предыдущих кадров разностей по выражению

способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 ,

где способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 - абсолютная погрешность дифференциальной яркости, определяемая эмпирически, поступающая из блока инициализации 3.

Схема операции вычисления порогового значения яркости Lp р-го сюжета представлена на фиг.3

После определения порогового значения яркости в блоке 7 происходит сравнение суммарных дифференциальных яркостей последующих кадров-разностей с пороговым значением по следующему правилу:

1. В блоке 4 определяется кадр-разность для способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 кадров видеопотока способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , а в блоке 5 вычисляется его суммарная дифференциальная яркость способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 .

При неравенстве способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 идентифицируется первая граница:

- кадра-вставки;

- подлежащих выделению кадров видеопотока;

- нового p+1 сюжета.

При выполнении условия способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 исследуется следующий кадр данного сюжета l=l+1 и в блоке 6 вычисляется новое пороговое значения яркости Lp как среднее арифметическое значение суммарных дифференциальных яркостей трех кадров-разностей: способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640

способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 .

2. В блоках 4 и 5 определяются кадр-разность для способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 кадров видеопотока способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и его суммарная дифференциальная яркость способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 .

При неравенстве способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 идентифицируется способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , кадр-вставка, поступающий в блок выделения кадров видеопотока 8, а при суммарной яркости способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , в блоках 4 и 5 определяются кадр-разность для способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 кадров видеопотока способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и его суммарная дифференциальная яркость способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 .

3. При выполнении условия способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 выделяются способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 кадры видеопотока, поступающие в блок 8, а при способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 в блоках 4 и 5 определяются кадр-разность для способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 кадров видеопотока способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и суммарная дифференциальная яркость способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 .

4. При условии способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 вьщеляются способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 кадры видеопотока, поступающие в блок 8, иначе в блоке 2 осуществляется переход на р+1 сюжет и в блоке 6 пересчитывается пороговое значение яркости относительно способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 , способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 и способ идентификации кадров-вставок в потоке мультимедийных данных, патент № 2506640 кадров видеопотока.

Выделенные кадры из видеопотока хранятся в блоке 9. (Выделенные видеокадры из фильма Роберта Родригеса "От заката до рассвета" (From Durk Till Dawn)).

Алгоритм, поясняющий критерий идентификации видеокадров в мультимедийном потоке информации, отражен на фиг.4.

Принцип работы методики экстремальной суммарной дифференциальной яркости представлен на фиг.5.

Экспериментальная проверка способа идентификации кадров-вставок была выполнена на ЭВМ в пакете прикладной математики Matlab 2008b при следующих исходных данных:

1) 100 видеороликов без кадров-вставок длительностью от 1 до 5 минут с различным количеством сюжетных линий;

2) 100 видеороликов с размещенными через каждые 100 кадров кадрами-вставками (количество подряд идущих кадров-вставок от 1 до 3);

3) кадры видеороликов и кадры-вставки не искажены и имеют высокое качество.

Результаты экспериментов показали, что в условиях отсутствия априорных сведений о наличии в анализируемом видеопотоке кадров-вставок известный способ (прототип) правильно идентифицировал 10% кадров-вставок при ошибочном распознавании сюжетных линий в 67%, а с помощью заявленного способа удалось правильно идентифицировать 89% кадров-вставок при ошибочном распознавании сюжетных линий в 12%. Это подтверждает существенный положительный эффект от внедрения нового способа.

Полученные результаты дают основания для вывода, что заявленный способ идентификации кадров-вставок в потоке мультимедийных данных имеет лучшие характеристики по точности распознавания кадров-вставок по сравнению с прототипом.

Таким образом, при такой совокупности существенных признаков в процессе идентификации кадров-вставок в видеопотоке обеспечивается уменьшение количества ошибочно идентифицированных кадров-вставок и кадров отдельных сюжетных линий в видеопотоке.

Промышленная применимость изобретения обусловлена тем, что устройство, реализующее предложенный способ, может быть осуществлено с помощью современной элементной базы, с достижением указанного в изобретении назначения.

Класс G06T7/00 Анализ изображения, например из побитового к непобитовому изображению

cпособ автоматического распознавания объектов на изображении -  патент 2528140 (10.09.2014)
способ автоматического ретуширования цифровых фотографий -  патент 2528082 (10.09.2014)
устройство для определения изменения размера объекта -  патент 2525106 (10.08.2014)
улучшение совместной визуализации устройства и анатомии -  патент 2524568 (27.07.2014)
способ выделения протяженных линейных объектов на аэрокосмических изображениях -  патент 2523944 (27.07.2014)
система и способ интерактивной live-mesh-сегментации -  патент 2523915 (27.07.2014)
способ наблюдения за взлетно-посадочной полосой и система для реализации способа -  патент 2523167 (20.07.2014)
способ обработки сигналов для обнаружения прямолинейных границ объектов, наблюдаемых на изображении -  патент 2522924 (20.07.2014)
способ распознавания и классификации формы объектов в лабиринтных доменных структурах -  патент 2522869 (20.07.2014)
устройство выделения контуров объектов на текстурированном фоне при обработке цифровых изображений -  патент 2522044 (10.07.2014)
Наверх