WWW.DISUS.RU

БЕСПЛАТНАЯ НАУЧНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

 

Разработка и исследование моделей поведения динамических объектов на основе интеллектуального анализа видеопотоков данных

На правах рукописи

УДК 004.89

Целых Юлия Александровна

РАЗРАБОТКА И ИССЛЕДОВАНИЕ МОДЕЛЕЙ ПОВЕДЕНИЯ ДИНАМИЧЕСКИХ ОБЪЕКТОВ НА ОСНОВЕ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ВИДЕОПОТОКОВ ДАННЫХ

Специальность: 05.13.18 – Математическое моделирование, численные методы и комплексы программ

05.13.17 – Теоретические основы информатики

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук

Таганрог – 2010

Работа выполнена на кафедре прикладной информатики Технологического института Южного федерального университета в г. Таганроге

Научный руководитель: доктор технических наук, доцент

Сергеев Николай Евгеньевич

(ТТИ ЮФУ, г. Таганрог)

Официальные оппоненты: доктор технических наук, профессор

Ромм Яков Евсеевич

(Таганрогский государственный

педагогический институт, г. Таганрог)

доктор технических наук, профессор

Гуда Александр Николаевич

(Ростовский государственный университет

путей сообщения, г. Ростов-на-Дону)

Ведущая организация: Федеральное государственное унитарное

предприятие научно-исследовательский

институт «Спецвузавтоматика»,

г. Ростов-на-Дону

Защита диссертации состоится « 31 » августа 2010 г. в 14.20 на за­седании диссертационного совета Д 212.208.22 при Южном федеральном университете по адресу: 347928, ГСП-17 А, Ростовская область, г. Таганрог, пер. Некрасовский, 44, ауд. Д-406.

С диссертацией можно ознакомиться в Зональной научной библиотеке Южного федерального университета по адресу: 344000, Ростов-на-Дону, ул. Пушкинская, 148.

Автореферат разослан « 8 » июля 2010 г.

Учёный секретарь

диссертационного совета

д.т.н., профессор Лебедев Б.К.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования обусловлена стремительным ростом объемов видеоинформации, которая нуждается в оперативном анализе. По прогнозам специалистов, мировой рынок средств видеоаналитики в 2010 году составит 600 млн. долларов.

Особую актуальность данная тема приобре­тает в связи с участившимися случаями террористических актов. Так, Правительство РФ приняло решение о разработке проекта централизованной системы видео­наблюдения в реальном времени для Московского метро­политена с возможностью автоматического анализа видеоизображений.

Современные средства видеоаналитики должны совмещать в себе высо­кую эффективность оперативного видеоконтроля, комплексный анализ сцены и рас­ширенные возможности автоматической индексации потока видео­изображений.

Решать подобные задачи возможно с помощью классической теории рас­познавания образов. Однако современные достижения этой теории не всегда применимы в силу больших затрат вычислительных ресурсов и вре­мени. Поэтому предлагается использовать основные положения теории искусственного интеллекта с выделением характеризующих признаков и по­лучением их значений, достаточных для описания сцен по видео- и фотоизображениям. Это значительно упрощает анализ действий объекта на кадрах видеоизображения. Примером такого подхода является представление объекта в виде фантома и выделение основных точек на теле человека. Пред­лагаемая модель может служить как воспринимающим аппаратом, так и инструментом моделирования действий человека и дальнейшего анализа.

Основная проблема при создании архива появлений объекта, например, лица человека, в поле зрения видеокамеры состоит, во-первых, в сильной из­быточности информации, а во-вторых, в необходимости определения объ­екта на каждом кадре. Идеально это может делать человек, однако он имеет огра­ниченные возможности и не в состоянии следить за большим количеством объектов одновременно. А зачастую присутствие человека не­возможно. Поэтому требуется помощь компьютера и возникает необходи­мость в ис­пользовании ин­теллектуальных систем видеонаблюдения.

Характерными особенностями видеоданных являются гигантский объем и высокая размерность, подверженность ошибкам и пропускам, неполнота и неточность. Эти сложности в полной мере учитывают современные методы и алгоритмы интеллектуального анализа данных – междисциплинарного на­правления исследований по выявлению в больших объемах сырых данных практически полезных и доступных интерпретации знаний, необходимых для принятия качественных решений.

Системы, основанные на знаниях, используются при решении следую­щих задач обработки видеоизображений:

  • выделение отдельных смысловых важных фрагментов сцен;
  • интерпретация символов и сигналов;
  • анализ переднего и заднего плана видеокадра;
  • принятие решений в условиях неопределенности.

О важности использования методов интеллектуальной обработки видео­изображений также свидетельствует распространение систем мониторинга «Безопасный город» и разработка и опубликование проекта Федерального закона Российской Федерации «О технических средствах обеспечения противо­криминальной защиты объектов и имущества». Закон определяет ос­новные положения технического регулирования в области криминальной безопасности и устанавливает общие требования к техническим средствам обеспечения противо­криминальной защиты объектов и имущества.

В соответствии с основными положениями закона, под системой охраны и мониторинга понимается совокупность технических средств, связанных между собой каналами передачи данных, использующих систему для опреде­ления параметров пространственно-временного положения подвижных объ­ектов и предназначенных для противодействия преступным посягательствам.



Целью диссертационной работы является разработка и исследование моделей поведения динамических объектов при обработке видео­изоб­ражений для решения задач анализа данных и распознавания сцен.

Поставленная цель определяет следующие основные задачи диссерта­ционного исследования:

  1. Исследовать и разработать нечеткие модели представления пространственно-временных знаний и данных для задач обработки видеоизображений.
  2. Разработать алгоритм распознавания сцен для моделей поведения динамических объектов.
  3. Разработать систему распознавания сцен и анализа действий объектов на видеокадре.
  4. Реализовать практическое решение задачи интеллектуального анализа данных и распознавания сцен в виде программного комплекса.

Методы исследования основаны на использовании теории нечетких множеств и нечеткой логики, теории графов и гиперграфов, моделей искус­ственного интеллекта, методов интеллектуального анализа данных.

Достоверность полученных в диссертации результатов подтвержда­ется корректными математическими доказательствами и аналитическими оценками, результатами программного и численного эксперимента на ЭВМ, практическим использованием разработанных в диссертации моделей, методов и алгоритмов.

Основные положения диссертации, выносимые на защиту:

1. Разработка и исследование нечетких моделей представления про­странственно-времен­ных данных для задач обработки видеоизображений.

2. Алгоритм распознавания сцен при обработке видеоизображений.

3. Информационная система автоматического распознавания сцен и анализа действий объектов на видеокадре.

4. Модель обобщенного гиперграфа для описания сцен.

5. Результаты экспериментов с использованием методов интеллекту­аль­ного анализа данных и разработанного программного комплекса.

Научная новизна диссертационной работы:

1. Разработаны и исследованы математические модели для описания положения объектов на видеокадре, отличающиеся от известных использова­нием нечетких пространственно-временных атрибутов и лингвистических переменных, что позволяет на основе моделирования нечетких рассуждений вырабатывать компетентные решения в условиях неопределенности и слож­ной пространственно-временной обстановки.

2. Разработаны вычислительные методы и алгоритмы анализа видеокадров, отличающиеся возможностью реализации нечетких процедур поиска и слежения за компонентами объекта, что позволяет оперативно и адекватно формировать сценарии и описания ситуаций в системах анализа видеоизображений.

3. Разработана графово-гиперграфовая модель описания сцен и ситуа­ций, отличающаяся использованием понятия обобщенного гиперграфа, что позволяет с высокой степенью достоверности имитировать процедуры получения экспертных решений.

4. Разработан программный комплекс «Система мониторинга динами­ческих объектов», предназначенный для анализа видеокадров и распознава­ния сцен, позволяющий определить требования к основным параметрам и характеристикам таких систем и предложить принципы создания интеллектуальных систем обработки видеоизображений, отличающиеся воз­можностью принятия решений в условиях неполноты и противоречивости исходной информации.

Практическая значимость.

1. Разработанные модели и методы обработки видеоизображений могут быть ис­пользо­ваны для создания систем мониторинга сложных объектов с возмож­ностью анализа видеоизображений.





2. Предложенные принципы создания адаптивной интеллектуальной системы могут быть применены для создания систем принятия решений в сложной пространственно-временной обстановке.

3. Разработанная система распознавания сцен и анализа действий объекта на кадрах видеоизображения, реализованная в виде программного комплекса, может служить инструментом для мо­делирования действий человека в информационных системах искусственного интеллекта.

Реализация результатов работы.

Диссертация выполнена в соот­ветствии с основным направлением научно-исследовательской работы Тех­нологического института Южного Фе­дерального университета в г. Таганроге «Формальные системы, искусствен­ный интеллект и системы принятия решений».

Основные результаты диссертационной работы использованы при выполнении научно-исследовательских работ, в том числе:

– при выполнении НИР № 15551 «Разработка теории, моделей и методов принятия решений в интегрированных интеллектуальных системах на основе нечетких знаний и смешанного представления атрибутов», при выполнении НИР № 15552 «Разработка теории, моделей и методов, основанных на ис­пользовании нечетких ситуационных систем и нечетких классификационных моделей для целей принятия решений в сложной пространственно-временной обстановке», выполняемых на кафедре приклад­ной информатики Таганрог­ского технологического института Южного феде­рального университета в 2006-2010 г.г.;

– при выполнении хоздоговорных НИР, выполняе­мых Ростовским областным центром новых информационных технологий (РОЦ НИТ) при Южном федеральном университете в 2007-2010 г.г.;

– в учебном процессе кафедры прикладной информатики ТТИ ЮФУ при чтении лекций, проведении практических и лабораторных занятий, а также при выполнении студентами курсовых и дипломных работ.

Использование результатов диссертационной работы под­тверждается соответствующими актами.

Апробация работы.

Основные результаты диссертационной работы доклады­вались и обсуждались на международных научно-технических конферен­циях и моло­дежных научных конференциях: «Интеллектуальные системы 2009. Интел­лек­туальные САПР 2009». (Дивноморск, 2007-2009 г.г.); VIII, IX, X Всерос­сийских научных конференциях студентов и аспирантов “Техническая кибер­нетика, радиоэлектроника и системы управления” (Таганрог, 2007, 2008, 2009 г.г.); III Межгосударственной научно-практической конференции “Эконо­мико-организа­ционные проблемы проектирования и применения информа­ционных систем” (Ростов-на-Дону, 2008 г.), XII Всероссийской научной конференции мо­лодых ученых и аспирантов “Новые информационные технологии. Разработка и аспекты применения” (Таганрог, 2009 г.); на ежегодных научно-технических конферен­циях профессорско-преподаватель­ского состава, аспирантов и сотрудников ТТИ ЮФУ.

Публикации. Результаты диссертации отражены в 10-ти печатных работах, в том числе в 5-ти работах, опубликованных в изданиях, рекомендованных ВАК.

Структура и объем работы. Диссертационная работа состоит из введения, трех глав, заключения, списка использованной литературы (96 наименований) и 3-х приложений. Диссертация содержит 203 страницы машинописного текста, включая 69 рисунков, 15 таблиц, 37 страниц приложений.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертационной работы, сфор­мулированы цель и задачи исследования, охарактеризованы научная новизна работы, ее практическая ценность, реализация и апробация результатов работы, дано краткое содержание структуры диссертации.

В первой главе дана формальная постановка задач и определены общие принципы формирования моделей предметной области. Представлены нечет­кие пространственно-временные атрибуты для описания положения объектов на видеокадре. Дается интерпретация понятия нечеткого множества исходя из про­цессов, лежащих в основе формирования значений описываемых атри­бутов. Введены специальные типы лингвистических переменных (ЛП), каж­дая из которых содержит в своей структуре элементы логического вывода, что позволяет проек­тировать эффективное представление предметной об­ласти для динамических сис­тем:

Составная ЛП определена на пред­метных шкалах и непересекающихся подмножествах термов.

Сдвоенная ЛП использовалась при описании атрибутов, плохо определенных на одной шкале при наличии информации от нескольких сенсоров.

Сложная ЛП определена на множестве термов, где каждый терм представляет самостоятельную переменную, которая и в даль­нейшем может использоваться самостоятельно или в качестве элемента терм-множества другой переменной. Сложные ЛП имеют трехмерные функции принадлежности, полу­чаемые путем вращения симметричных функций принадлежности. При переходе к треугольным/трапециевидным функциям поверхности, функции принадлежности приобретают формы конусов, усеченных конусов и четвертьконусов.

Пространственное положение объекта определяется как значение лингвистической переменной по изображениям, последовательно получен­ным через равные промежутки времени. От трехмерных функций принад­лежности мы переходим к проекциям сечений, параллельных основанию (рисунок 1). Эллиптическая форма проек­ций объясняется разными размерами изображения по вертикали и горизон­тали.

 Схематическое изображение положения объекта на предметной плоскости -6

Рис.1. Схематическое изображение положения объекта на предметной плоскости

Предложен порядок учета временных факторов восприятия внешней обстановки и предсказания движений оператора. Введены темпоральные отноше­ния и описана взаимосвязь объектов темпоральных отношений.

Предложен способ представления знаний в моделях поведения оператора с помощью продукций и фреймов. Перечислены требования, которым должен удовлетворять набор процедур фреймовой сети.

Во второй главе рассматриваются особенности применения методов интел­лектуального анализа данных для обработки видеоизображений. Разработаны концепция и методика создания интеллектуальной системы автоматического опи­сания сцен по видеоизображениям.

На основе нечетких пространственно-временных атрибутов разработан алгоритм анализа видеоизображений, который реализован программно на языке C++ и в совокупности с комплексом аппаратных средств составляет систему мо­ниторинга динамического объекта (СМДО).

Для анализа функционирования разработанной системы мониторинга динами­ческих объектов был проведен эксперимент с использованием техни­ческих и программных средств обработки видеоизображений.

В ходе проведенного эксперимента задача идентификации положения объекта на видеокадре была представлена как задача классификации. Системе было предложено провести классификацию одной тысячи видео­кадров с различными положениями рук. В качестве исходных данных были использованы значения углов, полученные от сенсоров. Предварительная об­работка данных была произведена в программной среде SAS Enterprise Miner. Прогнозная модель построена на основе ряда известных алгоритмов, приме­няемых в интеллектуальном анализе данных (рисунок 2).

 Построение прогнозных моделей в SAS Enterprise Miner На диаграмме-7

Рис.2. Построение прогнозных моделей в SAS Enterprise Miner

На диаграмме роста (рисунок 3) видно, что по результатам эксперимента наиболь­шую эффективность показала ансамблированная модель. Она в 1,6 раза превосходит модель, не использующую знаний, извлеченных из данных. Точность прогнозов составила 97%.

 Оценка эффективности и сравнение моделей В работе показано, что-8

Рис.3. Оценка эффективности и сравнение моделей

В работе показано, что используемый подход имеет и свои недостатки: длительность процесса обучения, загрубление результатов, сложность настройки и отладки моделей, а также то, что эти алгоритмы работают по принципу «черного ящика».

В третьей главе предложена модель системы анализа видеоизобра­жений, которая может быть использована как самостоятельный продукт, так и в качестве составного элемента более сложных программно-аппаратных комплексов. Описан алгоритм функционирования системы анализа видео­изображений. Приводится алгоритмическая и программная реализация сис­темы распо­знавания сцен и поведения объекта, которая позволила осуществ­лять анализ видеоизображений большого объема и сложной структуры.

На рисунке 4 представлен алгоритм системы мониторинга динамических объектов, описывающий работу системы поиска и слежения за компонентами объекта на видеоизображениях. На схеме присутствуют три основных элемента: это оператор, СМДО и фантом. СМДО – это подсистема, которая управляет всеми действиями, выполняет основные операции и обновляет данные, которые использует для своего отображения фантом. Фантом является графическим представлением объекта в кадре. Он повторяет действия объекта находящегося перед камерой.

 Алгоритм системы мониторинга динамических объектов Рассмотрим-9

Рис.4. Алгоритм системы мониторинга динамических объектов

Рассмотрим представленный выше алгоритм поэтапно.

Анализ сцен начинается с выделения отдельных стационарных и динами­ческих объектов на видеокадре. С каждым изображением объекта производится следующая последовательность действий:

1. Первоначально система получает кадр от видеокамеры и передает его на обработку.

2. Затем осуществляется темпоральная привязка видеокадра.

3. На следующем этапе осуществляется процесс поиска объекта и выделение его контура на видеокадре, который необходим для дальнейшего распознавания, а именно для разбиения контура на последовательность контрольных точек.

4. Процесс поиска контрольных точек заключается в нахождении на некото­ром контуре набора характерных точек, каждая из которых четко позиционирует отдельную часть объекта. Контрольные точки могут быть следующих типов: кисти рук, плечевые и локтевые суставы, голова, суставы ног, ступни ног.

5. Далее контрольные точки соединяются характеризующими линиями, которые с некоторой достоверностью определяют положение интересующих частей объекта. По изменению углов таких линий мы будем характеризовать динамику объекта.

6. После первоначального размещения контрольных точек на наблю­дае­мую часть объекта накладываются контрольные интервалы (рисунок 5). Смещение объ­екта или изменение формы объекта определяется заполнением контрольных интервалов точками цели с одной стороны и точками фона с другой. При этом предполагается, что изображение объекта отличается от фона цветом или интенсивностью. Контрольные интервалы выбираются в следующих ос­новных направлениях: северное, южное, восточное и западное.

 Расположение контрольных интервалов При перемещении объекта атрибуты-10

Рис.5. Расположение контрольных интервалов

При перемещении объекта атрибуты объекта описываются нечеткими лингвистическими переменными. Наблюдателю предоставляется возмож­ность изменять формы функций принадлежности в реальном времени и наблюдать за изменением получаемых решений.

Атрибут «Сенсор правой руки» описывается лингвистическими переменными с терм-множествами:

T right hand = {«СЛЕГКА ПОДНЯТА», «ПОДНЯТА», «СИЛЬНО ПОДНЯТА»}

T right hand = {«СЛЕГКА СОГНУТА», «СОГНУТА», «СИЛЬНО СОГНУТА»}

Атрибут «Сенсор левой руки» описывается лингвистическими переменными с терм-множествами:

T left hand = {«СЛЕГКА ПОДНЯТА», «ПОДНЯТА», «СИЛЬНО ПОДНЯТА»}

T left hand = {«СЛЕГКА СОГНУТА», «СОГНУТА», «СИЛЬНО СОГНУТА»}

Функция принадлежности термов T right hand, T left hand будет иметь следующий вид (рисунок 6):

T1 T2 T3

0 0,1 0,3 0,7 0,8 x

Рис.6. Функция принадлежности термов «Положение правой руки»

Лингвистическая переменная описывает статическое положение отдель­ных частей тела (рука, нога, кисть, ступня и т.д.) по результатам размещения контрольных точек объекта. Значения ЛП образуют описание сцен. Представим описание сцен в виде графов следующего вида (рисунок 7):

Рис.7. Графы описания положения объектов

где – сенсор правой руки; – сенсор левой руки; – сенсор правой ноги; – сенсор левой ноги.

Лингвистическая переменная (положение сенсора правой руки) описывает статическое положение точек объекта, ;

Лингвистическая переменная имеет базовое терм-множество ={Ti}. Каждый терм описывается нечетким подмножеством множества значений и некоторой базовой переменной >, где – имя лингвистической переменной, – множество значений лингвистической переменной, X – интервал числовых значений переменной.

7. После того как контрольные точки размещены на объекте, производится замена изображения объекта упрощенным макетом – фантомом и привязка «фантома» к изображению. Графическое представление объекта и соответствующее ему изображение фантома представлено на рисунке 8.

Рис.8. Описание положения объекта по положению фантома

Осуществляется процедура нечеткой классификации различных поло­жений объекта: стационарного положения «фантома», изменения положения объектов и классификация сцен.

8. Далее происходит запуск агентов слежения за расположение контрольных точек. На рисунке 9 представлена структурная схема алгоритма управления агентами слежения. В соответствии с терминологией теории агентов, миссией агента является слежение за компонентами объекта, средой агента – адресное пространство видеокадра. Рецепторами агента – контроль­ные интервалы, распо­ложенные вокруг наблюдаемой части объекта. Агент имеет два типа эффекторов: одни обеспечивают перемещение самого агента в пространстве видеокадра и перемещение контрольных интервалов, другие сообщают данные о расположении компонентов объекта.

 Схема управления агентами слежения 9. Минимальное темпоральное-34

Рис.9. Схема управления агентами слежения

9. Минимальное темпоральное расстояние между видеокадрами ограни­чено максимальной частотой видеокамеры. Число пропущенных видеокадров зависит от скорости движения объекта и от наличия движущихся объектов. Для решения задачи описания сцен могут не потребоваться все видеокадры. В этом случае осуществляется «прореживание» видеокадров.

10. Новое размещение фантома для следующего кадра производится в случае потери объекта. В случае сохранения объекта в кадре, производится корректировка положения характеризующих линий и последующего движе­ния фантома.

11. Запись данных с системы ведется в специальный файл (протокол). В результате система выдает команду для реагирования на ситуацию, например сигнал тревоги.

Представлена графово-гиперграфовая модель описания сцен по видео­изображениям. Такие графы составлены на основе классификации двигательных действий и сцен. Окончанием маршрута является вершина, которая соответствует данному положению, перемещению или сцене. Кодом или индексом видеокадра или последовательности видеокадров является перечисление числовых обозначений вершин маршрута.

Введено понятие и исследованы свойства гиперграфа специального вида – обобщенного гиперграфа. Такая модель может отображать как отношения целых групп элементов, так и отношения между отдельными элементами. Предложенная модель используется для описания функционирования систем анализа видео­изображений.

На рисунке 10 показан пример обобщенного гиперграфа, в котором вершины задаются лингвистическими переменными.

Обобщенным гиперграфом назовем тройку следующего вида:

HX=(X, E, Gh (X)), X={x1, x2,…,xn},

E={E1, E2,…,Em}, E1, E2,…,Em X,

Gh (X)=(X,U), U={u1,u2,…,ul,…,us}, ul=(xi, xj), xi, xj X.

Такое определение оставляет возможность представления отношений между вершинами разных ребер гиперграфа.

Частный случай обобщенного гиперграфа определяет графовые отношения только внутри рёбер гиперграфа:

HX=(X,EX ), X={x1, x2,…,xn}, EX = {(E1,GE1), (E2,GE2),…,(Er,GEl),…,(Em,GEm)},

E1, E2,…, Er,…, Em X, GEr =(Er,Ur),Ur={u1,u2,…,ul,…,uk}, ul=( xi, xj), xi, xj Er.

 Пример обобщенного гиперграфа HX В таблице 1 представлена смежность-45

Рис.10. Пример обобщенного гиперграфа HX

В таблице 1 представлена смежность вершин гиперграфа HX1, изобра­женного на рисунке 10. Отношения в гиперграфе HX1 вершин x2, x6 описаны парой (1/E2). Это означает, что существует ребро (x2, x6) – “1” и они обе связаны ребром E2. Пара x4, x3 (0/E2,E3) непосредственно ребром (x4,x3) не связана, но входит в ребра E2 и E3.

Нетрудно предположить, каким образом будет выглядеть таблица смеж­ности нечеткого обобщенного гиперграфа. В ней должны присутствовать элементы следующих видов <µU(xi, xk)/(xi, xk)>, <µX(xi )/(xi)>, <µEi(xi )/(xi)>.

Таблица 1. Смежность вершин гиперграфа HX1

 редлагается пример представления обобщенного гиперграфа HX1.-46

На рисунке 11 предлагается пример представления обобщенного гиперграфа HX1. На представление гиперграфа H1 двудольным графом GK=(X UEX,V) наложены “графовые” связи вершин:

Рис.11. Обобщенный гиперграф HX1

С математической точки зрения, понятие обобщенного гиперграфа от­личается от классического гиперграфа тем, что отношения между вершинами внутри ребра могут описываться неполным графом. Такая модель позволяет отображать сложные функциональные и смысловые связи.

Приведены результаты эксперимента по решению задачи определения положения объ­екта на видеокадре с помощью системы интеллектуального анализа видео­изображений. Результаты эксперимента позволили сделать следующие выводы:

  1. Непосредственное применение традиционных методов систем интеллек­туального анализа данных (СИАД) для анализа видеопотоков дан­ных невозможно, поскольку входные данные для такой системы должны быть представлены в текстовом (буквенно-цифровом) виде, а получить такие данные из видеопотоков можно лишь с применением методов СМДО, где эти функции выполняют многоагентные компоненты.
  2. Для отладки и обеспечения корректного функционирования систем анализа данных необходимо иметь возможность объяснения, каким образом были получены те или иные результаты. Большинство методов и алгоритмов, реализованных в СИАД, работают по принципу «черного ящика».
  3. Для работы системы интеллектуального анализа данных необходимо предоставить обучающие примеры. Для сложных сцен может потребоваться несколько тысяч примеров. При этом для каждого примера эксперт должен сделать свое заключение. Для работы СМДО необходимо только построить функции принадлежности лингвистических переменных.
  4. СМДО дает результат, начиная от нижнего уровня иерархии сцены (например, поднятая рука) до описания сцены в целом. Систему интеллектуального анализа данных необходимо заново обучать на каждом уровне и независимо от других уровней.

В заключении перечислены основные результаты работы.

В приложении 1 представлены примеры работы системы мониторинга динамических объектов на видеоизображении.

В приложении 2 приведен листинг программного кода, реализующего работу системы автоматического описания сцен по видеоизображениям.

В приложении 3 представлены акты об использовании результатов работы.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ ПО ТЕМЕ ДИССЕРТАЦИОННОЙ РАБОТЫ

В ходе проведенных исследований получены следующие основные научные и практические результаты:

1. Разработаны и исследованы нечеткие модели на основе пространст­венно-временных атрибутов для описания положения объектов на видео­кадре, исполь­зование которых позволило проводить интеллектуальный ана­лиз видеопотоков данных, аналогичный деятельности человека-оператора.

2. Предложены принципы создания интеллектуальных систем обработки изображений и определены требования к основным параметрам и харак­те­ристикам таких систем, что позволило разработать комплексную систему мони­торинга динамических объектов и осуществить ее практическое применение в задачах обработки видеоизображений.

3. Введено понятие гиперграфа специального вида – обобщенного гиперграфа. Такая модель может отображать как отношения целых групп элементов, так и отношения между отдельными элементами. Предложенная модель исполь­зовалась для описания сцен при формировании сценариев и ситуаций в системах анализа видеоизображений.

4. Разработан алгоритм работы системы мониторинга динамических объектов и программный комплекс, реализующий поиск и слежение за компонентами объекта для анализа видео­кадров и распознавания сцен, что позволило получить достоверные результаты при анализе видеоизображений большого объема и сложной структуры.

Основные результаты диссертационной работы использованы при выполнении научно-исследовательских работ и в учебном процессе вуза, что подтверждается соответствующими актами.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИОННОЙ РАБОТЫ

Публикации в ведущих рецензируемых изданиях,

рекомендованных ВАК РФ

  1. Целых Ю.А. Мультиагентная реализация описания сложных сцен по видеоизображениям // Известия ЮФУ. Технические науки. Тематический выпуск «Интеллектуальные САПР». – Таганрог: Изд-во ТТИ ЮФУ, 2009,

№ 12(101). – С.149-153.

  1. Сергеев Н.Е., Целых Ю.А. Информационная система автомати­ческого описания сцен по видеоизображениям // Известия ЮФУ. Техни­ческие науки. №3. – Таганрог: ЮФУ, 2009. С. 253-259.
  2. Сергеев Н.Е., Целых Ю.А. GH-модели социальных сетей // Известия ЮФУ. Технические науки. №1. – Таганрог: ЮФУ, 2009. С. 90-95.
  3. Целых Ю.А. Теоретико-графовые методы анализа нечетких социаль­ных сетей // Программные продукты и системы. №2 (82), 2008. С. 48-50.
  4. Сергеев Н.Е., Целых Ю.А. Использование темпоральных отношений при описании сложных сцен по видеоизображениям // Известия ЮФУ. Тех­нические науки. Тематический выпуск «Интеллектуальные САПР». – Таганрог: Изд-во ТТИ ЮФУ, 2009, № 12(101). – С.134-142.

Публикации в других изданиях

  1. Tselykh J.A. Decision Search Methods in a Fuzzy Semantic Network // Proceedings of International Conference «Intelligent Systems (IEEE AIS’04)». Scientific publication in 3 volumes. Vol. 3. – Moscow. “Fizmatlit”, 2004. P. 18-21.
  2. Целых Ю.А. Особенности моделирования процедур принятия реше­ний в интегрированных интеллектуальных системах // Перспективные ин­формационные технологии и интеллектуальные системы. – № 2/2004 (18). – Таганрог, Изд-во ТРТУ. С.11-14.
  3. Целых Ю.А. Нечеткие модели поиска информации в гипертекстовой среде // Перспективные информационные технологии и интеллектуальные системы. – № 4/2004 (20). – Таганрог, Изд-во ТРТУ. С.57-61.
  4. Tselykh J.A. Decision Search Methods in Fuzzy Situational Systems // Proceedings of XIII International Scientific and Technical Conference «Mathematical Methods and Information Technologies in Economy, Sociology and Education» (MK-36-94). – Penza, 2004. P. 74-76.
  5. Сергеев Н.Е., Целых Ю.А. Использование гиперграфов специаль­ного вида для некоторых задач моделирования // Конгресс «AIS-IT 2009» по интеллектуальным системам и информационным технологиям. Интел­лектуальные системы 2009. Интеллектуальные САПР 2009. Труды конгресса. Том 1. – Дивноморское, 2009. С. 553.

Личный вклад автора в работах, опубликованных в соавторстве:

[2, 5] – разработана система поиска и слежения за компонентами объекта для анализа видеокадров и распознавания образов;

[3] – предложена графово-гиперграфовая модель;

[10] – введено понятие обобщенного гиперграфа для описания функцио­нирования систем анализа видеоизображений.

Соискатель Ю.А. Целых



 





<


 
2013 www.disus.ru - «Бесплатная научная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.