Лаборатория образована в 2003 г. в рамках сотрудничества с ИТ фирмой «Элекард» на базе кафедры Автоматизированные системы управления ТУСУР. Задачами лаборатории является подготовка специалистов от уровня бакалавра до аспирантов по направлению «Обработка и анализ изображений». Выполняемые в лаборатории работы в этом направлении связаны с учебными, научными и практическими задачами.
Объектом данной работы является двигательная деятельность человека, одной из основных функций которой является ходьба как вид перемещения в пространстве. Особенность поз и движений человека во время ходьбы называют его походкой. Параметры походки и их анализ могут быть полезны в спорте, медицине (для определения состояния пациента, постановки диагноза, реабилитации и др.), решения задач контроля. Походка уникальна для каждого человека, т.к. зависит от множества факторов: пола, возраста, роста, веса, формы фигуры, заболеваний, травм, нервного состояния и др. Вследствие этого походка человека не является статичной, и она может меняться в зависимости от изменения различного рода факторов. Одним из элементов этого является изучение колебаний центра тяжести фигуры человека (фронтальная и сагиттальная модели).
Изучение временного поведения центра тяжести позволяет получать множество информации о походке человека. Однако походка человека связана с включением всей фигуры человека в двигательные акты, что невозможно определить, исследуя лишь центр тяжести. Поэтому, кроме ЦТ, осуществляется построение скелетной модели человека на основе бинаризованных изображений, чтобы более глубоко исследовать движение человека и выявить особенности походки. Скелетную модель можно изобразить с различным количеством степеней свободы (DOF – degrees of freedom). Минимальным количеством DOF можно считать число три, линию спины (от головы до таза) и линию на каждую ногу от таза до лодыжки. В 5 DOF каждая линия для ноги разбивается на две линии – линия бедра и голени.
Определение углов поворота и наклона головы из видеопоследовательности важно для решения различных научных и практических приложений. Решение этой задачи связано с выделением области лица человека на изображении, с учетом сложного фона. Затем необходимо определить основные элементы лица человека (глаза, нос, рот) и контролировать изменение их в зависимости от поворота головы.
Для решения задач идентификации, медицины и человеко-машинного интерфейса необходимо строить цифровые маски лица человека. Жесткие маски лица больше подходят для определения поворотов, наклонов и смещений головы человека. Эластичные маски подходят для определения деформации лица человека. В лаборатории предлагается использовать некоторый триангуляционный «гибрид» жестких и эластичных масок лица на основе модели Candide-3 и эластичных графов. Маска занимает минимальное количество памяти и удобна для выполнения операция сравнения, вычисления изменений, вычисления гендерной принадлежности, возраста и др.
Определение эмоциональной составляющей из анализа изображения лица человека является важной задачей для различных приложений. Применяя сочетание различных подходов, удается идентифицировать несколько наиболее часто возникающих эмоциональных составляющих человека.
Поиск сюжетной части изображения, связанного с лицом человека, является важным для решения множества практических задач, например, контроль состояния водителя в процессе движения, покупателей в магазинах, детей на занятиях и др. Для решения этой задачи используются геометрические особенности головы человека.
Жесты человека важны для решения задачи управления устройствами, понимания мимики, медицины, спорта и др. приложений. Данная задача является сложной в виду скорости перемещения руки относительно частей сложного фона.
Учебная часть связана с тремя предметами, которые читаются для направления магистратуры: «Методы обработки изображений», «Методы распознавания изображений», «Видеомониторинг жилых помещений». Содержание дисциплин, в урезанном, интегральном виде включает следующие элементы: Типы и форматы изображений. Подавление шумов. Меры близости изображений. Цветовые пространства. Обнаружение объектов на изображении. Дискретизация и квантование функции яркости. Коррекция уровней яркости. Фильтры для подчеркивания границ. Анализ перепадов яркости и гистограмм. Выделение контуров: градиентный метод, комбинаторный метод (метод порогового градиента). Сегментация изображений. Спектральные преобразования (уровень RGB). Обнаружение объектов на изображении. Поисковые деревья, ассоциированные с изображениями и оптимизация алгоритмов работы с ними. Нейрокомпьютерный подход в распознавании. Параллельные системы обработки информации. Сжатие изображений. Семантический и иные методы описания изображений. Поиск изображений.
Михаил Юрьевич Катаев, д.т.н., проф.
Томский государственный университет систем управления и радиоэлектроники
634050, г. Томск, пр. Ленина, 40, Тел.: (3822) 51-05-30, Факс: (3822) 51-32-62
www.tusur.ru, office@tusur.ru, kataev89@gmail.com