Международная группа исследователей создала 26-слойную сверточную нейронную сеть (CNN) для точного распознавания действий человека (HAR), которая достигла отличных результатов в тестировании и, как надеются ее разработчики, станет основой для создания самых совершенных систем, сообщает портал Тechxplore.com.
Проблема современных сверточных нейронных сетей (CNN), которые, надо признать, гораздо лучше справляются с задачами HAR, чем обычные нейронные сети, заключается в том, что они не могут отличить, к примеру, ходьбу от бега трусцой, так как в основе механизмов распознавания зачастую лежат особенности, определяющие сходство этих двух действий человека. Исследователи из университетов HITEC и Исламабада (Пакистан), Седжонга и Чунг-Анг (Южная Корея), Лестера (Великобритания) и принца Султана (Саудовская Аравия) недавно разработали новую CNN для распознавания действий человека, запечатленные на видео.
Ученые решили использовать подход, который объединяет метод выбора признаков, называемый распределением Пуассона, с одномерными мерами (PDaUM). Исследователи обучили с помощью наборов данных HMDB51, UFC Sports, KH и Weizmann две CNN – EML, улучшенное новым механизмом PDaUM, и Softmax, после чего сравнили системы. Softmax уступила во всех тестах улучшенной EML, которая в наборе данных HMDB51 показала точность 81,4%, 99,2% в наборе данных UCF Sports, 98,3% в наборе данных KTH и 98,7% в наборе данных Вейцмана.
Авторы разработки уверены, что их детище станет основой для создания наиболее совершенных систем, способных с высокой точностью распознавать действия человека не только на видео, но и по прямой трансляции.