Человек против компьютера. Очередное поражение

Сначала компьютер обыграл человека в шахматы, затем в покер, в Jeopardy! (российский аналог: телевизионное шоу «Своя игра»), а теперь превзошли человеческий разум в распознавании образов.

Соревнование в этой области устраивает сайт ImageNet Large Scale Visual Recognition Challenge (соревнование по масштабному распознаванию графических образов в рамках сети изображений, см. http://image-net.org/ ) и общие итоги текущего чемпионата должны быть подведены 17 декабря 2015 года. На данный момент (спустя 5 дней после начала) компания Microsoft объявила о превышении точности распознавания человеком (в среднем 5,1% ошибок) с показателем 4,94% для своей нейронной сети, затем Google побила рекорд Microsoft еще на 0,04%. Смысл соревнования в том, чтобы выявить на произвольно взятом графическом изображении определенные объекты, которые можно выразить осмысленным текстом (словами).

Chelovek-protiv-kompjutera-ocherednoje-poragenie-1

Для первого изображения определены объекты bird (птица) и frog (лягушка), для следующего: person (человек), god (собака) и char (кресло) и т.д.

Слова-описания изображения (термины) берутся не просто так, а из лексической базы данных английского языка WordNet (http://wordnet.princeton.edu/ ), в котором слова-термины сопоставлены по смыслу, поэтому после распознавания терминов на фотографиях можно будет аналогично словам связать друг с другом изображения по осмысленным критериям (поиск изображений в Google пока действует только по внешнему виду изображений, не учитывая смыслового контекста никоим образом). Кстати, в WordNet английский язык упорядочен по когнитивным синонимам – synsets (cognitive synonyms), определяющим концептуальные понятия на смысловом и лексическом уровнях.

Соревнования ImageNet проводятся с 2010 года, но впервые первое место занял компьютер, а использованный для этого алгоритм основан на «глубоком исследовании (deep learning)» в искусственных нейронных сетях, некоторым образом моделируя работу человеческого мозга. Участники соревнования представили описания своих алгоритмов, хотя и без реализации в коде, поэтому известно, что Microsoft применяла сверточные нейронные сети (convolutional neural network, CNN) с 30 весовыми уровнями. Алгоритм Google основан на пакетной нормализации (batch normalization).

Chelovek-protiv-kompjutera-ocherednoje-poragenie-2

«В предыдущий раз нейронные блоки разрабатывались вручную и фиксировались в процессе обучения. Теперь же мы сделали блоки интеллектуальными, позволив им принимать более гибкие формы. – Рассказал Джан Сан (Jian Sun), ведущий исследователь из группы Visual Computing Group, подразделения Microsoft Research Asia. – Важнее то, что определенная форма каждого блока обучается в процессе тренировки от начала и до конца. Мы увидели, что ввод интеллектуальных блоков может существенно улучшить модель».

Спонсором ежегодного соревнования ImageNet Challenge стала компания Nvidia, которая предоставила массивы своих графических процессоров всем конкурсантам. Microsoft использовала процессоры Nvidia, но дополнительно приобрела и настроила свой собственный суперкомпьютер для моделирования параметрических выверенных линейных нейронных блоков, чтобы стать «первой, победившей человека» в области классификации графических изображений.

Эти теоретические результаты уже применяются на практике для поиска изображений в поисковике Bing от Microsoft и в облачном хранилище данных OneDrive.

Источник:
http://www.eetimes.com/document.asp?doc_id=1325712

Кроме того, искусственный интеллект оказался сильнее человеческого в старых аркадных играх на Atari 2600. Система Deep-Q-Network, которая теперь принадлежит Google, лучше человека справилась с 49 классическими играми, не имея доступа к исходному коду игры и не пользуясь опытом человека. За счет самообучения нейронной сети в рамках алгоритма с «поощрением» (в качестве которого выступал счет в игре) удалось превзойти опытных игроков-людей в 60%.

Источник:
http://news.sciencemag.org/technology/2015/02/artificial-intelligence-bests-humans-classic-arcade-games