Система искусственного ума компании Гугл в первый раз одолела человека, проф игрока в Го — pittopit.ru

Система искусственного ума AlphaGo, построенная на принципах глубинного машинного обучения и сделанная группой Гугл DeepMind, со счетом 5-0 одолела Фань Хуэя (Fan Hui) трехкратного евро чемпиона по игре Го (Go). Этот вариант является первым разом в истории, когда компьютерная программ обыграла проф игрока в Го, хотя некие специалисты в области искусственного ума предсказывали, что пришествия данного действия можно ждать не ранее, чем через одно десятилетие.

«Система AlphaGo употребляет способы глубинного машинного исследования и самообучения. С помощью этого она улучшает саму себя, просматривая ходы настоящих игр и играя сама с собой» — говорят Дэвид Сильвер (David Silver) и Демис Хассабис (Demis Hassabis), члены группы Гугл DeepMind, — «Обучение (педагогический процесс, в результате которого учащиеся под руководством учителя овладевают знаниями, умениями и навыками) системы было произведено на широком наборе данных о 30 миллионах ходов, изготовленных проф игроками в Го. А опосля этого система отточила свое мастерство, играя сама с собой».

Для того, чтоб создать вероятной победу системы искусственного ума над человеком, ее создатели реализовали современный метод поиска по дереву решений. Две независящие нейронные сети сформировали из миллионов собственных схожих нейронам структур 12 слоев, которые были «пронзены насквозь» деревом решений игры Го, в каком насчитывается наиболее чем 10^100 вариантов. Это больше, чем количество вариантов ходов в шахматах и больше, чем количество атомов во всей Вселенной.

«Поначалу мы научили одну из сетей на базе данных о 30 миллионов ходов, которые были изготовлены людьми-экспертами в данной нам игре. Уже опосля этого система AlphaGo стала в состоянии верно предвидеть ход человека в 57 вариантах из 100 вероятных и выигрывала в 99.8 процентах матчей у остальных Го-программ» — говорят Дэвид Сильвер и Демис Хассабис, — «Но наша цель заключалась не в подражании людям-игрокам, мы намеревались одержать полную победу над ними. Потому мы принудили две нейронных сети системы AlphaGo тыщи раз играться вместе, обнаруживая новейшие стратегии, приобретая новейший опыт с помощью эмпирического процесса, известного как «укрепляющее обучение (педагогический процесс, в результате которого учащиеся под руководством учителя овладевают знаниями, умениями и навыками)» (reinforcement learning)».

Последующей задачей, которую поставили впереди себя создатели системы AlphaGo, станет попытка победы над Ли Седолем (Lee Sedol), общепризнанным мировым игроком в игру Го. И этот матч состоится в Сеуле, Южная Корея, в марте этого года.

«Логические игры являются прелестной платформой для разработки, обучения, тестирования и совершенствования алгоритмов систем искусственного ума. А такие системы в дальнейшем могут быть применены в самых разных областях настоящего мира» — пишут исследователи, — «Способы, которые мы используем для поиска решений в играх, в один прекрасный момент могут быть расширены и модернизированы так, что при их помощи люди отыщут решения всех самых насущных заморочек, связанных с неуввязками общества, переменами атмосферного климата и здравоохранением».

Источник: dailytechinfo.org