Шкала тьюринга. Человеческий разум и разум вообще


Стандартная интерпретация теста Тьюринга

Тест Тьюринга - эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум» (англ. Computing Machinery and Intelligence ), опубликованной в 1950 году в философском журнале «Mind» . Тьюринг задался целью определить, может ли машина мыслить .

Стандартная интерпретация этого теста звучит следующим образом: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы - ввести человека в заблуждение, заставив сделать неверный выбор ».

Все участники теста не видят друг друга. Если судья не может сказать определенно, кто из собеседников является человеком, то считается, что машина прошла тест. Чтобы протестировать именно интеллект машины, а не её возможность распознавать устную речь, беседа ведется в режиме «только текст», например, с помощью клавиатуры и экрана (компьютера-посредника). Переписка должна производиться через контролируемые промежутки времени, чтобы судья не мог делать заключения, исходя из скорости ответов. Во времена Тьюринга компьютеры реагировали медленнее человека. Сейчас это правило необходимо, потому что они реагируют гораздо быстрее, чем человек.

История

Философские предпосылки

Хотя исследования в области искусственного интеллекта начались в 1956 году , их философские корни уходят глубоко в прошлое. Вопрос, сможет машина думать или нет, имеет долгую историю. Он тесно связан с различиями между дуалистическим и материалистическим взглядами. С точки зрения дуализма, мысль не является материальной (или, по крайней мере, не имеет материальных свойств), и поэтому разум нельзя объяснить только с помощью физических понятий. С другой стороны, материализм гласит, что разум можно объяснить физически, таким образом, оставляя возможность существования разумов, созданных искусственно.

Алан Тьюринг

К 1956 году британские учёные уже на протяжении 10 лет исследовали «машинный интеллект». Этот вопрос был обычным предметом для обсуждения среди членов «Ratio Club» - неформальной группы британских кибернетиков и исследователей в области электроники, в которой состоял и Алан Тьюринг, в честь которого был назван тест.

Тьюринг в особенности занимался проблемой машинного интеллекта, по меньшей мере, с 1941 года. Одно из самых первых его упоминаний о «компьютерном интеллекте» было сделано в 1947 году. В докладе «Интеллектуальные машины» Тьюринг исследовал вопрос, может ли машина обнаруживать разумное поведение, и в рамках этого исследования предложил то, что может считаться предтечей его дальнейших исследований: «Нетрудно разработать машину, которая будет неплохо играть в шахматы. Теперь возьмем трех человек - субъектов эксперимента. А, В и С. Пусть А и С неважно играют в шахматы, а В - оператор машины. […] Используются две комнаты, а также некоторый механизм для передачи сообщений о ходах. Участник С играет или с А, или с машиной. Участник С может затрудниться ответить с кем он играет».

Таким образом, к моменту публикации в 1950 году статьи «Вычислительные машины и разум», Тьюринг уже на протяжении многих лет рассматривал возможность существования искусственного интеллекта. Тем не менее, данная статья стала первой статьёй Тьюринга, в которой рассматривалось исключительно это понятие.

Тьюринг начинает свою статью утверждением: «Я предлагаю рассмотреть вопрос „Могут ли машины думать?“». Он подчёркивает, что традиционный подход к этому вопросу состоит в том, чтобы сначала определить понятия «машина» и «интеллект». Тьюринг, однако, выбрал другой путь; вместо этого он заменил исходный вопрос другим, «который тесно связан с исходным и формулируется относительно недвусмысленно». По существу, он предлагает заменить вопрос «Думают ли машины?» вопросом «Могут ли машины делать то, что можем делать мы (как мыслящие создания)?». Преимуществом нового вопроса, как утверждает Тьюринг, является то, что он проводит «чёткую границу между физическими и интеллектуальными возможностями человека».

Чтобы продемонстрировать этот подход, Тьюринг предлагает тест, придуманный по аналогии с игрой для вечеринок «Imitation game» - имитационная игра. В этой игре мужчина и женщина направляются в разные комнаты, а гости пытаются различить их, задавая им серию письменных вопросов и читая напечатанные на машинке ответы на них. По правилам игры и мужчина, и женщина пытаются убедить гостей, что все наоборот. Тьюринг предлагает переделать игру следующим образом: "Теперь зададим вопрос, что случится, если в этой игре роль А будет исполнять машина? Будет ли задающий вопросы ошибаться так же часто, как если бы он играл с мужчиной и женщиной? Эти вопросы заменяют собой исходный «Может ли машина думать?».

В том же докладе Тьюринг позднее предлагает «эквивалентную» альтернативную формулировку, включающую судью, который беседует только с компьютером и человеком. Наряду с тем, что ни одна из этих формулировок точно не соответствует той версии теста Тьюринга, которая наиболее известна сегодня, в 1952 учёный предложил третью. В этой версии теста, которую Тьюринг обсудил в эфире радио Би-Би-Си, жюри задает вопросы компьютеру, а роль компьютера состоит в том, чтобы заставить значительную часть членов жюри поверить, что он на самом деле человек.

В статье Тьюринга учтены 9 предполагаемых вопросов, которые включают все основные возражения против искусственного интеллекта, поднятые после того, как статья была впервые опубликована.

Элиза и PARRY

Блей Витби указывает на 4 основные поворотные точки в истории теста Тьюринга - публикация статьи «Вычислительные машины и разум» в 1950, сообщение о создании Джозефом Уайзенбаумом программы Элиза (ELIZA) в 1966, создание Кеннетом Колби программы PARRY , которая была впервые описана в 1972 году, и Коллоквиум Тьюринга в 1990.

Принцип работы Элизы заключается в исследовании введенных пользователем комментариев на наличие ключевых слов. Если найдено ключевое слово, то применяется правило, по которому комментарий пользователя преобразуется и возвращается предложение-результат. Если же ключевое слово не найдено, Элиза либо возвращает пользователю общий ответ, либо повторяет один из предыдущих комментариев. Вдобавок Уайзенбаум запрограммировал Элизу на имитацию поведения психотерапевта, работающего по клиент-центрированной методике. Это позволяет Элизе «притвориться, что она не знает почти ничего о реальном мире». Применяя эти способы, программа Уайзенбаума могла вводить в заблуждение некоторых людей, которые думали, что они разговаривают с реально существующим человеком, а некоторых было «очень трудно убедить, что Элиза […] не человек». На этом основании некоторые утверждают, что Элиза - одна из программ (возможно первая), которые смогли пройти тест Тьюринга. Однако это утверждение очень спорно, так как людей, «задающих вопросы», инструктировали так, чтобы они думали, что с ними будет разговаривать настоящий психотерапевт, и не подозревали о том, что они могут разговаривать с компьютером.

Коллоквиум по разговорным системам, 2005

В ноябре 2005 года в Университете Суррея проходила однодневная встреча разработчиков ACE , которую посетили победители практических тестов Тьюринга, проходивших в рамках конкурса на получение премии Лёбнера: Робби Гарнер (Robby Garner), Ричард Уоллес (Richard Wallace), Ролл Карпентер (Rollo Carpenter). В числе приглашенных докладчиков были Дэвид Хэмилл (David Hamill), Хью Лёбнер и Хьюма Ша.

Симпозиум общества AISB по тесту Тьюринга, 2008

В 2008 году наряду с проведением очередного конкурса на получение премии Лёбнера, проходившего в Университете Рединга (University of Reading), Общество изучения искусственного интеллекта и моделирования поведения (The Society for the Study of Artificial Intelligence and Simulation of Behavior - AISB) провело однодневный симпозиум, на котором обсуждался тест Тьюринга. Симпозиум организовали Джон Бенден (John Barnden), Марк Бишоп (Mark Bishop), Хьюма Ша и Кевин Ворвик. В числе докладчиков были директор Королевского института баронесса Сьюзан Гринфилд (Susan Greenfield) , Сельмер Брингсорд (Selmer Bringsjord), биограф Тьюринга Эндрю Ходжес (Andrew Hodges) и ученый Оуэн Холланд (Owen Holland). Никакого соглашения о каноническом тесте Тьюринга не появилось, однако Брингсорд предположил, что более крупная премия будет способствовать тому, что тест Тьюринга будет пройден быстрее.

Год Алана Тьюринга и Тьюринг-100 в 2012

В 2012 году будет отмечаться юбилей Алана Тьюринга. На протяжении всего года будет проходить множество больших мероприятий. Многие из них будут проходить в местах, имевших большое значение в жизни Тьюринга: Кембридж, Манчестер и Блетчи Парк. Год Алана Тьюринга курируется организацией TCAC (Turing Centenary Advisory Committee), осуществляющей профессиональную и организационную поддержку мероприятий в 2012 году. Также поддержкой мероприятий занимаются: ACM , ASL , SSAISB , BCS , BCTCS , Блетчи Парк , BMC , BLC , CCS , Association CiE , EACSL , EATCS , FoLLI , IACAP , IACR , KGS и LICS .

Для организации мероприятий по празднованию в июне 2012 года столетия со дня рождения Тьюринга создан специальный комитет, задачей которого является донести мысль Тьюринга о разумной машине, отраженную в таких голливудских фильмах, как «Бегущий по лезвию », до широкой публики, включая детей. В работе комитета участвуют: Кевин Ворвик, председатель, Хьюма Ша, координатор, Ян Бланд (Ian Bland), Крис Чапмэн (Chris Chapman), Марк Аллен (Marc Allen), Рори Данлоуп (Rory Dunlop), победители конкурса на получение премии Лёбнера Робби Гарне и Фред Робертс (Fred Roberts). Комитет работает при поддержке организации «Женщины в технике» (Women in Technology) и Daden Ltd.

На этом конкурсе россияне, имена которых не разглашаются, представили программу «Евгений». В 150 проведённых тестах (а по факту пятиминутных разговорах) участвовали пять новейших программ, которые «затерялись» среди 25 обычных людей. Программа «Евгений», изображавшая 13-летнего мальчика, проживающего в Одессе, стала победителем, сумев в 29,2 % своих ответов ввести экзаменаторов в заблуждение. Таким образом, программа не добрала всего 0,8 % для полного прохождения теста.

Варианты теста Тьюринга

Имитационная игра согласно описанию Тьюринга в статье «Вычислительные машины и разум». Игрок С путем задания серии вопросов пытается определить, кто из двух других игроков - мужчина, а кто - женщина. Игрок А, мужчина, пытается запутать игрока С, а игрок В пытается помочь С.

Первоначальный тест на основе имитационной игры, в котором вместо игрока А играет компьютер. Компьютер теперь должен запутать игрока С, в то время как игрок В продолжает пытаться помочь ведущему.

Существуют, по крайней мере, три основных варианта теста Тьюринга, два из которых были предложны в статье «Вычислительные машины и разум», а третий вариант, по терминологии Саула Трейджера (Saul Traiger), является стандартной интерпретацией.

Наряду с тем, что существует определенная дискуссия, соответствует ли современная интерпретация тому, что описывал Тьюринг, либо она является результатом неверного толкования его работ, все три версии не считаются равносильными, их сильные и слабые стороны различаются.

Имитационная игра

Тьюринг, как мы уже знаем, описал простую игру для вечеринок, которая включает в себя минимум трех игроков. Игрок А - мужчина, игрок В - женщина и игрок С, который играет в качестве ведущего беседу, любого пола. По правилам игры С не видит ни А, ни В и может общаться с ними только посредством письменных сообщений. Задавая вопросы игрокам А и В, С пытается определить, кто из них - мужчина, а кто - женщина. Задачей игрока А является запутать игрока С, чтобы он сделал неправильный вывод. В то же время задачей игрока В является помочь игроку С вынести верное суждение.

В той версии, которую С. Г. Стеррет (S. G. Sterret) называет «Первоначальный тест на основе имитационной игры» (Original Imitation Game Test), Тьюринг предлагает, чтобы роль игрока А исполнял компьютер. Таким образом, задачей компьютера является притвориться женщиной, чтобы сбить с толку игрока С. Успешность выполнения подобной задачи оценивается на основе сравнения исходов игры, когда игрок А - компьютер, и исходов, когда игрок А - мужчина:

Второй вариант предложен Тьюрингом в той же статье. Как и в «Первоначальном тесте», роль игрока А исполняет компьютер. Различие заключается в том, что роль игрока В может исполнять как мужчина, так и женщина.

«Давайте рассмотрим конкретный компьютер. Верно ли то, что модифицируя этот компьютер с целью иметь достаточно места для хранения данных, увеличивая скорость его работы и задавая ему подходящую программу, можно сконструировать такой компьютер, чтобы он удовлетворительно выполнял роль игрока А в имитационной игре, в то время как роль игрока В выполняет мужчина?», - Тьюринг, 1950, стр. 442.

В этом варианте оба игрока А и В пытаются склонить ведущего к неверному решению.

Стандартная интерпретация

Главной мыслью данной версии является то, что целью теста Тьюринга является ответ не на вопрос, может ли машина одурачить ведущего, а на вопрос, может ли машина имитировать человека или нет. Несмотря на то, что идут споры о том, подразумевался ли этот вариант Тьюрингом или нет, Стеррет считает, что этот вариант Тьюрингом подразумевался и, таким образом, совмещает второй вариант с третьим. В это же время группа оппонентов, включая Трейджера, так не считает. Но это все равно привело к тому, что можно назвать «стандартной интерпретацией». В этом варианте игрок А - компьютер, игрок В - человек любого пола. Задачей ведущего является теперь не определить кто из них мужчина и женщина, а кто из них компьютер, а кто - человек.

Имитационная игра в сравнении со стандартным тестом Тьюринга

Существуют разногласия по поводу того, какой же вариант имел в виду Тьюринг. Стеррет настаивает на том, что из работы Тьюринга следуют два различных варианта теста, которые, согласно Тьюрингу, неэквивалентны друг другу. Тест, в котором используется игра для вечеринок и сравнивается доля успехов, называется Первоначальным тестом на основе имитационной игры, в то время как тест, основанный на беседе судьи с человеком и машиной, называют Стандартным тестом Тьюринга, отмечая, что Стеррет приравнивает его к стандартной интерпретации, а не ко второму варианту имитационной игры.

Стеррет согласен, что Стандартный тест Тьюринга (STT - Standard Turing Test) имеет недостатки, на которые указывает его критика. Но он считает, что напротив первоначальный тест на основе имитационной игры (OIG Test - Original Imitation Game Test) лишен многих из них в силу ключевых различий: в отличие от STT он не рассматривает поведение, похожее на человеческое, в качестве основного критерия, хотя и учитывает человеческое поведение в качестве признака разумности машины. Человек может не пройти тест OIG, в связи с чем есть мнение, что это является достоинством теста на наличие интеллекта. Неспособность пройти тест означает отсутствие находчивости: в тесте OIG по определению считается, что интеллект связан с находчивостью и не является просто «имитацией поведения человека во время разговора». В общем виде тест OIG можно даже использовать в невербальных вариантах.

Тем не менее, другие писатели интерпретировали слова Тьюринга, как предложение считать саму имитационную игру тестом. Причем не объясняется, как связать это положение и слова Тьюринга о том, что тест, предложенный им на основе игры для вечеринок, базируется на критерии сравнительной частоты успехов в этой имитационной игре, а не на возможности выиграть раунд игры.

Должен ли судья знать о компьютере?

В своих работах Тьюринг не поясняет, знает ли судья о том, что среди участников теста будет компьютер, или нет. Что касается OIG, Тьюринг лишь говорит, что игрока А следует заменить машиной, но умалчивает, известно ли это игроку С или нет. Когда Колби, Ф. Д. Хилф (F. D. Hilf), А. Д. Крамер (A. D. Kramer) тестировали PARRY, они решили, что судьям необязательно знать, что один или несколько собеседников будут компьютерами. Как отмечает А. Седжин (A. Saygin), а также другие специалисты, это накладывает существенный отпечаток на реализацию и результаты теста.

Достоинства теста

Ширина темы

Сильной стороной теста Тьюринга является то, что можно разговаривать о чем угодно. Тьюринг писал, что «метод вопросов и ответов кажется подходящим для обсуждения почти любой из сфер человеческих интересов, которую мы хотим обсудить». Джон Хогеленд добавил, что «одного понимания слов недостаточно; вам также необходимо разбираться в теме разговора». Чтобы пройти хорошо поставленный тест Тьюринга, машина должна использовать естественный язык, рассуждать, иметь познания и обучаться. Тест можно усложнить, включив ввод с помощью видео, или, например, оборудовав шлюз для передачи предметов: машине придётся продемонстрировать способность к зрению и робототехнике. Все эти задачи вместе отражают основные проблемы, стоящие перед теорией об искусственном интеллекте.

Уступчивость и простота

Сила и привлекательность теста Тьюринга исходит из его простоты. Философы сознания, психологии в современной неврологии не способны дать определения «интеллект» и «мышление», насколько они являются достаточно точными и вообще применимы к машинам. Без такого определения, в центральных вопросах философии об искусственном интеллекте не может быть ответа. Тест Тьюринга, даже если и несовершенен, но по крайней мере, обеспечивает то, что это действительно может быть измерено. Как таковой, это является прагматическим решением, трудных философских вопросов.

Недостатки теста

Несмотря на все свои достоинства и известность, тест критикуют на нескольких основаниях.

Человеческий разум и разум вообще

Поведение человека и разумное поведение

Направленность теста Тьюринга ярко выражена в сторону человека (антропоморфизм). Проверяется только способность машины походить на человека, а не разумность машины вообще. Тест неспособен оценить общий интеллект машины по двум причинам:

  • Иногда поведение человека не поддается разумному толкованию. В это же время тест Тьюринга требует, чтобы машина была способна имитировать все виды человеческого поведения, не обращая внимания на то, насколько оно разумно. Он также проверяет способность имитировать такое поведение, какое человек за разумное и не посчитает, например, реакция на оскорбления, соблазн соврать или просто большое количество опечаток. Если машина неспособна с точностью до деталей имитировать поведение человека, опечатки и тому подобное, то она не проходит тест, несмотря на весь тот интеллект, которым она может обладать.
  • Некоторое разумное поведение не присуще человеку. Тест Тьюринга не проверяет высокоинтеллектуальное поведение, например, способность решать сложные задачи или выдвигать оригинальные идеи. По сути, тест требует, чтобы машина обманывала: какой бы умной ни была машина, она должна притворяться не слишком умной, чтобы пройти тест. Если же машина способна быстро решить некую вычислительную задачу, непосильную для человека, она по определению провалит тест.

Непрактичность

Экстраполируя экспоненциальный рост уровня технологии в течение нескольких десятилетий, футурист Рэймонд Курцвейл предположил, что машины, способные пройти тест Тьюринга, будут изготовлены, по грубым оценкам, около 2020 года. Это перекликается с законом Мура .

В проект Long Bet Project входит пари стоимостью 20 000 $ между Митчем Капуром (Mitch Kapor - пессимист) и Рэймондом Курцвейлом (оптимист). Смысл пари: пройдет ли компьютер тест Тьюринга к 2029 году? Определены также некоторые условия пари.

Вариации теста Тьюринга

Многочисленные версии теста Тьюринга, включая описанные ранее, уже обсуждаются довольно долгое время.

Обратный тест Тьюринга и CAPTCHA

Модификация теста Тьюринга, в которой цель или одну или более ролей машины и человека поменяли местами, называется обратным тестом Тьюринга. Пример этого теста приведен в работе психоаналитика Уилфреда Биона, который был в особенности восхищен тем, как активизируется мыслительная активность при столкновении с другим разумом.

Развивая эту идею, Р. Д. Хиншелвуд (R. D. Hinshelwood) описал разум как «аппарат, распознающий разум», отметив, что это можно считать как бы «дополнением» к тесту Тьюринга. Теперь задачей компьютера будет определить с кем он беседовал: с человеком или же с другим компьютером. Именно на это дополнение к вопросу и пытался ответить Тьюринг, но, пожалуй, оно вводит достаточно высокий стандарт на то, чтобы определить, может ли машина «думать» так, как мы обычно относим это понятие к человеку.

CAPTCHA - это разновидность обратного теста Тьюринга. Перед тем как разрешить выполнение некоторого действия на сайте, пользователю выдается искаженное изображение с набором цифр и букв и предложение ввести этот набор в специальное поле. Цель этой операции - предотвратить атаки автоматических систем на сайт. Обоснованием подобной операции является то, что пока не существует программ достаточно мощных для того, чтобы распознать и точно воспроизвести текст с искаженного изображения (или они недоступны простым пользователям), поэтому считается, что система, которая смогла это сделать, с высокой вероятностью может считаться человеком. Выводом будет (хотя и не обязательно), что искусственный интеллект пока не создан.

Тест Тьюринга со специалистом

Эта вариация теста описывается следующим образом: ответ машины не должен отличаться от ответа эксперта - специалиста в определенной области знаний. По мере развития технологий по сканированию организма человека, станет возможным копировать необходимую информацию из тела и мозга в компьютер.

Тест бессмертия

Тест бессмертия - это вариация теста Тьюринга, которая определяет, качественно ли передан характер человека, а именно возможно ли отличить скопированный характер от характера человека, послужившего его источником.

Минимальный интеллектуальный Signal-тест (MIST)

MIST предложен Крисом Мак-Кинстри (Chris McKinstry). В этой вариации теста Тьюринга разрешены лишь два типа ответов - «да» и «нет». Обычно MIST используют для сбора статистической информации, с помощью которой можно измерить производительность программ, реализующих искусственный интеллект.

Мета-тест Тьюринга

В этой вариации теста субъект (скажем, компьютер) считают разумным, если он создал нечто, что он сам хочет проверить на разумность.

Премия Хаттера

Организаторы премии Хаттера считают, что сжатие текста на естественном языке является трудной задачей для искусственного интеллекта, эквивалентной прохождению теста Тьюринга.

Тест по сжатию информации имеет определенные преимущества над большей частью вариантов и вариаций теста Тьюринга:

  • Его результатом является единственное число, по которому можно судить какая из двух машин «более разумная».
  • Не требуется, чтобы компьютер врал судье - учить компьютеры врать считают плохой идеей.

Основными недостатками подобного теста являются:

  • С его помощью невозможно протестировать человека.
  • Неизвестно какой результат (и есть ли он вообще) эквивалентен прохождению теста Тьюринга (на уровне человека).

Другие тесты интеллекта

Существует множество тестов на уровень интеллекта, которые используют для тестирования людей. Возможно, что их можно использовать для тестирования искусственного интеллекта. Некоторые тесты (например, Си-тест), выведенные из «Колмогоровской сложности», используются для проверки людей и компьютеров.

Когда начинается Вторая мировая война, ученый устремляется в Блетчли-Парк - в Правительственную школу кодов и шифров. Там он присоединяется к специалистам, работающим над расшифровкой посланий, созданных с помощью легендарной немецкой машины Энигма . Ее секретные обозначения нацисты использовали для своих радиограмм. В стенах школы Тьюринг пр идумывает уникальную установку - Turing Bombe.

Махина три метра длиной и весом в две с половиной тонны расправлялась с кодами за считанные минуты. А британская власть получала точную информацию о передвижениях противника. Хотя лента была признана критиками весьма удачной, тем не менее она не раскрывает все научные достижения Алана Тьюринга. А жаль… Этот талантливый профессор долгое время занимался морфогенезом и даже описал математически процесс с амоорганизации материи. Кроме этого, Тьюринг - автор абстрактного вычислительного аппарата, прадедушки современной ЭВМ. А еще ученый - один из первых, кто серьезно задумался о взаимодействии синтетического и живого разумов.

В 1950 году, когда в лабораториях многих стран пытались разработать первые компьютерные программамы , он привлек внимание мирового сообщества своей статьей «Вычислительные машины и разум», которая вышла на страницах журнала Mind. Суть материала сводилась к следующему. Британец предложил заменить вопрос «Думают ли машины » на эквивалентный «Могут ли машины выполнять то, что выполняем мы». В этом случае, как утверждал Тьюринг, возникала бы четкая граница между интеллектуальными и физическими возможностями. В качестве примера Алан привел простой тест. Испытуемый должен общаться параллельно с человеком и с ПК. Беседа ведется не устно с глазу на глаз, а письменно, вслепую, при помощи клавиатуры. Во времена математика ЭВМ не были еще столь быстрыми и мощными. Поэтому переговоры шли с определенными временными интервалами. Паузы снижали скорость реакции, и понять кто есть кто в данной ситуации становилось чрезвычайно затруднительным. Тест сч итался пройденным, если установку принимали за живого субъекта.

Многие полагали, что Тьюринг, осуществляя свое исследование, был настроен жутко пессимистично и перспектива прихода к власти машин его нисколько не радовала. Есть, однако, свидетельства, которые указывают на обратное. Например, друг ученого Робин Ганди частенько припоминал, что когда Тьюринг в сотый раз перелистывал пассажи своей работы, то и дело улыбался и даже хихикал. Как бы то ни было, его поиски стали важной вехой на пути сближения компьютера и человека. И по сути , пробным анализом этой сферы. Позже специалисты пойдут экспериментировать дальше и придумают различные способы, как электронный мыслитель может обвести человека вокруг пальца.

Так, в 1966 году американский ученый Джозеф Вейценбаум (Joseph Weizenbaum) объявил о создании виртуального собеседника - компьютерной программы «Элиза». Она должна была имитировать знатного психотерапевта. Почему Вейценбаум остановился именно на этой медицинской области? Именно здесь можно запросто ответить вопросом на вопрос . К тому же их смысловая нагрузка относительно невелика, нет пространных предложений, а мысли легко структурируются в единую систему. Давая консультацию, «Элиза» не философствовала, а просто перефразировала речь собеседника. Выглядело это примерно так:

Испытуемый: У меня болит голова.

Элиза: Почему вы говорите, что у вас болит голова?

Подчас тестируемые попадали в ловушку и беззаветно верили, что разговаривают с реальным врачом. Но были и курьезные моменты. Периодически в ходе эксперимента люди осознавали, что электронный доктор не понимает сути вопросов. Не находя правильных вариантов ответа, «Элиза» обычно заключала: I see… И переводила диалог на другую тему. Джозеф Вейценбаум писал о своей программе в книге «Возможности вычислительных машин и человеческий разум. От суждений к вычислениям»:

В некотором смысле «Элиза» являлась актрисой, обладавшей определенной техникой, но сказать самой ей было нечего. Сценарий, в свою очередь, представлял собой некоторый набор правил, позволявший актеру импровизировать на любом имевшемся у него материале.

Восемью годами позже, в 1972 году, еще один американец Кеннет Колби (Kenneth Colby) выпускает в свет похожую программу PARRY, призванную копировать поведение параноидального шизофреника.Для того чтобы проверить новое изобретение на эффективность, Колби провел забавный эксперимент. Он предложил профессиональным психиатрам протестировать две группы больных - реальных пациентов и виртуальных, сгенерированных программой PARRY. Общение велось при помощи телетайпа. Позже другой команде психиатров продемонстрировали стенограммы речей. Затем два медицинских коллектива определяли, кто из испытуемых был человеком, а кто аппаратом. В результате верное решение было вынесено лишь в 48% случаев. А это означало, что машине удалось-таки обмануть врачей. Примечательно, что Элизе и PARRY было суждено встретиться друг с другом. Rendez-vous организовали через сеть ARPANET. Диалог электронных доктора и больного длился несколько минут.

Теперь перенесемся в другую сферу, скажем, в музыкальную. Это вам не математика, геометрия и физика, где все подчиняется сухим числам. Здесь нужен полет фантазии, талант и, главное, вдохновение. Без этих трех составляющих появление на свет хорошего произведения, того, что проникает глубоко в душу, невозможно. Точнее, было невозможно до того момента, пока в южно-испанском университете Малага дотошные волхвы не изобрели музыкальный компьютер Iamus. Названный в честь сына Апполона, он пишет ритмичные партитуры, по сложности сравнимые разве что с Гершвином или Орфом . Сначала ПК генерирует простые, короткие ритмические фразы - «геномы». Потом они начинают эволюционировать и постепенно обретают форму полномасштабного академического сочинения. Разработчики на основе теста Тьюринга проверили работу своего агрегата на профессиональных музыкантах. Авторы Iamus`а дали прослушать артистам несколько вариантов опусов: сотворенных компьютером и подлинными композиторами. Позже знатокам предстояло установить: кто есть кто . Самое интересное, что опрашиваемых тест завел в тупик. Произведение, составленное синтетическим разумом, практически не отличалось от рукотворного.

Загвоздка заключалась в том, что сочинения Iamus`а вызывали те же самые эмоции: грусть, радость, смех, слезы. Поэтому большинство испытуемых так и не смогло определиться и дать точный ответ. Обычно они говорили, что не знают.

Подобная реплика от тестируемых ждала и специалистов Кембриджского университета. В стенах своей альма-матер британские лингвисты и программисты попытались научить компьютер сочинять японское хокку . Скажите теперь: как можно поверить в то, что это машина, если она способна создать такое?

Вчера все в порядке,

А сейчас все накрылось -

В этом суть Windows.

Разрабатывая свой тест, Алан Тьюринг утверждал, что если ученые изобретут искусственную кожу и наделят ею машины, то это вряд ли сделает их человечнее. Компьютер есть компьютер , мыслящий папками и файлами. Тем не менее специалисты уже давно трудятся в этом направлении. Например, инженер-механик Джон-Джон Кабибихан из Университета Катара придумал мягкий силиконовый полимер, который при нагреве до 36.6 градусов напоминает настоящий кожный покров.Специалист напечатал на 3D-принтере искусственную руку и обернул ее новым материалом. Далее провел простой тест. Кабибихан посадил участников спиной к себе и стал касаться их плеча то своей рукой, то искусственной моделью. Респонденты не сумели провести четких различий.

Впрочем, несмотря на множественные изыскания и попытки приблизить компьютер к человеку, официально тест Т ьюринга был пройден лишь в 2014 году. Это стало возможным благодаря программе Eugene Goostman, исполненной выходцем из России Владимиром Веселовым и представителем Украины Евгением Демченко.Эксперимент св одился к серии коротких диалогов с пятью ЭВМ. В ходе них жюри предстояло догадаться, ведут их автоматы или всамделишные люди. Тест сч итался пройденным, если компьютер морочил ареопагу голову в течение трети от от веденного времени. Собственно, детищу Веселова-Демченко это как раз удалось. Показатель оказался даже на несколько десятых выше - 33%. Искусственный интеллект активно объяснялся от имени вымышленного тринадцатилетнего подростка из Одессы Жени Густмана , который «претендует на то, что знает всё на свете, но в силу своего возраста не знает ничего». Его-то и признали живым человеком. Скептики, однако, тут же назвали прохождение теста Тьюринга сомнительным. Ведь Женя Густман являлся лишь чат-ботом . Поэтому , по их мнению, ответ на вопрос, могут ли машины выполнять то, что выполняем мы, остается открытым. Впрочем, решение можно попытаться найти, пообщавшись с программами-роботами в интернете. Сегодня на просторах всемирной паутины их видимо-невидимо: от онлайн-игр до социальных сетей. Если бы Алан Тьюринг оказался в XXI веке, он бы обязательно организовал подобный наглядный опыт.

Словосочетание «тест Тьюринга» правильнее использовать для обозначения предложения, которое касается вопроса о том, могут ли машины мыслить. По мнению автора, такая постановка «слишком бессмысленна», чтобы заслуживать обсуждения. Однако если рассмотреть более конкретный вопрос о том, способен ли цифровой компьютер справиться с некоего рода игрой в имитацию, то появляется возможность точного обсуждения. Более того, сам автор считал, что пройдет не слишком много времени - и появятся вычислительные устройства, которые будут в этом очень «хороши».

Выражение «тест Тьюринга» иногда используется в более общем смысле для обозначения некоторых поведенческих исследований присутствия разума, мысли или интеллекта у предположительно разумных субъектов. Так, например, иногда высказывается мнение, что прообраз теста описан в «Дискурсе о методе» Декарта.

Кто придумал тест Тьюринга?

В 1950-м увидела свет работа «Вычислительные машины и интеллект», в которой впервые была предложена идея игры в имитацию. Тот, кто придумал тест Тьюринга, - английский ученый в области информатики, математик, логик, криптоаналитик и биолог-теоретик Алан Мэтисон Тьюринг. Его модели позволили формализовать концепции алгоритма и вычислений, а также внесли вклад в теории искусственного интеллекта.

Игра в имитацию

Тьюринг описывает следующий вид игры. Предположим, есть человек, машина и лицо, задающее вопросы. Интервьюер находится в комнате, отделенной от остальных участников, которые проходят тест Тьюринга. Цель теста состоит в том, чтобы задающий вопросы определил, кто является человеком, а кто машиной. Интервьюеру оба испытуемых известны под метками X и Y, но по крайней мере в начале ему неизвестно, кто скрывается за меткой Х. В конце игры он должен сказать, что Х - это человек, а Y - это машина, или наоборот. Интервьюеру разрешено задавать испытуемым вопросы теста Тьюринга следующего вида: «Ну будет ли Х любезен сказать мне, играет ли Х в шахматы?» Тот, кто является Х, должен отвечать на вопросы, адресованные Х. Цель машины состоит в том, чтобы ввести в заблуждение спрашивающего, и тот ошибочно сделал вывод о том, что она - человек. Человек же должен помочь установить истину. Об этой игре Алан Тьюринг в 1950 году сказал: «Я считаю, через 50 лет можно будет запрограммировать компьютеры с объемом памяти около 10 9 таким образом, что они успешно смогут играть в имитацию, и средний интервьюер с вероятностью, превышающей 70%, за пять минут не будет в состоянии угадать, кто является машиной».

Эмпирический и концептуальный аспекты

Существует как минимум два вида вопросов, которые возникают относительно предсказаний Тьюринга. Во-первых, эмпирический - правда ли, что уже есть или вскоре появятся компьютеры, способные играть в имитацию настолько успешно, что средний интервьюер с вероятностью, не превышающей 70%, сделает правильный выбор в течение пяти минут? Во-вторых, концептуальный - правда ли, что если бы средний интервьюер после пяти минут допроса с вероятностью менее 70% правильно идентифицировал человека и машину, то мы должны сделать вывод, что последняя демонстрирует некоторый уровень мышления, интеллекта или разума?

Конкурс Лебнера

Мало кто сомневается, что Алан Тьюринг был бы разочарован положением дел с игрой в имитацию к концу ХХ века. Участники конкурса Лебнера (ежегодного мероприятия, в ходе которого компьютерные программы подвергаются тесту Тьюринга) далеки от стандарта, представленного основоположником информатики. Беглый взгляд на протоколы участников за последние десятилетия показывает, что машину можно легко обнаружить с помощью не очень изощренных вопросов. Более того, наиболее успешные игроки постоянно заявляют о сложности конкурса Лебнера по причине отсутствия компьютерной программы, которая бы могла вести достойный разговор в течение пяти минут. Общепризнанным является факт, что конкурсные приложения разрабатываются исключительно с целью получения малого приза, присуждаемого лучшему участнику года, и на большее они не рассчитаны.

Тест Тьюринга: прохождение затягивается?

К середине второго десятилетия XXI века ситуация почти не изменилась. Правда, в 2014 г. возникли претензии на то, что компьютерная программа Eugene Goostman прошла тест Тьюринга, когда она обманула 33% судей в соревновании 2014 г. Но были и другие разовые соревнования, в которых были достигнуты аналогичные результаты. Еще в 1991 году PC Therapist ввел в заблуждение 50% судей. И в демонстрации 2011 г. Cleverbot имел даже более высокий показатель успеха. Во всех этих трех случаях продолжительность процесса была очень мала, и результат не был надежен. Ни один из них не дал веских оснований полагать, что средний интервьюер с вероятностью более 70% правильно идентифицирует отвечающего в течение 5-минутного сеанса.

Метод и прогноз

Кроме того, и это гораздо важнее, необходимо различать тест Тьюринга и предсказание, которое он сделал о его прохождении к концу ХХ века. Вероятность правильной идентификации, интервал времени, в течение которого происходит испытание, и количество необходимых вопросов являются регулируемыми параметрами, несмотря на их ограничение конкретным прогнозом. Даже если основоположник информатики был очень далек от истины в предсказании, которое он сделал о ситуации с искусственным интеллектом к концу ХХ века, вполне вероятна справедливость предложенного им метода. Но прежде чем одобрить тест Тьюринга, следует рассмотреть различные возражения, которые необходимо учесть.

Обязательно ли уметь говорить?

Некоторые люди считают тест Тьюринга шовинистическим в том смысле, что он признает разум только в объектах, которые способны поддерживать беседу с нами. Почему не могут существовать разумные объекты, неспособные вести разговор, или, во всяком случае, беседу с людьми? Возможно, мысль, стоящая за этим вопросом, верна. С другой стороны, можно предположить наличие квалифицированных переводчиков для любых двух интеллектуальных агентов, говорящих на разных языках, позволяющих вести любой разговор. Но в любом случае обвинение в шовинизме совершенно к делу не относится. Тьюринг утверждает лишь то, что если что-то может вести беседу с нами, то у нас есть веские основания полагать наличие у него сознания, подобного нашему. Он не говорит, что только способность вести беседу с нами свидетельствует о потенциальном обладании разумом, похожем на наш.

Почему так легко?

Другие считают тест Тьюринга недостаточно требовательным. Существуют анекдотичные доказательства того, что совершенно бестолковые программы (например, ELIZA) могут казаться обычному наблюдателю обладателями интеллекта в течение достаточно продолжительного времени. Кроме того, за такое короткое время, как пять минут, вполне вероятно, что почти все интервьюеры могут быть обмануты хитрыми, но совершенно неразумными приложениями. Однако важно помнить, что программа тест Тьюринга не может пройти, обманув «простых наблюдателей» в иных условиях, чем те, в которых проверка должна происходить. Приложение должно быть в состоянии выдержать допрос того, кто знает, что один из двух других участников беседы является машиной. Кроме того, программа должна выдерживать такой допрос с высокой степенью успешности после многократного числа испытаний. Тьюринг не упоминает о том, какое конкретно количество тестов потребуется. Однако можно смело предположить, что их число должно быть достаточно большим, чтобы можно было говорить о среднем значении.

Если программа способна на это, то кажется правдоподобным утверждение, что мы, по крайней мере предварительно, будем иметь основания предполагать присутствие интеллекта. Возможно, стоит подчеркнуть еще раз, что может существовать умный субъект, в том числе и умный компьютер, тест Тьюринга пройти не сумевший. Можно допустить, например, существование машин, которые отказываются лгать по моральным соображениям. Поскольку предполагается, что участник-человек должен делать все возможное, чтобы помочь интервьюеру, то вопрос «Вы - машина?» позволит быстро отличить таких патологически правдивых субъектов от людей.

Почему так сложно?

Есть и сомневающиеся в том, что машина когда-либо сможет пройти тест Тьюринга. Среди выдвигаемых ими аргументов - различие времени распознавания слов на родном и иностранном языке у людей, способность ранжировать неологизмы и категории и наличие других особенностей человеческого восприятия, которые трудно симулировать, но которые несущественны для наличия разума.

Почему дискретная машина?

Еще одним спорным аспектом работы теста Тьюринга является то, что его обсуждение ограничено «цифровыми компьютерами». С одной стороны, очевидно, что это важно лишь для прогноза, а не касается подробностей самого метода. Действительно, если тест достоверный, то он подойдет для любой сущности, в том числе для животных, инопланетян и аналоговых вычислительных устройств. С другой стороны, весьма спорно утверждение о том, что «думающие машины» должны быть цифровыми компьютерами. Также вызывает сомнения то, что так полагал сам Тьюринг. В частности стоит отметить, что седьмое возражение, рассматриваемое им, касается возможности существования машин непрерывных состояний, которые автор признает отличными от дискретных. Тьюринг утверждал, что даже если мы являемся автоматами непрерывных состояний, то дискретная машина сможет хорошо подражать нам в игре в имитацию. Однако кажется сомнительным, что его соображения достаточны для того, чтобы установить, что при наличии машин непрерывных состояний, прошедших тест, можно сделать дискретный конечный автомат, который также успешно справится с этим испытанием.

В целом, важным моментом представляется то, что хотя Тьюринг признавал наличие значительно более обширного класса машин, помимо дискретных конечных автоматов, он был уверен в том, что правильно спроектированный дискретный автомат может преуспеть в игре в имитацию.

Эмпирический эксперимент, в ходе которого человек общается с компьютерной интеллектуальной программой, которая моделирует ответы как человек.

Предполагается, что тест Тьюринг пройден, если человек при общении с машиной считает, что общается с человеком, а не машиной.

Британский математик Алан Тьюринг в 1950 г. придумал такой эксперимент по аналогии с имитационной игрой, которая предполагает, что 2 человека уходят в разные комнаты, а 3й человек должен понять кто где, общаясь с ними письменно.

Тьюринг предложил такую игру провести с машиной и, если машина сможет ввести в заблуждение эксперта, это будет означать, что машина может думать. Таким образом, классический тест проходит по следующему сценарию:

Человек-эксперт общается через чат с чат-ботом и другими людьми. По окончании общения эксперт должен понять, кто из собеседников был человеком, а кто — ботом.

В наше время тест Тьюринга получил много разных модификаций, рассмотрим некоторые из них:

Обратный тест Тьюринга

Тест заключается в выполнении каких- либо действий для подтверждения, что ты человек. Н-р, мы можем часто сталкиваться с потребностью ввести цифры и буквы в специальное поле с искаженного изображения с набором цифр и букв. Данные действия защищают сайт от ботов. Прохождение данного теста подтверждало бы способность машины воспринимать сложные искаженные изображения, но пока таких не существует.

Тест бессмертия

Тест заключается в максимальном повторении личностных характеристик человека. Считается, что если характер человека максимально качественно скопирован, и его невозможно отличить от источника, то означает, что пройден тест бессмертия.

Минимальный интеллектуальный Signal-тест

Теста предполагает упрощенную форму ответов на вопросы — только да и нет.

Мета-тест Тьюринга

Тест предполагает, что машина «умеет мыслить», если она может создать что-то, что она сама хочет проверить на разумность.

Первое прохождение классического теста Тьюринга зафиксировано 6 июня 2014 года чат-ботом «Женя Густман», разработанным в Санкт-Петербурге. Бот убедил экспертов, что они общаются с 13-летним подростка из Одессы.

В общем, машины уже способны на многое, сейчас много специалистов работают в данном направлении и нас ждут все более интересные вариации и прохождения данного теста.

"Eugene Goostman" удалось пройти тест Тьюринга и убедить 33% судей в том, что с ними общается не машина. Программа выдавала себя за триннадцатилетнего мальчика по имени Евгений Густман из Одессы и смогла убедить беседовавших с ней людей в том, что выдаваемые ею ответы принадлежат человеку.

Тест проходил в Лондонском королевском обществе, его проведение организовал Университет Рединга, Великобритания. Авторами программы являются российский инженер Владимир Веселов, проживающий в настоящее время в США, и украинец Евгений Демченко, который живёт сейчас в России.

Как программа "Евгений Густман" прошла тест Тьюринга?

В субботу 7 июня 2014 года суперкомпьютер по имени Eugene попытался воссоздать интеллект тринадцатилетнего подростка - Евгения Густмана.

В тестировании, организованном Школой системной инженерии при Университете Рединга (Великобритания), участвовали пять суперкомпьютеров. Испытание представляло собой серию пятиминутных письменных диалогов.

Разработчикам программы удалось подготовить бота ко всем возможным вопросам и даже обучить его собирать примеры диалогов через Twitter. Кроме того, инженеры наделили героя ярким характером. Притворяясь 13-летним мальчиком, виртуальный «Евгений Густман» не вызывал сомнений у экспертов. Они поверили в то, что мальчик может не знать ответы на многие вопросы, ведь уровень знаний у среднего ребёнка существенно ниже, чем у взрослых. При этом его правильные и точные ответы списывали на необычную эрудицию и начитанность.

В тесте участвовали 25 «скрытых» людей и 5 чат-ботов. Каждый из 30-ти судей провёл по пять чат-сессий, пытаясь определить реальную природу собеседника. Для сравнения, в традиционном ежегодном конкурсе программ искусственного интеллекта на премию Лёбнера* участвует всего 4 программы и 4 скрытых человека.

Впервые программа с «юным одесситом» появилась ещё в 2001 году. Однако лишь в 2012 году она показала действительно серьёзный результат, убедив 29 % судей.

Данный факт доказывает, что в скором будущем, появятся програмы, которые будут способны без проблем пройти тест Тьюринга .

ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ

Тест Тьюринга известен каждому человеку, интересующемуся искусственным интеллектом. Его сформулировал в 1938 г. Алан Тьюринг в статье “Может ли машина мыслить?”. Тест заключается в следующем. Экспериментатор общается с собеседником, не видя его (например, по компьютерной сети), набирая фразы на клавиатуре и получая текстовый ответ на мониторе. Затем он пытается определить, с кем вел разговор. Если экспериментатор принимает компьютерную программу за человека, значит, она прошла тест Тьюринга и может считаться интеллектуальной.

Золотую медаль получит все же человек

Наиболее известной программой, еще в 60-х годах показавшей реальную возможность прохождения этого теста, стала легендарная ELIZA. Она была создана в 1966 г. учеными Виноградом, Вейценбаумом и Колби. ELIZA находила в фразе ключевые слова (например, “мать”) и выдавала шаблонную просьбу, механически на эти слова реагируя (“Расскажите побольше о вашей матери”). В дальнейшем Тодди Виноград на основе ELIZA создал более совершенный вариант “Психотерапевт”. Появление ELIZA вошло в историю искусственного интеллекта наряду с такими событиями, как выпуск первого промышленного робота в 1962 г. или начало финансирования Пентагоном разработок в области распознавания образов и речи в 1975-1976 гг.

В 1991 г. впервые состоялся частный, но весьма солидный турнир по прохождению теста Тьюринга, на который были приглашены авторы подходящих компьютерных программ (называемых ботами). Этот турнир основал Хью Лебнер (www.loebner.net/Prizef/loebner-prize.html). За победу в нем полагались приз в размере 100 тыс. долл. и золотая медаль.

Пока главный приз не достался никому. Однако в 1994 г. Лебнер внес серьезные изменения в правила, потребовав, чтобы программа общалась с судьей не только в текстовом формате, но и путем генерации изображения виртуального человека. Она также должна уметь синтезировать и распознавать речевую информацию. Эти условия многие сочли крайне трудными, и до сих пор претендентов на главный приз по новым правилам не появилось. А за победу в старом, “текстовом” режиме теперь обещаны 25 тыс. долл. и серебряная медаль. Надо отметить, что вероятность субъективной ошибки судьи при общении с программой по старым правилам достаточно высока. Кроме того, боты совершенствуются довольно-таки быстро, и мы наверняка дождемся в ближайшие годы победителя в тесте Тьюринга.

Судейство на конкурсе очень строгое. Эксперты заранее готовятся к турниру и подбирают весьма заковыристые вопросы, чтобы понять, с кем же они общаются. Их разговор с программами напоминает допрос следователя. Судьи любят, например, повторять некоторые вопросы через определенное время, так как слабые боты не умеют следить за историей диалога и их можно поймать на однообразных ответах.

Но и разработчики не теряют времени даром, настраивая своих виртуальных подопечных таким образом, чтобы на провокационные вопросы типа “вы машина или человек?” программа весьма убедительно отвечала: “Конечно, человек!”.

8 ноября 1991 г. в Бостонском компьютерном музее восемь программ вступили в схватку с живыми экспертами. Результат был ошеломляющим. Пять из десяти судей решили, что под псевдонимом Whimsical Conversation скрывается человек. На самом деле это была программа Therapist, работавшая под управлением IBM PC 386 и созданная в 1986 г. на основе легендарной ELIZA Джозефом Вейнтраубом, специалистом по психологии. Впрочем, такой результат во многом связан со скептицизмом и предубеждением экспертов, считавших, что программы общаются на гораздо более примитивном уровне, чем это было в реальности. В дальнейшем судьи освоились с компьютерной манерой общения, и столь успешного результата ботам с тех пор достичь не удалось.

Первоначально Therapist состояла из семи модулей, написанных на Си, Turbo-Prolog и QuickBasic. Позже она была дополнена системой синтеза речи и базой знаний. Программа использует словарь из 70 000 слов и запоминает все, что ей рассказывают, используя эту информацию в следующих диалогах и подстраиваясь под интересы конкретного собеседника. Therapist выигрывала приз Лебнера еще в 1992, 1993 и 1995 гг. Затем она была усилена специализированными модулями, способными поддерживать разговоры на темы “мужчина против женщины” и “либералы против консерваторов”.

Вот пример из одного ее победного диалога:

Судья: Do you think that American soldiers should go to Bosnia?

Therapist: I think that what clinton has done in sending 20,000 peacekeepers to bosnia will ensure a lasting peace.

Судья: Do you think most Americans feel the way you do?

Therapist: What did you mean when you said do you think that american soldiers should go to bosnia? Did anyone ever tell you that you think too much? Oh, I think most americans feel the way i do?

В 1994 г. победу в турнире одержал Томас Вайлен, доктор экспериментальной психологии, специализирующийся на изучении естественных языков. Его программа TIPS была обучена хранить и анализировать фразы (в базе их было несколько тысяч) и выполнять поиск по лексическим шаблонам.

В 1996 г. бронзовую медаль получил Джейсон Хатченс и его бот SEPO, который общался примерно так:

Судья: I think. I do research. I write. I love. I Live.

SEPO: I wonder whether you think sometimes! I am feeling like the judge here!

В 1997 г. чемпионом стал Дэвид Леви с ботом Converse. В 1998-м и 1999-м победы добивался Робби Гарнет, считающий, что прохождение теста Тьюринга не требует реального интеллекта. Интересно, что почти все авторы, упоминая о научных подходах к обучению (нейронные сети, генетические алгоритмы), обходились в своих решениях достаточно простыми эвристическими методами.

Гарнет выставил на состязание программу Computational Behaviorist, основанную на принципе “стимул - реакция”, схожем с тем, что заложен в TIPS и ELIZA. Только его бот искал не одно, а до трех ключевых слов в фразе. В то же время, понимая, что от программы требуется нечто большее, чем однообразный ответ на вопросы, он встроил в нее ряд дополнительных эвристических алгоритмов, создававших более полную иллюзию общения с человеком.

В ходе разработки Behaviorist возникли технические трудности, связанные со сложностью реализации поиска знаний в крупных по тем временам базах, что приводило к заметным временны’м задержкам в общении, сразу выдававшим компьютерного собеседника. Поэтому Гарнет объединил два общедоступных бота - Albert, написанный на С++, и одну из Паскаль-версий ELIZA и реализовал их в среде разработки Visual DataFlex, позволявшей пользоваться стандартными алгоритмами запросов к БД.

В 2000-м и 2001 г. малый приз доставался программе ALICE Ричарда Уоллеса. Сегодня на базе ALICE организован фонд ALICE AI Foundation (http://alice.sunlitsurf.com/), занимающийся стандартизацией деятельности по созданию ботов. В частности, ALICE дополнена средствами поддержки БД в формате AIML (Artificial Intelligence Markup Language) - подмножестве XML, нацеленном на формализацию представления ключевых фраз и ответов. Теперь любой желающий, незнакомый с программированием, может взять базовый вариант ALICE и наполнить его собственной базой знаний на любом языке, используя обычный редактор.

К сожалению, летом этого года, как сообщило издание Wired, у г-на Уоллеса начались проблемы с психикой (он угрожал одному из своих коллег-профессоров физической расправой, утверждая, что в ряде американских университетов процветает коррупция и в отношении Уоллеса преподавательским составом задуман масштабный заговор). Пока ученый находится под следствием.

Одним из наиболее вероятных претендентов на победу в текущем году (турнир пройдет в октябре) считается Смит Джошуа, автор программы Anna (AIML-расширение ALICE, свободно доступное на сайте http://annabot.sourceforge.net/). Г-н Джошуа отмечает, что в отличие от своих коллег он с самого начала создавал бот, выдающий себя в процессе общения за человека. Anna действительно считает себя живым существом, обладает набором индивидуальных качеств и достаточно бойко ведет разговор.

Есть ли подобные российские разработки - боты, способные общаться на русском языке? Редакция PC Week/RE готова провести российский конкурс на прохождение теста Тьюринга. Напишите автору по адресу: [email protected]