Многие люди утверждают, что тест Тьюринга не дает подходящей цели для исследований в области искусственного интеллекта. Например, вопросы в тесте ограничены и часто основаны на очень специфических областях знаний. Это может затруднить прохождение теста машиной.
Некоторые люди также утверждают, что тест Тьюринга недостаточно требователен. Например, они предположили, что машина может выполнить ряд действий, которые помогут ей пройти тест.
Тест Тьюринга — это способ определить, обладает ли машина искусственным интеллектом (AI). Он был изобретен Аланом Тьюрингом, английским специалистом по информатике и математику. Тест заключается в том, что человека помещают в одну комнату, а машину — в другую. Затем судья задает вопросы каждому из них и пытается определить, кто из них человек, а кто машина. Машина проходит тест Тьюринга, если ей удается обмануть судью, заставив его поверить, что это человек.
Однако тест Тьюринга имеет ряд ограничений. Очень сложно вынести окончательное суждение об ИИ, основываясь только на результатах теста. Более того, опрос ограничивается разговорами на иностранном языке и не учитывает другие важные аспекты человеческого интеллекта, такие как восприятие, умение решать проблемы и принимать решения. Кроме того, на результаты теста влияют пристрастия и предпочтения участвующих в нем судей.Некоторые эксперты считают, что тест Тьюринга устарел из-за достижений в области технологий искусственного интеллекта, таких как обработка естественного языка. Например, недавно Google создала чат-бота под названием LaMDA, который, по их мнению, обладал способностью чувствовать. Он способен понимать естественный язык и реагировать соответствующими эмоциями. Тем не менее, многие исследователи ИИ по-прежнему утверждают, что тест Тьюринга должен оставаться критерием для оценки прогресса ИИ. Это связано с тем, что он может дать хорошее представление о том, насколько машина близка к уровню интеллекта человека.
Обратный тест Тьюринга — это тип теста, в котором человек притворяется искусственным интеллектом, чтобы увидеть, насколько хорошо он работает. Это может быть полезно для совершенствования искусственного интеллекта, поскольку может помочь исследователям выяснить, где ему не хватает интеллекта. Это также обеспечивает определенный уровень игривости, который может помочь в продвижении к AGI.
Одним из примеров обратного теста Тьюринга может быть, если чат-боту будут заданы бессмысленные вопросы, такие как «в чем разница между полетом и самолетом?»#8221; или “в чем разница между бейсбольным мячом и лягушкой?” Вопросы такого типа предназначены для того, чтобы затруднить ответ машины. Однако, если машине удается реагировать логичным образом, который имеет смысл, то она, скорее всего, проходит тест.
Другой вариант этого теста называется обратной капчей, которая используется вместо обычной капчи для предотвращения автоматического рассылки спама и других злоупотреблений. Здесь модератор действует как человек, а бот должен убедить их, что он не робот.
Существуют также другие тесты, которые пытаются обнаружить присутствие искусственного интеллекта, включая тест Маркуса, который проверяет понимание телевизионного контента и способность отвечайте на содержательные вопросы по этому поводу. Другие примеры включают тест Лавлейса 2.0, который пытается измерить креативность в вычислительной технике, и тест Winograd Schema Challenge, в котором используются вопросы с множественным выбором.
Хотя многие люди возражают против стандартной интерпретации теста Тьюринга, он все еще может служить эффективным критерием интеллекта. Важно отметить, что этот критерий не направлен на определение интеллекта как такового; он лишь указывает на наличие определенного типа поведения, которое мы склонны ассоциировать с людьми. Например, для машины может быть важно уметь отвечать на вопросы, на которые иначе человек не смог бы ответить. Для машины также может быть важно проявлять эмпатию и признаки эмоционального интеллекта.Однако важно понимать, что Тьюринг пытался найти не такие возможности, когда предлагал имитационную игру. На самом деле, он недвусмысленно предостерегал от предположения, что любая машина, способная пройти тест Тьюринга, в некотором роде разумна. Вместо этого он выступал за более общий подход к изучению когнитивных процессов, который допускал бы различные и даже низшие формы интеллекта, которые, тем не менее, были бы действительными.
К сожалению, похоже, что оригинальные идеи, лежащие в основе теста Тьюринга, были утрачены при переводе. Действительно, публичными конкурсами, основанными на тесте Тьюринга, к которым прилагаются призы, часто манипулируют, чтобы получить результаты, которые не отражают подлинный интеллект. Это не означает, что стандартная интерпретация теста Тьюринга не может быть полезной; но важно, чтобы мы понимали, что существует множество других, более строгих тестов для оценки машинного интеллекта, чем имитационная игра.
Поскольку вычислительные системы продолжают развиваться, могут потребоваться новые решения для определения интеллектуальности. Тест минимального интеллектуального сигнала (Minimum Intelligent Signal Test, или MIST) — это одна из таких оценок, которая призвана смягчить некоторые критические замечания по тесту Тьюринга. В этом тесте используется серия прямых вопросов для оценки способностей ИИ. Эти вопросы разработаны таким образом, чтобы использовать знания, основанные на здравом смысле, что затрудняет ИИ обман судей.
Несмотря на присущие ему ограничения, MIST по-прежнему считается полезным инструментом для оценки способности ИИ демонстрировать интеллект. MIST можно использовать для проверки различных возможностей искусственного интеллекта, включая способность понимать язык и проводить логические различия. Кроме того, MIST также можно использовать для проверки способности компьютера быстро и точно реагировать.Однако у MIST есть свои критики. Некоторые критики утверждают, что тест проверяет только ограниченный диапазон возможностей и не дает достаточной оценки интеллекта машины. Другие отмечают, что MIST основан на наборе правил, которые вряд ли будут применены к реальным системам искусственного интеллекта.Другие критические замечания к MIST включают тот факт, что он основан на логических или двоичных ответах (т.е. да/нет или истина/ложь). Другие отмечают, что тест MIST не учитывает сложность реакции человека. Третьи утверждают, что тест MIST не является подходящей альтернативой тесту Тьюринга, поскольку он не учитывает возможности восприятия.
Обратный минимальный тест интеллектуального сигнала — это способ измерить интеллект ИИ без использования самого теста Тьюринга. Вместо этого специалист, проводящий опрос, задает системе ряд вопросов и оценивает, будут ли ответы даны человеком или нет. Система, которая может дать наиболее последовательные и содержательные ответы, считается интеллектуальной. Этот метод отличается от реального теста Тьюринга тем, что он не требует физического контакта между допрашивающим и испытуемым, а также не использует какой-либо определенный текст или язык.
Этот тип тестирования не лишен противоречий. Хотя это может быть эффективным способом оценки производительности определенных компьютерных систем, он не подходит для измерения всех типов искусственного интеллекта. Например, компьютер, который может успешно одурачить следователя-человека во время допроса, может не считаться судьей разумным, если машина не обладает каким-либо эмоциональным интеллектом или осознанностью.
Существуют и другие способы компьютерной проверки интеллекта, такие как тест Маркуса, тест Лавлейса 2.0 и тест схемы Винограда. Эти тесты фокусируются на различных аспектах интеллекта машины, таких как навыки восприятия и нестандартное мышление. Однако критики этих тестов утверждают, что они недостаточно строгие, чтобы определить, прошел ли ИИ тест Тьюринга.
Некоторые авторы предполагают, что тест Тьюринга является ошибочным потому что он фокусируется только на том, смогут ли обычные судьи при определенном стечении обстоятельств идентифицировать машину (при определенном уровне успеха). Хотя это утверждение справедливо, оно не учитывает тот факт, что может существовать множество различных способов определить, является ли машина интеллектуальной. Другими словами, могут существовать несущественные различия, которые позволяют судьям идентифицировать данный тип машины как таковой (например, количество ошибок, которые она допускает при сложении и вычитании).Хотя есть некоторые критики теста Тьюринга, другие полагают, что он слишком сложный или ограничивающий. Например, есть некоторые авторы, которые утверждают, что, безусловно, логически возможно существование разумных существ, которые не прошли тест Тьюринга, и у них, вероятно, будут те же ответы, что и у Болвана (т.е. что было бы шовинизмом думать, что любой нечеловек не смог бы пройти тест Тьюринга). будьте разумны).Другие критики теста Тьюринга утверждали, что этот тест является пережитком прошлого и что вместо него следует сосредоточиться на том, как сделать взаимодействие человека и машины более интуитивным и эффективным. Это привело к разработке новых тестов, таких как Минимальный интеллектуальный сигнальный тест, который допускает только ответы «да»/»нет» или «истинно/ложно». Существуют также тесты, которые фокусируются на навыках восприятия и умении манипулировать объектами, такие как тест Маркуса, тест Лавлейса 2.0 и Winograd Schema Challenge.