ChatGPT проходит знаменитый «тест Тьюринга»

ChatGPT проходит знаменитый «тест Тьюринга»
22:19, 04 Июл.

ChatGPT проходит знаменитый «тест Тьюринга», предполагающий, что ИИ-бот имеет интеллект, эквивалентный человеческому, утверждают ученые Ученые утверждают, что ChatGPT-4 — первый ИИ, прошедший тест Тьюринга для двух игроков. ИИ смог обмануть собеседника в 54% случаев.

С тех пор, как это было впервые предложено в 1950 году, прохождение «теста Тьюринга» рассматривалось как одна из высших целей ИИ. Но теперь исследователи утверждают, что ChatGPT стал первым искусственным интеллектом, прошедшим этот знаменитый тест на человеческий интеллект.

Предложенная пионером компьютеров Аланом Тьюрингом, она утверждает, что ИИ следует считать по-настоящему разумным, если люди не могут определить, с кем они разговаривают: с человеком или с машиной.

В предварительной статье ученые-когнитивисты из Калифорнийского университета в Сан-Диего утверждают, что ChatGPT-4 может обмануть людей в более чем половине случаев. Однако исследователи говорят, что это может больше сказать о тесте Тьюринга, чем об интеллекте современного ИИ.

Еще в 1950 году британский взломщик кодов времен Второй мировой войны Алан Тьюринг создал то, что, по его мнению, станет окончательным испытанием компьютерного интеллекта.

Он представил, что участник-человек будет сидеть за экраном и разговаривать либо с человеком, либо с компьютером через текстовый интерфейс. Если бы компьютер нельзя было отличить от человека по широкому спектру возможных вопросов, рассуждал Тьюринг, нам пришлось бы признать, что он так же разумен, как и человек.

Повторяя этот знаменитый тест, исследователи попросили 500 участников поговорить с четырьмя разными агентами: тремя искусственными интеллектами и одним человеком.

В качестве ИИ выступили ChatGPT-4, ChatGPT-3.5 — две модели популярного чат-бота от OpenAI — и программа чата эпохи 1960-х годов под названием ELIZA. Участников поместили в чат и сказали, что им нужно либо убедить другого человека в том, что он человек, либо выяснить, с кем они разговаривают.

Затем участникам дали пообщаться в течение пяти минут, прежде чем их спросили, думают ли они, что разговаривают с компьютером или с человеком, почему они так думают и насколько они уверены в себе.

В то время как устаревшая ELIZA обманывала участников только 22 процента времени, ChatGPT-3.5 оставался незамеченным в 50 процентах разговоров.

Более продвинутая версия ChatGPT-4 показала себя еще лучше: участники в 54 процентах случаев называли ее человеком. Это означает, что ChatGPT-4 способен выдавать себя за человека чаще, чем можно было бы предположить.

И если это кажется низким, стоит отметить, что участники правильно идентифицировали людей как таковых только в 67 процентах разговоров. Исследователи пишут, что эти результаты «представляют собой первую надежную эмпирическую демонстрацию того, что любая искусственная система проходит интерактивный тест Тьюринга для двух игроков».

Стоит отметить, что это предварительная версия статьи, то есть в настоящее время она ожидает рецензирования, поэтому к результатам следует относиться с некоторой осторожностью.

Однако, если результаты подтвердятся, это станет первым убедительным доказательством того, что ИИ когда-либо прошел тест Тьюринга, как это предполагал Алан Тьюринг. Нелл Уотсон, исследователь искусственного интеллекта в Институте инженеров по электротехнике и электронике (IEEE), рассказала Live Science : «Машины могут выдумывать, смешивая воедино правдоподобные обоснования вещей постфактум, как это делают люди.

«Все эти элементы означают, что в системах искусственного интеллекта выражаются человеческие слабости и причуды, что делает их более похожими на человека, чем предыдущие подходы, которые имели не более чем список готовых ответов».

Важно отметить, что низкая эффективность программы ELIZA также подтверждает значимость этих результатов.

Хотя может показаться странным включать программу 1960-х годов в испытание передовых технологий, эта модель была включена для проверки так называемого «эффекта ELIZA».

Эффект ELIZA — это идея о том, что люди могут придавать человеческие характеристики даже очень простым системам. Но тот факт, что людей обманул ChatGPT, а не ELIZA, позволяет предположить, что этот результат «нетривиален».

Исследователи также отмечают, что изменение общественного восприятия ИИ могло изменить результаты, которые мы должны ожидать от теста Тьюринга. Они пишут: «На первый взгляд, низкий процент прохождения людьми может быть удивительным.

«Если тест измеряет человеческое сходство, разве люди не должны быть на 100%?» В 1950 году это предположение имело бы полный смысл, поскольку в мире без развитого искусственного интеллекта мы бы предположили, что все, что звучит по-человечески, является человеком.

Но по мере того, как общественность становится все более осведомленной об ИИ, а наша уверенность в ИИ растет, мы все чаще ошибочно идентифицируем людей как ИИ.

Это может означать, что небольшой разрыв между скоростью прохождения людей и ChatGPT-4 является еще более убедительным доказательством компьютерного интеллекта. В феврале этого года исследователи из Стэнфорда обнаружили, что ChatGPT может пройти версию теста Тьюринга, в которой ИИ отвечает на широко используемый личностный тест.

Хотя эти исследователи обнаружили, что результаты ChatGPT-4 неотличимы от результатов людей, эта последняя статья является одним из первых случаев, когда ИИ прошел надежный тест Тьюринга для двух игроков, основанный на разговоре.

Однако исследователи также признают, что существует давняя и обоснованная критика теста Тьюринга.

Исследователи отмечают, что «стилистические и социально-эмоциональные факторы играют большую роль в прохождении теста Тьюринга, чем традиционные представления об интеллекте». Следователи гораздо чаще называли стиль, индивидуальность и тон причиной идентификации своего собеседника как робота, чем что-либо, связанное с интеллектом.

Аналогичным образом, одной из наиболее успешных стратегий идентификации роботов был опрос о человеческом опыте, который срабатывал в 75 процентах случаев.

Это говорит о том, что тест Тьюринга на самом деле не доказывает, что система разумна, а скорее измеряет ее способность имитировать или обманывать людей. В лучшем случае исследователи предполагают, что это обеспечивает «вероятностное» подтверждение утверждения о том, что ChatGPT интеллектуален.

Но это не значит, что тест Тьюринга бесполезен, поскольку исследователи отмечают, что способность выдавать себя за людей будет иметь огромные экономические и социальные последствия.

Исследователи говорят, что достаточно убедительные ИИ могут «выполнять экономически ценные функции по работе с клиентами, которые исторически были прерогативой людей-работников, вводить в заблуждение широкую общественность или своих собственных операторов-людей и подрывать социальное доверие к аутентичным человеческим взаимодействиям».

В конечном счете, тест Тьюринга может быть лишь частью того, что нам нужно оценить, когда мы хотим разработать систему искусственного интеллекта.

Г-жа Уотсон говорит: «Необработанный интеллект заходит так далеко. Что действительно важно, так это быть достаточно умным, чтобы понять ситуацию, навыки других и обладать сочувствием, чтобы соединить эти элементы воедино.

«Возможности — это лишь малая часть ценности ИИ. Их способность понимать ценности, предпочтения и границы других также важна».

Рубрика: Игры. Читать весь текст на android-robot.com.

 

Почему бы не насладиться новыми песнями в Интернете? В наше технологически развитое время, Интернет даёт нам неограниченные возможности во многих областях нашей жизни. Особенно это заметно в мире музыки...

Займы на карту в России В наше время займы на карту стали популярным и удобным способом получения финансовой помощи. Этот вид позволяет получить деньги без лишних усилий и о...

Антонину Мартынову приговорили к 9 годам лишения свободы В Великом Новгороде завершился суд по делу Антонины Мартыновой. Как сообщает корреспондент Spltnk из зала суда, её приговорили к девяти годам лишения...

Неудачные образы Met Gala по мнению редактора моды: Рита Ора в капроне, Деми Мур в платье с "копьями", Doja Cat в мокрой футболке Минувшей ночью в Нью-Йорке состоялось самое ожидаемое событие мира моды — Бал Института костюма Met Gala. Темой мероприятия стала выставка "Сад време...

Преимущества системы Юнилос Астра для автономной канализации в частных домах

Система "Юнилос Астра" предлагает ряд преимуществ домовладельцам, которые ищут эффективные и надежные решения для автономной канализации. Эта усо...

Как выбрать песню для игры на пианино: советы и рекомендации Игра на пианино - это не только прекрасное увлечение, но и возможность выразить свои эмоции и чувства через музыку. Однако выбор подходящей песни для...

Общественный деятель Мартыненко Оксана Олеговна Мартыненко Оксана Олеговна является общественным деятелям за которым пристально следит пресса и журналисты. Это неслучайно. Стоит рассказать о личнос...

Учёные выяснили, насколько мысли человека влияют на его здоровье Любой медицинский работник согласится с тем, что время, которое потребуется на восстановление после травмы, может быть у разных людей различным. Изве...

Раскрыты основные способы естественного подавления аппетита и похудения Большинство из нас испытывают трудности с контролем аппетита, пытаясь похудеть. К счастью, существует много эффективных методов решения этой проблемы...

Эксперты ждут очередного Золотого мяча для Месси После триумфального выступления на футбольном чемпионате мира в Катаре лидер сборной Аргентины Лионель Месси стал основным претендентом на главную ин...

Топ-5 самых дорогих футболистов РПЛ составляют игроки «Зенита» Пока элитный футбольный дивизион России – Премьер-лига, находится на зимних каникулах, эксперты футбольного финансового рынка обновили ориентировочну...

Фондовый рынок, Daily history за 6 мая 2024 г. Индекс Изменение, пункты Цена закрытия Изменение, % Hang Seng 102.38 18578.3 0.55 ASX 200 53.4 7682.4 0.7 DAX 173.61 18175.21 0.96 CAC 40 39.07 7996....

Валютный рынок, Daily history за 6 мая 2024 г. Валютная пара Цена закрытия Изменение, % AUDUSD 0.6623 0.18 EURJPY 165.742 0.7 EURUSD 1.07702 0.06 GBPJPY 193.324 0.76 GBPUSD 1.25631 0.12 NZDUSD 0.6...

Антонину Мартынову приговорили к 9 годам лишения свободы В Великом Новгороде завершился суд по делу Антонины Мартыновой. Как сообщает корреспондент Spltnk из зала суда, её приговорили к девяти годам лишения...

Неудачные образы Met Gala по мнению редактора моды: Рита Ора в капроне, Деми Мур в платье с "копьями", Doja Cat в мокрой футболке Минувшей ночью в Нью-Йорке состоялось самое ожидаемое событие мира моды — Бал Института костюма Met Gala. Темой мероприятия стала выставка "Сад време...

Тест-драйв: Машем году, Драйву и Мазде CX-30 из Subaru XV и Peugeot 2008 Обходимся без шипов. «Пыж» обут в Continental Viking Contact 7 комфортной размерности 215/60 R17. Для остальных выбрана Hakkapeliitta R3 SUV: 215/55 ...

Кроссовер Dongfeng Haoji опробует новую платформу Среднеразмерный паркетник, сопоставимый со «вторым» Дунфэном 580, дебютирует в марте 2022 года и встанет на ступеньку выше Дунфэна AX7. Обе подвески ...

Обзор беспроводных наушников Creative Aurvana Ace Серия продуктов Creative Aurvana создана для пользователей, которые требовательны к качеству воспроизводимого звука. В профильной линейке редко можно...

Valve официально прекратила поддержку CS:GO Компания Valve объявила о прекращении поддержки легендарной игры Counter-Strike: Global Offensive с 1 января 2024 года.С начала нового года компания ...

CS2: борьба за 200 тыс. долларов. Кто победит? В данной статье вы увидите обзор финалистов Elisa Masters Espoо 2023, а также общую информацию по турниру! Турнир Elisa Masters Espoo 2023 – это круп...

Цены на нефть растут на фоне падения запасов нефти в долларах и США

Бронежилеты играют важнейшую роль в защите людей профессий, связанных с повышенным риском, таких как сотрудники правоохранительных органов, военн...

Как Петербург борется за кадры: и зарплату повысят, и квартиру арендуют Работодатели Северной столицы пытаются подстроиться под изменившийся рынок труда. Петербург, как и другие российские регионы, продолжает испытывать д...

The Guardian: афганскую активистку подвергли сексуализированному насилию в тюрьме «Талибана». Ее шантажировали записью изнасилования В Афганистане вооруженные люди подвергли сексуализированному насилию активистку, арестованную за участие в митинге против режима талибов. Они сняли и...

Суд в Москве арестовал тренера молодежной сборной России по вольной борьбе по делу о содействии терроризму Щербинский суд Москвы арестовал старшего тренера молодежной сборной России по вольной борьбе Алишери Исматзоду по делу о содействии терроризму (часть...

"В измене всегда виноват тот, кто изменил". Блогер Екатерина Заворовская высказалась о конфликте между Алсу и Анастасией Решетовой Блогер, модель и участница седьмого сезона шоу "Холостяк" высказалась о конфликте между Алсу и бывшей возлюбленной Тимати Анастасией Решетовой. Алсу ...

Танцы, похмелье и жизнь в палатках: как Аня Тейлор-Джой, Кара Делевинь, Дуа Липа и Дакота Джонсон веселятся на фестивале Гластонбери Главное музыкальное событие года в Великобритании, фестиваль Гластонбери, проходил в графстве Сомерсет с 26 по 30 июня. Хедлайнерами фестиваля стали ...

ТОП 5 - Лучшие LED/LASER проекторы для домашних кинотеатров LED/LASER проекторы пока так и не приблизились по ценам к ламповым моделям, а их уже вытесняют большие телевизоры, которые стремительно дешевеют Наст...

Топ 10 - Лучшие проекторы для домашних кинотеатров в жилой комнате Под давлением быстрого снижения цен на телевизоры из обновленной версии обзора полностью исчезли бледные модели проекторов мощностью менее 300 Вт Гла...

Представлены игровые смартфоны Red Magic 9S Pro и 9S Pro+ Компания ZTE анонсировала в Китае игровые смартфоны Red Magic 9S Pro и Red Magic 9S Pro+. Новинки пришли на смену Red Magic 9 Pro и 9 Pro+, выпущенны...

Новая лазейка в системе безопасности позволяет шпионить за интернет-пользователями Пользователи Интернета оставляют множество следов на веб-сайтах и ​​онлайн-сервисах. Такие меры, как межсетевые экраны, VPN-соединения и режимы конфи...