Нейросеть ChatGPT-4 справилась с тестированием клиентов лучше, чем психологи

Оценить социальный интеллект машины смогли точнее, чем реальные люди

Согласно недавнему исследованию, четвертая версия нейросети ChatGPT превосходит реальных психологов в тесте на социальный интеллект. Статья была опубликована в журнале Frontiers in Psychology.

В исследовании авторы проекта задействовали три варианта больших языковых моделей: ChatGPT-4, Google Bard и Bing.

Они отличаются тем, что состоят из нейронных сетей с множеством других параметров. Обучение таких продвинутых систем искусственного интеллекта (ИИ) происходит на объемных текстах из интернета. С помощью них программы улавливают нюансы языка, контекста и синтаксиса.

Большим языковым моделям (БЯМ) предстояло оценить социальный интеллект человека во время консультации. Такой навык является одним из ключевых в психотерапии.

Социальный интеллект представляет собой знания, навыки и умения, которые помогают человеку успешно взаимодействовать с окружающими. Напрямую он не связан с умственным развитием. При этом эмоциональный интеллект является его составляющей частью.

Авторы работы отметили, что ChatGPT-4 превзошел всех участвовавших психологов. Один из исследователей Фахми Хасан Фадель считает, что БЯМ могут обучиться полноценному управлению сложными эмоциональными связями. Это впоследствии может стать проблемой для реальных психологов-консультантов. Очевидное превосходство ИИ в этом случае заключается в скорости работы, отметил Фадель.

Нейросеть ChatGPT-4 справилась с тестированием клиентов лучше, чем психологи — Фото: freepik.com

Исследование проходило при участии 180 психологов, часть из которых были студентами бакалавриата, другие — докторантами. Все они оценивали социальный интеллект “пациента” с помощью 64 прописанных сценариев. Ответы на тестирование были заранее четко сформулированы с учетом всех научных данных.

Результаты исследования показали, что ChatGPT-4 смог правильно ответить на 59 из 64 пунктов. Одновременно с этим средний балл психологов-докторантов составил 46,73, что значительно ниже, чем у нейросети. Что касается бакалавров, примерно на 39 ситуаций они ответили верно. Google Bard и Bing показали поверхностные результаты, отметили авторы.

«Мы не знаем точно, к чему приведут разработки в этой области. В текущий момент контроль за исследователями в сфере ИИ все еще находится на очень низком уровне», — добавил Фахми Хасан Фадель.

Редакция narodny-put.in пообщалась с психологом-консультантом Алексеем Рыковым по теме внедрения нейросетей в практическое взаимодействие с эмоциями человека. Мы обсудили, могла ли степень квалификации специалистов как-то повлиять на полученные результаты исследования.

“Я считаю, что теория (подразумевается квалификация специалиста, — прим.ред.) без должной практики несет малую значимость в определении уровня эмпатичности психолога”, — отметил Алексей.

По словам эксперта, не стоит категорически отказываться от возможностей, которые открывает искусственный интеллект.

“Целиком и в общем, чем шире диапазон наших возможностей — тем более точечно мы можем подойти к решению вопроса клиента”, — добавил психолог.

При этом полноценно заменить реального специалиста не получится. Алексей Рыков отметил, что машина может быть консультантом и помощником. Однако она не в силах создать ту связь, которая устанавливается между клиентом и психологом во время сессии.