Система искусственного интеллекта превзошла результаты человека в одном из самых сложных в мире тестов на понимание прочитанного — Stanford Question Answering Dataset (SQuAD).
Данный тест, разработанный в Стэнфордском университете (США), содержит 100 тысяч вопросов, основанных на более чем 500 статьях Википедии, и считается самым сложным в области когнитивной обработки текстов. Он привлекает разработчиков из университетов и компаний таких, как Google, Facebook, IBM, Microsoft в Университете Карнеги-Меллона, Стэндфордского Университета и Алленского научно-исследовательского института.
Команды, конкурирующие между собой, должны создавать модели машинного обучения, которые могут дать наиболее точные ответы на все вопросы.
Наиболее высокий балл, установленный человеком в этом тесте, составлял 82.304.
Система глубокой нейронной сети Alibaba (разработка Alibaba Institute of Data Science of Technologies), набрала 82.44 балла, став первой системой искусственного интеллекта, которая превзошла результат человека в этом тесте. Также опередить человечество удалось искусственному интеллекту, разработанному Microsoft. Его результаты - 82.65 балла, однако об этом стало известно только на следующий день после оглашения результатов Alibaba.
Точность системы Alibaba связана с её способностью находить потенциально точные ответы среди абзацев, предложений и слов в тексте. Также технология использует NLP —обработку естественного языка, в процессе которой машины имитируют человеческое понимание слов и предложений.
В течение нескольких лет машины Alibaba отвечали на большое количество входящих запросов от клиентов с использованием системы искуственного интеллекта, параллельно обучаясь.
Исследователи считают, что тесты SQuAD помогут привести к созданию более совершенных роботов и автоматизированных систем, способных решать сложные проблемы и отвечать на сложные вопросы, сформулированные людьми.
ПЕРЕЙДИТЕ В ПОЛНУЮ ВЕРСИЮ