Ученые показали, как существующие ИИ-модели справились с нестандартным тестом (ИНФОГРАФИКА)

Как сообщает «kamysh.press» со ссылкой на материал Epoch AI, вышеописанный тест, получивший название FrontierMath, оказался непосильным для алгоритмов даже наиболее инновационных типов искусственного интеллекта, даже самых «продвинутых».

В частности, FrontierMath сформирован из усложненных математических задач, решить которые не смогли Claude 3.5 (Sonnet), GPT-4 (Orion), o1-preview/-mini и Gemini 1.5 Pro, вопреки открытому доступу к вычислительной среде Python.

Ключевое отличие данного тестирования — задачи являются абсолютно новыми и ранее не публиковавшимися в Сети, то есть нейросети не смогли «подсмотреть» решение.

Наилучший результат у модели от Google — Gemini 1.5 Pro, а расхваленный LLM Grok 2 Beta от Илона Маска вообще не одолел ни с одного уравнения, с чем можно ознакомиться ниже:

Фото — epoch.ai

Ранее мы писали о том, какие навыки получают дети на курсах разработки игр.

Автор: Віталій Шульгін

« Декабрь 2024 »
Пн	Вт	Ср	Чт	Пт	Сб	Вс
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Ученые показали, как существующие ИИ-модели справились с нестандартным тестом (ИНФОГРАФИКА)

Добавить комментарий

Популярные новости

Мария Захарова заявила о неизбежном наказании тех, на ком..

Маргарита Симоньян заявила о важности сохранения Абхазии в качестве..

Сенатор Пушков заявил, что Зурабишвили готовит громкую политическую..

По поручению Путина Савельев займется ликвидацией ЧП в акватории Керчи..

Власти Израиля намерены заселять Голанские высоты..

Обрати Внимание

Избранная Статья

Психология игроков в покер..

Руководство для новичков по игровым автоматам..

Новые комментарии

Наши опросы

Кто стоит за терактом в Крокус Сити Холл в Подмосковье?

Партнеры

Случаные новости

«КамАЗ» вышел на маркетплейсы: грузовик можно купить на Ozon..

Unitree Robotics продемонстрировала способности андроида..

Ульяновский завод точного литья и «Поликом» получат..

Календарь новостей

Категории новостей

Облако тэгов

Премиум спонсор

Похожие новости