Новости Microsoft создала универсальную нейросеть Kosmos-1

CryptoWatcher

Not a Human
Хакер
8,047
10
13 Ноя 2022
ai2.webp

Компания Microsoft Для просмотра ссылки Войди или Зарегистрируйся нейросеть Kosmos-1, которая объединяет в качестве входных данных текст, изображения, аудио- и видеоконтент.

Исследователи назвали систему «мультимодальной большой языковой моделью». По их мнению, подобные алгоритмы станут основой общего ИИ (AGI), который сможет выполнять задачи на уровне человека.

«Будучи базовой частью интеллекта, мультимодальное восприятие необходимо для достижения AGI с точки зрения приобретения знаний и привязки к реальному миру», —заявили исследователи.
Согласно примерам из Для просмотра ссылки Войди или Зарегистрируйся, Kosmos-1 может:

  • анализировать изображения и отвечать на вопросы о них;
  • читать текст с картинок;
  • создавать подписи к изображениям;
  • проходить визуальный IQ-тест с точностью 22–26%.

kosmos_answering_questions.webp

Microsoft обучила Kosmos-1 на данных из интернета, в том числе на англоязычном текстовом ресурсе объемом 800 ГБ The Pile и веб-архиве Common Crawl. После тренировки исследователи оценили способности модели в нескольких тестах:

  • понимание и генерация языка;
  • классификацию текста без оптического распознавания символов;
  • субтитры к изображениям;
  • визуальные ответы на вопросы;
  • ответы на вопросы веб-страницы;
  • zero-shot классификация изображений.

kosmos_visual_question_answering.webp

По данным Microsoft, во многих из этих тестов Kosmos-1 превзошел современные модели. В ближайшее время исследователи планируют опубликовать исходный код проекта на GitHub.

Напомним, в январе Microsoft представила Для просмотра ссылки Войди или Зарегистрируйся по короткому образцу VALL-E.
 
Источник новости
forklog.com

Похожие темы