Google научится давать изображениям описания

Современные программы способны сравнивать изображения и находить среди них похожие, а также распознавать имеющиеся на них текст и прочие объекты. Но вот чтобы описывать изображения понятным человеку языком, на такое они не способны. По крайней мере, так было до недавнего времени.

Усовершенствованную технологию распознавания объектов на изображении представили специалисты Стенфордского университета и поискового гиганта Google. Созданная ими система способна не только распознавать объекты на картинке, но и давать описания всей группы, то есть буквально описывать изображённую сцену обычным человеческим языком.

Google

Например, фотографию едущего по грязному треку мотоциклиста, система описывает как «Человек, едущий на мотоцикле по грунтовой дороге», а фото кошки на кровати как «Изображенная крупным планом кошка на диване».

В основе технологии визуального описания лежат два алгоритма, использующие принципы работы нейронных сетей. Первый алгоритм выделяет на изображении отдельные объекты, второй же пытается связать их в некое целое.

Слово «пытается» мы употребили намеренно, поскольку сама система находится в ранней стадии разработки и нередко ошибается. И хотя в ней заложена способность к самообучению, без помощи человека ей не обойтись, к тому же её база данных пока ещё весьма невелика.

Предполагается, что в будущем эта технология найдёт применение в искусственном интеллекте и робототехнике, а пока что это всего лишь концепция, хотя и весьма перспективная.

Оцените Статью:

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...
Что делать, если Telegram для Windows не отображает изображения и видео

Популярный мессенджер Telegram доступен в двух версиях — мобильной и десктопной, причем обе версии стабильно ...

Программы для слайд-шоу: есть ли альтернативы PowerPoint?

Нужно сделать презентацию, но классика в виде PowerPoint надоела или не хочется покупать офисный пакет? ...

Как в Microsoft Word изменить заданное по умолчанию место сохранения изображений

Документы Word тем хороши, что могут содержать не только форматированный текст, гиперссылки, таблицы, фигуры и ...

Как в Word сгруппировать и разгруппировать добавленные в документ фигуры

Работая с документами Microsoft Word, вы можете вставлять в текст изображения, графики, смарт-объекты и типовые ...

2 комментария

  • Роман:

    Я вот думаю, какой бы ни была умной машина, она всегда будет оставаться мертвой железякой, лишенной свободы выбора и самосознания - того, что делает человека человеком.

    Хотя кто знает, возможно в будущем удастся разгадать тайны психического бытия и создать нечто разумное и самостоятельно. Но если это и случится, то наверное уже в лучшем мире.

    • Мы все ближе и ближе по технологиям приближаемся к созданию искусственного интеллекта. И когда нам это удастся – это будет конец человеческой цивилизации :-).

      Кстати в шахматы мы уже не выигрываем у компьютера.

Добавить комментарий для Дмитрий Демченко Отменить ответ

Ваш адрес email не будет опубликован.