Google научится давать изображениям описания

Современные программы способны сравнивать изображения и находить среди них похожие, а также распознавать имеющиеся на них текст и прочие объекты. Но вот чтобы описывать изображения понятным человеку языком, на такое они не способны. По крайней мере, так было до недавнего времени.

Усовершенствованную технологию распознавания объектов на изображении представили специалисты Стенфордского университета и поискового гиганта Google. Созданная ими система способна не только распознавать объекты на картинке, но и давать описания всей группы, то есть буквально описывать изображённую сцену обычным человеческим языком.

Google

Например, фотографию едущего по грязному треку мотоциклиста, система описывает как «Человек, едущий на мотоцикле по грунтовой дороге», а фото кошки на кровати как «Изображенная крупным планом кошка на диване».

В основе технологии визуального описания лежат два алгоритма, использующие принципы работы нейронных сетей. Первый алгоритм выделяет на изображении отдельные объекты, второй же пытается связать их в некое целое.

Слово «пытается» мы употребили намеренно, поскольку сама система находится в ранней стадии разработки и нередко ошибается. И хотя в ней заложена способность к самообучению, без помощи человека ей не обойтись, к тому же её база данных пока ещё весьма невелика.

Предполагается, что в будущем эта технология найдёт применение в искусственном интеллекте и робототехнике, а пока что это всего лишь концепция, хотя и весьма перспективная.

Photo Anonymizer — инструмент для удаления метаданных EXIF, DICOM, IPTC и XMP из фотографий

Публикуя в интернете сделанные вами фотографии, вы в какой-то мере деанонимизируете себя. Любая фотография — Читать далее

PureRef — оригинальный графический вьювер с нестандартным подходом к управлению

Программ для просмотра графики существует столь много, что уже мало кого можно удивить фишками, встраиваемыми Читать далее

Как включить в параметрах персонализации скрытую опцию установки изображений Spotlight на рабочий стол в Windows 10

Раньше желающим заполучить изображения Windows Spotlight приходилось прибегать к различным трюкам, существовали даже сторонние утилиты, Читать далее

Как повернуть картинку в Microsoft Word

В текстовых документах форматов DOCX, DOC и RTF, загруженных из интернета, иногда встречаются страницы с Читать далее

Оцените Статью:

1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...

2 комментария

  • Роман:

    Я вот думаю, какой бы ни была умной машина, она всегда будет оставаться мертвой железякой, лишенной свободы выбора и самосознания - того, что делает человека человеком.

    Хотя кто знает, возможно в будущем удастся разгадать тайны психического бытия и создать нечто разумное и самостоятельно. Но если это и случится, то наверное уже в лучшем мире.

    • Мы все ближе и ближе по технологиям приближаемся к созданию искусственного интеллекта. И когда нам это удастся – это будет конец человеческой цивилизации :-).

      Кстати в шахматы мы уже не выигрываем у компьютера.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *