Что такое информация с точки зрения компьютера

Обновлено: 21.11.2024

Энн Макнамара получает финансирование от Национального научного фонда (NSF). Этот материал основан на работе, поддержанной Национальным научным фондом в рамках гранта № 1253432. Любые мнения, выводы и выводы или рекомендации, выраженные в этом материале, принадлежат авторам и не обязательно отражают точку зрения Национального научного фонда.< /p>

Партнеры

Техасский университет A&M предоставляет финансирование в качестве партнера-основателя The Conversation US.

Представьте, что вы едете в автомобиле и используете проекционный дисплей на лобовом стекле для навигации по незнакомому городу. Это дополненная реальность (AR); эта информация используется не только для того, чтобы направлять вас по маршруту, но и для того, чтобы предупредить вас о важной информации в вашем окружении, например о велосипедистах или пешеходах. Правильное размещение виртуального контента не только имеет решающее значение, но и, возможно, является вопросом жизни и смерти.

Информация не может заслонять другой материал и должна отображаться достаточно долго, чтобы вы могли ее понять, но не слишком долго. Компьютерные системы должны делать эти определения в режиме реального времени, чтобы никакая информация не отвлекала или не мешала. Мы, конечно же, не хотим, чтобы предупреждение о велосипедисте, который собирается перейти дорогу перед автомобилем, скрыло саму велосипедистку!

Как исследователь дополненной реальности, я трачу много времени, пытаясь понять, как отобразить нужную информацию на экране пользователя в нужном месте и в нужный момент. Я понял, что отображение слишком большого количества информации может запутать пользователя, но недостаточное отображение может сделать приложение бесполезным. Нам нужно найти золотую середину.

Оказалось, что ключевым элементом здесь является знание того, куда смотрят пользователи. Только тогда мы сможем доставить нужную им информацию туда, где они смогут ее обработать. Наше исследование включает в себя измерение того, куда смотрит пользователь в реальной сцене, чтобы помочь решить, где разместить виртуальный контент. Поскольку дополненная реальность готова проникнуть во многие сферы нашей жизни — от вождения автомобиля до работы и отдыха, — нам нужно решить эту проблему, прежде чем мы сможем полагаться на дополненную реальность для поддержки серьезных или критических действий.

Определение места размещения информации

Разумно, чтобы информация появлялась там, где ее видит пользователь. Во время навигации пользователь может посмотреть на здание, улицу или другой реальный объект, чтобы открыть соответствующую виртуальную информацию; система будет знать, что нужно скрыть все остальные дисплеи, чтобы не загромождать видимую сцену.

Но откуда мы знаем, что кто-то смотрит? Оказывается, нюансы человеческого зрения позволяют рассмотреть глаза человека и вычислить, куда он смотрит. Сопоставив эти данные с камерами, показывающими поле зрения человека, мы можем определить, что видит человек и на что он смотрит.

Системы отслеживания взгляда впервые появились в 1900-х годах. Первоначально они в основном использовались для изучения моделей чтения; некоторые могут быть очень навязчивыми для читателя. Совсем недавно появилась технология отслеживания взгляда в реальном времени, которая стала более доступной, простой в эксплуатации и компактной.

Эйтрекеры можно прикрепить к экрану или интегрировать в носимые очки или наголовные дисплеи. Глаза отслеживаются с помощью комбинации камер, проекций и алгоритмов компьютерного зрения для расчета положения глаза и точки взгляда на мониторе.

Обычно при анализе данных отслеживания взгляда мы учитываем два показателя. Первый называется фиксацией и используется для описания того, когда мы останавливаем взгляд, часто на интересном месте в сцене, потому что оно привлекло наше внимание. Второй — саккада, одно из быстрых движений глаз, используемое для позиционирования взгляда. По сути, наши глаза быстро бегают с места на место, собирая фрагменты информации о частях сцены. Затем наш мозг объединяет информацию, полученную от этих фиксаций, и формирует в уме зрительный образ.

Сочетание отслеживания взгляда с дополненной реальностью

Часто содержимое дополненной реальности привязано к реальному объекту или местоположению. Например, на этой улице должна отображаться виртуальная метка, содержащая название улицы. В идеале мы хотели бы, чтобы метки дополненной реальности отображались близко к реальному объекту, с которым они связаны. Но мы также должны быть осторожны, чтобы не допустить, чтобы несколько меток AR перекрывались и становились нечитаемыми. Существует множество подходов к управлению размещением меток. Мы изучаем один вариант: вычисление того, куда смотрит человек в реальной сцене, и отображение меток дополненной реальности только в этом месте.

Например, пользователь взаимодействует с мобильным приложением, которое помогает ему покупать низкокалорийные хлопья в продуктовом магазине. В приложении дополненной реальности у каждой крупы есть связанная с ней информация о калориях. Вместо того, чтобы брать в руки каждую коробку с хлопьями и читать содержание питательных веществ, пользователь может поднять свое мобильное устройство и навести его на конкретную коробку с хлопьями, чтобы открыть соответствующую информацию.

Но подумайте о том, как переполнен отдел с хлопьями в магазине с различными упаковками. Без какого-либо способа управления отображением этикеток AR будут отображаться этикетки с информацией о калориях для всех коробок с хлопьями. Было бы невозможно определить калорийность интересующей его каши.

Отслеживая его взгляд, мы можем определить, на какую коробку с хлопьями смотрит пользователь. Затем мы отображаем информацию о калориях для этой конкретной каши. Когда он переводит взгляд на другую коробку, мы показываем цифры для следующей, которую он рассматривает. На его экране нет беспорядка, нужная ему информация всегда доступна, и когда ему нужна дополнительная информация, мы можем ее отобразить.

Этот тип разработки делает время для исследований дополненной реальности захватывающим. Наша способность интегрировать сцены реального мира с компьютерной графикой на мобильных дисплеях улучшается. Это подпитывает перспективу создания потрясающих новых приложений, которые расширяют наши возможности взаимодействовать, учиться и развлекаться в окружающем мире.

Несмотря на то, что были приложены все усилия для соблюдения правил стиля цитирования, могут быть некоторые расхождения. Если у вас есть какие-либо вопросы, обратитесь к соответствующему руководству по стилю или другим источникам.

Наши редакторы рассмотрят то, что вы отправили, и решат, нужно ли пересматривать статью.

информационная система, интегрированный набор компонентов для сбора, хранения и обработки данных, а также для предоставления информации, знаний и цифровых продуктов. Коммерческие фирмы и другие организации полагаются на информационные системы для выполнения своих операций и управления ими, взаимодействия со своими клиентами и поставщиками и конкуренции на рынке. Информационные системы используются для запуска межорганизационных цепочек поставок и электронных рынков. Например, корпорации используют информационные системы для обработки финансовых счетов, для управления своими человеческими ресурсами и для привлечения своих потенциальных клиентов с помощью онлайн-рекламы. Многие крупные компании полностью построены вокруг информационных систем. К ним относятся eBay, преимущественно аукционный рынок; Amazon, расширяющийся электронный торговый центр и поставщик услуг облачных вычислений; Alibaba, торговая площадка для бизнеса; и Google, поисковая компания, которая получает большую часть своего дохода от рекламы по ключевым словам при поиске в Интернете. Правительства внедряют информационные системы для экономически эффективного предоставления услуг гражданам. Цифровые товары, такие как электронные книги, видеопродукция и программное обеспечение, и онлайн-сервисы, такие как игры и социальные сети, поставляются с информационными системами. Люди полагаются на информационные системы, как правило, основанные на Интернете, в значительной части своей личной жизни: для общения, учебы, покупок, банковских операций и развлечений.

По мере того как на протяжении тысячелетий изобретались новые основные технологии записи и обработки информации, появлялись новые возможности, и люди расширяли свои возможности. Изобретение печатного станка Иоганном Гутенбергом в середине 15 века и изобретение механического калькулятора Блезом Паскалем в 17 веке — это лишь два примера. Эти изобретения привели к глубокой революции в способности записывать, обрабатывать, распространять и получать информацию и знания. Это, в свою очередь, привело к еще более глубоким изменениям в жизни людей, организации бизнеса и управлении людьми.

Первой крупномасштабной механической информационной системой был табулятор переписи населения Германа Холлерита. Изобретенная вовремя для обработки данных переписи населения США 1890 года, машина Холлерита стала важным шагом в автоматизации, а также послужила источником вдохновения для разработки компьютеризированных информационных систем.

Одним из первых компьютеров, использовавшихся для такой обработки информации, был UNIVAC I, установленный в Бюро переписи населения США в 1951 году для административного использования и в General Electric в 1954 году для коммерческого использования. Начиная с конца 1970-х годов, персональные компьютеры принесли некоторые преимущества информационных систем малым предприятиям и частным лицам. В начале того же десятилетия Интернет начал свое распространение как глобальная сеть сетей.В 1991 году Всемирная паутина, изобретенная Тимом Бернерсом-Ли как средство доступа к взаимосвязанной информации, хранящейся на глобально рассредоточенных компьютерах, подключенных к Интернету, начала функционировать и стала основной услугой, предоставляемой в сети. Глобальное проникновение Интернета и Сети открыло доступ к информации и другим ресурсам и облегчило формирование отношений между людьми и организациями в беспрецедентных масштабах. Прогресс электронной коммерции через Интернет привел к резкому росту цифрового межличностного общения (через электронную почту и социальные сети), распространения продуктов (программного обеспечения, музыки, электронных книг и фильмов) и деловых операций (покупка, продаж и рекламы в Интернете). С распространением по всему миру смартфонов, планшетов, ноутбуков и других мобильных устройств на базе компьютеров, все из которых связаны беспроводными сетями связи, информационные системы были расширены для поддержки мобильности как естественного человеческого состояния.

Поскольку информационные системы сделали возможной более разнообразную человеческую деятельность, они оказали глубокое влияние на общество. Эти системы ускорили темп повседневной деятельности, позволили людям развивать и поддерживать новые и зачастую более полезные отношения, влияли на структуру и структуру организаций, меняли тип покупаемой продукции и влияли на характер работы. Информация и знания стали жизненно важными экономическими ресурсами. Однако наряду с новыми возможностями зависимость от информационных систем принесла и новые угрозы. Интенсивные отраслевые инновации и академические исследования постоянно открывают новые возможности и направлены на сдерживание угроз.

Компоненты информационных систем

Основными компонентами информационных систем являются компьютерное оборудование и программное обеспечение, телекоммуникации, базы данных и хранилища данных, человеческие ресурсы и процедуры. Аппаратное обеспечение, программное обеспечение и телекоммуникации представляют собой информационные технологии (ИТ), которые в настоящее время прочно вошли в деятельность и управление организациями.

Компьютерное оборудование

Сегодня во всем мире даже самые маленькие фирмы, а также многие домохозяйства владеют или арендуют компьютеры. Физические лица могут владеть несколькими компьютерами в виде смартфонов, планшетов и других носимых устройств. Крупные организации обычно используют распределенные компьютерные системы, от мощных серверов с параллельной обработкой данных, расположенных в центрах обработки данных, до широко рассредоточенных персональных компьютеров и мобильных устройств, интегрированных в информационные системы организации. Датчики становятся все более широко распространенными в физической и биологической среде для сбора данных и, во многих случаях, для осуществления управления с помощью устройств, известных как исполнительные механизмы. Вместе с периферийным оборудованием, таким как магнитные или твердотельные накопители, устройства ввода-вывода и телекоммуникационное оборудование, они составляют аппаратную часть информационных систем. Стоимость аппаратного обеспечения неуклонно и быстро снижалась, в то время как скорость обработки и емкость хранилища значительно увеличивались. Это развитие происходит в соответствии с законом Мура: мощность микропроцессоров, лежащих в основе вычислительных устройств, удваивается примерно каждые 18–24 месяца. Тем не менее, использование электроэнергии оборудованием и его воздействие на окружающую среду вызывают озабоченность у разработчиков. Все чаще компьютеры и службы хранения данных предоставляются из облака — из общих объектов, доступ к которым осуществляется через телекоммуникационные сети.

Компьютерное зрение – это область искусственного интеллекта (ИИ), которая позволяет компьютерам и системам извлекать значимую информацию из цифровых изображений, видео и других визуальных данных, а затем выполнять действия или давать рекомендации на основе этой информации. Если ИИ позволяет компьютерам думать, то компьютерное зрение позволяет им видеть, наблюдать и понимать.

Компьютерное зрение работает почти так же, как и человеческое, за исключением того, что у человека есть преимущество. Преимущество человеческого зрения заключается в продолжительности жизни контекста, чтобы научиться различать объекты, как далеко они находятся, движутся ли они и есть ли что-то неправильное в изображении.

Компьютерное зрение обучает машины выполнять эти функции, но для этого требуется гораздо меньше времени с помощью камер, данных и алгоритмов, а не сетчатки, зрительных нервов и зрительной коры. Поскольку система, обученная проверять продукты или наблюдать за производственным активом, может анализировать тысячи продуктов или процессов в минуту, замечая незаметные дефекты или проблемы, она может быстро превзойти возможности человека.

Компьютерное зрение используется в самых разных отраслях: от энергетики и коммунальных услуг до производства и автомобилестроения, и рынок продолжает расти. Ожидается, что к 2022 году он достигнет 48,6 млрд долларов США. 1

Как работает компьютерное зрение?

Компьютерному зрению требуется много данных. Он выполняет анализ данных снова и снова, пока не распознает различия и, в конечном счете, не распознает изображения. Например, чтобы научить компьютер распознавать автомобильные шины, ему нужно передать огромное количество изображений шин и элементов, связанных с шинами, чтобы изучить различия и распознать шину, особенно без дефектов.

Для этого используются две основные технологии: тип машинного обучения, называемый глубоким обучением, и сверточная нейронная сеть (CNN).

В машинном обучении используются алгоритмические модели, которые позволяют компьютеру самостоятельно изучать контекст визуальных данных. Если через модель передается достаточно данных, компьютер «посмотрит» на данные и научится отличать одно изображение от другого. Алгоритмы позволяют машине обучаться самостоятельно, а не тому, кто программирует ее для распознавания изображения.

CNN помогает модели машинного обучения или глубокого обучения «выглядеть», разбивая изображения на пиксели, которым присваиваются теги или метки. Он использует метки для выполнения сверток (математическая операция над двумя функциями для получения третьей функции) и делает прогнозы относительно того, что он «видит». Нейронная сеть выполняет свертки и проверяет точность своих прогнозов в серии итераций, пока прогнозы не начнут сбываться. Затем он распознает или видит изображения так же, как люди.

Подобно тому, как человек разбирает изображение на расстоянии, CNN сначала различает резкие края и простые формы, а затем заполняет информацию, выполняя итерации своих прогнозов. CNN используется для понимания отдельных изображений. Рекуррентная нейронная сеть (RNN) используется аналогичным образом для видеоприложений, чтобы помочь компьютерам понять, как изображения в серии кадров связаны друг с другом.

История компьютерного зрения

Ученые и инженеры уже около 60 лет пытаются разработать способы, с помощью которых машины смогут видеть и понимать визуальные данные. Эксперименты начались в 1959 году, когда нейрофизиологи показали кошке набор изображений, пытаясь сопоставить реакцию ее мозга. Они обнаружили, что он сначала реагирует на резкие края или линии, и с научной точки зрения это означает, что обработка изображений начинается с простых форм, таких как прямые края. (2)

Примерно в то же время была разработана первая технология компьютерного сканирования изображений, позволяющая компьютерам оцифровывать и получать изображения. Еще одна веха была достигнута в 1963 году, когда компьютеры смогли преобразовывать двухмерные изображения в трехмерные формы. В 1960-х годах ИИ стал академической областью исследований, и это также положило начало стремлению ИИ решить проблему человеческого зрения.

В 1974 году была представлена ​​технология оптического распознавания символов (OCR), позволяющая распознавать текст, напечатанный любым шрифтом или гарнитурой. (3) Точно так же интеллектуальное распознавание символов (ICR) может расшифровывать рукописный текст с помощью нейронных сетей. (4) С тех пор OCR и ICR нашли свое применение в обработке документов и счетов, распознавании автомобильных номеров, мобильных платежах, машинном переводе и других распространенных приложениях.

В 1982 году нейробиолог Дэвид Марр установил, что зрение работает иерархически, и представил алгоритмы, позволяющие машинам обнаруживать края, углы, кривые и аналогичные базовые формы. Одновременно ученый-компьютерщик Кунихико Фукусима разработал сеть клеток, способных распознавать закономерности. Сеть под названием Неокогнитрон включала сверточные слои нейронной сети.

К 2000 году основное внимание уделялось распознаванию объектов, а к 2001 году появились первые приложения для распознавания лиц в реальном времени. Стандартизация того, как наборы визуальных данных помечаются и аннотируются, появилась в 2000-х годах. В 2010 году стал доступен набор данных ImageNet. Он содержал миллионы помеченных изображений в тысячах классов объектов и обеспечивает основу для CNN и моделей глубокого обучения, используемых сегодня. В 2012 году команда из Университета Торонто представила CNN для участия в конкурсе по распознаванию изображений. Модель под названием AlexNet значительно снизила количество ошибок при распознавании изображений. После этого прорыва количество ошибок снизилось до нескольких процентов. (5)

Энн Макнамара получает финансирование от Национального научного фонда (NSF). Этот материал основан на работе, поддержанной Национальным научным фондом в рамках гранта № 1253432. Любые мнения, выводы и выводы или рекомендации, выраженные в этом материале, принадлежат авторам и не обязательно отражают точку зрения Национального научного фонда.< /p>

Партнеры

Техасский университет A&M предоставляет финансирование в качестве партнера-основателя The Conversation US.

Представьте, что вы едете в автомобиле и используете проекционный дисплей на лобовом стекле для навигации по незнакомому городу. Это дополненная реальность (AR); эта информация используется не только для того, чтобы направлять вас по маршруту, но и для того, чтобы предупредить вас о важной информации в вашем окружении, например о велосипедистах или пешеходах. Правильное размещение виртуального контента не только имеет решающее значение, но и, возможно, является вопросом жизни и смерти.

Информация не может заслонять другой материал и должна отображаться достаточно долго, чтобы вы могли ее понять, но не слишком долго. Компьютерные системы должны делать эти определения в режиме реального времени, чтобы никакая информация не отвлекала или не мешала. Мы, конечно же, не хотим, чтобы предупреждение о велосипедисте, который собирается перейти дорогу перед автомобилем, скрыло саму велосипедистку!

Как исследователь дополненной реальности, я трачу много времени, пытаясь понять, как отобразить нужную информацию на экране пользователя в нужном месте и в нужный момент. Я понял, что отображение слишком большого количества информации может запутать пользователя, но недостаточное отображение может сделать приложение бесполезным. Нам нужно найти золотую середину.

Оказалось, что ключевым элементом здесь является знание того, куда смотрят пользователи. Только тогда мы сможем доставить нужную им информацию туда, где они смогут ее обработать. Наше исследование включает в себя измерение того, куда смотрит пользователь в реальной сцене, чтобы помочь решить, где разместить виртуальный контент. Поскольку дополненная реальность готова проникнуть во многие сферы нашей жизни — от вождения автомобиля до работы и отдыха, — нам нужно решить эту проблему, прежде чем мы сможем полагаться на дополненную реальность для поддержки серьезных или критических действий.

Определение места размещения информации

Разумно, чтобы информация появлялась там, где ее видит пользователь. Во время навигации пользователь может посмотреть на здание, улицу или другой реальный объект, чтобы открыть соответствующую виртуальную информацию; система будет знать, что нужно скрыть все остальные дисплеи, чтобы не загромождать видимую сцену.

Но откуда мы знаем, что кто-то смотрит? Оказывается, нюансы человеческого зрения позволяют рассмотреть глаза человека и вычислить, куда он смотрит. Сопоставив эти данные с камерами, показывающими поле зрения человека, мы можем определить, что видит человек и на что он смотрит.

Системы отслеживания взгляда впервые появились в 1900-х годах. Первоначально они в основном использовались для изучения моделей чтения; некоторые могут быть очень навязчивыми для читателя. Совсем недавно появилась технология отслеживания взгляда в реальном времени, которая стала более доступной, простой в эксплуатации и компактной.

Эйтрекеры можно прикрепить к экрану или интегрировать в носимые очки или наголовные дисплеи. Глаза отслеживаются с помощью комбинации камер, проекций и алгоритмов компьютерного зрения для расчета положения глаза и точки взгляда на мониторе.

Обычно при анализе данных отслеживания взгляда мы учитываем два показателя. Первый называется фиксацией и используется для описания того, когда мы останавливаем взгляд, часто на интересном месте в сцене, потому что оно привлекло наше внимание. Второй — саккада, одно из быстрых движений глаз, используемое для позиционирования взгляда. По сути, наши глаза быстро бегают с места на место, собирая фрагменты информации о частях сцены. Затем наш мозг объединяет информацию, полученную от этих фиксаций, и формирует в уме зрительный образ.

Сочетание отслеживания взгляда с дополненной реальностью

Часто содержимое дополненной реальности привязано к реальному объекту или местоположению. Например, на этой улице должна отображаться виртуальная метка, содержащая название улицы. В идеале мы хотели бы, чтобы метки дополненной реальности отображались близко к реальному объекту, с которым они связаны. Но мы также должны быть осторожны, чтобы не допустить, чтобы несколько меток AR перекрывались и становились нечитаемыми. Существует множество подходов к управлению размещением меток. Мы изучаем один вариант: вычисление того, куда смотрит человек в реальной сцене, и отображение меток дополненной реальности только в этом месте.

Например, пользователь взаимодействует с мобильным приложением, которое помогает ему покупать низкокалорийные хлопья в продуктовом магазине. В приложении дополненной реальности у каждой крупы есть связанная с ней информация о калориях. Вместо того, чтобы брать в руки каждую коробку с хлопьями и читать содержание питательных веществ, пользователь может поднять свое мобильное устройство и навести его на конкретную коробку с хлопьями, чтобы открыть соответствующую информацию.

Но подумайте о том, как переполнен отдел с хлопьями в магазине с различными упаковками. Без какого-либо способа управления отображением этикеток AR будут отображаться этикетки с информацией о калориях для всех коробок с хлопьями. Было бы невозможно определить калорийность интересующей его каши.

Отслеживая его взгляд, мы можем определить, на какую коробку с хлопьями смотрит пользователь. Затем мы отображаем информацию о калориях для этой конкретной каши. Когда он переводит взгляд на другую коробку, мы показываем цифры для следующей, которую он рассматривает. На его экране нет беспорядка, нужная ему информация всегда доступна, и когда ему нужна дополнительная информация, мы можем ее отобразить.

Этот тип разработки делает время для исследований дополненной реальности захватывающим. Наша способность интегрировать сцены реального мира с компьютерной графикой на мобильных дисплеях улучшается. Это подпитывает перспективу создания потрясающих новых приложений, которые расширяют наши возможности взаимодействовать, учиться и развлекаться в окружающем мире.

Читайте также: