Какая информация содержится в компьютерном коде изображения

Обновлено: 21.11.2024

Изображения изначально недоступны для людей, которые не могут их видеть. Способ решения этой проблемы зависит от назначения и сложности изображения.

Методы

Для каждого изображения на вашей веб-странице или цифровом документе определите, какая из следующих категорий лучше всего описывает ваше изображение:

  1. Изображение передает простую информацию (например, фотографию, значок или логотип).
  2. Изображение содержит сложную информацию (например, диаграмму или график).
  3. Изображение является чисто декоративным, а не информативным

См. ниже применимые методы для каждой категории.

1. Изображения, передающие простую информацию

Изображения, передающие простую информацию, должны быть описаны альтернативным текстом или «альтернативным текстом». Замещающий текст — это краткое описание содержимого изображения, добавленное таким образом, что оно обычно невидимо для людей, которые могут видеть изображение, но доступно для людей, использующих вспомогательные технологии, такие как программы чтения с экрана или дисплеи Брайля. Браузеры также отображают замещающий текст, если изображение не загружается.

Описание должно максимально лаконично передавать содержание и функциональность изображения, чтобы обеспечить доступ к содержимому изображения, не обременяя пользователей лишними деталями.

Добавление замещающего текста в HTML

В HTML добавьте замещающий текст к элементу с помощью атрибута alt, как показано в следующем примере:

Добавление замещающего текста в программах обработки текстов или редакторах форматированного текста

Приложения для обработки текстов, такие как Microsoft Word и Google Docs, а также онлайн-редакторы форматированного текста, например те, которые используются для добавления контента в Canvas, WordPress или Drupal, включают поддержку замещающего текста на изображениях. При добавлении изображения на веб-страницу или в документ просто найдите вкладку или поле с надписью «Замещающий текст» или его эквивалент и введите в поле краткое описание. Если при добавлении изображения вам не предлагается ввести замещающий текст, щелкните правой кнопкой мыши изображение после его добавления и выберите «Свойства изображения» или аналогичный, а затем просмотрите диалоговое окно свойств изображения в поисках подсказки «Замещающий текст».

Добавление замещающего текста к изображению в Canvas

2. Изображения, передающие сложную информацию

Сложные изображения, такие как графики, диаграммы или диаграммы, могут содержать слишком много информации, чтобы их можно было эффективно описать с помощью замещающего текста. Вместо этого эти изображения должны быть описаны подробным описанием. Длинное описание — это более подробное описание, которое обеспечивает эквивалентный доступ к информации изображения. Вопрос, который следует задать: учитывая текущий контекст, какую информацию предназначено передавать это изображение? Эта же информация должна быть предоставлена ​​людям, которые не могут видеть изображение. Подробное описание может включать любую структуру, необходимую для передачи содержания изображения, включая заголовки, списки и таблицы данных. Национальный центр доступных медиа (NCAM) разработал руководство по описанию сложных изображений, а также множество примеров. Они доступны в разделе «Эффективные методы описания научного контента в цифровых говорящих книгах».

Добавление длинного описания в HTML

В HTML подробное описание можно добавить либо на отдельной веб-странице, либо на той же странице в веб-странице.

с атрибутом id. Последнее может быть скрыто от зрячих пользователей, хотя вам следует подумать, может ли оно быть полезным и для некоторых зрячих пользователей, особенно для тех, кто с трудом понимает визуальное символическое содержимое, такое как диаграммы и графики. Когда длинное описание будет готово, добавьте к элементу атрибут longdesc, указывающий на URL-адрес длинного описания. В следующем примере подробное описание содержится в отдельном заголовке веб-страницы figure1-longdesc.html:

3. Изображения, которые носят чисто декоративный характер

Если изображение носит чисто декоративный характер и не несет никакой смысловой нагрузки, существует несколько способов заставить программы чтения с экрана игнорировать изображение:

На Flickr, сайте для обмена фотографиями, есть особенно привлекательная черно-белая фотография мальчика. Мальчик стоит у домашней тарелки в форме Малой лиги, над плечом завешена бита. Ранний вечер. Мальчику на вид 8 или 9 лет. Освещение драматично. Он частично в тени, но его лицо четко очерчено на фоне неба.

Нет подписи, и мало визуальных подсказок о том, где и когда было сделано изображение. Но скачайте файл и откройте несколько меню, и вы сможете многое узнать.

Мы видим, что фотографии около полутора лет; игра мальчика состоялась 6 июня 2018 года. Когда щелкнул затвор, время было 19:15.Вызовите некоторые данные GPS, и вы сможете узнать, где играл мальчик. Он был на грязном бейсбольном поле за церковью в маленьком городке в Огайо — место, которое мы не будем называть.

Вы можете узнать больше. Например, фотограф снимал на iPhone X и оставил в настройках камеры автоматический режим.

Одна вещь, которую мы не знаем, это осознавал ли он, сколько личной информации он размещал в Интернете.

Сведения о том, когда, где и как была сделана фотография, автоматически фиксируются смартфонами и цифровыми камерами и сохраняются в виде данных Exif (Exchangeable Image File Format). Может быть включена информация обо всем, от настроек экспозиции до высоты над уровнем моря. И данные Exif передаются вместе с фотографией — с камеры на жесткий диск или на веб-сайт.

"Люди должны знать, что когда они загружают фотографию, они видят больше, чем просто пиксели, – говорит Хани Фарид, профессор компьютерных наук Калифорнийского университета в Беркли и ведущий исследователь. по цифровой криминалистике. «Многие люди даже не знают, что существует такая штука, как Exif-данные, которые постоянно распространяются».

Хранение фотографий в Интернете

Данные Exif могут быть очень полезными. Это позволяет службам хранения фотографий сортировать ваши фотографии по дате и местоположению, чтобы вы могли найти альбом о поездках вашей семьи в Диснейуорлд или в дом бабушки и дедушки в другом штате. Если вы посмотрите на старую фотографию на жестком диске, вы сможете точно узнать, где вы ее сняли.

Как и во многих других аспектах цифровой конфиденциальности, по словам экспертов по безопасности, важно, чтобы потребители делали осознанный выбор в отношении того, чем они делятся.

"В некоторых ситуациях нужно быть осторожным", – говорит Бобби Рихтер, руководитель отдела тестирования конфиденциальности и безопасности в Consumer Reports. «Если вы делитесь изображениями с людьми, которых не знаете или которым не доверяете, вам следует опасаться, раскрываете ли вы конфиденциальную информацию, например данные о местоположении».

Если вы отправляете фотографию по электронной почте или в текстовом сообщении, данные Exif обычно переносятся вместе с ней. Это важно для людей — от студентов колледжей до тех, кто продает товары в Интернете, — которые общаются в Интернете с людьми, которых они плохо знают.

Данные Exif «могут быть кладезем информации», которой люди не осознают, что делятся ею, — говорит Джонатан Раевски, эксперт по цифровой криминалистике и вице-президент фирмы по кибербезопасности Stroz Friedberg, компании Aon.

Продавец из Craigslist однажды отправил Раевски по электронной почте фотографии товара, который он собирался купить, с прикрепленными данными Exif. «Я такой: «Теперь я знаю, где ты живешь, но я действительно не хочу знать, где ты живешь», — говорит Раевски. «Когда я встретил этого человека, я как бы просветил его, сказав: «Эй, может быть, это проблема конфиденциальности для вас», чтобы они могли принимать более взвешенные решения в будущем».

При сохранении фотографий в Google Фото или Apple Фото данные Exif сохраняются. Это позволяет искать фотографии позже по дате и местоположению. В обоих сервисах есть функция, позволяющая обмениваться фотографиями без прикрепления этой информации.

Если вы размещаете фотографии в Интернете, детали зависят от сайта. Flickr сохраняет данные Exif по умолчанию, но пользователи могут изменить настройки своей учетной записи, чтобы контролировать доступность данных Exif, когда другие загружают их фотографии. В сервисе также есть настройка, которая автоматически удаляет данные о местоположении при загрузке фотографий.

Многие другие сайты, которые позволяют показывать фотографии друзьям или публике, удаляют данные Exif до того, как изображения будут показаны другим. Если вы загружаете изображения в Craigslist, Facebook, Imgur, Instagram, Twitter или WhatsApp, данные Exif не будут доступны людям, которые их видят.

Однако это не означает, что компании, работающие в социальных сетях, не находят для него применения. «Вы почти наверняка можете быть уверены, что они его не выбрасывают, учитывая, что по сути это пылесосы для работы с большими данными», — говорит Фарид.

Представители компаний, с которыми беседовали Consumer Reports, в том числе Apple, Google, Imgur и Facebook, которой принадлежат Instagram и WhatsApp, заявили, что данные Exif не используются для таргетинга рекламных сообщений.

Однако представитель Facebook сообщил по электронной почте, что Facebook собирает и обрабатывает данные Exif, в том числе «такую ​​информацию, как марка и модель устройства, использованного для съемки фотографии, настройки камеры и дата, когда была сделана фотография». . . чтобы сделать ваш опыт лучше и обеспечить безопасность людей».

Если вы вообще не хотите предоставлять такие данные Facebook и другим компаниям, вы можете удалить их самостоятельно перед загрузкой фотографии.

Как самостоятельно удалить данные Exif

Данные Exif нетрудно найти или удалить, но шаги немного различаются в зависимости от того, какое устройство вы используете. Есть три варианта, которые следует рассмотреть: в первую очередь предотвращение захвата данных с вашими фотографиями, стирание данных Exif с фотографии, которую вы уже сняли, и использование инструментов, которые удаляют конфиденциальные детали, когда вы делитесь фотографией.

На смартфонах Apple Photos и Google Photos теперь имеют функции, которые позволяют вам видеть, содержат ли фотографии данные о местоположении, и делиться фотографиями, не отправляя их вместе с ними. На iPhone с новейшей операционной системой вы можете увидеть, есть ли у фотографии данные о местоположении, проведя пальцем вверх при просмотре изображения в приложении для фотографий. Если у него есть данные о местоположении, вы увидите карту с местоположением. Вы можете отправить фотографию без этих сведений, нажав кнопку «Поделиться», нажав «Параметры» в верхней части экрана и отключив переключатель «Местоположение». Имейте в виду, что вам придется делать это снова каждый раз, когда вы отправляете изображение.

Как и в Apple Фото, вы можете проверить данные о местоположении в Google Фото, проведя пальцем вверх по любому изображению. Вы можете обновить свои настройки, чтобы исключить эти данные, если вы делитесь фотографиями со ссылкой: откройте меню, коснувшись значка в левом верхнем углу главного экрана приложения, выберите «Настройки» и включите «Удалить геолокацию». Однако это не защитит вас, если вы отправляете фотографии другими способами, такими как текст или электронная почта.

Вы можете выполнить аналогичные действия на компьютере. Используя Windows, вы можете увидеть, прикреплены ли к фотографии данные Exif, щелкнув файл правой кнопкой мыши, выбрав «Свойства» и проверив вкладку «Подробности». Вы также можете использовать это меню для удаления большинства данных Exif, включая информацию о местоположении, нажав «Удалить свойства и личную информацию». Затем сохраните файл, и у вас есть фотография без GPS.

На Mac откройте фотографию в режиме предварительного просмотра и выберите «Показать инспектор» в меню «Инструменты». Если у фотографии есть данные Exif, вы найдете вкладку с надписью Exif. Когда информация о местоположении присутствует, предварительный просмотр разбивает ее на собственную вкладку с пометкой GPS. Там же вы найдете кнопку «Удалить информацию о местоположении», которая удалит эти данные.

В большинстве смартфонов нет встроенного инструмента для полного удаления данных Exif с фотографий, к которым они уже прикреплены, но есть бесплатные приложения для устройств Android и iOS, которые сделают это за вас.

Есть еще более простой маршрут. «Один из способов — просто сделать снимок экрана и поделиться им», — говорит Рихтер из CR. «Скриншоты обычно не содержат таких важных метаданных, как камера».

Для многих пользователей единственной информацией Exif, которая может показаться особенно личной, является место, где были сделаны их фотографии. «Для некоторых людей это довольно серьезная проблема конфиденциальности — вы знаете, где они находятся в определенное время суток», — говорит Фарид из Беркли. Вы можете легко изменить настройки, чтобы данные о местоположении не сохранялись вместе с вашими фотографиями. Все, что вам нужно сделать, это отозвать доступ приложения камеры к функции GPS вашего устройства.

В iOS перейдите в «Настройки», откройте вкладку «Конфиденциальность» и выберите «Службы геолокации». Нажмите «Камера» и выберите «Никогда».

Инструкции для устройств Android различаются в зависимости от модели, но обычно вам нужно открыть "Настройки", затем "Конфиденциальность" и выбрать "Диспетчер разрешений". Затем нажмите «Местоположение», откройте «Камеру» и выберите «Запретить». На некоторых устройствах Android приложения камеры имеют собственные настройки GPS.

Проделайте все это, и вам будет сложнее найти фотографии из отпуска. Но вы точно не расскажете миру, где снимали фотографии или где ваш ребенок играет в мяч после школы.

Беспокоитесь о том, кто за вами наблюдает? CR делится простыми и эффективными способами лучше контролировать свою цифровую конфиденциальность.

Компьютерное зрение – это область искусственного интеллекта (ИИ), которая позволяет компьютерам и системам извлекать значимую информацию из цифровых изображений, видео и других визуальных данных, а затем выполнять действия или давать рекомендации на основе этой информации. Если ИИ позволяет компьютерам думать, то компьютерное зрение позволяет им видеть, наблюдать и понимать.

Компьютерное зрение работает почти так же, как и человеческое, за исключением того, что у человека есть преимущество. Преимущество человеческого зрения заключается в продолжительности жизни контекста, чтобы научиться различать объекты, как далеко они находятся, движутся ли они и есть ли что-то неправильное в изображении.

Компьютерное зрение обучает машины выполнять эти функции, но для этого требуется гораздо меньше времени с помощью камер, данных и алгоритмов, а не сетчатки, зрительных нервов и зрительной коры. Поскольку система, обученная проверять продукты или наблюдать за производственным активом, может анализировать тысячи продуктов или процессов в минуту, замечая незаметные дефекты или проблемы, она может быстро превзойти возможности человека.

Компьютерное зрение используется в самых разных отраслях: от энергетики и коммунальных услуг до производства и автомобилестроения, и рынок продолжает расти. Ожидается, что к 2022 году он достигнет 48,6 млрд долларов США. 1

Как работает компьютерное зрение?

Компьютерному зрению требуется много данных. Он выполняет анализ данных снова и снова, пока не распознает различия и, в конечном счете, не распознает изображения. Например, чтобы научить компьютер распознавать автомобильные шины, ему нужно передать огромное количество изображений шин и элементов, связанных с шинами, чтобы изучить различия и распознать шину, особенно без дефектов.

Для этого используются две основные технологии: тип машинного обучения, называемый глубоким обучением, и сверточная нейронная сеть (CNN).

В машинном обучении используются алгоритмические модели, которые позволяют компьютеру самостоятельно изучать контекст визуальных данных. Если через модель передается достаточно данных, компьютер «посмотрит» на данные и научится отличать одно изображение от другого. Алгоритмы позволяют машине обучаться самостоятельно, а не тому, кто программирует ее для распознавания изображения.

CNN помогает модели машинного обучения или глубокого обучения «выглядеть», разбивая изображения на пиксели, которым присваиваются теги или метки. Он использует метки для выполнения сверток (математическая операция над двумя функциями для получения третьей функции) и делает прогнозы относительно того, что он «видит». Нейронная сеть выполняет свертки и проверяет точность своих прогнозов в серии итераций, пока прогнозы не начнут сбываться. Затем он распознает или видит изображения так же, как люди.

Подобно тому, как человек разбирает изображение на расстоянии, CNN сначала различает резкие края и простые формы, а затем заполняет информацию, выполняя итерации своих прогнозов. CNN используется для понимания отдельных изображений. Рекуррентная нейронная сеть (RNN) используется аналогичным образом для видеоприложений, чтобы помочь компьютерам понять, как изображения в серии кадров связаны друг с другом.

История компьютерного зрения

Ученые и инженеры уже около 60 лет пытаются разработать способы, с помощью которых машины смогут видеть и понимать визуальные данные. Эксперименты начались в 1959 году, когда нейрофизиологи показали кошке набор изображений, пытаясь сопоставить реакцию ее мозга. Они обнаружили, что он сначала реагирует на резкие края или линии, и с научной точки зрения это означает, что обработка изображений начинается с простых форм, таких как прямые края. (2)

Примерно в то же время была разработана первая технология компьютерного сканирования изображений, позволяющая компьютерам оцифровывать и получать изображения. Еще одна веха была достигнута в 1963 году, когда компьютеры смогли преобразовывать двухмерные изображения в трехмерные формы. В 1960-х годах ИИ стал академической областью исследований, и это также положило начало стремлению ИИ решить проблему человеческого зрения.

В 1974 году была представлена ​​технология оптического распознавания символов (OCR), позволяющая распознавать текст, напечатанный любым шрифтом или гарнитурой. (3) Точно так же интеллектуальное распознавание символов (ICR) может расшифровывать рукописный текст с помощью нейронных сетей. (4) С тех пор OCR и ICR нашли свое применение в обработке документов и счетов, распознавании автомобильных номеров, мобильных платежах, машинном переводе и других распространенных приложениях.

В 1982 году нейробиолог Дэвид Марр установил, что зрение работает иерархически, и представил алгоритмы, позволяющие машинам обнаруживать края, углы, кривые и аналогичные базовые формы. Одновременно ученый-компьютерщик Кунихико Фукусима разработал сеть клеток, способных распознавать закономерности. Сеть под названием Неокогнитрон включала сверточные слои нейронной сети.

К 2000 году основное внимание уделялось распознаванию объектов, а к 2001 году появились первые приложения для распознавания лиц в реальном времени. Стандартизация того, как наборы визуальных данных помечаются и аннотируются, появилась в 2000-х годах. В 2010 году стал доступен набор данных ImageNet. Он содержал миллионы помеченных изображений в тысячах классов объектов и обеспечивает основу для CNN и моделей глубокого обучения, используемых сегодня. В 2012 году команда из Университета Торонто представила CNN для участия в конкурсе по распознаванию изображений. Модель под названием AlexNet значительно снизила количество ошибок при распознавании изображений. После этого прорыва количество ошибок снизилось до нескольких процентов. (5)

Новая технология Codex позволяет создавать программы на 12 языках кодирования и даже выполнять перевод между ними. Но это не угроза для профессиональных программистов.

Том Смит, программист-ветеран, показывает, как Codex может мгновенно генерировать компьютерный код из запроса на простом английском языке. Кредит. Джейсон Генри

Отправить историю любому другу

Как подписчик, у вас есть 10 подарочных статей каждый месяц. Любой может прочитать то, чем вы делитесь.

Отдать эту статью

Как только Том Смит получил в свои руки Codex — новую технологию искусственного интеллекта, которая пишет свои собственные компьютерные программы, — он дал ей собеседование.

Он спросил, сможет ли он решить "проблемы кодирования", с которыми часто сталкиваются программисты, проходя собеседования на высокооплачиваемую работу в таких компаниях Силиконовой долины, как Google и Facebook. Может ли он написать программу, которая заменяет все пробелы в предложении тире? Еще лучше, может ли он написать код, который идентифицирует недопустимые почтовые индексы?

Он сделал и то, и другое сразу, прежде чем выполнить несколько других задач. «Многим людям, в том числе и мне, было бы трудно решить эти проблемы, а ответ он напечатал бы за две секунды», — сказал г-н Смит, опытный программист, курирующий работу отдела искусственного интеллекта. стартап под названием Gado Images. «На это было жутко смотреть».

Кодекс казался технологией, которая вскоре заменит людей. По мере того, как г-н Смит продолжал тестировать систему, он понял, что ее возможности выходят далеко за рамки способности отвечать на стандартные вопросы интервью. Его можно было даже перевести с одного языка программирования на другой.

Тем не менее, после нескольких недель работы с этой новой технологией г-н Смит считает, что она не представляет угрозы для профессиональных программистов. На самом деле, как и многие другие эксперты, он рассматривает это как инструмент, который в конечном итоге повысит производительность труда человека. Это может даже помочь целому новому поколению людей научиться искусству работы с компьютерами, показывая им, как писать простые фрагменты кода, почти как личный репетитор.

"Этот инструмент может значительно облегчить жизнь кодировщика", – сказал г-н Смит.

Тестирование Кодекса убедило г-на Смита, руководителя стартапа в области искусственного интеллекта, в том, что это только улучшит работу людей с компьютерами. Кредит. Джейсон Генри для The New York Times

Кодекс, созданный OpenAI, одной из самых амбициозных исследовательских лабораторий в мире, дает представление о состоянии искусственного интеллекта. Хотя широкий спектр А.И. технологии стремительно развивались за последнее десятилетие, и даже самые впечатляющие системы дополняли людей, а не заменяли их.

Благодаря быстрому развитию математической системы, называемой нейронной сетью, машины теперь могут приобретать определенные навыки, анализируя огромные объемы данных. Например, анализируя тысячи фотографий кошек, они могут научиться узнавать кошку.

Около четырех лет назад исследователи из таких лабораторий, как OpenAI, начали разрабатывать нейронные сети, которые анализировали огромное количество прозы, включая тысячи цифровых книг, статей из Википедии и других текстов, размещенных в Интернете.

Выявляя закономерности во всем этом тексте, сети научились предсказывать следующее слово в последовательности. Когда кто-то вводил несколько слов в эти «универсальные языковые модели», он мог завершить мысль целыми абзацами. Таким образом, одна система — творение OpenAI под названием GPT-3 — могла писать свои собственные сообщения в Твиттере, речи, стихи и новостные статьи.

К большому удивлению даже исследователей, создавших систему, она могла даже писать свои собственные компьютерные программы, хотя они были короткими и простыми. Очевидно, он извлек уроки из бесчисленного количества программ, размещенных в Интернете. Поэтому OpenAI пошел еще дальше, обучив новую систему — Codex — на огромном массиве прозы и кода.

Если вы попросите Codex «создать метель на черном фоне», он сделает именно это, сгенерировав и запустив код.

В результате система понимает и прозу, и код — до определенной степени. Вы можете запросить на простом английском языке снег, падающий на черный фон, и он даст вам код, создающий виртуальную метель. Если вы попросите синий прыгающий мяч, он даст вам и его.

«Вы можете попросить его что-то сделать, и он это сделает», — говорит Аня Кубоу, еще один программист, использовавший эту технологию.

Кодекс может создавать программы на 12 компьютерных языках и даже переводить их между ними. Но он часто ошибается, и хотя его навыки впечатляют, он не может рассуждать, как человек. Он может распознавать или имитировать то, что видел в прошлом, но он недостаточно проворный, чтобы думать самостоятельно.

Иногда программы, созданные Кодексом, не запускаются. Или они содержат недостатки безопасности. Или они и близко не подходят к тому, что вы от них хотите. По оценкам OpenAI, Codex создает правильный код в 37 % случаев.

Когда г-н Смит использовал систему в рамках программы бета-тестирования этим летом, полученный код был впечатляющим.Но иногда это срабатывало только в том случае, если он делал крошечные изменения, например настраивал команду в соответствии со своей конкретной настройкой программного обеспечения или добавлял цифровой код, необходимый для доступа к интернет-сервису, который он пытался запросить.

Другими словами, Codex был действительно полезен только для опытного программиста.

Но это может помочь программистам выполнять свою повседневную работу намного быстрее. Это могло помочь им найти основные строительные блоки, в которых они нуждались, или указать им на новые идеи. Используя эту технологию, GitHub, популярный онлайн-сервис для программистов, теперь предлагает Copilot, инструмент, который предлагает следующую строку кода так же, как инструменты «автозаполнения» предлагают следующее слово при вводе текста или электронных писем.

«Это способ написания кода без необходимости писать его слишком много», — сказал Джереми Ховард, который основал лабораторию искусственного интеллекта Fast.ai и помог создать языковую технологию, на которой основана работа OpenAI. «Это не всегда правильно, но достаточно близко».

В знак уважения к популярному интернет-мему Codex создает веб-сайт для «кота, который работает адвокатом», предоставляя биографию, номер телефона и небольшой аватар.

Г-н. Ховард и другие считают, что Codex также может помочь новичкам научиться программировать. Он особенно хорош для создания простых программ из кратких описаний на английском языке. И это работает и в другом направлении, объясняя сложный код простым английским языком. Некоторые, включая Джоэла Хеллермарка, предпринимателя из Швеции, уже пытаются превратить систему в инструмент обучения.

Остальные части А.И. пейзаж похож. Роботы становятся все более мощными. Так же и чат-боты предназначены для онлайн-общения. DeepMind, ИИ Лаборатория в Лондоне недавно создала систему, которая мгновенно определяет форму белков в организме человека, что является ключевой частью разработки новых лекарств и вакцин. Эта задача когда-то занимала у ученых дни или даже годы. Но эти системы заменяют лишь небольшую часть того, что могут сделать люди-эксперты.

В тех немногих областях, где новые машины могут мгновенно заменить работников, они, как правило, занимают рабочие места, которые рынок не может заполнить. Роботы, например, все чаще используются в транспортных центрах, которые расширяются и изо всех сил пытаются найти работников, необходимых для того, чтобы идти в ногу со временем.

Грег Брокман из OpenAI сказал, что искусственный интеллект избавляет рабочих от рутинной работы, а не заменяет их. Кредит. Стив Дженнингс/Getty Images

С помощью своего стартапа Gado Images г-н Смит решил создать систему, которая могла бы автоматически сортировать фотоархивы газет и библиотек, находить забытые изображения, автоматически добавлять подписи и теги и делиться фотографиями с другими публикациями. и предприятия. Но технология могла справиться только с частью работы.

Он мог просматривать обширный фотоархив быстрее, чем люди, выявляя типы изображений, которые могут быть полезны, и подбирая подписи. Но для того, чтобы найти самые лучшие и важные фотографии и правильно пометить их, по-прежнему требовался опытный архивист.

"Мы думали, что эти инструменты полностью устранят потребность в людях, но через много лет мы узнали, что это на самом деле невозможно — вам по-прежнему нужен опытный человек для проверки результатов", — сказал г-н Смит. . «Технологии ошибаются. И оно может быть предвзятым. Вам по-прежнему нужен человек, который проанализирует, что он сделал, и решит, что хорошо, а что нет».

Кодекс расширяет возможности машины, но это еще одно свидетельство того, что технология лучше всего работает, когда за рулем находится человек.

Читайте также: