Провайдер Vision, что это за программа для Android
Обновлено: 21.11.2024
Создайте любой продукт, мы с самого начала придаем большое значение возможностям. Наши команды имеют обыкновенную жизнь с ограниченными потребностями. В итоге у нас получается не просто новое приложение или устройство. предполагаемый инклюзивный подход, мы предполагаем создать возможность для познания мира, которая будет распространена на всеобщее обозрение.
Новый способ общения
Новый способ общения
Благодаря приложению "Прямая расшифровка" у глухих и слабослышащих пользователей появилась возможность по-новому общаться с людьми без особого слуха.
Специальные возможности при воспроизведении медиаконтента
Специальные возможности при воспроизведении медиаконтента
В 2009 году мы добавили для видеороликов на YouTube новую функцию – автоматические титры. Теперь мы подумали: что если сделать ее доступной для хранения за пределами YouTube?
Фильтрация шумов и обнаружение необходимых звуков
Фильтрация шумов и обнаружение необходимых звуков
Какие технологии Android воспринимают людей лучше слышать.
Специальные возможности
Все используют устройства по-разному. Вот почему мы берем передовые технологии и спрашиваем себя: "Как это поможет человеку решить ту или иную проблему?" Так мы создаем инструменты, которые позволяют людям узнавать больше об окружающем мире, и сервисы, упрощающие общение, благодаря которому удалось преобразовать речь в текст. Мы не просто изучаем потребности пользователей, но и разрабатываем решения, которые помогают сделать жизнь немного лучше.
Функции, распознающие каждое слово
Прямая расшифровка
Используйте расшифровку разговоров в режиме реального времени
Речь собеседников преобразуется в текст на экране прямо во время разговора. Приложение "Прямая расшифровка" умеет правильно распознавать слова даже в сложных случаях. Больше не нужно видеть, чтобы понять, что подумал собеседник: "йоркширский терьер" или "нью-йоркский интерьер".
Прямая расшифровка позволяет сразу видеть на экране устройства то, что сказано вслух.
На этой странице мы перечисляем приложения для устройств Android, а также для iPhone, iPod Touch и iPad. Некоторые приложения бесплатны, а другие стоят небольшую сумму. Мы не пробовали их все, поэтому рекомендуем прочитать отзывы пользователей перед загрузкой.
Время от времени мы будем добавлять новые, так что заходите еще раз!
Вспомогательные средства и тесты для зрения
Обследование глаза. Бесплатное приложение EyeXam для iPhone или iPod Touch позволяет проверить свое зрение по эталону 20/20, а также включает тесты на цветовосприятие, астигматизм и доминирование глаз.
Приложение Amsler Grid. Это приложение может помочь вам тестировать и отслеживать изменения зрения, связанные с дегенерацией желтого пятна или другими искажениями поля зрения в результате повреждения макулы.
Большие часы HD. Нужны действительно большие часы? Это приложение отображает время на вашем iPhone или iPad. Он также отображает дату в формате региона и на языке, который установлен на вашем устройстве.
Большие часы. Это похоже на Big Clock HD, но также имеет программируемый будильник на основе таймера.
EyeCBest. Это расширение веб-браузера повышает читабельность веб-сайтов и полностью настраивается. Пользователь может изменить шрифт, размер и жирность любого текста веб-сайта одним щелчком мыши.
Гигантские часы. Дисплей настраивается, поэтому вы можете изменить цвет текста и фона по своему усмотрению.
Увеличительное стекло. Просто запустите программу и наведите телефон на объект, который вы просматриваете, и это увеличит его. В приложении также есть индикатор, который активируется, только если на вашем телефоне или планшете есть вспышка. Он также может останавливать просматриваемое изображение, поэтому вам не нужно постоянно держать устройство во время чтения.
Увеличительное стекло со светом. Подобно приложению Magnifying Glass для телефонов Android, это приложение для устройств Apple очень удобно. Отлично подходит для увеличения мелкого шрифта в меню, бутылочках с лекарствами, квитанциях и многом другом, приложение также имеет регулируемую опцию фонарика и захват изображения.
Нарушение зрения и слепота
Будь моими глазами. Помогайте слепым людям с важными повседневными задачами, такими как чтение этикеток, квитанций и этих действительно трудно увидеть даты истечения срока годности продуктов. Вы можете стать помощником или подписаться на помощь, если у вас проблемы со зрением. Если вы являетесь помощником, вы будете получать аудио-видео запросы от людей, которым нужна помощь. Не беспокойтесь, если вы не сможете принять запрос — приложение переключится на другого доступного помощника в сети.
Репетитор по шрифту Брайля. Разработчик говорит, что это интересный способ выучить как сокращённый, так и несокращённый унифицированный английский шрифт Брайля (1 и 2 классы). Вы даже можете соревноваться с друзьями в гонках на время.
Писатель Брайля. Это приложение переводит ваш текст на шрифт Брайля и является отличным инструментом для обучения или преподавания.
Считыватель денег NantMobile. Для слепых или слабовидящих это приложение использует камеру iPhone для распознавания валюты, сообщая вам номинал в режиме реального времени без необходимости подключения к Интернету. Это помогает убедиться, что вы платите правильную сумму в кассе, а также может проверить, что вы получаете правильную сумму сдачи. В прошлый раз, когда мы проверяли, приложение поддерживало 21 валюту. Для функции озвучивания доступны английский, испанский, китайский, французский, итальянский, немецкий, русский, японский и несколько других языков.
Карманный шрифт Брайля. С его помощью вы можете выучить шрифт Брайля, в том числе алфавит, цифры, сокращения и одно- и двухклеточные словесные знаки.
Цены и приложения-напоминания
Контактное средство отслеживания линз. Это приложение для замены контактных линз, которое поможет вам отслеживать сроки годности и даты замены контактных линз. Это кажется простым и понятным, а на главном экране очень крупный шрифт, который может улучшить читаемость, если вы еще не надели новые линзы.
Напоминание о приеме лекарств MyTherapy и трекер таблеток. Это удобное напоминание о повторяющихся событиях может помочь вам следить за дозами лекарств от глаукомы, рецептурными глазными каплями от сухости глаз и другими лекарствами, которые вы принимаете в течение дня. Вы также можете распечатать отчеты о состоянии здоровья, чтобы обсудить их на следующем приеме у врача.
Напоминание о таблетках от MediSafe. Это еще одно напоминание о лекарствах, которое работает с глазными каплями, лекарствами от глаукомы и другими лекарствами, которые вы принимаете. Он также информирует вас о ваших лекарствах и состояниях. Потратьте время, чтобы прочитать полное описание этого приложения, чтобы избежать конфликтов с другими будильниками, которые вы могли установить на своем смартфоне.
Полароид УФ. В ясные дни ультрафиолетовый свет может отражаться от песка, воды или снега и вызывать серьезные повреждения глаз. Это приложение от Polaroid Eyewear уведомляет вас об УФ-индексе в вашем текущем районе, напоминая вам о необходимости убедиться, что вы и члены вашей семьи носите солнцезащитные очки.
Оптические иллюзии и развлечения
Оттенок. Это приложение измеряет, сколько видимого света может пройти через прозрачный объект. Это полезно при покупке солнцезащитных очков, потому что помогает понять, является ли оттенок для вас слишком темным или слишком светлым. Вы также можете убедиться, что тонированные стекла вашего автомобиля являются законными в штате, где вы находитесь. Приложение включает в себя законы штата США в отношении тонировки автомобильных стекол.
Оптические иллюзии. Это коллекция из 98 различных оптических иллюзий с описанием каждой из них. Вы также можете отправить их друзьям по электронной почте и поделиться ими на Facebook.
Оптические иллюзии 100+. В этих иллюстрациях используются скрытые изображения, видимое движение и другие забавные приемы. У каждого есть описание, чтобы вы могли понять, как изображение обманывает ваши глаза. Вы также можете поделиться изображениями на Facebook и Twitter.
Нарушение цветового зрения
Друг для дальтоников. Коснитесь точки на изображении, и приложение отобразит название цвета этой точки. Он также имитирует дальтонизм, поэтому люди с нормальным зрением могут увидеть, что значит быть дальтоником. Оно не только говорит вам, как называются цвета, но и имеет Инспектор цвета, который описывает цвет, чтобы помочь людям, страдающим дальтонизмом.
Помощник ColorBlind. Это приложение определяет цвета для людей с нарушениями цветовосприятия. Вы делаете снимок объекта или сцены, затем касаетесь точки на изображении, и приложение отображает название цвета, композицию RGB или шестнадцатеричный код точки, к которой вы прикоснулись. Когда мы последний раз проверяли, в базе данных было около 1500 названий цветов.
Окрашивание в слепую. Это приложение для людей с дефицитом цвета, а также для тех, кто хотел бы увидеть, как люди с дефицитом цвета видят мир. Он использует графический процессор вашего устройства для запуска расширенных алгоритмов управления цветом, чтобы помочь людям лучше различать цвета.
Разрешить. Это приложение полезно для цветовых недостатков. Он делает определенные цвета на фотографии, сделанной камерой (или сохраненной в фотоальбоме), ярче или темнее в зависимости от ваших критериев. Например, если вы не можете различить красный и зеленый цвета, Visolve может сделать красные цвета ярче. Или затемнить все цвета, кроме указанного вами. Другие варианты включают рисование различных образцов штриховки для определенных цветов и увеличение насыщенности всех цветов на изображении.
Приложения для косметики и примерки
Цвета Air Optix — Color Studio. Это приложение от Alcon позволяет виртуально примерить контактные линзы Air Optix различных цветов. Вы можете загрузить свою фотографию или использовать фотографию модели, чтобы увидеть разные цвета. Вы также можете нанести макияж на глаза, губы и лицо.
Кабинка цвета глаз. Это приложение для фотографии позволяет вам изменять цвет глаз на фотографии, чтобы создавать забавные, сумасшедшие или художественные эффекты. Вы даже можете изменить цвет глаз на радужный или просто посмотреть, как бы вы выглядели с новым цветом глаз. Одной из забавных функций является возможность раскрасить глаза, а затем сделать остальную часть фотографии черно-белой.
Студия цвета глаз. Если вы думаете о цветных контактных линзах или даже театральных контактных линзах, попробуйте это приложение. Вы загружаете свою фотографию, затем нажимаете на разные цвета глаз и эффекты, чтобы "примерить" их.
Макияж. Это приложение обеспечивает виртуальный макияж. Версия для Android позволяет использовать различные оттенки макияжа глаз, а также основу, румяна и помаду для вашей фотографии. Функция фото до и после тоже забавна. Обновленная версия для устройств Apple отличается — она применяет фильтры к вашему живому видео, которое вы можете сохранить как видео или как фото.
Приложения для отказа от курения
Выйти сейчас! Это приложение обеспечивает отличную мотивацию для отказа от курения. Он отслеживает, когда вы в последний раз курили, сколько сигарет вы избегали и сколько денег вы сэкономили, бросив курить.
Бросьте курить прямо сейчас с Максом Кирстен. Курение является фактором риска возрастной дегенерации желтого пятна, которая может ухудшить ваше зрение. А если у вас сухие глаза, то курение только сильнее их раздражает. Рассмотрим это приложение, которое адаптирует известную программу отказа от курения Макса Кирстена для устройств Apple. Существует множество способов бросить курить, поэтому перед покупкой прочтите описание и решите, может ли этот способ вам помочь.
Разработка концепции
Билайн Ридер. Это приложение может помочь вам увеличить скорость чтения на iPhone и iPad. Он использует цветовые градиенты, чтобы подкрасить шрифты в книге, статье или другом тексте, чтобы привлечь внимание и уменьшить вероятность пропуска строк или повторного чтения. Разработчики говорят, что это может даже помочь людям с СДВ, дислексией или нарушениями зрения, и они предлагают на своем веб-сайте задание по чтению, чтобы вы могли увидеть, действительно ли увеличивается ваша скорость чтения. Также доступны расширение для настольного браузера и программа для чтения PDF-файлов.
Расширяющиеся возможности доступа, включенные в операционную систему Google Android, а также широкий спектр доступных мобильных устройств, работающих под управлением ОС Android, сделали платформу все более популярной среди тех, кто ищет смартфон или планшет. Поскольку Android — это открытая операционная система, развернутая рядом производителей на своих телефонах и планшетах, покупатели могут выбирать из множества аппаратных средств, не задумываясь о том, доступен ли гаджет, который им больше всего нравится. В дополнение к средству чтения с экрана TalkBack, последние версии Android позволяют пользователям с плохим зрением создавать свои собственные доступные возможности, используя комбинацию настроек для изменения внешнего вида экрана. Некоторые поставщики, в том числе Samsung, даже добавили собственные специальные возможности в стандартную среду Android.
Но каким бы доступным ни был ваш телефон или планшет Android, существует целый мир доступных приложений, которые вы можете использовать для настройки внешнего вида экрана вашего устройства, повышения производительности и даже развертывания встроенного камеру, чтобы лучше рассмотреть окружающий мир. В огромном магазине Google Play вы найдете множество приложений, которые вы можете купить или загрузить бесплатно и использовать для настройки своего мобильного устройства. В этой статье мы рассмотрим некоторые из лучших приложений для пользователей Android со слабым зрением. Имейте в виду, что есть много других доступных приложений, которые хорошо работают с программой чтения с экрана TalkBack, а также обеспечивают высокую производительность как для людей с нарушениями зрения. Здесь мы сосредоточимся на приложениях, которые поддерживают работу пользователей Android с плохим зрением, а также позволяют использовать телефон или планшет в качестве визуального помощника. Чтобы узнать о других приложениях, доступных для слепых и слабовидящих пользователей, посетите веб-сайт сообщества Inclusive Android, где участники оценивают и описывают широкий спектр аппаратного и программного обеспечения Android.
Знай свою ОС Android
Поскольку Android работает на таком большом количестве устройств, неудивительно, что в обращении находится несколько версий ОС. Это важно, потому что не все специальные возможности и приложения доступны во всех версиях ОС. Хотя в предыдущих версиях Android были предусмотрены специальные возможности, версия 5, также называемая Lollipop, стала особенно важным преимуществом для пользователей с плохим зрением, которые получают выгоду от настройки визуального интерфейса устройства. Lollipop (и его преемник, Marshmallow) добавили возможность инвертировать цвета на экране вашего устройства, обеспечивая темный фон под светлым текстом и значками. Если вы хотите использовать эту функцию или хотите использовать приложения, выполняющие ту же задачу, убедитесь, что у вас установлен Lollipop (или более поздней версии). Также рекомендуется проверить настройки специальных возможностей, чтобы узнать, добавил ли производитель вашего устройства собственные параметры. Samsung, например, сделала это, а другие производители устройств предлагают свои собственные клавиатуры и речевые движки, которые могут быть вам полезны, но которые вы захотите сравнить со стандартными предложениями Android в этих категориях.
Расширьте свое представление об окружающем мире
Камера на вашем мобильном устройстве может делать гораздо больше, чем просто делать снимки.Вы можете использовать различные приложения, чтобы превратить свое устройство в электронную лупу, сканер или идентификатор объекта и цвета. Хотя мы ориентируемся на приложения для слабовидящих, перечисленные здесь приложения для сканирования и идентификации также доступны с TalkBack, что делает их отличным выбором для людей с полной потерей зрения.
Увеличить из MPaja
AMagnify (бесплатно или 1,31 долл. США, Android 2.2 или более поздней версии) использует камеру вашего устройства для увеличения того, на что она направлена. Увеличьте текст, заморозьте снятое изображение и инвертируйте увеличенное изображение. Платная версия убирает рекламу. Вы найдете множество приложений для увеличения в магазине Google Play. AMagnify — отличный выбор, потому что он чрезвычайно прост в использовании и предлагает отличные функции.
Умная лупа от Smart Tools Co.
Используйте Smart Magnifier (бесплатно, Android 2.3 или более поздней версии) в качестве полноэкранного увеличительного стекла или сосредоточьте увеличенную область на меньшей части экрана. Элементы управления на экране позволяют легко масштабировать, автофокусировать, останавливать и переворачивать увеличенные изображения, а также использовать светодиодную вспышку устройства для добавления большего количества света.
Офисный объектив Microsoft
Приложение для сканирования Office Lens (бесплатное, версия зависит от устройства) от Microsoft позволяет сканировать электронные доски, визитные карточки, фотографии или другие одностраничные элементы, с которыми вы можете столкнуться в деловых или учебных ситуациях. Используйте OCR для захвата текста и сохранения отсканированных файлов в приложениях Microsoft Office или в формате PDF. Вы можете сохранять свои сканы в службах Microsoft OneNote или OneDrive. В Play Store вы найдете множество приложений для сканирования и распознавания текста. Office Lens отлично справляется с быстрым сканированием, интеллектуальной обрезкой изображений и отправкой их в экосистему Microsoft.
TapTapSee от CamFind Inc.
Сфотографируйте объект и используйте комбинацию автоматических и человеческих ресурсов TapTapSee (бесплатно при покупках в приложении, версия зависит от устройства) для получения идентифицирующей информации. Узнайте цвет рубашки, которую вы выбрали, достал ли вы лайм или лимон из холодильника, и многое другое.
Настроить Android
Стандартный Android позволяет пользователю изменять размер экранных шрифтов и увеличивать изображение на экране, увеличивая его. Вы можете загружать сторонние приложения, которые настраивают определенные части вашего домашнего экрана и работу приложения. Вы можете обнаружить, что размер значков, раскладка клавиатуры или стиль уведомлений, например, сложны, в то время как другие части интерфейса либо не нуждаются в настройке, либо их можно эффективно просматривать, внеся изменения в специальные возможности. настройки. Или вы можете пойти дальше, заменив стандартную программу запуска Android программой, которая управляет тем, как значки приложений, фон, текст на главном экране и панель приложений отображаются на экране. Некоторые программы запуска интегрируются с версиями приложений с увеличенным текстом для чтения почты, отправки SMS-сообщений и совершения телефонных звонков.
BIG Launcher из Big Launcher
BIG Launcher (10 долларов США, Android 2.1 или более поздняя версия) – это упрощенная программа запуска Android с крупными значками и текстом, а также возможностью выбора цветовых тем. Ваш домашний экран заменен сеткой с толстыми линиями, в которой есть место всего для нескольких приложений, каждое из которых имеет очень большой значок. Когда вы коснетесь БОЛЬШОГО значка Launcher, вы увидите упрощенные и значительно увеличенные представления для совершения звонков, отправки SMS, просмотра контактов, доступа к почте и многого другого. Разработчик Big Launcher предлагает ряд приложений, которые работают с лаунчером и используют такие же очень большие яркие значки, текст и цвета. Вы можете выбрать размер шрифта, цветовые темы и значки, которые должны отображаться на главном экране (другие приложения отображаются в алфавитном порядке за одним значком). И вы можете отключить ненужные приложения. Некоторым пользователям внешний вид и подход BIG Launcher могут показаться слишком упрощенными. Другим, у которых может быть меньше опыта или интереса к техническим гаджетам, это может показаться довольно простым. Приложение позиционируется как инструмент для пожилых людей, многие из которых раньше не пользовались смартфонами.
Клавиатура MessageEase от Exideas
Разработанная, чтобы помочь вам печатать быстрее и с минимальным количеством пальцев, MessageEase (бесплатно, Android 2.2 или более поздней версии) – это альтернативная экранная клавиатура для вашего устройства. Вы можете использовать ее вместо клавиатуры устройства Google по умолчанию или запускать ее для определенных задач, например, для ввода текста, и возвращаться к обычной клавиатуре, когда закончите. MessageEase использует большие буквы, расставленные в зависимости от того, как часто вы будете набирать ту или иную букву. Клавиша R будет под рукой, в то время как вам, возможно, придется немного потянуться, чтобы найти, например, Z. Вы также можете настроить раскладку клавиатуры и цветовую схему.
Гигантикон от Габриэля Таубмана
Хотя вы можете использовать встроенную функцию масштабирования, чтобы увеличить изображение элементов на экране устройства, вам может быть проще увеличить некоторые или все значки приложений. Чтобы использовать Giganticon (бесплатно, Android 2.2 или более поздней версии), установите его и выберите приложение, значок которого вы хотите увеличить.Вам придется выбирать каждый по отдельности.
Нет светодиодов, Madmack
Выберите уведомления, которые будут отображаться на вашем устройстве, даже если оно заблокировано. NoLED (бесплатно, Android 2.1 или более поздняя версия) отображает значки, представляющие электронную почту, SMS, голосовую почту, Google Talk и множество других приложений. Выберите те, которые вы хотите видеть на экране, и настройте их цвет, оттенок и насыщенность. Хотя сами значки маленькие, вы можете выбрать только те, которые наиболее важны для вас, выбрать цвета, которые вам легко увидеть, и расположить их так, чтобы они появлялись там, где вам нравится, когда приходит уведомление.
Оттенки из проекта Eyes-Free
Яркие дисплеи могут вызывать затруднения у людей с чувствительностью к свету. Если вы обычно устанавливаете низкую яркость экрана и по-прежнему обнаруживаете, что он пропускает слишком много света, вам могут пригодиться Shades (бесплатно). Это позволяет уменьшить яркость экрана ниже типичного уровня, установленного аппаратным обеспечением. В качестве дополнительного преимущества более низкая яркость позволяет экономить заряд батареи.
Чтение и письмо
Выбор приложений для письма и чтения на вашем Android-устройстве огромен. Благодаря встроенным функциям доступности и параметрам шрифта в отдельных приложениях вы можете использовать практически любое основное приложение, которое обрабатывает текст. Вот несколько инструментов, специально разработанных для обработки доступного текста.
Доступный редактор Talkback, Philosoft
Philosoft выпускает ряд приложений, которые делают стандартные мобильные функции более доступными (другие включают телефонный номеронабиратель, текстовое приложение для SMS и приложение для чтения). Доступный редактор (бесплатно, Android 4.0 и более поздние версии) позволяет вводить текст с клавиатуры или голосом. Редактируйте и просматривайте то, что вы вводите, используя один из нескольких больших размеров шрифта, или прочитайте его вам. Вы также можете выбрать, какой речевой движок и голоса вы хотите применить. В сочетании с доступной клавиатурой того же разработчика, которая также бесплатна, вы получите очень большую QWERTY-клавиатуру.
@Voice Aloud Reader от Hyperionics Technology
Даже если вы не используете TalkBack, вы можете использовать речь для чтения определенных книг, статей, веб-страниц и другого текста. После установки приложения @Voice Aloud Reader (бесплатно или за 4,99 долл. США без рекламы, версия Android зависит от устройства) и механизма преобразования текста в речь вы сможете сохранять документы, веб-страницы или другой текст в приложении изнутри. веб-браузер или приложение для чтения. После того, как вы сохранили элементы для чтения, используйте @Voice Aloud Reader для навигации по ним и прослушивания вашего текста, прочитанного вслух, используя выбранный вами речевой движок и голос.
Обычные приложения с опциями для слабовидящих
Иногда отличным доступным приложением является то, которое просто обеспечивает исключительную поддержку функций, уже доступных в Android. Крупные значки, богатые настройки шрифта и цвета или возможность добавлять голосовые команды в области, где их еще нет, в конечном итоге будут полезны всем.
Лучшая камера от Almalence
Вот пример простого в использовании приложения с множеством функций. Улучшенная камера (бесплатная облегченная версия или полная версия за 1,99 долл. США, Android 4.0 или более поздняя версия) поможет вам делать более качественные фотографии с помощью устройства Android и даст вам доступ к ряду настроек, которые помогут вам сосредоточиться на том, что вы видите в видоискателе. Сетка с яркими толстыми линиями помогает центрировать изображения и выровнять объекты в видоискателе, а большие кнопки, окружающие область изображения, дают доступ к настройкам серийной фотосъемки, ночного режима, видео, фокусировки, выбора ISO и многого другого. р>
Команда для Google Now от RSenApps
Возможно, Google Now уже установлен на вашем устройстве. Получите доступ к нему из приложения Google и используйте «OK Google» для голосового поиска на вашем устройстве и в Интернете. Commandr для Google Now (бесплатная версия Android 4.1 и более поздние версии) позволяет добавлять множество новых голосовых команд. Слушайте определенную музыку, открывайте приложения, используйте фонарик, делайте селфи и многое другое.
Total Commander от К. Гислера
Один из способов настроить Android под себя, не говоря уже о повышении производительности, — установить файловый менеджер. Эти приложения позволяют загружать и скачивать файлы с компьютеров, облачных сервисов, интернет-сервисов и других мобильных устройств. Помимо нескольких способов перемещения файлов, Total Commander (бесплатно, Android 1.5 или более поздней версии) доступен для TalkBack и включает параметры для настройки цветовой схемы, размера текста и даже используемого шрифта.
Платформа становится богаче
До недавнего времени считалось, что Apple iOS, установленная на iPhone и iPad, лучше подходит для пользователей с нарушениями зрения. Разработчики, похоже, тоже в это верили, поскольку многие важные доступные приложения не были перенесены на платформу Android. К счастью, ситуация меняется, когда в 2015 году было объявлено, что важные приложения для слепых теперь доступны в магазине Google Play.В дополнение к ссылкам в этой статье поищите в магазине те приложения, которые вы, возможно, ждали, или инструменты, которые делают то, что вы раньше не могли найти. Там многое может понравиться.
Компьютерное зрение считается полной задачей ИИ. Другими словами, ее решение было бы эквивалентно созданию программы, которая была бы такой же умной, как люди. Излишне говорить, что такая программа еще не создана. Однако если вы когда-либо пользовались такими приложениями, как Google Goggles или Google Фото, или смотрели сегмент Google Lens в ключевом выступлении Google I/O 2017, вы, вероятно, понимаете, что компьютерное зрение стало очень мощным.
Благодаря API-интерфейсу на базе REST под названием Cloud Vision API компания Google делится своими революционными технологиями, связанными с машинным зрением, со всеми разработчиками. Используя API, вы можете легко добавить в свои приложения для Android впечатляющие функции, такие как распознавание лиц, распознавание эмоций и оптическое распознавание символов. В этом уроке я покажу вам, как это сделать.
Предпосылки
Чтобы следовать этому руководству, у вас должны быть:
- аккаунт Google Cloud Platform
- проект в консоли Google Cloud
- последняя версия Android Studio
- и устройство под управлением Android 4.4 или более поздней версии
Если некоторые из приведенных выше требований кажутся вам незнакомыми, я предлагаю вам прочитать следующее вводное руководство по платформе Google Cloud Machine Learning:
1. Включение Cloud Vision API
Вы можете использовать API Cloud Vision в своем приложении для Android только после того, как включите его в консоли Google Cloud и получите действительный ключ API. Поэтому начните с входа в консоль и перехода в Диспетчер API > Библиотека > Vision API. На открывшейся странице просто нажмите кнопку Включить.
Если вы уже создали ключ API для своего проекта облачной консоли, вы можете пропустить следующий шаг, поскольку вы сможете повторно использовать его с API Cloud Vision. В противном случае откройте вкладку «Учетные данные» и выберите «Создать учетные данные» > «Ключ API».
В появившемся диалоговом окне вы увидите свой ключ API.
2. Добавление зависимостей
Как и большинство других API, предлагаемых Google, доступ к API Cloud Vision можно получить с помощью клиентской библиотеки Google API. Чтобы использовать библиотеку в проекте Android Studio, добавьте следующие зависимости компиляции в файл build.gradle модуля приложения:
Кроме того, чтобы упростить операции файлового ввода-вывода, я предлагаю вам также добавить зависимость компиляции для библиотеки ввода-вывода Apache Commons.
Поскольку клиент API Google может работать, только если у вашего приложения есть разрешение INTERNET, убедитесь, что в файле манифеста вашего проекта присутствует следующая строка:
3. Настройка клиента API
Класс Vision представляет клиент Google API для Cloud Vision. Хотя можно создать экземпляр класса с помощью его конструктора, сделать это с помощью класса Vision.Builder проще и гибче.
При использовании класса Vision.Builder не забудьте вызвать метод setVisionRequestInitializer(), чтобы указать ключ API. Следующий код показывает, как это сделать:
После того как экземпляр Vision.Builder будет готов, вы можете вызвать его метод build() для создания нового экземпляра Vision, который вы сможете использовать в своем приложении.
На данный момент у вас есть все необходимое, чтобы начать использовать Cloud Vision API.
4. Обнаружение и анализ лиц
Распознавание лиц на фотографиях — очень распространенное требование в приложениях, связанных с компьютерным зрением. С помощью Cloud Vision API вы можете создать высокоточный детектор лиц, который также может определять эмоции, условия освещения и ориентиры лица.
Для демонстрации мы запустим распознавание лиц на следующей фотографии, на которой запечатлен экипаж Аполлона-9:
Я предлагаю вам загрузить версию фотографии в высоком разрешении с Викисклада и поместить ее в папку res/raw вашего проекта.
Шаг 1. Закодируйте фотографию
API Cloud Vision ожидает, что его входное изображение будет закодировано как строка Base64, помещенная внутрь объекта Image. Однако перед созданием такого объекта необходимо преобразовать загруженную фотографию, которая в настоящее время является необработанным ресурсом изображения, в массив байтов. Это можно быстро сделать, открыв входной поток с помощью метода openRawResource() класса Resources и передав его методу toByteArray() класса IOUtils.
Поскольку операции файлового ввода-вывода не должны выполняться в потоке пользовательского интерфейса, перед открытием входного потока обязательно создайте новый поток. Следующий код показывает, как это сделать:
Теперь вы можете создать объект изображения, вызвав его конструктор по умолчанию. Чтобы добавить к нему массив байтов в виде строки Base64, все, что вам нужно сделать, это передать массив его методу encodeContent().
Шаг 2. Сделайте запрос
Поскольку Cloud Vision API предлагает несколько различных функций, вы должны явно указать интересующую вас функцию при отправке запроса. Для этого вы должны создать объект Feature и вызвать его метод setType(). В следующем коде показано, как создать объект Feature только для распознавания лиц:
С помощью объектов Image и Feature теперь можно составить экземпляр AnnotateImageRequest.
Обратите внимание, что объект AnnotateImageRequest всегда должен принадлежать объекту BatchAnnotateImagesRequest, поскольку API Cloud Vision предназначен для одновременной обработки нескольких изображений. Чтобы инициализировать экземпляр BatchAnnotateImagesRequest, содержащий один объект AnnotateImageRequest, можно использовать служебный метод Arrays.asList().
Чтобы сделать запрос на обнаружение лица, необходимо вызвать метод execute() объекта Annotate, инициализированного с помощью только что созданного вами объекта BatchAnnotateImagesRequest. Чтобы сгенерировать такой объект, необходимо вызвать метод annotate(), предлагаемый клиентом API Google для Cloud Vision. Вот как:
Шаг 3. Используйте ответ
После обработки запроса вы получаете объект BatchAnnotateImagesResponse, содержащий ответ API. Для запроса обнаружения лица ответ содержит объект FaceAnnotation для каждого лица, обнаруженного API. Вы можете получить список всех объектов FaceAnnotation с помощью метода getFaceAnnotations().
Объект FaceAnnotation содержит много полезной информации о лице, например его местоположение, угол наклона и эмоцию, которую оно выражает. Начиная с версии 1 API может обнаруживать только следующие эмоции: радость, печаль, гнев и удивление.
Чтобы сделать это руководство коротким, давайте теперь просто отобразим следующую информацию в Toast:
- Количество лиц
- Вероятность того, что они выражают радость
Конечно, вы можете получить количество лиц, вызвав метод size() списка, содержащего объекты FaceAnnotation. Чтобы получить вероятность того, что лицо выражает радость, вы можете вызвать метод с интуитивно понятным названием getJoyLikelihood() связанного объекта FaceAnnotation.
Обратите внимание: поскольку простой Toast может отображать только одну строку, вам придется объединить все приведенные выше сведения. Кроме того, Toast может отображаться только из потока пользовательского интерфейса, поэтому убедитесь, что вы вызываете его после вызова метода runOnUiThread(). Следующий код показывает, как это сделать:
Теперь вы можете запустить приложение и увидеть следующий результат:
5. Чтение текста
Процесс извлечения строк текста из фотографий называется оптическим распознаванием символов, или сокращенно OCR. API Cloud Vision позволяет легко создать оптический считыватель символов, который может обрабатывать фотографии как печатного, так и рукописного текста. Более того, у созданного вами читателя не возникнет проблем с чтением текста под углом или текста, наложенного на красочную картинку.
API предлагает две разные функции для OCR:
- TEXT_DETECTION , для чтения небольших объемов текста, например на вывесках или обложках книг.
- и DOCUMENT_TEXT_DETECTION для чтения больших объемов текста, например, на страницах романа.
Действия, которые необходимо выполнить, чтобы сделать запрос OCR, идентичны шагам, которые вы выполнили, чтобы сделать запрос на распознавание лиц, за исключением того, как вы инициализируете объект Feature. Для OCR вы должны установить его тип либо на TEXT_DETECTION, либо на DOCUMENT_TEXT_DETECTION. Пока остановимся на первом.
Конечно, вам также придется поместить фотографию с текстом в папку res/raw вашего проекта. Если у вас нет такой фотографии, вы можете использовать эту, на которой изображен дорожный знак:
Вы можете загрузить версию этой фотографии в высоком разрешении с Викисклада.
Чтобы начать обработку результатов операции OCR, после получения объекта BatchAnnotateImagesResponse необходимо вызвать метод getFullTextAnnotation(), чтобы получить объект TextAnnotation, содержащий весь извлеченный текст.
Затем вы можете вызвать метод getText() объекта TextAnnotation, чтобы фактически получить ссылку на строку, содержащую извлеченный текст.
В следующем коде показано, как отобразить извлеченный текст с помощью всплывающего уведомления:
Если вы сейчас запустите свое приложение, вы должны увидеть что-то вроде этого:
Заключение
В этом руководстве вы узнали, как использовать API Cloud Vision для добавления функций распознавания лиц, эмоций и оптического распознавания символов в приложения для Android. Я уверен, что вы согласитесь со мной, когда я скажу, что эти новые возможности позволят вашим приложениям предлагать более интуитивно понятный и интеллектуальный пользовательский интерфейс.
Стоит отметить, что в Cloud Vision API отсутствует одна важная функция: распознавание лиц. В своей текущей форме API может только обнаруживать лица, но не идентифицировать их.
Чтобы узнать больше об API, вы можете обратиться к официальной документации.
А пока ознакомьтесь с другими нашими руководствами по добавлению компьютерного обучения в свои приложения для Android!
Читайте также: