Какие человеческие способности воспроизводятся компьютером
Обновлено: 21.11.2024
Тематические статьи: к новой форме сосуществования реального мира и кибермира
Лаборатория Human Insight Laboratories в NTT Human Informatics Laboratories стремится углубить наше понимание мыслительных способностей человека, состоящих из восприятия информации человеком, обработки информации человеком, реакции и поведения, а также создать технологии, которые могут воспроизвести эти способности на компьютерах и расширять мыслительные способности человека. В этой статье представлены технологии визуального понимания машинного чтения, моделирования поведения, распознавания речи и дизайна стимулов, улучшающих мышление.
Кёске Нисида, Такэси Курасима, Нобору Миядзаки, Хироюки Тода и Шуичи Нисиока
1. Введение
Целью лаборатории Human Insight Laboratory компании NTT Human Informatics Laboratories является углубление нашего понимания (1) понимания информации человеком (от восприятия к познанию), (2) обработки информации человеком (для интерпретации полученной информации и принятия следующих действий) , и (3) реакция и действие (для воздействия на внешний мир). Мы создаем технологии воспроизведения этих процессов на компьютерах для расширения мыслительных способностей человека. Мы представляем четыре технологии, которые приведут к этой цели, а именно: (i) технологию визуально-машинного чтения-понимания для визуального понимания документов, (ii) технологию моделирования поведения для рассмотрения механизма принятия решений и поведения человека, (iii ) технология распознавания речи для понимания внутреннего состояния человека и (iv) разработка стимулов, усиливающих мышление, для выявления и расширения мыслительных способностей человека.
2. Технология визуального машинного чтения для визуального понимания документов
Для дальнейшего развития служб поиска информации и диалогов/вопросов лаборатория Human Insight Laboratories исследует понимание машинного чтения, с помощью которого искусственный интеллект (ИИ) читает текст, написанный на естественном языке (то есть на языке, используемом в нашей повседневной жизни). ) и понимает его значение [ 1 , 2 ].
Исследования понимания машинного чтения достигли большого прогресса, и, согласно оценочным данным, ИИ превзошел понимание человеческого чтения; однако понимание машинного чтения ограничено тем, что оно может понимать только текстовую информацию. Документы PDF (формат переносимых документов) и слайды презентаций, которые мы используем ежедневно, содержат не только лингвистическую информацию, но и визуальные элементы, такие как размер и цвет шрифта, рисунки, таблицы, графики и информацию о макете. Таким образом, комплексное понимание зрения и языка имеет важное значение для разработки ИИ для поддержки офисной работы и повседневной жизни.
Для достижения визуального машинного понимания изображений документов (рис. 1) мы в Human Insight Laboratory создали набор данных под названием VisualMRC [3] и продолжаем исследования с его использованием. Этот набор данных состоит из данных вопросов и ответов в произвольном формате, касающихся изображений документов и скриншотов веб-страниц, а области в документах аннотированы девятью классами, включая заголовок, абзац, список, изображение и подпись. Мы провели исследование с использованием этого набора данных и предложили модель визуального машинного чтения, которая может учитывать в качестве дополнительных входных данных области в документе (извлекаемые с использованием технологии распознавания объектов), а также информацию о положении и внешнем виде «токенов». (извлечено с использованием технологии оптического распознавания символов) [3] . Хотя эта модель еще не может сравниться с точностью ответов человека на вопросы, мы подтвердили, что понимание визуальной информации документов повышает эффективность ответов на вопросы по сравнению с моделями, основанными только на тексте. Мы продолжим работу над различными исследовательскими проектами для комплексного понимания зрения и языка.
Рис. 1. Визуальное машинное понимание чтения.
3. Технология моделирования поведения для рассмотрения механизма принятия решений и поведения человека
Мы изучаем механизмы принятия решений и суждений о поведении человека (включая иррациональные суждения), используя как гуманитарные, так и социологические знания (например, поведенческую экономику) и различные данные о людях, которые стали доступны с недавним распространением Интернет вещей. Мы также создаем поведенческую модель, которая воспроизводит процесс принятия решений и поведение человека, используя полученные знания в качестве основы, и стремимся применить эту модель для будущих прогнозов и моделирования людей. Когда предсказано нежелательное будущее, мы сможем использовать результаты моделирования для поиска путей, которые приведут к более светлому будущему.
В рамках наших усилий по объяснению механизма принятия решений человеком мы изучали влияние таких факторов, как личность, ценности, физическое и психологическое состояние и социальная среда, на принятие человеком решений и поведение. Экологическая мгновенная оценка (EMA), также известная как метод выборки опыта, представляет собой метод опроса, при котором участникам отправляются простые вопросы об их ситуации, мыслях, эмоциях и поведении через портативное устройство (например, смартфон или планшет) и задаются спонтанно отвечать на вопросы. Используя результаты 10-недельного анкетирования студентов вузов [4], мы подробно проанализировали различия в склонности студентов отвечать на анкету по индивидуальным характеристикам с точки зрения временных изменений [5]. Например, как показано на рис. 2(а), участники, у которых ежедневно отмечался высокий уровень стресса (согласно предварительному опросу, проведенному до начала опроса EMA), были склонны к активному самораскрытию информации своим устройства в течение всего периода обследования. Однако наш анализ показал, что сразу после стрессового события (например, очередного экзамена) студенты, как правило, отказывались отвечать на вопросы, и объем их ответов резко снижался. Мы также обнаружили, что участники, которые в предварительном опросе были оценены как высокопорядочные, сотрудничали и давали большое количество ответов сразу после начала опроса EMA; однако количество их ответов со временем значительно уменьшалось. Углубляя наше понимание временных изменений в таком человеческом поведении (в данном случае акт добровольного ответа на вопросник), можно будет предсказать, что произойдет в отношении поведения людей и результатов, и будет легче принимать решения относительно как изменить будущее к лучшему. С точки зрения постоянного понимания состояния человека опросник EMA должен обеспечивать единообразное количество ответов без предвзятости по времени или участникам. Например, если ожидается, что количество ответов уменьшится, как показано на рис. 2(b), можно дать специальные стимулы участникам с высоким уровнем стресса, чтобы побудить их ответить после теста.
Рис. 2. Поиск стратегий на основе результатов поведенческого анализа данных.
Приведенный выше пример — это всего лишь анализ, который фиксирует один аспект сложного человеческого поведения. В будущем мы планируем усложнить наши модели принятия решений и поведения человека [6] за счет учета поведенческих экономических характеристик человека, таких как отношение к неопределенности (склонность к избеганию риска) и к ожиданию (терпение). Под «сложной» мы подразумеваем, что такая модель сможет принимать более «человеческие» решения. Мы считаем, что, поскольку модель «похожа на человека», можно предсказать и изобразить будущее общества, даже нежелательное будущее.
4. Технология распознавания речи для понимания внутреннего состояния человека
С появлением голосовых помощников, которые позволяют пользователям управлять устройствами, говоря в смартфон или динамик с искусственным интеллектом, технология распознавания речи быстро распространилась по всему миру. Практическое применение технологии распознавания речи для работы на компьютерах посредством разговорных диалогов с использованием обмена короткими словами началось в 1980-х годах с появлением интерактивных систем голосового ответа. Появление автомобильных (спутниковых) навигационных систем в 1990-х годах и технологии глубокого обучения в последние годы значительно повысили точность распознавания речи и стимулировали быстрое распространение голосовых помощников.
Естественное общение между людьми включает в себя более длинные предложения и более сложные языковые выражения, с которыми распознавание речи сложнее справиться, чем с короткими предложениями, произносимыми голосовому помощнику. Более того, когда собеседник знаком, тон голоса становится более небрежным, а высказывания фрагментарными, что затрудняет прогнозирование как звуков, так и языковых выражений. Несмотря на эти трудности, распознавание такой разговорной речи может быть использовано для приложений, имеющих значительную ценность для бизнеса, таких как анализ содержания разговоров в журналах вызовов, хранящихся в большом количестве в колл-центрах, и поддержка разговоров в режиме реального времени; соответственно, активно изучаются различные технологии распознавания речи, основанные на глубоком обучении. Как показано на рис. 3, технология распознавания речи развивалась за счет неоднократных улучшений точности преобразования речи в текст, расширения ее применения и увеличения сложности обрабатываемой речи.
Рис. 3. Усилия NTT в отношении технологии распознавания голоса.
Информация, передаваемая посредством речи, включает не только вербальную информацию (текстовую информацию), но и невербальную информацию, такую как пол, возраст, эмоции, намерения и отношения. Помимо работы над распознаванием текстовой информации из речи с высокой точностью, мы исследуем технологии распознавания и использования невербальной информации и разрабатываем технологии, которые могут извлекать атрибуты говорящего (взрослый мужчина, взрослая женщина и ребенок), эмоции (радость, гнев , грусть и спокойствие), а также вопросы и/или не вопросы. Мы также исследуем, разрабатываем и применяем на практике технологии оценки степени гнева и/или удовлетворенности клиента, а также впечатления, которое производит на этого клиента ответ телефонистки во время разговорной речи двух говорящих (например, когда клиент звонит в колл-центр).
Технология распознавания вербальной и невербальной информации, которую мы в настоящее время изучаем, является первым шагом к считыванию внутреннего состояния человека таким образом, который позволяет нам предлагать более продвинутые услуги. В повседневном разговоре мы используем различные подсказки, такие как тон голоса, линия взгляда, выражение лица, длина паузы во время общения и изменения формулировок, чтобы оценить информацию в уме человека, такую как его эмоции и интересы или дружелюбие и безразличие. и мы используем эту информацию для обеспечения беспрепятственного общения. Ожидается, что распознавание такой внутренней информации с помощью машины приведет к появлению новых сервисов, нацеленных на тонкости человеческого разума, которые невозможно выразить словами. Такие услуги могут включать в себя агент голосового диалога, настроенный на эмоции пользователя, обучение, которое реагирует на понимание и интересы каждого учащегося, а также определение физического состояния пациента и психического стресса на основе данных диалога медицинского интервью. Ожидается также, что он внесет свой вклад в создание нового типа связи, на что нацелена грандиозная задача «Связь между разумами», поставленная перед Digital Twin Computing (DTC), которая является одним из элементов IOWN (Инновационная оптическая и Wireless Network), продвигаемый NTT Group, который может непосредственно понимать, как люди воспринимают и чувствуют, и преодолевает различия в индивидуальных характеристиках, таких как опыт и чувствительность.
5. Дизайн стимуляторов, улучшающих мышление, для выявления и расширения мыслительных способностей человека
На мысли и поведение человека влияет не только информация, которая интерпретируется сознательно, например язык и числовые значения, но и ощущения и восприятия, которые воспринимаются бессознательно, например цвета, запахи и атмосфера, создаваемая манерой поведения. Говорящий. Например, запах мыла заставляет нас хотеть умыться [7], а изменение цвета упаковки продукта заставляет нас чувствовать, что продукт отличается, даже если он содержит то же самое [8] .
Мы накапливаем знания о взаимосвязи между перцептивными стимулами и человеческим мышлением и поведением, и на основе этой взаимосвязи мы исследуем создание и контроль перцептивных стимулов с целью выявления и расширения мыслительных способностей человека. В одном из наших предыдущих исследований мы исследовали влияние стиля речи говорящего (высоты голоса, скорости речи и интонации) на психологическое состояние и поведение человека [9] . В этом исследовании мы провели крупномасштабный эксперимент по субъективной оценке взаимосвязи между речью, продвигающей товары, и потребительским поведением людей, и проанализировали взаимосвязь между речью и намерением совершить покупку, используя модель потребительского поведения, разработанную Мехрабяном и Расселом [10]. (рис. 4), который выражает эмоции как посредник.
Рис. 4. Модель потребительского поведения.
5.1 Экспериментальная процедура
С помощью краудсорсинга мы попросили 202 носителя японского языка (мужчин и женщин) послушать рекламу электроприбора, произнесенную в разных стилях речи. После прослушивания мы попросили их ответить на оценочные вопросы об эмоциях и мотивации к покупке, которые они испытали, слушая устную рекламу. Затем мы проанализировали взаимосвязь между речевыми характеристиками, эмоциями и намерением совершить покупку на основе полученных параметров (тембр голоса, скорость речи и интонация), связанных с речью объявления (голосовыми характеристиками) и ответами на пункты оценки. Рекламный текст объявления был основан на речи, произнесенной профессиональным диктором женского пола в тоне чтения вслух, где параметры речи были установлены, как показано в Таблице 1. Элементы оценки перечислены в Таблице 2.
Таблица 1. Голосовые параметры. Таблица 2. Элементы оценки.
5.2 Результаты
Результаты анализа взаимосвязи между речевыми характеристиками, эмоциями и намерением совершить покупку с использованием трехуровневой модели, основанной на модели потребительского поведения Мехрабиана и Рассела, показаны на рис. 5. В соответствии с предыдущими исследованиями [11]. ] результаты показывают, что среди эмоций «удовольствие» и «возбуждение» положительно влияют на намерение совершить покупку. Они также указывают, что эффект удовольствия является самым сильным, более высокий голос, более высокая скорость речи и более высокая интонация приводят к более высокой оценке эмоций, и среди этих параметров скорость речи оказала наибольшее влияние на элементы оценки.
Рис. 5. Результаты анализа связи между характеристиками голоса, эмоциями и намерением совершить покупку.
Подводя итог этим результатам, мы обнаружили, что (i) модель потребительского поведения действительна для речевого стимула, основанного на прочитанной рекламе, и (ii) скорость речи оказывает самое сильное влияние на удовольствие, которое оказывает самое сильное влияние. влияние на намерение совершить покупку.
Описанные выше усилия представляют собой анализ лишь небольшой части сложных и разнообразных мыслительных процессов человека. Мы планируем изучить более широкий спектр факторов, таких как связь между атрибутами слушателей со слуховым стимулом, и исследовать неслуховые стимулы, такие как зрение и обоняние. Мы также планируем изучить влияние стимулов на явления человеческого мышления — от интуитивных суждений до более глубоких стадий, таких как влияние на логическое мышление и человеческие ценности. С помощью этих исследований мы хотим выяснить, что необходимо для развития мыслительных способностей человека, расширения человеческого потенциала и внесения вклада в создание лучшего общества.
6. Заключительные замечания
Усовершенствуя четыре технологии, описанные в этой статье, мы планируем понять, воспроизвести и расширить мыслительные способности человека, которые состоят из понимания информации человеком, обработки информации человеком, реакции и поведения.
Кризис COVID-19 ускорит ряд изменений и преобразований в человеческом обществе. Примечательно, что ожидается, что пандемия значительно ускорит Четвертую промышленную революцию.
Вы читали?
Это связано с тем, что кризис с коронавирусом вынудил людей оставаться дома и свести к минимуму контакты, чтобы сдержать распространение инфекции. В результате бесконтактные технологии получат еще большее распространение в обществе.
Технологии, которые будут распространяться быстрее всего, связаны с цифровой трансформацией (DX), включая онлайн-конференции, виртуальную реальность и дополненную реальность (VR и AR), робототехнику и искусственный интеллект (ИИ), дроны и автоматизированное вождение. Именно Четвертая промышленная революция способствовала быстрому развитию всех этих технологий.
Итак, каковы последствия такого ускорения Четвертой промышленной революции, вызванного коронавирусным кризисом?
Массовая безработица произойдет из-за технологий робототехники, искусственного интеллекта, дронов и автоматизированного вождения, которые распространяются в обществе в ответ на кризис. Эта революция отнимет рабочие места у многих работников самых разных профессий.
Те, кто занимается простым ручным трудом, который можно заменить такими технологиями, как роботы, дроны и автоматизированное вождение, потеряют работу. Тем не менее, эти люди, вероятно, могут получить новую работу, изучив несколько более продвинутые навыки ручного труда, даже если их рабочие места будут сокращены.
Более серьезная проблема безработицы, созданная Четвертой промышленной революцией, — это перспектива того, что многие работники, ранее занятые в экономике знаний, потеряют работу из-за стремительно развивающегося ИИ.
Примечательно, что многие из тех, кто будет уволен с работы, — это люди, занятые на работе, которая зависит от применения профессиональных знаний и суждений, основанных на логическом мышлении — двух навыках, в которых ИИ имеет подавляющее преимущество. Юристы, бухгалтеры, врачи, фармацевты и представители других профессий не являются исключением.
Итак, какие способности мы должны развивать в ближайшие годы, учитывая быстрый прогресс Четвертой промышленной революции? И на каких способностях должны сосредоточиться страны и компании при развитии своих человеческих ресурсов?
Несмотря на то, что на ежегодном собрании Всемирного экономического форума в Давосе и в Совете по глобальной повестке дня состоялось множество дискуссий, многие эксперты пришли к единому мнению о трех передовых способностях, которые нельзя заменить искусственным интеллектом: гостеприимство, управление и креативность. .
В действительности, однако, быстро развивающиеся технологии искусственного интеллекта заменят эти три способности на рудиментарных уровнях. Поэтому нам необходимо приобретать и совершенствовать более сложные способности в этих областях, чтобы их нельзя было заменить искусственным интеллектом.
Что касается гостеприимства, ИИ может легко взять на себя стандартные услуги, основанные на вербальном общении, такие как прием и информационные услуги. По этой причине людям необходимо приобретать более продвинутые навыки гостеприимства.
Во-первых, это способность осуществлять невербальное общение. Другими словами, нам нужно улучшить нашу способность слушать тихий голос клиентов, понимать, что они чувствуют, и передавать теплые чувства, которые превосходят слова.
Во-вторых, способность проявлять глубокое сочувствие к клиентам. Это самая важная способность, которая позволяет нам использовать наши невербальные коммуникативные навыки на самом высоком уровне. Излишне говорить, что эти два навыка никогда не заменит искусственный интеллект.
Во-вторых, что касается управления, ИИ призван заменить работников в таких задачах, как управление финансами, управление материалами, управление персоналом и управление проектами, в которых ожидается, что в будущем способности ИИ превзойдут возможности человека. Это направит людей к более сложным управленческим задачам, которые нельзя заменить искусственным интеллектом. Следующие две способности играют ключевую роль в этой области.
Во-первых, это способность управлять ростом. Это способность поддерживать членов организации в развитии их навыков и профессиональном росте, и это основано на коучинговых способностях.
Во-вторых, это способность управлять разумом. Это способность поддерживать выздоровление членов организации, находящихся в бедственном положении, когда они страдают от проблем, возникающих в межличностных отношениях или других проблем, и она основана на навыках консультирования.
Оба этих навыка, которые никогда не сможет заменить ИИ, будут чрезвычайно важны для менеджеров и лидеров на рабочем месте в грядущем Обществе передовых знаний.
Что касается творчества, ИИ никогда не сможет заменить гениальность: он включает в себя такие навыки, как изобретение инновационных технологий и предложение новых дизайнов. Однако такие способности недоступны большинству людей.
Что же представляет собой творчество, которое каждый может продемонстрировать в эпоху ИИ? Во-первых, это способность осуществлять управление коллективным разумом. Это способность лидеров управлять членами организации, объединяя их, побуждая делиться своими знаниями и мудростью и способствуя появлению новых знаний и мудрости, возникающих в результате этого процесса.
Жизненно важными элементами, позволяющими продемонстрировать этот навык, являются способность выражать видение, которое волнует членов вашей организации; и способность управлять своим эго, создавая форум, где участники могут выйти за пределы личности и сотрудничать друг с другом.
Во-вторых, это способность реализовывать новые идеи в организации. Это способность выходить за рамки простого предложения новых идей, красиво объяснять идею, умело убеждать начальника и плавно продвигать организацию к реализации идеи.
На самом деле креативность, которая действительно требуется в корпоративной организации, включает в себя гораздо больше, чем способность предлагать новые идеи. Для этого также требуются две другие способности, которые ИИ никогда не сможет заменить: способность управлять коллективным разумом и способность реализовывать новые идеи в организации.
Что делает Всемирный экономический форум в связи с Четвертой промышленной революцией?
Всемирный экономический форум первым привлек внимание всего мира к Четвертой промышленной революции — нынешнему периоду беспрецедентных изменений, вызванных быстрым технологическим прогрессом. Политика, нормы и правила не поспевают за темпами инноваций, что создает растущую потребность в заполнении этого пробела.
В 2017 году Форум создал Сеть Центра четвертой промышленной революции, чтобы гарантировать, что новые и новейшие технологии будут помогать, а не вредить человечеству в будущем. Сеть со штаб-квартирой в Сан-Франциско открыла центры в Китае, Индии и Японии в 2018 году и быстро создает местные партнерские центры во многих странах мира.
Глобальная сеть тесно сотрудничает с партнерами из правительства, бизнеса, научных кругов и гражданского общества, чтобы совместно разрабатывать и тестировать гибкие платформы для управления новыми и появляющимися технологиями, включая искусственный интеллект (ИИ), автономные транспортные средства, блокчейн, политику данных, цифровая торговля, дроны, Интернет вещей (IoT), точная медицина и экологические инновации.
Узнайте больше о новаторской работе, которую проводит Сеть Центра четвертой промышленной революции, чтобы подготовить нас к будущему.
Хотите помочь нам организовать Четвертую промышленную революцию? Свяжитесь с нами, чтобы узнать, как стать участником или партнером.
Ожидается, что этот глубокий кризис и быстро развивающаяся революция приведут к сокращению многих рабочих мест в ближайшие годы, и высококвалифицированные специалисты не застрахованы от этого затруднения.
Если и страны, и предприятия не окажут полную поддержку своим гражданам и работникам в приобретении этих шести способностей, мы не сможем пройти мимо грядущей эры массовой безработицы.
Точно так же, как древние греки мечтали о парящем полете, сегодняшние мечтают о слиянии разума и машины, чтобы решить надоедливую проблему человеческой смертности. Может ли разум напрямую подключаться к искусственному интеллекту, роботам и другим разумам с помощью технологий интерфейса мозг-компьютер (BCI), чтобы превзойти наши человеческие ограничения?
За последние 50 лет исследователи из университетских лабораторий и компаний по всему миру добились впечатляющих успехов в достижении такого видения. Недавно такие успешные предприниматели, как Илон Маск (Neuralink) и Брайан Джонсон (Kernel), объявили о создании новых стартапов, направленных на расширение возможностей человека за счет взаимодействия между мозгом и компьютером.
Насколько мы действительно близки к успешному подключению нашего мозга к нашим технологиям? И какие могут быть последствия, когда наш разум подключен к сети?
Как работают интерфейсы мозг-компьютер и что они могут делать?
Истоки: Реабилитация и реставрация
Эб Фетц, исследователь из Центра сенсомоторной нейронной инженерии (CSNE), является одним из первых, кто соединил машины с разумом. В 1969 году, еще до появления персональных компьютеров, он показал, что обезьяны могут усиливать сигналы своего мозга, чтобы управлять стрелкой, которая движется по циферблату.
Большая часть недавней работы над BCI направлена на улучшение качества жизни людей, которые парализованы или имеют серьезные двигательные нарушения. Возможно, вы видели некоторые недавние достижения в новостях: исследователи Питтсбургского университета используют сигналы, записанные внутри мозга, для управления роботизированной рукой. Исследователи из Стэнфорда могут извлекать намерения парализованных пациентов из сигналов их мозга, что позволяет им использовать планшет без проводов.
Аналогичным образом некоторые ограниченные виртуальные ощущения могут быть отправлены обратно в мозг путем подачи электрического тока внутрь мозга или на его поверхность.
А как насчет наших основных органов зрения и слуха? Очень ранние версии бионических глаз для людей с серьезными нарушениями зрения были запущены в коммерческую эксплуатацию, а улучшенные версии прямо сейчас проходят испытания на людях. С другой стороны, кохлеарные имплантаты стали одними из самых успешных и распространенных бионических имплантатов — более 300 000 пользователей по всему миру используют имплантаты, чтобы слышать.
Самыми сложными BCI являются «двунаправленные» BCI (BBCI), которые могут как записывать, так и стимулировать нервную систему. В нашем центре мы изучаем BBCI как радикально новый инструмент реабилитации после инсульта и травм спинного мозга. Мы показали, что BBCI можно использовать для укрепления связей между двумя областями мозга или между головным и спинным мозгом, а также для перенаправления информации в область повреждения для реанимации парализованной конечности.
Учитывая все эти успехи на сегодняшний день, вы можете подумать, что интерфейс мозг-компьютер станет следующим обязательным потребительским гаджетом.
Еще рано
Сетка электрокортикографии, используемая для обнаружения электрических изменений на поверхности мозга, тестируется на электрические характеристики. Предоставлено: Вашингтонский университет Flickr (CC BY 2.0)
Однако внимательное изучение некоторых из текущих демонстраций НКИ показывает, что нам еще многое предстоит сделать: когда НКИ производят движения, они намного медленнее, менее точны и менее сложны, чем то, что здоровые люди легко делают каждый день с помощью своих конечности.Бионические глаза обеспечивают зрение с очень низким разрешением; кохлеарные имплантаты могут в электронном виде передавать ограниченную речевую информацию, но искажают восприятие музыки. И чтобы все эти технологии заработали, электроды должны быть вживлены хирургическим путем, а сегодня большинство людей даже не рассматривают эту возможность.
Однако не все BCI являются инвазивными. Существуют неинвазивные BCI, не требующие хирургического вмешательства; как правило, они основаны на электрических (ЭЭГ) записях кожи головы и использовались для демонстрации управления курсорами, инвалидными колясками, роботизированными руками, дронами, роботами-гуманоидами и даже межмозговой связью.
Первая демонстрация неинвазивного управляемого мозгом гуманоидного робота-аватара по имени Морфеус в Лаборатории нейронных систем в Вашингтонском университете в 2006 году. Этот неинвазивный BCI определяет, какой объект должен выбрать робот и куда его доставить, основываясь на рефлекторной реакции мозга, когда появляется изображение желаемого объекта или места.
Первая демонстрация неинвазивного управляемого мозгом гуманоидного робота-аватара по имени Морфеус в Лаборатории нейронных систем Вашингтонского университета в 2006 году. Этот неинвазивный BCI делает вывод, какой объект должен выбрать робот и куда его доставить, на основе рефлекторная реакция мозга, когда вспыхивает изображение желаемого объекта или места.
Но все эти демонстрации были в лаборатории, где комнаты тихие, испытуемые не отвлекаются, техническая установка долгая и методичная, а эксперименты длятся ровно столько, сколько нужно, чтобы показать, что концепция возможна. Оказалось очень сложно сделать эти системы достаточно быстрыми и надежными, чтобы их можно было использовать на практике.
Даже с имплантированными электродами еще одна проблема с попыткой читать мысли возникает из-за того, как устроен наш мозг. Мы знаем, что каждый нейрон и тысячи связанных с ним соседей образуют невообразимо большую и постоянно меняющуюся сеть. Что это может означать для нейроинженеров?
Представьте, что вы пытаетесь понять разговор большой группы друзей на сложную тему, но вам разрешено слушать только одного человека. Возможно, вы сможете выяснить очень приблизительную тему разговора, но точно не все детали и нюансы всего обсуждения. Поскольку даже наши лучшие импланты позволяют нам слушать только несколько небольших участков мозга за раз, мы можем делать впечатляющие вещи, но нам далеко не до понимания всего разговора.
Есть также то, что мы называем языковым барьером. Нейроны общаются друг с другом посредством сложного взаимодействия электрических сигналов и химических реакций. Этот родной электрохимический язык можно интерпретировать с помощью электрических цепей, но это непросто. Точно так же, когда мы обращаемся к мозгу с помощью электрической стимуляции, это делается с сильным электрическим «акцентом». Это затрудняет понимание нейронами того, что стимуляция пытается передать среди всей другой продолжающейся нейронной активности.
Наконец, существует проблема повреждений. Мозговая ткань мягкая и гибкая, в то время как большинство наших электропроводящих материалов — проводов, которые соединяются с мозговой тканью — имеют тенденцию быть очень жесткими. Это означает, что имплантированная электроника часто вызывает рубцевание и иммунные реакции, что означает, что имплантаты со временем теряют эффективность. В этом отношении со временем могут помочь гибкие биосовместимые волокна и массивы.
Совместная адаптация, совместное проживание
Несмотря на все эти проблемы, мы с оптимизмом смотрим на наше бионическое будущее. BCI не обязательно должны быть идеальными. Мозг удивительно адаптивен и способен учиться использовать НКИ так же, как мы осваиваем новые навыки, такие как вождение автомобиля или использование интерфейса с сенсорным экраном. Точно так же мозг может научиться интерпретировать новые типы сенсорной информации, даже если она доставляется неинвазивно, например, с помощью магнитных импульсов.
Обучение интерпретации и использованию искусственной сенсорной информации, полученной с помощью неинвазивной стимуляции мозга.
В конечном счете, мы считаем, что «коадаптивный» двунаправленный BCI, в котором электроника обучается вместе с мозгом и постоянно общается с мозгом в процессе обучения, может оказаться необходимым шагом для создания нейронного моста. Целью нашего центра является создание таких коадаптивных двунаправленных BCI.
Мы также рады недавним успехам в целенаправленном лечении таких заболеваний, как диабет, с помощью «электроцевтиков» — экспериментальных небольших имплантатов, которые лечат болезнь без лекарств, передавая команды непосредственно внутренним органам.
Исследователи обнаружили новые способы преодоления электрического и биохимического языкового барьера.Инъекционное «нейронное кружево», например, может оказаться многообещающим способом постепенно позволить нейронам расти вместе с имплантированными электродами, а не отторгать их. Гибкие зонды на основе нанопроволоки, гибкие каркасы нейронов и интерфейсы из стеклоуглерода также могут позволить биологическим и технологическим компьютерам счастливо сосуществовать в наших телах в будущем.
От вспомогательного к усиливающему
Новый стартап Илона Маска, Neuralink, ставит перед собой конечную цель — улучшить людей с помощью BCI, чтобы дать нашему мозгу преимущество в продолжающейся гонке вооружений между человеческим и искусственным интеллектом. Он надеется, что благодаря возможности подключения к нашим технологиям человеческий мозг сможет расширить свои возможности, что, возможно, позволит нам избежать потенциального антиутопического будущего, в котором ИИ намного превзойдет естественные человеческие возможности. Такое видение, конечно, может показаться далеким или фантастичным, но мы не должны отказываться от идеи только из-за странности. В конце концов, еще полтора десятилетия назад беспилотные автомобили относились к области научной фантастики, а теперь делят наши дороги.
В ближайшем будущем, когда интерфейсы мозг-компьютер перейдут от восстановления функций у людей с ограниченными возможностями к расширению возможностей здоровых людей сверх их человеческих возможностей, мы должны остро осознавать множество вопросов, связанных с согласием, конфиденциальностью, идентификацией, агентность и неравенство. В нашем центре команда философов, клиницистов и инженеров активно работает над решением этих этических, моральных и социальных вопросов справедливости и предлагает нейроэтические рекомендации до того, как область продвинется слишком далеко.
Прямое подключение нашего мозга к технологиям может в конечном итоге стать естественным развитием того, как люди на протяжении веков совершенствовали себя с помощью технологий: от использования колес для преодоления ограничений, связанных с прямохождением, до создания записей на глиняных табличках и бумаге для расширения нашей памяти. Подобно современным компьютерам, смартфонам и гарнитурам виртуальной реальности, аугментативные BCI, когда они наконец появятся на потребительском рынке, будут воодушевляющими, разочаровывающими, рискованными и в то же время многообещающими.
Эта статья изначально была опубликована на сайте The Conversation. Прочтите исходную статью.
ОБ АВТОРАХ
Раджеш П. Н. Рао — профессор информатики и инженерии, директор Центра сенсомоторной нейронной инженерии Вашингтонского университета.
Искусственный интеллект превратился из фантастики в важнейшую часть нашей повседневной жизни
Успех в создании эффективного ИИ может стать крупнейшим событием в истории нашей цивилизации. Или самое худшее. Мы просто не знаем. Поэтому мы не можем знать, будет ли ИИ безмерно помогать нам, будет ли он игнорироваться и оттесняться на второй план, или, возможно, будет уничтожен им.
(Легендарный физик Стивен Хокинг)
Искусственный интеллект (ИИ) — это термин, описывающий машинное обучение, логику, рассуждения, восприятие и творчество, которые когда-то считались уникальными для человека, но теперь воспроизводятся технологиями и используются во всех отраслях.
Искусственный интеллект — это использование программирования в области компьютерных наук для имитации человеческого мышления и действий путем анализа данных и окружения, решения или прогнозирования проблем, обучения самообучению или адаптации к различным задачам. ИИ может избавить людей от различных повторяющихся задач. Технология может научиться работать один раз и повторять ее столько раз, сколько пожелает ее человек-программист. ИИ позволяет машинам учиться на собственном опыте, приспосабливаться к новым данным и выполнять задачи, подобные человеческим, от компьютеров, играющих в шахматы, до беспилотных автомобилей, которые в значительной степени зависят от глубокого обучения и обработки естественного языка.
Основная цель искусственного интеллекта, или стимуляция когнитивного поведения, состоит в том, чтобы позволить компьютерам выполнять такие интеллектуальные задачи, как принятие решений, решение проблем, восприятие, понимание человеческого общения на любом языке и перевод между ними.
ИИ – это не только технология. это все больше и больше становится частью нашей повседневной жизни. Каждый день мы наблюдаем новые виды развития в каждой сфере жизни, от политики до экономики. Благодаря технологиям, искусственному интеллекту и Интернету вещей (IoT) мы можем легко получить доступ ко многим точкам, которые раньше были недоступны.
От исследований, которые мы проводим в Интернете, до товаров, которые доставляются к нам одним щелчком мыши, технологии напрямую входят в нашу жизнь. Искусственный интеллект произвел революцию в технологиях во всех отраслях и решил многие проблемы, с которыми сталкивается человечество.
ИИ – это моделирование процессов человеческого интеллекта с помощью машин, особенно компьютерных систем.Эти процессы включают обучение, рассуждение и самокоррекцию. Некоторые приложения искусственного интеллекта включают экспертные системы, речь, распознавание и машинное зрение.
Машинное обучение (ML) – это приложение искусственного интеллекта, которое предоставляет системам возможность автоматически обучаться и совершенствоваться на основе полученного опыта без явного программирования. ML фокусируется на разработке компьютерных программ, которые могут получать доступ к данным и использовать их для самостоятельного обучения. ML — это концепция, согласно которой компьютерная программа может обучаться и адаптироваться к новым данным без вмешательства человека. Машинное обучение — это область искусственного интеллекта, которая поддерживает встроенные алгоритмы компьютера в актуальном состоянии и позволяет машине идентифицировать данные и строить прогнозы на их основе. Машинное обучение полезно при анализе огромных объемов информации и может применяться в различных областях, таких как инвестиции, кредитование, систематизация новостей, обнаружение мошенничества и многое другое. Внедрение машинного обучения в эпоху цифровых технологий бесконечно, поскольку предприятия и правительства все больше осознают возможности, которые открывают большие данные.
Инвестиционные игроки на рынке ценных бумаг, финансовые исследователи, управляющие активами и представители отдельных секторов просматривают горы информации от разных компаний по всему миру, чтобы принимать выгодные решения. Фирма по управлению активами может использовать машинное обучение в области инвестиционного анализа и исследований.
- Искусственный интеллект будет искать оптимальное решение и ведет к разуму или мудрости;
- Машинное обучение подойдет только для решения, оптимального оно или нет, и ведет к знаниям.
Последние разработки в области искусственного интеллекта — это чат-боты, умные автомобили и устройства Интернета вещей. Здравоохранение, банковское дело, логистика и туристический сектор используют искусственный интеллект для повышения качества обслуживания.
Новый тип чат-бота с искусственным интеллектом Replika предназначен для обучения на основе стиля письма человека и каналов социальных сетей, а также содержания разговоров, которые он ведет с человеком. На самом деле, системы искусственного интеллекта были разработаны для понимания контента в открытой форме, такого как естественный язык, социальные сети и ответы по электронной почте.
Мощные решения и возможности искусственного интеллекта развиваются очень быстро, а системы ИИ способны понимать человеческие эмоции и реагировать на них.
Одним из типов ИИ, который быстро проникает в дома большинства потребителей, являются голосовые помощники, такие как Siri от Apple, Alexa от Amazon, Assistant от Google и Cortana от Microsoft.
Самый продвинутый человекоподобный робот компании Hanson Robotic София воплощает в себе мечты людей о будущем искусственного интеллекта. София также является основой для передовых исследований в области робототехники и искусственного интеллекта, особенно для понимания взаимодействия человека и робота и их потенциальных сервисных и развлекательных приложений.
София позиционируется как «социальный робот», который может имитировать поведение и вызывать у людей чувство любви. Программа ИИ анализирует разговоры и извлекает данные, которые позволяют улучшить ответы в будущем.
Виртуальный помощник Alexa, разработанный Amazon, обучается быстрее, чем любой другой помощник, а также может управлять несколькими интеллектуальными устройствами, используя себя в качестве системы домашней автоматизации. Alexa обычно требуется несколько недель, чтобы изучить привычки своего владельца с помощью их умных домашних устройств. Используя технологию искусственного интеллекта в облаке, Alexa создает картину распорядка дня своих владельцев, обращая внимание на время суток, погодные условия и даже смену времен года.
Физический ИИ — это новый рубеж в исследованиях робототехники, который будет иметь большое значение в ближайшие десятилетия. Развитие навыков в области физического ИИ может привести к появлению реалистичных интеллектуальных роботов, и эти роботы будут спроектированы так, чтобы выглядеть и вести себя как люди или животные, обладая при этом интеллектуальными способностями, обычно присущими биологическим организмам (например, человекоподобный робот по имени Адам в романе Иэна Макьюэна ). >Машины вроде меня).
В будущем эти роботы могли бы помогать людям на работе и в повседневной жизни, выполняя опасные для человека задачи и помогая в медицине, уходе, безопасности, строительстве и промышленности.
Однако профессор Мирко Ковач из Швейцарско-федеральной лаборатории материалов, науки и технологий Центра робототехники сказал: «Разработка «тел» роботов значительно отстает от разработки «мозгов» роботов, в отличие от цифрового ИИ, который интенсивно изучался в последние несколько десятилетий; вдыхание в них физического разума остается сравнительно неизученным».
Создание реалистичных роботов может стать возможным благодаря включению физического искусственного интеллекта в систему высшего образования, развитию навыков и междисциплинарному поиску ИИ, что приблизит нас к переосмыслению взаимодействия человека и робота с окружающей средой.
У искусственного интеллекта много преимуществ: сокращение числа человеческих ошибок, принятие рисков вместо людей, доступность 24/7, помощь в повторяющихся задачах, цифровая помощь и более быстрое принятие решений.
При правильном кодировании у ИИ будет меньше ошибок, чем у людей. Он будет иметь невероятную точность, точность и скорость, и на него не повлияет враждебная среда, поэтому он сможет выполнять опасные задачи, исследовать космос и справляться с проблемами, которые могут ранить или убить людей.
ИИ может значительно повысить эффективность наших рабочих мест и избавить людей от необходимости выполнять утомительные задачи. Когда искусственный интеллект берет на себя повторяющиеся или опасные задачи, он освобождает людей, позволяя им выполнять задачи, требующие творчества, и оставляет достаточно места и времени для межличностных аспектов их жизни.
Искусственный интеллект делает жизнь людей более эффективной, обеспечивая работу многих программ и сервисов, которые помогают им выполнять повседневные задачи, например общаться с друзьями и использовать программу электронной почты или сервис совместных поездок.
Лучшими примерами использования ИИ в повседневной жизни являются навигация для путешествий, умные домашние устройства, смартфоны, дроны и умные автомобили. Электромобили Tesla — яркий пример того, как искусственный интеллект влияет на повседневную жизнь людей, а такие компании, как Amazon и Walmart, вкладывают значительные средства в программы доставки дронами.
Финансовая отрасль использует искусственный интеллект для анализа данных, чтобы найти наилучшие способы вложения денег. Банковская и финансовая отрасли в значительной степени полагаются на искусственный интеллект, используя все преимущества этой технологии в обслуживании клиентов, защите от мошенничества и многом другом. Простым примером является автоматическое электронное письмо, которое человек получает от банка всякий раз, когда совершается необычная транзакция.
Мы также используем ИИ в навигации и путешествиях, независимо от того, бронируем ли мы авиабилеты или используем карты Google или Apple для навигации или вызова Uber.
В сельском хозяйстве некоторые искусственные роботы способны собирать урожай быстрее и выше, чем люди.
Мы можем ожидать совершенно другого будущего для здравоохранения, когда операции будут выполнять роботы-хирурги. Физический хирург будет только зрителем. Инженеры-нанотехнологи напечатали на 3D-принтере реалистичную функциональную сеть кровеносных сосудов, которая может проложить путь к созданию искусственных органов и регенеративной терапии.
Социальные роботы могут использоваться в системах здравоохранения и образования для поддержки терапевтов и могут быть запрограммированы для тренировки словарного запаса с детьми.
Алгоритмы уголовного правосудия могут поддерживать верховенство закона в системе уголовного правосудия. ИИ можно использовать для прогнозирования преступлений, и благодаря ИИ мы увидим решения, из которых исключены человеческие предубеждения и эмоциональное мышление судей.
Интеллектуальное прогнозирование погоды дало нам столь необходимую информацию об экстремальных климатических явлениях, а искусственный интеллект наглядно продемонстрировал свою незаменимость при анализе интеллектуальных мер реагирования на стихийные бедствия.
Искусственный интеллект и глобальное использование больших технологий, распознавание лиц, кибернетика, робототехника, дроны, 5G, смартфоны, криптовалюты, биоцифровые социальные программы, автономное оружие, социальные манипуляции, вторжение в частную жизнь и отслеживание информации без согласия может иметь потенциально вредные последствия.
Вторжение в частную жизнь. Конфиденциальность — это основное право человека, но ИИ может привести к потере конфиденциальности в будущем. Даже сегодня нас можно легко отследить. Новейшие технологии, такие как распознавание лиц, могут идентифицировать любого человека в толпе, и все камеры видеонаблюдения оснащены этим. Возможности ИИ по сбору данных также означают, что график вашей повседневной деятельности может быть создан путем доступа к данным человека из различных сайтов социальных сетей. Китай в настоящее время работает над системой социального кредита, которая будет работать на основе искусственного интеллекта, который будет давать всем гражданам Китая баллы в зависимости от их поведения. Это может включать неуплату кредитов, парковку в неположенных местах, курение в некурящих местах, громкую музыку в поездах и т. д. Низкий балл может означать трудности с трудоустройством, запрет зачисления детей в определенные школы, запрет в путешествии или с более низким социальным статусом.
Автономное вооружение. Эти «роботы-убийцы» — это военные роботы и дроны, которые могут самостоятельно искать свои цели и прицеливаться в соответствии с заранее запрограммированными инструкциями. Практически все технически развитые страны мира разрабатывают таких роботов. Будущие войны не будут вестись людьми, и использование автономного смертоносного оружия будет неизбежным. Но что, если такое оружие не может отличить свои цели от невинных людей? Серьезной проблемой было бы, если бы эти роботы-убийцы были разработаны правительствами, которым наплевать на человеческую жизнь.
Потеря рабочих мест. По мере того, как ИИ будет становиться все более продвинутым, он, очевидно, возьмет на себя работу, которую когда-то выполняли люди.Согласно отчету Глобального института McKinsey, к 2030 году из-за автоматизации во всем мире может быть потеряно около 800 миллионов рабочих мест. Роботам не нужно платить, поэтому владельцы компаний, управляемых ИИ, будут получать всю прибыль, увеличивая разрыв между богатые и бедные еще больше.
ИИ-терроризм. Дроны уже используются в террористических атаках, а автономные транспортные средства также могут использоваться для доставки и взрыва бомб или создания оружия, которое могло бы отслеживать движение без какой-либо помощи человека.
Искусственный интеллект развивается быстрыми темпами, и будущее наступает быстрее, чем предсказания, показанные в фильме Особое мнение, действие которого происходит в 2054 году. К 2024 году ИИ будет лучше людей переводить языки, а продавать товары на 2031 г. и проведение операций к 2053 г. ИИ станет неотъемлемой частью нашей жизни, и пришло время подготовиться к эпохе ИИ, инвестируя в образование и обучение. За нами остается выбор: повышать квалификацию и участвовать в Четвертой промышленной революции.
Читайте также: