Какие человеческие знания моделируются и обрабатываются с помощью компьютера

Обновлено: 09.07.2026

В этом введении в машинное обучение представлен обзор его истории, важных определений, приложений и проблем современного бизнеса.

Что такое машинное обучение?

Машинное обучение – это область искусственного интеллекта (ИИ) и компьютерных наук, в которой основное внимание уделяется использованию данных и алгоритмов для имитации того, как люди учатся, с постепенным повышением точности.

IBM имеет богатую историю машинного обучения. Одному из них, Артуру Сэмюэлю, приписывают создание термина «машинное обучение» в его исследовании (PDF, 481 КБ) (ссылка находится вне IBM) игры в шашки. Роберт Нили, самопровозглашенный мастер шашек, играл в эту игру на компьютере IBM 7094 в 1962 году и проиграл компьютеру. По сравнению с тем, что можно сделать сегодня, этот подвиг кажется почти тривиальным, но он считается важной вехой в области искусственного интеллекта. В течение следующих нескольких десятилетий технологические разработки, связанные с хранением и вычислительной мощностью, позволят создать ряд инновационных продуктов, которые мы знаем и любим сегодня, таких как система рекомендаций Netflix или беспилотные автомобили.

Машинное обучение — важный компонент растущей области науки о данных. Благодаря использованию статистических методов алгоритмы обучаются делать классификации или прогнозы, раскрывая ключевые идеи в рамках проектов интеллектуального анализа данных. Эти идеи впоследствии влияют на принятие решений в приложениях и компаниях, в идеале влияя на ключевые показатели роста. Поскольку большие данные продолжают расширяться и расти, рыночный спрос на специалистов по данным будет расти, что потребует от них помощи в определении наиболее важных бизнес-вопросов, а затем и данных для ответов на них.

Машинное обучение, глубокое обучение и нейронные сети

Поскольку глубокое обучение и машинное обучение, как правило, используются взаимозаменяемо, стоит обратить внимание на нюансы между ними. Машинное обучение, глубокое обучение и нейронные сети — все это подобласти искусственного интеллекта. Однако на самом деле глубокое обучение — это часть машинного обучения, а нейронные сети — часть глубокого обучения.

Способ, которым глубокое обучение и машинное обучение отличаются, заключается в том, как каждый алгоритм обучается. Глубокое обучение автоматизирует большую часть процесса извлечения признаков, устраняя часть необходимого ручного вмешательства человека и позволяя использовать большие наборы данных. Вы можете думать о глубоком обучении как о «масштабируемом машинном обучении», как отмечает Лекс Фридман в этой лекции Массачусетского технологического института (01:08:05) (ссылка находится вне IBM). Классическое или «неглубокое» машинное обучение больше зависит от вмешательства человека. Эксперты-люди определяют набор функций, чтобы понять различия между входными данными, что обычно требует более структурированных данных для изучения.

«Глубокое» машинное обучение может использовать помеченные наборы данных, также известное как обучение с учителем, для информирования своего алгоритма, но для этого не обязательно требуется помеченный набор данных. Он может принимать неструктурированные данные в необработанном виде (например, текст, изображения) и может автоматически определять набор функций, которые отличают разные категории данных друг от друга. В отличие от машинного обучения, для обработки данных не требуется вмешательство человека, что позволяет масштабировать машинное обучение более интересными способами. Глубокое обучение и нейронные сети в первую очередь способствовали ускорению прогресса в таких областях, как компьютерное зрение, обработка естественного языка и распознавание речи.

Нейронные сети, или искусственные нейронные сети (ИНС), состоят из слоев узлов, содержащих входной слой, один или несколько скрытых слоев и выходной слой. Каждый узел или искусственный нейрон соединяется с другим и имеет соответствующий вес и порог. Если выход любого отдельного узла превышает указанное пороговое значение, этот узел активируется, отправляя данные на следующий уровень сети. В противном случае данные не передаются на следующий уровень сети. «Глубокое» в глубоком обучении просто относится к глубине слоев в нейронной сети. Нейронная сеть, состоящая из более чем трех слоев, включая входные и выходные данные, может считаться алгоритмом глубокого обучения или глубокой нейронной сетью. Нейронная сеть, состоящая только из двух или трех слоев, — это просто базовая нейронная сеть.

См. сообщение в блоге "Искусственный интеллект, машинное обучение, глубокое обучение и нейронные сети: в чем разница?" для более подробного изучения взаимосвязи различных концепций.

Как работает машинное обучение

Калифорнийский университет в Беркли (ссылка находится за пределами IBM) разбивает систему обучения алгоритма машинного обучения на три основные части.

Процесс принятия решения. Как правило, алгоритмы машинного обучения используются для прогнозирования или классификации. На основе некоторых входных данных, которые могут быть помечены или не помечены, ваш алгоритм произведет оценку закономерности в данных.
Функция ошибки. Функция ошибки служит для оценки предсказания модели. Если есть известные примеры, функция ошибок может провести сравнение для оценки точности модели.
Процесс оптимизации модели. Если модель может лучше соответствовать точкам данных в обучающем наборе, веса корректируются, чтобы уменьшить несоответствие между известным примером и оценкой модели. Алгоритм будет повторять этот процесс оценки и оптимизации, автономно обновляя веса, пока не будет достигнут порог точности.

Методы машинного обучения

Классификаторы машинного обучения делятся на три основные категории.

Машинное обучение под наблюдением

Обучение с учителем, также известное как машинное обучение с учителем, основано на использовании помеченных наборов данных для обучения алгоритмов, позволяющих точно классифицировать данные или прогнозировать результаты. Когда входные данные поступают в модель, она корректирует свои веса до тех пор, пока модель не будет подогнана должным образом. Это происходит как часть процесса перекрестной проверки, чтобы гарантировать, что модель избегает переобучения или недообучения. Обучение под наблюдением помогает организациям решать множество реальных проблем в масштабе, таких как классификация спама в отдельной папке из папки «Входящие». Некоторые методы, используемые в обучении с учителем, включают нейронные сети, наивный байесовский метод, линейную регрессию, логистическую регрессию, случайный лес, метод опорных векторов (SVM) и другие.

Машинное обучение без учителя

Неконтролируемое обучение, также известное как неконтролируемое машинное обучение, использует алгоритмы машинного обучения для анализа и кластеризации немаркированных наборов данных. Эти алгоритмы обнаруживают скрытые шаблоны или группы данных без необходимости вмешательства человека. Его способность обнаруживать сходства и различия в информации делает его идеальным решением для исследовательского анализа данных, стратегий перекрестных продаж, сегментации клиентов, распознавания изображений и образов. Он также используется для уменьшения количества функций в модели посредством процесса уменьшения размерности; Анализ основных компонентов (PCA) и разложение по сингулярным числам (SVD) являются двумя распространенными подходами для этого. Другие алгоритмы, используемые в неконтролируемом обучении, включают нейронные сети, кластеризацию k-средних, вероятностные методы кластеризации и многое другое.

Обучение под наблюдением

Обучение с частичным учителем предлагает золотую середину между обучением с учителем и обучением без учителя. Во время обучения он использует меньший помеченный набор данных для классификации и извлечения признаков из большего неразмеченного набора данных. Полууправляемое обучение может решить проблему нехватки помеченных данных (или невозможности пометить достаточно данных) для обучения алгоритма обучения с учителем.

Чтобы глубже понять различия между этими подходами, ознакомьтесь с разделом "Обучение с учителем и без учителя: в чем разница?"

Машинное обучение с подкреплением

Машинное обучение с подкреплением — это поведенческая модель машинного обучения, аналогичная обучению с учителем, но алгоритм не обучается на примерах данных. Эта модель учится на ходу путем проб и ошибок. Последовательность успешных результатов будет подкреплена для разработки наилучшей рекомендации или политики для данной проблемы.

Хорошим примером является система IBM Watson®, победившая в конкурсе Jeopardy! в 2011 году. Система использовала обучение с подкреплением, чтобы решить, стоит ли пытаться ответить (или как бы задать вопрос), какую клетку выбрать на доске и сколько ставить, особенно на ежедневные удвоения.

Реальные примеры использования машинного обучения

Вот несколько примеров машинного обучения, с которыми вы можете сталкиваться каждый день:

Распознавание речи. Оно также известно как автоматическое распознавание речи (ASR), компьютерное распознавание речи или преобразование речи в текст. Это функция, использующая обработку естественного языка (NLP) для преобразования человеческой речи в письменный формат. . Многие мобильные устройства включают в свои системы распознавание речи для осуществления голосового поиска. Siri — или предоставьте дополнительные возможности для текстовых сообщений.

Обслуживание клиентов. Онлайн-чат-боты заменяют людей на пути к покупке. Они отвечают на часто задаваемые вопросы (FAQ) по таким темам, как доставка, или предоставляют персональные советы, перекрестные продажи продуктов или предлагают размеры для пользователей, изменяя наше представление о взаимодействии с клиентами на веб-сайтах и платформах социальных сетей. Примеры включают боты для обмена сообщениями на сайтах электронной коммерции с виртуальными агентами, приложения для обмена сообщениями, такие как Slack и Facebook Messenger, а также задачи, обычно выполняемые виртуальными помощниками и голосовыми помощниками.

Компьютерное зрение. Эта технология искусственного интеллекта позволяет компьютерам и системам извлекать значимую информацию из цифровых изображений, видео и других визуальных входных данных и на основе этих входных данных выполнять действия. Эта способность давать рекомендации отличает его от задач распознавания изображений.Компьютерное зрение, основанное на сверточных нейронных сетях, применяется для пометки фотографий в социальных сетях, рентгенологических изображений в здравоохранении и беспилотных автомобилей в автомобильной промышленности.

Системы рекомендаций. Алгоритмы искусственного интеллекта, используя данные о прошлом потреблении, могут помочь обнаружить тенденции данных, которые можно использовать для разработки более эффективных стратегий перекрестных продаж. Это используется для предоставления релевантных дополнительных рекомендаций покупателям в процессе оформления заказа для интернет-магазинов.

Автоматизированная торговля акциями. Платформы для высокочастотной торговли на основе искусственного интеллекта, предназначенные для оптимизации портфелей акций, совершают тысячи и даже миллионы сделок в день без вмешательства человека.

Проблемы машинного обучения

Развитие технологий машинного обучения, безусловно, сделало нашу жизнь проще. Однако внедрение машинного обучения в бизнесе также вызвало ряд этических проблем, связанных с технологиями искусственного интеллекта. Некоторые из них включают:

Технологическая особенность

Хотя эта тема привлекает большое внимание общественности, многих исследователей не волнует идея о том, что ИИ превзойдет человеческий интеллект в ближайшем или ближайшем будущем. Это также называют сверхразумом, который Ник Бострум определяет как «любой интеллект, который значительно превосходит лучшие человеческие мозги практически во всех областях, включая научное творчество, общую мудрость и социальные навыки». Несмотря на то, что Сильный ИИ и суперинтеллект не являются неизбежными в обществе, идея этого поднимает некоторые интересные вопросы, поскольку мы рассматриваем использование автономных систем, таких как автомобили с автоматическим управлением. Нереально думать, что беспилотный автомобиль никогда не попадет в автомобильную аварию, но кто несет ответственность и несет ответственность в таких обстоятельствах? Должны ли мы по-прежнему стремиться к автономным транспортным средствам, или мы ограничим интеграцию этой технологии, чтобы создавать только полуавтономные транспортные средства, которые способствуют безопасности водителей? Присяжные по этому поводу еще не пришли к единому мнению, но именно такие этические дебаты происходят по мере развития новых инновационных технологий искусственного интеллекта.

Влияние ИИ на рабочие места

Хотя общественное мнение об искусственном интеллекте во многом связано с потерей работы, эту озабоченность, вероятно, следует переосмыслить. Мы видим, что с появлением каждой прорывной новой технологии меняется рыночный спрос на конкретные должности. Например, когда мы смотрим на автомобильную промышленность, многие производители, такие как GM, переключаются на производство электромобилей, чтобы соответствовать экологическим инициативам. Энергетика не исчезает, но источник энергии переходит от экономии топлива к электричеству. Искусственный интеллект следует рассматривать аналогичным образом, поскольку искусственный интеллект сместит спрос на рабочие места в другие области. Потребуются люди, которые помогут управлять этими системами, поскольку данные растут и меняются каждый день. По-прежнему потребуются ресурсы для решения более сложных проблем в отраслях, на которые, скорее всего, повлияет изменение спроса на рабочие места, таких как обслуживание клиентов. Важным аспектом искусственного интеллекта и его влияния на рынок труда будет помощь людям в переходе к этим новым сферам рыночного спроса.

Конфиденциальность

Конфиденциальность, как правило, обсуждается в контексте конфиденциальности данных, защиты данных и безопасности данных, и эти проблемы позволили политикам добиться большего прогресса в этом вопросе в последние годы. Например, в 2016 году было принято законодательство GDPR для защиты персональных данных людей в Европейском союзе и Европейской экономической зоне, что дало людям больший контроль над своими данными. В Соединенных Штатах отдельные штаты разрабатывают политику, такую как Калифорнийский закон о конфиденциальности потребителей (CCPA), который требует от компаний информировать потребителей о сборе их данных. Это недавнее законодательство заставило компании переосмыслить то, как они хранят и используют персональные данные (PII). В результате инвестиции в безопасность становятся все более приоритетными для компаний, поскольку они стремятся устранить любые уязвимости и возможности для наблюдения, взлома и кибератак.

Предвзятость и дискриминация

Случаи предвзятости и дискриминации в ряде интеллектуальных систем подняли множество этических вопросов, касающихся использования искусственного интеллекта. Как мы можем защититься от предвзятости и дискриминации, когда сами обучающие данные могут привести к предвзятости? В то время как компании обычно имеют благие намерения в отношении своих усилий по автоматизации, Reuters (ссылка находится за пределами IBM) подчеркивает некоторые непредвиденные последствия включения ИИ в практику найма. Стремясь автоматизировать и упростить процесс, Amazon непреднамеренно предвзято относился к потенциальным кандидатам на работу по полу для открытых технических должностей, и в конечном итоге им пришлось отказаться от проекта.По мере появления подобных событий журнал Harvard Business Review (ссылка находится за пределами IBM) поднял другие острые вопросы, связанные с использованием ИИ при приеме на работу, например, какие данные вы должны иметь возможность использовать при оценке кандидата на роль.

Предвзятость и дискриминация не ограничиваются работой отдела кадров. его можно найти в ряде приложений, от программного обеспечения для распознавания лиц до алгоритмов социальных сетей.

Поскольку компании все больше осознают риски, связанные с искусственным интеллектом, они также стали активнее обсуждать этику и ценности искусственного интеллекта. Например, в прошлом году генеральный директор IBM Арвинд Кришна сообщил, что IBM прекратила выпуск продуктов IBM для распознавания и анализа лиц общего назначения, подчеркнув, что «IBM решительно выступает против и не будет мириться с использованием любых технологий, включая технологии распознавания лиц, предлагаемые другими поставщиками, для массовых слежка, расовое профилирование, нарушение основных прав и свобод человека или любые цели, не соответствующие нашим ценностям и принципам доверия и прозрачности».

Чтобы узнать больше об этом, посетите блог политики IBM, в котором изложена его точка зрения на «Подход точного регулирования к контролю за экспортом технологий распознавания лиц».

Подотчетность

Поскольку не существует серьезного законодательства, регулирующего использование ИИ, нет и реального механизма обеспечения соблюдения этических норм ИИ. Нынешние стимулы для компаний придерживаться этих рекомендаций являются негативными последствиями неэтичной системы искусственного интеллекта для прибыли. Чтобы заполнить этот пробел, в рамках сотрудничества между специалистами по этике и исследователями возникли этические рамки, регулирующие создание и распространение моделей ИИ в обществе. Однако на данный момент они служат только для руководства, и исследования (ссылка находится за пределами IBM) (PDF, 1 МБ) показывают, что сочетание распределенной ответственности и отсутствия предвидения потенциальных последствий не обязательно способствует предотвращению вреда обществу. .

Чтобы узнать больше о позиции IBM в отношении этики ИИ, читайте здесь.

Машинное обучение и IBM Cloud

IBM Watson Studio в IBM Cloud Pak for Data поддерживает сквозной жизненный цикл машинного обучения на платформе данных и искусственного интеллекта. Вы можете создавать, обучать и управлять моделями машинного обучения, где бы ни хранились ваши данные, и развертывать их в любом месте гибридной многооблачной среды.

Компьютерная модель, которая может предсказать, как люди будут выполнять контролируемую задачу и как знания, необходимые для выполнения этой задачи, будут развиваться с течением времени, является продуктом группы исследователей под руководством профессора Пенсильванского государственного колледжа информационных наук и технологий. .

Фрэнк Риттер, адъюнкт-профессор информационных технологий и психологии, и его коллеги-исследователи использовали язык программирования Soar, предназначенный для представления человеческих знаний, в задаче по устранению неполадок из 20 пробных цепей, которую недавно выполнили 10 студентов Университета Ноттингем, Великобритания.

Каждый участник должен был выявить неисправности в электрической цепи после запоминания организации ее компонентов и переключателей. Этот процесс повторялся 20 раз для каждого человека, при этом серии тестов каждый раз выбирались случайным образом. Их выбор и время реакции записывались и сравнивались с результатами компьютерной модели.

Как и учащиеся, компьютерная модель под названием Diag обучалась по мере выполнения каждого теста и приобретала знания для быстрого и эффективного выполнения задачи.

"Модель не только точно прогнозирует время решения задач для участников-людей, но и воспроизводит стратегию, которую используют участники, и обучается с той же скоростью, с которой учатся участники", – сказал Риттер.

В большинстве случаев модель предсказывала, сколько времени потребуется каждому участнику для решения проблемы, в течение двух-четырех секунд, и она очень хорошо соответствовала времени решения проблемы восьми из 10 участников. Риттер сказал, что результаты, изложенные в документе, согласуются с предыдущими испытаниями, демонстрируя развитие закономерности в модели.

"Проект показывает, что мы можем прогнозировать человеческое обучение на детальном уровне, – – сказал Риттер. "Все думают, что это возможно, но вот реальная модель, которая делает это. Модель дает подробное представление о том, как работает перевод, и именно этот процесс перевода и есть образование".

Риттер работал с Питером Бибби и двумя научными сотрудниками в Ноттингемском университете.

В основе когнитивной психологии лежит идея обработки информации.

Когнитивная психология рассматривает человека как процессора информации, во многом так же, как компьютер получает информацию и следует программе для получения результата.

Основные предположения

Подход к обработке информации основан на ряде предположений, в том числе:

(1) информация, предоставляемая окружающей средой, обрабатывается рядом систем обработки (например, внимание, восприятие, кратковременная память);
(2) эти системы обработки преобразуют или изменяют информацию в систематическими способами;
(3) цель исследования – определить процессы и структуры, лежащие в основе когнитивных функций;
(4) обработка информации у людей аналогична обработке в компьютерах.

Компьютер — аналогия разума

Развитие компьютеров в 1950-х и 1960-х годах оказало важное влияние на психологию и отчасти стало причиной того, что когнитивный подход стал доминирующим подходом в современной психологии (заменив бихевиоризм).

Компьютер дал когнитивным психологам метафору или аналогию, с которой они могли сравнить мыслительную деятельность человека. Использование компьютера в качестве инструмента для понимания того, как человеческий разум обрабатывает информацию, известно как компьютерная аналогия.

По сути, компьютер кодирует (то есть изменяет) информацию, хранит информацию, использует информацию и производит вывод (извлекает информацию). Идея обработки информации была принята когнитивными психологами как модель того, как работает человеческое мышление.

Например, глаз получает визуальную информацию и кодирует информацию в электрическую нейронную активность, которая возвращается в мозг, где она «хранится» и «кодируется». Эта информация может использоваться другими частями мозга, связанными с умственной деятельностью, такой как память, восприятие и внимание. Результатом (т. е. поведением) может быть, например, чтение того, что вы видите на печатной странице.

Следовательно, подход к обработке информации характеризует мышление как среду, обеспечивающую ввод данных, которые затем преобразуются нашими органами чувств. Информацию можно хранить, извлекать и преобразовывать с помощью «ментальных программ», результатом чего являются поведенческие реакции.

Когнитивная психология повлияла и интегрировалась со многими другими подходами и областями исследований, чтобы создать, например, теорию социального обучения, когнитивную нейропсихологию и искусственный интеллект (ИИ).

Обработка информации и выборочное внимание

Когда мы выборочно обращаем внимание на одно действие, мы, как правило, игнорируем другие стимулы, хотя наше внимание может быть отвлечено чем-то другим, например телефонным звонком или кем-то, кто называет наше имя.

Психологов интересует, что заставляет нас обращать внимание на одно, а не на другое (избирательное внимание); почему мы иногда переключаем наше внимание на то, что раньше оставалось без внимания (например, синдром вечеринки с коктейлем), и на скольких вещах мы можем сосредоточиться одновременно (объем внимания).

Один из способов концептуализации внимания — представить людей как обработчиков информации, которые могут обрабатывать только ограниченный объем информации за раз, не перегружаясь.

Бродбент и другие в 1950-х годах приняли модель мозга как системы обработки информации с ограниченными возможностями, через которую передается внешний ввод.

Процессы ввода связаны с анализом стимулов.
Процессы хранения охватывают все, что происходит со стимулами внутри мозга, и могут включать кодирование и манипулирование стимулами.
Процессы вывода отвечают за подготовку соответствующей реакции на стимул.

Критическая оценка

В рамках концепции обработки информации был предложен ряд моделей внимания, в том числе:

Модель фильтра Бродбента (1958 г.), модель затухания Трейсмана (1964 г.) и модель позднего отбора Дойча и Дойча (1963 г.).

Однако при изучении этих моделей и подхода к обработке информации в целом следует учитывать ряд оценочных моментов. К ним относятся:

Последовательная обработка фактически означает, что один процесс должен быть завершен до начала следующего.
Параллельная обработка предполагает, что некоторые или все процессы, связанные с когнитивной задачей, происходят одновременно.

Эксперименты с двумя задачами показали, что возможна параллельная обработка. Трудно определить, обрабатывается ли конкретная задача последовательно или параллельно, так как это, вероятно, зависит (а) от процессов, необходимых для решения задачи, и (б) от количества практики выполнения задачи.

Параллельная обработка, вероятно, чаще используется, когда кто-то обладает высокой квалификацией; например, опытный машинист думает на несколько букв вперед, а новичок сосредотачивается только на одной букве за раз.

<р>2. Аналогия между человеческим познанием и работой компьютера, используемая в подходе к обработке информации, ограничена.

Компьютеры можно рассматривать как системы обработки информации, поскольку они:

(i) комбинировать представленную информацию с сохраненной информацией для решения различных проблем, и

НО -

(i) человеческий мозг способен к обширной параллельной обработке, а компьютеры часто полагаются на последовательную обработку;

<р>3. Доказательства теорий/моделей внимания, подпадающих под подход обработки информации, в значительной степени основаны на экспериментах в контролируемых научных условиях.

Большинство лабораторных исследований являются искусственными, и можно сказать, что они не имеют экологической достоверности.

В повседневной жизни когнитивные процессы часто связаны с целью (например, вы уделяете внимание в классе, потому что хотите сдать экзамен), тогда как в лаборатории эксперименты проводятся изолированно от других когнитивных и мотивационных факторов.< /p>

Хотя эти лабораторные эксперименты легко интерпретировать, данные могут быть неприменимы к реальному миру за пределами лаборатории. Были предложены более современные экологически обоснованные подходы к познанию (например, Perceptual Cycle, Neisser, 1976).

Внимание в основном изучалось изолированно от других когнитивных процессов, хотя очевидно, что оно действует как взаимозависимая система со связанными когнитивными процессами восприятия и памяти.

Чем успешнее мы изучаем часть когнитивной системы изолированно, тем меньше наши данные говорят нам о когнитивных способностях в повседневной жизни.

<р>4. Хотя общепризнано, что информация, управляемая стимулом (восходящая снизу вверх), важна для познания, то, что человек привносит в задачу с точки зрения ожиданий/прошлого опыта, также важно.

Эти влияния известны как "нисходящие" или "концептуально управляемые" процессы. Например, прочтите треугольник ниже:

Ожидание (обработка «сверху вниз») часто замещает информацию, действительно имеющуюся в стимуле (снизу вверх), на который мы предположительно обращаем внимание. Как вы прочитали текст в треугольнике выше?

Ссылки на стиль APA

Бродбент, Д. (1958). Восприятие и общение. Лондон: Pergamon Press.

Дойч, Дж. А., и Дойч, Д. (1963). Внимание: некоторые теоретические соображения. Психологический обзор, 70, 80–90

Нейссер, У. (1967). Когнитивная психология. Нью-Йорк: Appleton-Century-Crofts.

Трейсман, А. (1964). Избирательное внимание у человека. Британский медицинский бюллетень, 20, 12–16.

Как ссылаться на эту статью:

Контент сайта Simply Psychology предназначен только для информационных и образовательных целей. Наш веб-сайт не предназначен для замены профессиональной медицинской консультации, диагностики или лечения.

Изображенный роботами мир нашего недалекого будущего во многом зависит от нашей способности успешно внедрять искусственный интеллект (ИИ). Однако превратить машины в мыслящие устройства не так просто, как может показаться. Сильный ИИ может быть достигнут только с помощью машинного обучения (МО), чтобы помочь машинам понимать, как люди.

Машинное обучение может сбивать с толку, поэтому важно начать с четкого определения термина:

Машинное обучение — это применение ИИ, позволяющее системам учиться и совершенствоваться на основе опыта без явного программирования. Машинное обучение направлено на разработку компьютерных программ, которые могут получать доступ к данным и использовать их для самостоятельного обучения.

Как работает машинное обучение?

Подобно тому, как человеческий мозг получает знания и понимание, машинное обучение опирается на входные данные, такие как обучающие данные или графики знаний, для понимания сущностей, доменов и связей между ними. Когда сущности определены, можно начинать глубокое обучение.

Процесс машинного обучения начинается с наблюдений или данных, таких как примеры, непосредственный опыт или инструкции. Он ищет шаблоны в данных, чтобы позже сделать выводы на основе предоставленных примеров. Основная цель машинного обучения — позволить компьютерам учиться автономно, без вмешательства или помощи человека, и соответствующим образом корректировать действия.

Почему машинное обучение важно?

Концепция машинного обучения существует уже довольно давно.Термин «машинное обучение» был придуман Артуром Сэмюэлем, ученым-компьютерщиком из IBM и пионером в области искусственного интеллекта и компьютерных игр. Сэмюэл разработал компьютерную программу для игры в шашки. Чем больше программа играла, тем больше она узнавала из опыта, используя алгоритмы для прогнозирования.

Машинное обучение как дисциплина исследует анализ и построение алгоритмов, которые могут обучаться и делать прогнозы на основе данных.

Машинное машинное обучение доказало свою ценность, поскольку оно может решать проблемы со скоростью и в таких масштабах, которые не могут быть воспроизведены только человеческим разумом. Обладая огромными вычислительными возможностями для выполнения одной или нескольких конкретных задач, машины можно научить выявлять закономерности и взаимосвязи между входными данными и автоматизировать рутинные процессы.

Данные — ключ к успеху. Алгоритмы, управляющие машинным обучением, имеют решающее значение. Алгоритмы машинного обучения строят математическую модель на основе выборочных данных, известных как «данные для обучения», чтобы делать прогнозы или принимать решения без явного программирования для этого. Это может выявить тенденции в данных, которые информационные компании могут использовать для улучшения процесса принятия решений, оптимизации эффективности и сбора данных, которые можно использовать в любом масштабе.
Искусственный интеллект — это цель. Машинное обучение обеспечивает основу для систем искусственного интеллекта, которые автоматизируют процессы и автономно решают бизнес-задачи на основе данных. Это позволяет компаниям заменять или дополнять определенные человеческие способности. Распространенные приложения машинного обучения, которые вы можете найти в реальном мире, включают чат-боты, беспилотные автомобили и распознавание речи.

Машинное обучение получило широкое распространение

Машинное обучение — это не научная фантастика. Он уже широко используется предприятиями во всех секторах для продвижения инноваций и повышения эффективности процессов. В 2021 году 41% компаний ускорили внедрение ИИ из-за пандемии. Эти новички присоединяются к 31 % компаний, которые уже используют искусственный интеллект или активно тестируют технологии искусственного интеллекта.

Методы обучения машинному обучению различаются

Машинное обучение предлагает очевидные преимущества для технологий искусственного интеллекта. Но какой подход к машинному обучению подходит для вашей организации? Существует множество методов обучения машинному обучению, в том числе:

обучение под наблюдением
обучение без учителя
полуконтролируемое обучение

Давайте посмотрим, что каждый может предложить.

Контролируемое обучение: больше контроля, меньше предвзятости

Алгоритмы контролируемого машинного обучения применяют то, что было изучено в прошлом, к новым данным, используя помеченные примеры для прогнозирования будущих событий. Анализируя известный набор обучающих данных, алгоритм обучения создает предполагаемую функцию для прогнозирования выходных значений. Система может предоставить цели для любого нового ввода после достаточного обучения. Он также может сравнивать свои выходные данные с правильными предполагаемыми выходными данными, чтобы найти ошибки и соответствующим образом изменить модель.

Неконтролируемое обучение: скорость и масштаб

Алгоритмы неконтролируемого машинного обучения используются, когда информация, используемая для обучения, не классифицируется и не помечается. Неконтролируемое обучение изучает, как системы могут вывести функцию для описания скрытой структуры из немаркированных данных. Система ни в коем случае не знает правильный вывод с уверенностью. Вместо этого он делает выводы из наборов данных о том, какими должны быть выходные данные.

Обучение с подкреплением: вознаграждение за результаты

Алгоритмы машинного обучения с подкреплением – это метод обучения, который взаимодействует с окружающей средой, производя действия и обнаруживая ошибки или вознаграждения. Наиболее важными характеристиками обучения с подкреплением являются поиск методом проб и ошибок и отсроченное вознаграждение. Этот метод позволяет машинам и программным агентам автоматически определять идеальное поведение в определенном контексте, чтобы максимизировать его производительность. Простая обратная связь с вознаграждением, известная как сигнал подкрепления, необходима для того, чтобы агент понял, какое действие лучше.

Машинное обучение не идеально

Важно понимать, что может машинное обучение, а что нет. Как бы это ни было полезно для автоматизации передачи человеческого интеллекта машинам, это далеко не идеальное решение ваших проблем, связанных с данными. Учтите следующие недостатки, прежде чем слишком углубляться в пул машинного обучения:

Машинное обучение не основано на знаниях. Вопреки распространенному мнению, машинное обучение не может достичь уровня человеческого интеллекта. Машины управляются данными, а не человеческими знаниями. В результате «интеллект» определяется объемом данных, которые вы должны использовать для его обучения.
Модели машинного обучения сложно обучать. 81% специалистов по обработке и анализу данных признают, что обучение ИИ на данных сложнее, чем ожидалось. Для обучения машин требуется время и ресурсы. Для создания моделей данных необходимы огромные наборы данных, и этот процесс включает в себя предварительную маркировку и категоризацию наборов данных вручную. Такая утечка ресурсов может привести к задержкам и узким местам в продвижении инициатив машинного обучения.
При машинном обучении возникают проблемы с данными. Девяносто шесть процентов компаний столкнулись с проблемами, связанными с обучением, с качеством данных, маркировкой данных и созданием уверенности в модели. Эти проблемы, связанные с обучением, являются ключевой причиной, по которой семьдесят восемь процентов проектов машинного обучения останавливаются до развертывания. Это создало чрезвычайно высокий порог успеха машинного обучения.
Машинное обучение часто необъективно. Известно, что системы машинного обучения работают в «черном ящике», то есть вы не видите, как машина учится и принимает решения. Таким образом, если вы идентифицируете случай предвзятости, вы не сможете определить, что ее вызвало. Единственный выход — переобучить алгоритм с дополнительными данными, но это не гарантирует решения проблемы.

Будущее машинного обучения: гибридный ИИ

Несмотря на все свои недостатки, машинное обучение по-прежнему имеет решающее значение для успеха искусственного интеллекта. Однако этот успех будет зависеть от другого подхода к ИИ, который устраняет его слабые стороны, такие как проблема «черного ящика», возникающая, когда машины обучаются без присмотра. Этот подход представляет собой символический ИИ или основанную на правилах методологию обработки данных. В символическом подходе для определения понятий и семантических отношений используется граф знаний, представляющий собой открытое поле.

Вместе машинное обучение и символический ИИ образуют гибридный ИИ — подход, который помогает ИИ понимать язык, а не только данные. Благодаря более глубокому пониманию того, что было изучено и почему, этот мощный подход меняет способ использования данных на предприятии.

Расширение возможностей машинного обучения в гибридном ИИ

Узнайте, чем гибридный ИИ отличается от традиционного машинного обучения и как он изменит то, как мы используем наши данные.

Эта широко распространенная и мощная форма искусственного интеллекта меняет каждую отрасль. Вот что вам нужно знать о потенциале и ограничениях машинного обучения и о том, как оно используется.

Машинное обучение лежит в основе чат-ботов и интеллектуального ввода текста, приложений для языкового перевода, сериалов, которые предлагает вам Netflix, и того, как представлены ваши ленты в социальных сетях. Он приводит в действие автономные транспортные средства и машины, которые могут диагностировать заболевания на основе изображений.

Сегодня, когда компании внедряют программы искусственного интеллекта, они, скорее всего, используют машинное обучение — настолько часто, что эти термины часто используются взаимозаменяемо, а иногда и неоднозначно. Машинное обучение – это область искусственного интеллекта, которая дает компьютерам возможность обучаться без явного программирования.

"Всего за последние пять-десять лет машинное обучение стало критически важным и, возможно, самым важным способом реализации большинства компонентов ИИ", – сказал профессор Слоан из Массачусетского технологического института Томас В. Мэлоун, основатель и директор Массачусетского технологического института. Центр коллективного разума. «Вот почему некоторые люди используют термины ИИ и машинное обучение почти как синонимы… большинство современных достижений в области ИИ связано с машинным обучением».

Ввиду того, что машинное обучение становится все более распространенным явлением, каждый, кто занимается бизнесом, может столкнуться с ним, и ему потребуются некоторые практические знания в этой области. Опрос Deloitte 2020 года показал, что 67 % компаний используют машинное обучение, а 97 % используют или планируют использовать его в следующем году.

От производства до розничной торговли, банковского дела и пекарен — даже старые компании используют машинное обучение, чтобы открывать новые возможности или повышать эффективность. «Машинное обучение меняет или изменит каждую отрасль, и лидеры должны понимать основные принципы, потенциал и ограничения», — сказал профессор компьютерных наук Массачусетского технологического института Александр Мадри, директор Центра развертываемого машинного обучения Массачусетского технологического института.

Хотя не всем нужно знать технические детали, они должны понимать, что делает технология, что она может и чего не может делать, добавила Мадри. «Я не думаю, что кто-то может позволить себе не знать о том, что происходит».

Это включает в себя осознание социальных, социальных и этических последствий машинного обучения. «Важно задействовать и начать понимать эти инструменты, а затем подумать о том, как вы собираетесь их использовать. Мы должны использовать эти [инструменты] на благо всех», — сказала доктор Джоан ЛаРовер, магистр делового администрирования 16-го года, детский врач-кардиолог и соучредитель некоммерческой организации The Virtue Foundation. «ИИ обладает огромным потенциалом для добрых дел, и нам нужно действительно держать это в поле зрения, пока мы думаем об этом. Как мы можем использовать это, чтобы делать мир лучше и добрее?»

Что такое машинное обучение?

Машинное обучение – это область искусственного интеллекта, которая в широком смысле определяется как способность машины имитировать разумное поведение человека. Системы искусственного интеллекта используются для выполнения сложных задач таким же образом, как люди решают проблемы.

По словам Бориса Каца, главного научного сотрудника и руководителя группы InfoLab в CSAIL, цель искусственного интеллекта – создать компьютерные модели, демонстрирующие «разумное поведение», как у людей.Это означает, что машины могут распознавать визуальную сцену, понимать текст, написанный на естественном языке, или выполнять действия в физическом мире.

Машинное обучение — это один из способов использования ИИ. В 1950-х годах пионер ИИ Артур Сэмюэл определил его как «область исследования, которая дает компьютерам возможность учиться без явного программирования».

По словам Майки Шульмана, лектора MIT Sloan и руководителя отдела машинного обучения в компании Kensho, которая специализируется на искусственном интеллекте для финансового и разведывательного сообществ США, это определение верно. Он сравнил традиционный способ программирования компьютеров, или «программное обеспечение 1.0», с выпечкой, где рецепт требует точного количества ингредиентов и говорит пекарю смешивать в течение точного времени. Традиционное программирование также требует создания подробных инструкций для компьютера.

Но в некоторых случаях написание программы для машины требует много времени или невозможно, например, обучение компьютера распознаванию изображений разных людей. В то время как люди могут легко выполнить эту задачу, трудно сказать компьютеру, как это сделать. В машинном обучении используется подход, позволяющий компьютерам учиться программировать себя на основе опыта.

Машинное обучение начинается с данных — чисел, фотографий или текста, например банковских транзакций, изображений людей или даже хлебобулочных изделий, записей о ремонте, временных рядов данных с датчиков или отчетов о продажах. Данные собираются и подготавливаются для использования в качестве обучающих данных или информации, на которой будет обучаться модель машинного обучения. Чем больше данных, тем лучше программа.

Отсюда программисты выбирают модель машинного обучения для использования, предоставляют данные и позволяют компьютерной модели обучаться, чтобы находить закономерности или делать прогнозы. Со временем программист-человек также может настроить модель, в том числе изменить ее параметры, чтобы добиться более точных результатов. (Веб-сайт AI Weirdness ученого-исследователя Джанелл Шейн представляет собой занимательный взгляд на то, как алгоритмы машинного обучения учатся и как они могут ошибаться — как это произошло, когда алгоритм попытался сгенерировать рецепты и создал шоколадно-куриный куриный пирог.)

Некоторые данные сохраняются из обучающих данных для использования в качестве оценочных данных, которые проверяют, насколько точна модель машинного обучения при отображении новых данных. В результате получается модель, которую можно использовать в будущем с другими наборами данных.

Успешные алгоритмы машинного обучения могут делать разные вещи, — написал Мэлоун в недавнем обзоре исследования ИИ и будущего работы, написанном в соавторстве с профессором Массачусетского технологического института и директором CSAIL Даниэлой Рус и Робертом Лаубахером, заместителем директора Центра Массачусетского технологического института. для коллективного разума.

«Функция системы машинного обучения может быть описательной, то есть система использует данные для объяснения того, что произошло; прогностический, то есть система использует данные, чтобы предсказать, что произойдет; или предписывающий, то есть система будет использовать данные, чтобы давать рекомендации о том, какие действия следует предпринять», — пишут исследователи.

Существует три подкатегории машинного обучения:

Модели контролируемого машинного обучения обучаются с помощью помеченных наборов данных, что позволяет моделям обучаться и становиться более точными с течением времени. Например, алгоритм будет обучаться на изображениях собак и других предметов, помеченных людьми, а машина будет учиться самостоятельно идентифицировать изображения собак. Машинное обучение с учителем — наиболее распространенный тип, используемый сегодня.

При неконтролируемом машинном обучении программа ищет шаблоны в неразмеченных данных. Неконтролируемое машинное обучение может находить закономерности или тенденции, которые люди явно не ищут. Например, неконтролируемая программа машинного обучения может просматривать данные о продажах в Интернете и определять различные типы клиентов, совершающих покупки.

Машинное обучение с подкреплением обучает машины методом проб и ошибок предпринимать наилучшие действия, создавая систему вознаграждений. Обучение с подкреплением может обучать модели играть в игры или обучать автономные транспортные средства вождению, сообщая машине, когда она приняла правильное решение, что помогает ей со временем узнать, какие действия она должна предпринять.

В обзоре Work of the Future Мэлоун отметил, что машинное обучение лучше всего подходит для ситуаций с большим объемом данных — тысячами или миллионами примеров, таких как записи предыдущих разговоров с клиентами, журналы датчиков с машин или транзакции банкоматов. Например, Google Translate стал возможен благодаря тому, что он «обучался» на огромном количестве информации в Интернете на разных языках.

По словам Мадри, в некоторых случаях машинное обучение может помочь понять или автоматизировать процесс принятия решений в тех случаях, когда люди не в состоянии это сделать."Это может быть не только более эффективно и менее затратно, чтобы сделать это с помощью алгоритма, но иногда люди просто не в состоянии это сделать", – сказал он.

Поиск Google — это пример того, что могут делать люди, но никогда не с таким масштабом и скоростью, с которой модели Google могут показывать потенциальные ответы каждый раз, когда человек вводит запрос, — сказал Мэлоун. «Это не пример того, как компьютеры лишают людей работы. Это пример того, как компьютеры делают вещи, которые были бы экономически нецелесообразны, если бы их должны были делать люди».

Машинное обучение также связано с рядом других областей искусственного интеллекта:

Обработка естественного языка

Обработка естественного языка – это область машинного обучения, в которой машины учатся понимать естественный язык, как говорят и пишут люди, а не данные и числа, которые обычно используются для программирования компьютеров. Это позволяет машинам распознавать язык, понимать его и реагировать на него, а также создавать новый текст и переводить его с одного языка на другой. Обработка естественного языка позволяет использовать знакомые технологии, такие как чат-боты и цифровые помощники, такие как Siri или Alexa.

Нейронные сети

Нейронные сети — это широко используемый особый класс алгоритмов машинного обучения. Искусственные нейронные сети моделируются человеческим мозгом, в котором тысячи или миллионы узлов обработки взаимосвязаны и организованы в слои.

В искусственной нейронной сети клетки или узлы соединены друг с другом, каждая из которых обрабатывает входные данные и создает выходные данные, которые отправляются другим нейронам. Помеченные данные перемещаются по узлам или ячейкам, причем каждая ячейка выполняет свою функцию. В нейронной сети, обученной определять, есть ли на картинке кошка или нет, разные узлы будут оценивать информацию и получать выходные данные, указывающие, есть ли на картинке кошка.

Глубокое обучение

Сети глубокого обучения – это многоуровневые нейронные сети. Многоуровневая сеть может обрабатывать большие объемы данных и определять «вес» каждой ссылки в сети — например, в системе распознавания изображений некоторые слои нейронной сети могут обнаруживать отдельные черты лица, такие как глаза, нос, или рот, в то время как другой слой сможет определить, появляются ли эти черты таким образом, чтобы указывать на лицо.

Как и нейронные сети, глубокое обучение основано на том, как работает человеческий мозг, и используется во многих областях машинного обучения, таких как автономные транспортные средства, чат-боты и медицинская диагностика.

«Чем больше слоев у вас есть, тем больше у вас возможностей хорошо справляться со сложными задачами», — сказал Мэлоун.

Глубокое обучение требует большой вычислительной мощности, что вызывает опасения по поводу его экономической и экологической устойчивости.

Как компании используют машинное обучение

Машинное обучение лежит в основе бизнес-моделей некоторых компаний, например алгоритма предложений Netflix или поисковой системы Google. Другие компании активно занимаются машинным обучением, хотя это не является их основным бизнес-предложением.

Читайте также: