Как вы думаете, могут ли компьютеры научиться понимать значение данных

Обновлено: 23.08.2025

Машинное обучение – это метод анализа данных, который автоматизирует построение аналитической модели. Это направление искусственного интеллекта, основанное на идее, что системы могут учиться на данных, выявлять закономерности и принимать решения с минимальным вмешательством человека.

Эволюция машинного обучения

Благодаря новым вычислительным технологиям машинное обучение сегодня не похоже на машинное обучение прошлого. Он родился из распознавания образов и теории о том, что компьютеры могут учиться, не будучи запрограммированными для выполнения определенных задач; исследователи, интересующиеся искусственным интеллектом, хотели узнать, могут ли компьютеры учиться на данных. Итеративный аспект машинного обучения важен, потому что по мере того, как модели подвергаются воздействию новых данных, они могут независимо адаптироваться. Они учатся на предыдущих вычислениях, чтобы производить надежные, воспроизводимые решения и результаты. Это наука, которая не нова, но она получила новый импульс.

Хотя многие алгоритмы машинного обучения существуют уже давно, возможность автоматически применять сложные математические вычисления к большим данным — снова и снова, все быстрее и быстрее — появилась недавно. Вот несколько широко известных примеров приложений машинного обучения, с которыми вы, возможно, знакомы:

Разрекламированная беспилотная машина Google? Суть машинного обучения.
Интернет-рекомендации, такие как предложения Amazon и Netflix? Приложения машинного обучения для повседневной жизни.
Знаете, что клиенты говорят о вас в Твиттере? Машинное обучение в сочетании с созданием лингвистических правил.
Обнаружение мошенничества? Одно из наиболее очевидных и важных применений в современном мире.

Машинное обучение и искусственный интеллект

Хотя искусственный интеллект (ИИ) – это наука о том, как имитировать человеческие способности, машинное обучение – это особый вид ИИ, который обучает машину тому, как учиться. Посмотрите это видео, чтобы лучше понять взаимосвязь между ИИ и машинным обучением. Вы увидите, как работают эти две технологии, с полезными примерами и несколькими забавными замечаниями.

Почему машинное обучение важно?

Возрождение интереса к машинному обучению связано с теми же факторами, которые сделали интеллектуальный анализ данных и байесовский анализ более популярными, чем когда-либо. Такие вещи, как растущие объемы и разнообразие доступных данных, более дешевая и мощная вычислительная обработка и доступное хранилище данных.

Все это означает, что можно быстро и автоматически создавать модели, способные анализировать большие и сложные данные и получать более быстрые и точные результаты даже в очень больших масштабах. И, создавая точные модели, у организации больше шансов определить выгодные возможности или избежать неизвестных рисков.

Что требуется для создания хороших систем машинного обучения?

Возможности подготовки данных.
Алгоритмы — базовые и расширенные.
Автоматизация и повторяющиеся процессы.
Масштабируемость.
Моделирование ансамбля.

Знаете ли вы?

В машинном обучении цель называется ярлыком.
В статистике цель называется зависимой переменной.
Переменная в статистике называется функцией машинного обучения.
Преобразование в статистике называется созданием признаков в машинном обучении.

Машинное обучение в современном мире

Используя алгоритмы для построения моделей, выявляющих связи, организации могут принимать более эффективные решения без вмешательства человека. Узнайте больше о технологиях, которые формируют мир, в котором мы живем.

Возможности и проблемы машинного обучения в бизнесе

Этот информационный документ O'Reilly содержит практическое руководство по внедрению приложений машинного обучения в вашей организации.

Расширьте свой набор навыков

Получите подробные инструкции и бесплатный доступ к программному обеспечению SAS, чтобы развить навыки машинного обучения. Курсы включают: 14 часов учебного времени, 90 дней бесплатного доступа к программному обеспечению в облаке, гибкий формат электронного обучения, не требующий навыков программирования.

Изменит ли машинное обучение вашу организацию?

В этом отчете Harvard Business Review Insight Center рассматривается, как машинное обучение изменит компании и то, как мы ими управляем.

Скачать отчет

Применение машинного обучения к Интернету вещей

Машинное обучение можно использовать для повышения эффективности, особенно применительно к Интернету вещей. В этой статье рассматривается эта тема.

Кто его использует?

Большинство отраслей, работающих с большими объемами данных, признали ценность технологии машинного обучения. Извлекая ценные сведения из этих данных — часто в режиме реального времени — организации могут работать более эффективно или получать преимущество перед конкурентами.

Финансовые услуги

Банки и другие предприятия финансовой отрасли используют технологии машинного обучения для двух основных целей: выявления важных сведений в данных и предотвращения мошенничества. Эти идеи могут определить инвестиционные возможности или помочь инвесторам узнать, когда торговать. Интеллектуальный анализ данных также может идентифицировать клиентов с профилями высокого риска или использовать кибернаблюдение для выявления предупредительных признаков мошенничества.

Правительство

Государственные учреждения, такие как служба общественной безопасности и коммунальные службы, особенно нуждаются в машинном обучении, поскольку у них есть несколько источников данных, из которых можно извлечь ценную информацию. Например, анализ данных датчиков позволяет определить способы повышения эффективности и экономии средств. Машинное обучение также может помочь обнаружить мошенничество и свести к минимуму кражу личных данных.

Здравоохранение

Машинное обучение – это быстро развивающаяся тенденция в сфере здравоохранения благодаря появлению носимых устройств и датчиков, которые могут использовать данные для оценки состояния здоровья пациента в режиме реального времени. Эта технология также может помочь медицинским экспертам анализировать данные для выявления тенденций или тревожных сигналов, которые могут привести к улучшению диагностики и лечения.

Розничная торговля

Веб-сайты, которые рекомендуют товары, которые могут вам понравиться на основе предыдущих покупок, используют машинное обучение для анализа вашей истории покупок. Ритейлеры полагаются на машинное обучение для сбора данных, их анализа и использования для персонализации покупательского опыта, проведения маркетинговых кампаний, оптимизации цен, планирования ассортимента и сбора информации о клиентах.

Нефть и газ

Поиск новых источников энергии. Анализ полезных ископаемых в земле. Прогнозирование отказа датчика нефтеперерабатывающего завода. Оптимизация распределения масла, чтобы сделать его более эффективным и экономичным. Количество вариантов использования машинного обучения для этой отрасли огромно и продолжает расти.

Транспорт

Анализ данных для выявления закономерностей и тенденций – ключ к транспортной отрасли, которая делает маршруты более эффективными и прогнозирует потенциальные проблемы для повышения прибыльности. Аспекты анализа данных и моделирования машинного обучения являются важными инструментами для компаний доставки, общественного транспорта и других транспортных организаций.

Подробнее об отраслях, использующих эту технологию

Какие популярные методы машинного обучения?

Двумя наиболее распространенными методами машинного обучения являются обучение с учителем и обучение без учителя, но существуют и другие методы машинного обучения. Вот обзор самых популярных типов.

Алгоритмы контролируемого обучения обучаются на примерах с пометками, например на входных данных, где известен желаемый результат. Например, элемент оборудования может иметь точки данных, помеченные либо «F» (сбой), либо «R» (работает). Алгоритм обучения получает набор входных данных вместе с соответствующими правильными выходными данными, и алгоритм обучается, сравнивая свои фактические выходные данные с правильными выходными данными, чтобы найти ошибки. Затем он соответствующим образом модифицирует модель. С помощью таких методов, как классификация, регрессия, прогнозирование и повышение градиента, контролируемое обучение использует шаблоны для прогнозирования значений метки на дополнительных немаркированных данных. Обучение с учителем обычно используется в приложениях, где исторические данные предсказывают вероятные будущие события. Например, он может предвидеть, когда операции с кредитными картами могут быть мошенническими или какой клиент страховой компании может подать иск.

Неконтролируемое обучение используется для данных, которые не имеют исторических меток. Системе не говорят «правильный ответ». Алгоритм должен выяснить, что показывается. Цель состоит в том, чтобы изучить данные и найти внутри некоторую структуру. Неконтролируемое обучение хорошо работает с транзакционными данными. Например, он может идентифицировать сегменты клиентов с похожими характеристиками, с которыми затем можно обращаться одинаково в маркетинговых кампаниях. Или он может найти основные атрибуты, которые отделяют потребительские сегменты друг от друга. Популярные методы включают самоорганизующиеся карты, отображение ближайших соседей, кластеризацию k-средних и разложение по сингулярным значениям. Эти алгоритмы также используются для сегментации текстовых тем, рекомендации элементов и выявления выбросов данных.

Обучение с полуучителем используется для тех же приложений, что и обучение с учителем.Но для обучения он использует как размеченные, так и неразмеченные данные — обычно небольшое количество размеченных данных с большим объемом неразмеченных данных (поскольку неразмеченные данные дешевле и требуют меньше усилий для получения). Этот тип обучения можно использовать с такими методами, как классификация, регрессия и предсказание. Полууправляемое обучение полезно, когда затраты, связанные с маркировкой, слишком высоки, чтобы обеспечить полностью маркированный процесс обучения. Ранние примеры этого включают идентификацию лица человека на веб-камере.

Обучение с подкреплением часто используется в робототехнике, играх и навигации. При обучении с подкреплением алгоритм методом проб и ошибок определяет, какие действия приносят наибольшее вознаграждение. Этот тип обучения состоит из трех основных компонентов: агент (ученик или лицо, принимающее решения), среда (все, с чем взаимодействует агент) и действия (что агент может делать). Цель агента состоит в том, чтобы выбрать действия, которые максимизируют ожидаемое вознаграждение за заданный промежуток времени. Агент достигнет цели намного быстрее, если будет следовать хорошей политике. Таким образом, цель обучения с подкреплением — изучить наилучшую политику.

Люди обычно могут создавать одну или две хорошие модели в неделю; машинное обучение может создавать тысячи моделей в неделю.

Томас Х. Дэвенпорт, идейный лидер в области аналитики
отрывок из The Wall Street Journal

Кто умнее — вы или компьютер или мобильное устройство, на котором вы читаете эту статью? Ответ становится все более сложным и зависит от меняющихся определений. Компьютеры, безусловно, лучше справляются с трудностями, используя свой уникальный набор навыков, но люди имеют преимущество в задачах, которые машины просто не могут выполнить. Во всяком случае, еще нет.

Компьютеры могут воспринимать и обрабатывать определенные виды информации намного быстрее, чем мы. Они могут прокручивать эти данные в своем «мозге», состоящем из процессоров, и выполнять вычисления, чтобы просчитывать множество сценариев со сверхчеловеческой скоростью. Например, лучшие компьютеры, обученные игре в шахматы, могут в этот момент планировать стратегию на много ходов вперед, решая задачи гораздо ловче, чем лучшие игроки в шахматы. Компьютеры также учатся гораздо быстрее, сужая сложные варианты выбора до наиболее оптимальных. Да, люди тоже учатся на ошибках, но когда дело доходит до решения головоломок, с которыми компьютеры справляются лучше всего, мы гораздо более подвержены ошибкам.

У компьютеров есть и другие преимущества перед людьми. У них лучше память, поэтому они могут получать большое количество информации и могут использовать ее практически мгновенно. Компьютерам не требуется сон, как людям, поэтому они могут рассчитывать, анализировать и выполнять задачи без устали и круглосуточно. Несмотря на ошибки или уязвимость к перебоям в подаче электроэнергии, компьютеры просто точнее выполняют широкий спектр важных функций, чем мы. На них не влияют и не влияют эмоции, чувства, желания, потребности и другие факторы, которые часто затмевают суждения и интеллект нас, простых смертных.

С другой стороны, люди по-прежнему превосходят компьютеры во многих отношениях. Мы выполняем задачи, принимаем решения и решаем проблемы, основываясь не только на нашем интеллекте, но и на нашем программном обеспечении с массовой параллельной обработкой — абстрактно, что мы любим называть нашими инстинктами, нашим здравым смыслом и, возможно, самое главное, нашим жизненным опытом. Компьютеры можно запрограммировать огромными библиотеками информации, но они не могут воспринимать жизнь так, как мы. Люди обладают чертами, которые мы иногда называем (опять же, абстрактно) творчеством, воображением и вдохновением. Человек может написать стихотворение, сочинить и сыграть музыку, спеть песню, создать картину или придумать новое изобретение. Компьютеры можно запрограммировать на выполнение некоторых из этих задач, но они не обладают врожденной способностью творить так, как это делают люди.

Что обо всем этом думают специалисты по искусственному интеллекту? Начнем с определения того, что мы подразумеваем под словами «умнее» или «умнее». Интеллект состоит из двух компонентов, говорит профессор Шломо Майтал, старший научный сотрудник Института С. Неамана в Технионе — Израильском технологическом институте. Одно — это способность учиться, другое — это способность решать проблемы. И в этих областях компьютеры могут быть умнее людей.

"Сегодня компьютеры могут обучаться быстрее, чем люди. Например, Watson (IBM) может читать и запоминать все исследования рака, чего не может ни один человек", – говорит Майтал. «С помощью глубокого обучения Watson также может решить проблему, например, как лечить редкую форму рака — и он это сделал. Так что в этом смысле компьютеры могут быть умнее людей».

Майтал указывает на еще один пример компьютерного интеллекта в своей статье "Скоро ли роботы станут умнее людей?" 10 февраля 1996 года компьютер IBM Deep Blue победил чемпиона мира Гарри Каспарова в первой из шести игр серии, а год спустя выиграл серию — первый компьютер, которому это удалось. Был ли Deep Blue разумным?И да, и нет, – говорит Майтал.

"Нет, потому что он просто смог просчитать огромное количество возможных шахматных ходов за долю секунды", – пишет Майтал. «Скорость — это не интеллект. Но да, потому что он смог проанализировать эти шахматные ходы и выбрать лучший, достаточный для победы над Каспаровым».

«От ИИ С точки зрения перспективы, теперь мы можем обучать компьютеры выполнять многие задачи лучше, чем люди, например некоторые задачи визуального распознавания», — говорит Маллик. «У этих задач есть одна общая черта: для решения этих задач мы можем собрать огромное количество данных, и/или они повторяются. Любая повторяющаяся задача, которая создает много данных, в конечном итоге будет изучена компьютерами».

Однако эксперты сходятся во мнении, что люди по-прежнему превосходят компьютеры в общем интеллекте, творчестве и здравом смысле или понимании мира.

"Компьютеры могут превзойти людей в определенных специализированных задачах, таких как игра [в игру] го или шахматы, но сегодня ни одна компьютерная программа не может сравниться с человеческим общим интеллектом", – говорит Мюррей Шанахан, профессор когнитивной робототехники факультета вычислительной техники Университета Имперский колледж в Лондоне. «Люди учатся достигать самых разных целей в самых разных условиях. Мы еще не знаем, как наделить компьютеры здравым смыслом в понимании повседневного мира, который лежит в основе общего человеческого интеллекта, хотя я уверен, что однажды нам это удастся».

"Например, мы можем заставить компьютеры имитировать творчество, помещая произведения искусства в базу данных, а затем создавая новое произведение искусства из некоторого объединения", – говорит Грохол. «Но это то же самое, что и человеческое творчество, или компьютерный код просто следует набору инструкций? Я бы сказал, что это только последнее, что делает компьютер намного хуже, когда речь идет об этом компоненте интеллекта».

Компьютеры не понимают смысла так, как люди, – говорит Яна Эггерс, генеральный директор компании Nara Logics, занимающейся искусственным интеллектом. «Даже если компьютер может определить эмоцию, он не понимает, что означает переживание эмоции», — говорит Эггерс. «Будут ли? Это возможно, но неясно, как это будет работать с текущими формами вычислений».

Но что, если перевести часы достаточно далеко вперед? Эксперты в целом согласны с тем, что компьютеры завтрашнего дня будут обладать некоторыми чертами, которые сегодня считаются уникальными для человека.

"В человеческом мозгу 86 миллиардов нейронов (нервных клеток), и все они взаимосвязаны, – говорит Майтал. «Компьютерные нейронные сети имеют гораздо меньше «клеток». Но однажды такие нейронные сети достигнут сложности и изощренности мозга».

Вероятно, все это произойдет раньше, чем позже, считает Грохол. «Как только мы взломаем нейрокод, управляющий нашим мозгом, я считаю, что мы сможем воспроизвести эту структуру и функции искусственно, чтобы мы действительно могли создать искусственную жизнь с помощью искусственного интеллекта», — говорит он. «Я определенно могу предвидеть, что это произойдет в следующем столетии.

Некоторые люди, например ученый-компьютерщик Рэй Курцвейл и соучредитель Tesla Илон Маск, предостерегают от потенциальных опасностей искусственного интеллекта, предвидя будущее типа Терминатора, в котором машины вышли из-под контроля. Нам, безусловно, нужно контролировать искусственный интеллект, чтобы мы могли управлять машинами, а не наоборот. Но вопрос, похоже, не столько в «злых» машинах в голливудском стиле, которые поднимаются, чтобы истребить ничтожных людей, сколько в согласовании: как мы можем гарантировать, что машинный интеллект, который в конечном итоге может оказаться совершенно за пределами нашего понимания, останется полностью настроенным на наш собственный?

Отчасти это связано с переосмыслением того, как мы подходим к этим вопросам. Вместо того, чтобы зацикливаться на том, кто умнее, или иррационально бояться технологий, мы должны помнить, что компьютеры и машины предназначены для улучшения нашей жизни, точно так же, как компьютер IBM Watson помогает нам в борьбе со смертельными заболеваниями. Хитрость по мере того, как компьютеры становятся все лучше и лучше справляться с этими и многими другими задачами, заключается в том, чтобы «помочь нам» оставалась их главной директивой.

«Важно помнить, что это не противостояние человека и машины, — говорит Маллик. "Это не соревнование. Это сотрудничество».

Искусственный интеллект (ИИ) позволяет машинам учиться на собственном опыте, приспосабливаться к новым данным и выполнять задачи, подобные человеческим. Большинство примеров ИИ, о которых вы слышали сегодня — от компьютеров, играющих в шахматы, до беспилотных автомобилей — в значительной степени зависят от глубокого обучения и обработки естественного языка. С помощью этих технологий компьютеры можно научить выполнять определенные задачи, обрабатывая большие объемы данных и распознавая закономерности в данных.

История искусственного интеллекта

Термин "искусственный интеллект" был придуман в 1956 году, но сегодня искусственный интеллект стал более популярным благодаря увеличению объемов данных, усовершенствованным алгоритмам, а также усовершенствованиям вычислительной мощности и хранилища.

Ранние исследования ИИ в 1950-х годах касались таких тем, как решение задач и символьные методы. В 1960-х годах министерство обороны США заинтересовалось этим типом работы и начало обучать компьютеры имитировать основные человеческие рассуждения. Например, Агентство перспективных оборонных исследовательских проектов (DARPA) завершило проекты по картированию улиц в 1970-х годах. А DARPA выпустила интеллектуальных персональных помощников в 2003 году, задолго до того, как Siri, Alexa или Cortana стали общеизвестными именами.

Эта ранняя работа проложила путь к автоматизации и формальным рассуждениям, которые мы видим сегодня в компьютерах, включая системы поддержки принятия решений и интеллектуальные поисковые системы, которые могут быть разработаны для дополнения и расширения человеческих способностей.

Хотя в голливудских фильмах и научно-фантастических романах искусственный интеллект изображается как человекоподобные роботы, захватившие мир, нынешняя эволюция технологий искусственного интеллекта не так уж страшна и умна. Вместо этого ИИ развился, чтобы обеспечить множество конкретных преимуществ в каждой отрасли. Продолжайте читать, чтобы узнать о современных примерах использования искусственного интеллекта в здравоохранении, розничной торговле и т. д.

Ранняя работа с нейронными сетями вызывает интерес к «мыслящим машинам».

Машинное обучение становится популярным.

Прорывы в области глубокого обучения стимулируют бум ИИ.

Тенденции искусственного интеллекта, за которыми стоит следить

Быстро посмотрите это видео, чтобы услышать, как эксперты по ИИ и профессионалы в области обработки данных оценивают тенденции ИИ в следующем десятилетии.

Какова роль этики в будущем ИИ? Насколько важны большие данные? Почему знание предметной области имеет решающее значение для успеха ИИ?

Самое главное: «Важно то, у кого есть данные. Вот кто станет королем», – говорит Харпер Рид, пионер технологий.

Почему искусственный интеллект важен?

ИИ автоматизирует повторяющееся обучение и поиск данных. Вместо автоматизации ручных задач ИИ выполняет частые, объемные, компьютеризированные задачи. И делает это надежно и без усталости. Конечно, люди по-прежнему необходимы для настройки системы и постановки правильных вопросов.

Искусственный интеллект расширяет возможности существующих продуктов. Многие продукты, которые вы уже используете, будут улучшены за счет возможностей искусственного интеллекта, подобно тому, как Siri была добавлена в качестве функции в новое поколение продуктов Apple. Автоматизация, диалоговые платформы, боты и умные машины могут быть объединены с большими объемами данных для улучшения многих технологий. Обновления дома и на рабочем месте: от систем безопасности и умных камер до анализа инвестиций.

Искусственный интеллект адаптируется с помощью прогрессивных алгоритмов обучения, позволяя данным выполнять программирование. ИИ находит структуру и закономерности в данных, чтобы алгоритмы могли приобретать навыки. Точно так же, как алгоритм может научить себя играть в шахматы, он может сам научить себя, какой онлайн-продукт рекомендовать следующим. И модели адаптируются при получении новых данных.

ИИ анализирует больше и глубже данных, используя нейронные сети, которые имеют много скрытых слоев. Раньше создание системы обнаружения мошенничества с пятью скрытыми слоями было невозможным. Все изменилось благодаря невероятной мощности компьютеров и большим данным. Вам нужно много данных для обучения моделей глубокого обучения, потому что они учатся непосредственно на данных.

Искусственный интеллект достигает невероятной точности благодаря глубоким нейронным сетям. Например, ваше взаимодействие с Alexa и Google основано на глубоком обучении. И эти продукты становятся все более точными, чем больше вы их используете. В области медицины методы искусственного интеллекта, основанные на глубоком обучении и распознавании объектов, теперь можно использовать для более точного выявления рака на медицинских изображениях.

ИИ максимально эффективно использует данные. Когда алгоритмы самообучаемые, сами данные являются активом. Ответы в данных. Вам просто нужно применить ИИ, чтобы найти их. Поскольку роль данных сейчас важнее, чем когда-либо, они могут создать конкурентное преимущество. Если у вас есть лучшие данные в конкурентной отрасли, даже если все применяют одинаковые методы, лучшие данные победят.

Эта широко распространенная и мощная форма искусственного интеллекта меняет каждую отрасль. Вот что вам нужно знать о потенциале и ограничениях машинного обучения и о том, как оно используется.

Машинное обучение лежит в основе чат-ботов и интеллектуального ввода текста, приложений для языкового перевода, сериалов, которые предлагает вам Netflix, и того, как представлены ваши ленты в социальных сетях. Он приводит в действие автономные транспортные средства и машины, которые могут диагностировать заболевания на основе изображений.

Сегодня, когда компании внедряют программы искусственного интеллекта, они, скорее всего, используют машинное обучение — настолько часто, что эти термины часто используются взаимозаменяемо, а иногда и неоднозначно. Машинное обучение – это область искусственного интеллекта, которая дает компьютерам возможность обучаться без явного программирования.

"Всего за последние пять-десять лет машинное обучение стало важным и, возможно, самым важным способом реализации большинства компонентов искусственного интеллекта", – сказал Томас В. Мэлоун, профессор Массачусетского технологического института, директор-основатель Массачусетского технологического института. Центр коллективного разума.«Именно поэтому некоторые люди используют термины ИИ и машинное обучение почти как синонимы… большинство современных достижений в области ИИ связано с машинным обучением».

Ввиду того, что машинное обучение становится все более распространенным явлением, каждый, кто занимается бизнесом, может столкнуться с ним, и ему потребуются некоторые практические знания в этой области. Опрос Deloitte 2020 года показал, что 67 % компаний используют машинное обучение, а 97 % используют или планируют использовать его в следующем году.

От производства до розничной торговли, банковского дела и пекарен — даже старые компании используют машинное обучение, чтобы открывать новые возможности или повышать эффективность. «Машинное обучение меняет или изменит каждую отрасль, и лидеры должны понимать основные принципы, потенциал и ограничения», — сказал профессор компьютерных наук Массачусетского технологического института Александр Мадри, директор Центра развертываемого машинного обучения Массачусетского технологического института.

Хотя не всем нужно знать технические детали, они должны понимать, что делает технология, что она может и чего не может делать, добавила Мадри. «Я не думаю, что кто-то может позволить себе не знать о том, что происходит».

Это включает в себя осознание социальных, социальных и этических последствий машинного обучения. «Важно задействовать и начать понимать эти инструменты, а затем подумать о том, как вы собираетесь их использовать. Мы должны использовать эти [инструменты] на благо всех», — сказала доктор Джоан ЛаРовер, магистр делового администрирования 16-го года, педиатр-кардиолог-реаниматолог и соучредитель некоммерческой организации The Virtue Foundation. «ИИ обладает огромным потенциалом для добрых дел, и нам нужно действительно держать это в поле зрения, пока мы думаем об этом. Как мы можем использовать это, чтобы делать мир лучше и добрее?»

Что такое машинное обучение?

Машинное обучение — это область искусственного интеллекта, которая в широком смысле определяется как способность машины имитировать разумное поведение человека. Системы искусственного интеллекта используются для выполнения сложных задач таким же образом, как люди решают проблемы.

По словам Бориса Каца, главного научного сотрудника и руководителя группы InfoLab в CSAIL, цель искусственного интеллекта – создать компьютерные модели, демонстрирующие «разумное поведение», как у людей. Это означает, что машины могут распознавать визуальную сцену, понимать текст, написанный на естественном языке, или выполнять действия в физическом мире.

Машинное обучение — это один из способов использования ИИ. В 1950-х годах пионер ИИ Артур Сэмюэл определил его как «область исследования, которая дает компьютерам возможность учиться без явного программирования».

По словам Майки Шульмана, преподавателя MIT Sloan и руководителя отдела машинного обучения в компании Kensho, которая специализируется на искусственном интеллекте для финансового и разведывательного сообществ США, это определение верно. Он сравнил традиционный способ программирования компьютеров, или «программное обеспечение 1.0», с выпечкой, где рецепт требует точного количества ингредиентов и говорит пекарю смешивать в течение точного времени. Традиционное программирование также требует создания подробных инструкций для компьютера.

Но в некоторых случаях написание программы для машины требует много времени или невозможно, например, обучение компьютера распознаванию изображений разных людей. В то время как люди могут легко выполнить эту задачу, трудно сказать компьютеру, как это сделать. В машинном обучении используется подход, позволяющий компьютерам учиться программировать себя на основе опыта.

Машинное обучение начинается с данных — чисел, фотографий или текста, например банковских транзакций, изображений людей или даже хлебобулочных изделий, записей о ремонте, временных рядов данных с датчиков или отчетов о продажах. Данные собираются и подготавливаются для использования в качестве обучающих данных или информации, на которой будет обучаться модель машинного обучения. Чем больше данных, тем лучше программа.

Отсюда программисты выбирают модель машинного обучения для использования, предоставляют данные и позволяют компьютерной модели обучаться, чтобы находить закономерности или делать прогнозы. Со временем программист-человек также может настроить модель, в том числе изменить ее параметры, чтобы добиться более точных результатов. (Веб-сайт AI Weirdness ученого-исследователя Джанелл Шейн представляет собой занимательный взгляд на то, как алгоритмы машинного обучения учатся и как они могут ошибаться — как это произошло, когда алгоритм попытался сгенерировать рецепты и создал шоколадно-куриный куриный пирог.)

Некоторые данные сохраняются из обучающих данных для использования в качестве оценочных данных, которые проверяют, насколько точна модель машинного обучения при отображении новых данных. В результате получается модель, которую можно использовать в будущем с другими наборами данных.

Успешные алгоритмы машинного обучения могут делать разные вещи, — написал Мэлоун в недавнем обзоре исследования ИИ и будущего работы, написанном в соавторстве с профессором Массачусетского технологического института и директором CSAIL Даниэлой Рус и Робертом Лаубахером, заместителем директора Центра Массачусетского технологического института. для коллективного разума.

«Функция системы машинного обучения может быть описательной, то есть система использует данные для объяснения того, что произошло; прогностический, то есть система использует данные, чтобы предсказать, что произойдет; или предписывающий, то есть система будет использовать данные, чтобы давать рекомендации о том, какие действия следует предпринять», — пишут исследователи.

Существует три подкатегории машинного обучения:

Модели контролируемого машинного обучения обучаются с помощью помеченных наборов данных, что позволяет моделям обучаться и становиться более точными с течением времени. Например, алгоритм будет обучаться на изображениях собак и других предметов, помеченных людьми, а машина будет учиться самостоятельно идентифицировать изображения собак. Машинное обучение с учителем — наиболее распространенный тип, используемый сегодня.

При неконтролируемом машинном обучении программа ищет шаблоны в неразмеченных данных. Неконтролируемое машинное обучение может находить закономерности или тенденции, которые люди явно не ищут. Например, неконтролируемая программа машинного обучения может просматривать данные о продажах в Интернете и определять различные типы клиентов, совершающих покупки.

Машинное обучение с подкреплением обучает машины методом проб и ошибок предпринимать наилучшие действия, создавая систему вознаграждений. Обучение с подкреплением может обучать модели играть в игры или обучать автономные транспортные средства вождению, сообщая машине, когда она приняла правильное решение, что помогает ей со временем узнать, какие действия она должна предпринять.

В обзоре Work of the Future Мэлоун отметил, что машинное обучение лучше всего подходит для ситуаций с большим объемом данных — тысячами или миллионами примеров, таких как записи предыдущих разговоров с клиентами, журналы датчиков с машин или транзакции банкоматов. Например, Google Translate стал возможен благодаря тому, что он «обучался» на огромном количестве информации в Интернете на разных языках.

По словам Мадри, в некоторых случаях машинное обучение может помочь понять или автоматизировать процесс принятия решений в тех случаях, когда люди не в состоянии это сделать. "Это может быть не только более эффективно и менее затратно, чтобы сделать это с помощью алгоритма, но иногда люди просто не в состоянии это сделать", – сказал он.

Поиск Google — это пример того, что могут делать люди, но никогда не с таким масштабом и скоростью, с которой модели Google могут показывать потенциальные ответы каждый раз, когда человек вводит запрос, — сказал Мэлоун. «Это не пример того, как компьютеры лишают людей работы. Это пример того, как компьютеры делают вещи, которые были бы экономически нецелесообразны, если бы их должны были делать люди».

Машинное обучение также связано с рядом других областей искусственного интеллекта:

Обработка естественного языка

Обработка естественного языка – это область машинного обучения, в которой машины учатся понимать естественный язык, как говорят и пишут люди, а не данные и числа, которые обычно используются для программирования компьютеров. Это позволяет машинам распознавать язык, понимать его и реагировать на него, а также создавать новый текст и переводить его с одного языка на другой. Обработка естественного языка позволяет использовать знакомые технологии, такие как чат-боты и цифровые помощники, такие как Siri или Alexa.

Нейронные сети

Нейронные сети — это широко используемый особый класс алгоритмов машинного обучения. Искусственные нейронные сети моделируются человеческим мозгом, в котором тысячи или миллионы узлов обработки взаимосвязаны и организованы в слои.

В искусственной нейронной сети клетки или узлы соединены друг с другом, каждая из которых обрабатывает входные данные и создает выходные данные, которые отправляются другим нейронам. Помеченные данные перемещаются по узлам или ячейкам, причем каждая ячейка выполняет свою функцию. В нейронной сети, обученной определять, есть ли на картинке кошка или нет, разные узлы будут оценивать информацию и получать выходные данные, указывающие, есть ли на картинке кошка.

Глубокое обучение

Сети глубокого обучения – это многоуровневые нейронные сети. Многоуровневая сеть может обрабатывать большие объемы данных и определять «вес» каждой ссылки в сети — например, в системе распознавания изображений некоторые слои нейронной сети могут обнаруживать отдельные черты лица, такие как глаза, нос, или рот, в то время как другой слой сможет определить, появляются ли эти черты таким образом, чтобы указывать на лицо.

Как и нейронные сети, глубокое обучение основано на том, как работает человеческий мозг, и используется во многих областях машинного обучения, таких как автономные транспортные средства, чат-боты и медицинская диагностика.

«Чем больше слоев у вас есть, тем больше у вас возможностей хорошо справляться со сложными задачами», — сказал Мэлоун.

Глубокое обучение требует большой вычислительной мощности, что вызывает опасения по поводу его экономической и экологической устойчивости.

Как компании используют машинное обучение

Машинное обучение лежит в основе бизнес-моделей некоторых компаний, например алгоритма предложений Netflix или поисковой системы Google. Другие компании активно занимаются машинным обучением, хотя это не является их основным бизнес-предложением.

Читайте также: