Можно ли использовать несколько разных моделей при разработке одной компьютерной системы

Обновлено: 21.11.2024

Машинное обучение – это метод анализа данных, который автоматизирует построение аналитической модели. Это направление искусственного интеллекта, основанное на идее, что системы могут учиться на данных, выявлять закономерности и принимать решения с минимальным вмешательством человека.

Эволюция машинного обучения

Благодаря новым вычислительным технологиям машинное обучение сегодня не похоже на машинное обучение прошлого. Он родился из распознавания образов и теории о том, что компьютеры могут учиться, не будучи запрограммированными для выполнения определенных задач; исследователи, интересующиеся искусственным интеллектом, хотели узнать, могут ли компьютеры учиться на данных. Итеративный аспект машинного обучения важен, потому что по мере того, как модели подвергаются воздействию новых данных, они могут независимо адаптироваться. Они учатся на предыдущих вычислениях, чтобы производить надежные, воспроизводимые решения и результаты. Это наука, которая не нова, но она получила новый импульс.

Хотя многие алгоритмы машинного обучения существуют уже давно, возможность автоматически применять сложные математические вычисления к большим данным — снова и снова, все быстрее и быстрее — появилась недавно. Вот несколько широко известных примеров приложений машинного обучения, с которыми вы, возможно, знакомы:

  • Разрекламированная беспилотная машина Google? Суть машинного обучения.
  • Интернет-рекомендации, такие как предложения Amazon и Netflix? Приложения машинного обучения для повседневной жизни.
  • Знаете, что клиенты говорят о вас в Твиттере? Машинное обучение в сочетании с созданием лингвистических правил.
  • Обнаружение мошенничества? Одно из наиболее очевидных и важных применений в современном мире.

Машинное обучение и искусственный интеллект

Хотя искусственный интеллект (ИИ) – это наука о том, как имитировать человеческие способности, машинное обучение – это особый вид ИИ, который обучает машину тому, как учиться. Посмотрите это видео, чтобы лучше понять взаимосвязь между ИИ и машинным обучением. Вы увидите, как работают эти две технологии, с полезными примерами и несколькими забавными замечаниями.

Почему машинное обучение важно?

Возрождение интереса к машинному обучению связано с теми же факторами, которые сделали интеллектуальный анализ данных и байесовский анализ более популярными, чем когда-либо. Такие вещи, как растущие объемы и разнообразие доступных данных, более дешевая и мощная вычислительная обработка и доступное хранилище данных.

Все это означает, что можно быстро и автоматически создавать модели, способные анализировать большие и сложные данные и получать более быстрые и точные результаты даже в очень больших масштабах. И, создавая точные модели, у организации больше шансов определить выгодные возможности или избежать неизвестных рисков.

Что требуется для создания хороших систем машинного обучения?

  • Возможности подготовки данных.
  • Алгоритмы — базовые и расширенные.
  • Автоматизация и повторяющиеся процессы.
  • Масштабируемость.
  • Моделирование ансамбля.

Знаете ли вы?

  • В машинном обучении цель называется ярлыком.
  • В статистике цель называется зависимой переменной.
  • Переменная в статистике называется функцией машинного обучения.
  • Преобразование в статистике называется созданием признаков в машинном обучении.

Машинное обучение в современном мире

Используя алгоритмы для построения моделей, выявляющих связи, организации могут принимать более эффективные решения без вмешательства человека. Узнайте больше о технологиях, которые формируют мир, в котором мы живем.

Возможности и проблемы машинного обучения в бизнесе

Этот информационный документ O'Reilly содержит практическое руководство по внедрению приложений машинного обучения в вашей организации.

Расширьте свой набор навыков

Получите подробные инструкции и бесплатный доступ к программному обеспечению SAS, чтобы развить навыки машинного обучения. Курсы включают: 14 часов учебного времени, 90 дней бесплатного доступа к программному обеспечению в облаке, гибкий формат электронного обучения, не требующий навыков программирования.

Изменит ли машинное обучение вашу организацию?

В этом отчете Harvard Business Review Insight Center рассматривается, как машинное обучение изменит компании и то, как мы ими управляем.

Скачать отчет

Применение машинного обучения к Интернету вещей

Машинное обучение можно использовать для повышения эффективности, особенно применительно к Интернету вещей. В этой статье рассматривается эта тема.

Кто его использует?

Большинство отраслей, работающих с большими объемами данных, признали ценность технологии машинного обучения. Извлекая ценные сведения из этих данных — часто в режиме реального времени — организации могут работать более эффективно или получать преимущество перед конкурентами.

Финансовые услуги

Банки и другие предприятия финансовой отрасли используют технологии машинного обучения для двух основных целей: выявления важных сведений в данных и предотвращения мошенничества. Эти идеи могут определить инвестиционные возможности или помочь инвесторам узнать, когда торговать. Интеллектуальный анализ данных также может идентифицировать клиентов с профилями высокого риска или использовать кибернаблюдение для выявления предупредительных признаков мошенничества.

Правительство

Государственные учреждения, такие как служба общественной безопасности и коммунальные службы, особенно нуждаются в машинном обучении, поскольку у них есть несколько источников данных, из которых можно извлечь ценную информацию. Например, анализ данных датчиков позволяет определить способы повышения эффективности и экономии средств. Машинное обучение также может помочь обнаружить мошенничество и свести к минимуму кражу личных данных.

Здравоохранение

Машинное обучение – это быстро развивающаяся тенденция в сфере здравоохранения благодаря появлению носимых устройств и датчиков, которые могут использовать данные для оценки состояния здоровья пациента в режиме реального времени. Эта технология также может помочь медицинским экспертам анализировать данные для выявления тенденций или тревожных сигналов, которые могут привести к улучшению диагностики и лечения.

Розничная торговля

Веб-сайты, которые рекомендуют товары, которые могут вам понравиться на основе предыдущих покупок, используют машинное обучение для анализа вашей истории покупок. Ритейлеры полагаются на машинное обучение для сбора данных, их анализа и использования для персонализации покупательского опыта, проведения маркетинговых кампаний, оптимизации цен, планирования ассортимента и сбора информации о клиентах.

Нефть и газ

Поиск новых источников энергии. Анализ полезных ископаемых в земле. Прогнозирование отказа датчика нефтеперерабатывающего завода. Оптимизация распределения масла, чтобы сделать его более эффективным и экономичным. Количество вариантов использования машинного обучения для этой отрасли огромно и продолжает расти.

Транспорт

Анализ данных для выявления закономерностей и тенденций – ключ к транспортной отрасли, которая делает маршруты более эффективными и прогнозирует потенциальные проблемы для повышения прибыльности. Аспекты анализа данных и моделирования машинного обучения являются важными инструментами для компаний доставки, общественного транспорта и других транспортных организаций.

Подробнее об отраслях, использующих эту технологию

Какие популярные методы машинного обучения?

Двумя наиболее распространенными методами машинного обучения являются обучение с учителем и обучение без учителя, но существуют и другие методы машинного обучения. Вот обзор самых популярных типов.

Алгоритмы контролируемого обучения обучаются на примерах с пометками, например на входных данных, где известен желаемый результат. Например, элемент оборудования может иметь точки данных, помеченные либо «F» (сбой), либо «R» (работает). Алгоритм обучения получает набор входных данных вместе с соответствующими правильными выходными данными, и алгоритм обучается, сравнивая свои фактические выходные данные с правильными выходными данными, чтобы найти ошибки. Затем он соответствующим образом модифицирует модель. С помощью таких методов, как классификация, регрессия, прогнозирование и повышение градиента, контролируемое обучение использует шаблоны для прогнозирования значений метки на дополнительных немаркированных данных. Обучение с учителем обычно используется в приложениях, где исторические данные предсказывают вероятные будущие события. Например, он может предвидеть, когда операции с кредитными картами могут быть мошенническими или какой клиент страховой компании может подать иск.

Неконтролируемое обучение используется для данных, которые не имеют исторических меток. Системе не говорят «правильный ответ». Алгоритм должен выяснить, что показывается. Цель состоит в том, чтобы изучить данные и найти внутри некоторую структуру. Неконтролируемое обучение хорошо работает с транзакционными данными. Например, он может идентифицировать сегменты клиентов с похожими характеристиками, с которыми затем можно обращаться одинаково в маркетинговых кампаниях. Или он может найти основные атрибуты, которые отделяют потребительские сегменты друг от друга. Популярные методы включают самоорганизующиеся карты, отображение ближайших соседей, кластеризацию k-средних и разложение по сингулярным значениям. Эти алгоритмы также используются для сегментации текстовых тем, рекомендации элементов и выявления выбросов данных.

Обучение с полуучителем используется для тех же приложений, что и обучение с учителем.Но для обучения он использует как размеченные, так и неразмеченные данные — обычно небольшое количество размеченных данных с большим объемом неразмеченных данных (поскольку неразмеченные данные дешевле и требуют меньше усилий для получения). Этот тип обучения можно использовать с такими методами, как классификация, регрессия и предсказание. Полууправляемое обучение полезно, когда затраты, связанные с маркировкой, слишком высоки, чтобы обеспечить полностью маркированный процесс обучения. Ранние примеры этого включают идентификацию лица человека на веб-камере.

Обучение с подкреплением часто используется в робототехнике, играх и навигации. При обучении с подкреплением алгоритм методом проб и ошибок определяет, какие действия приносят наибольшее вознаграждение. Этот тип обучения состоит из трех основных компонентов: агент (ученик или лицо, принимающее решения), среда (все, с чем взаимодействует агент) и действия (что агент может делать). Цель агента состоит в том, чтобы выбрать действия, которые максимизируют ожидаемое вознаграждение за заданный промежуток времени. Агент достигнет цели намного быстрее, если будет следовать хорошей политике. Таким образом, цель обучения с подкреплением — изучить наилучшую политику.

Люди обычно могут создавать одну или две хорошие модели в неделю; машинное обучение может создавать тысячи моделей в неделю.

Томас Х. Дэвенпорт, идейный лидер в области аналитики
отрывок из The Wall Street Journal

Вычислительное моделирование — это использование компьютеров для моделирования и изучения сложных систем с использованием математики, физики и информатики. Вычислительная модель содержит множество переменных, характеризующих изучаемую систему. Моделирование выполняется путем корректировки переменных по отдельности или в комбинации и наблюдения за результатами. Компьютерное моделирование позволяет ученым проводить тысячи смоделированных экспериментов с помощью компьютера. Тысячи компьютерных экспериментов определяют несколько лабораторных экспериментов, которые с наибольшей вероятностью решат изучаемую проблему.

Современные вычислительные модели позволяют изучать биологическую систему на нескольких уровнях. Модели развития болезни включают молекулярные процессы, межклеточные взаимодействия и то, как эти изменения влияют на ткани и органы. Изучение систем на нескольких уровнях известно как многомасштабное моделирование (МСМ).

Вычислительные модели используются для моделирования и изучения сложных биологических систем. Изображение предоставлено ISB

Модели прогнозирования погоды делают прогнозы на основе многочисленных атмосферных факторов. Точные прогнозы погоды могут защитить жизнь и имущество, а также помочь коммунальным предприятиям планировать увеличение мощности, которое происходит при экстремальных климатических изменениях.

В авиасимуляторах используются сложные уравнения, которые управляют полетом самолета и реагируют на такие факторы, как турбулентность, плотность воздуха и осадки. Симуляторы используются для обучения пилотов, проектирования самолетов и изучения того, как самолеты меняются при изменении условий.

Моделирование землетрясений направлено на спасение жизней, зданий и инфраструктуры. Вычислительные модели предсказывают, как состав и движение конструкций взаимодействуют с подстилающими поверхностями, чтобы повлиять на то, что происходит во время землетрясения.

Отслеживание инфекционных заболеваний. Вычислительные модели используются для отслеживания инфекционных заболеваний среди населения, определения наиболее эффективных вмешательств, а также мониторинга и корректировки вмешательств для уменьшения распространения болезни. Выявление и внедрение мер, направленных на сдерживание распространения болезни, имеют решающее значение для спасения жизней и снижения нагрузки на систему здравоохранения во время пандемий инфекционных заболеваний.

Клиническая поддержка принятия решений. Вычислительные модели интеллектуально собирают, фильтруют, анализируют и представляют информацию о здоровье, чтобы предоставить врачам рекомендации по лечению заболеваний на основе подробных характеристик каждого пациента. Системы помогают обеспечить информированный и последовательный уход за пациентом при его переводе в соответствующие больничные учреждения и отделения и сдаче различных анализов в ходе курса лечения.

Прогнозирование побочных эффектов лекарств. Исследователи используют компьютерное моделирование, чтобы помочь разработать лекарства, которые будут наиболее безопасными для пациентов и с наименьшей вероятностью будут иметь побочные эффекты. Такой подход может сократить много лет, необходимых для разработки безопасного и эффективного лекарства.

Моделирование распространения инфекционных заболеваний для определения эффективных вмешательств. Точное моделирование инфекционных заболеваний опирается на многочисленные большие наборы данных. Например, оценка эффективности социального дистанцирования в отношении распространения гриппоподобных заболеваний должна включать информацию о дружбе и взаимодействии людей, а также стандартные биометрические и демографические данные.Исследователи, финансируемые NIBIB, разрабатывают новые вычислительные инструменты, которые могут включать новые доступные наборы данных в модели, предназначенные для определения наилучших направлений действий и наиболее эффективных вмешательств во время пандемического распространения инфекционных заболеваний и других чрезвычайных ситуаций в области общественного здравоохранения.

Многомасштабное моделирование (MSM) — это сложный тип вычислительного моделирования, который включает в себя несколько уровней биологической системы. Изображение предоставлено ISB.

Отслеживание эволюции вируса во время распространения инфекционного заболевания. РНК-вирусы, такие как ВИЧ, гепатит В и коронавирус, постоянно мутируют, вырабатывая лекарственную устойчивость, избегая иммунного ответа и вызывая новые инфекции. Образцы секвенированных патогенов от тысяч инфицированных можно использовать для идентификации миллионов эволюционирующих вариантов вируса. Исследователи, финансируемые NIBIB, создают вычислительные инструменты для включения этих важных данных в анализ инфекционных заболеваний медицинскими работниками. Новые инструменты будут созданы в сотрудничестве с CDC и доступны в Интернете для исследователей и медицинских работников. Проект улучшит эпиднадзор и лечение заболеваний во всем мире и позволит разработать более эффективные стратегии искоренения болезней.

Преобразование беспроводных данных о состоянии здоровья в улучшение здоровья и здравоохранения. Устройства для мониторинга здоровья в больницах и носимые датчики, такие как умные часы, генерируют огромные объемы данных о состоянии здоровья в режиме реального времени. Медицинское обслуживание на основе данных обещает быть быстрым, точным и менее дорогим, но непрерывные потоки данных в настоящее время превышают возможности использования информации. Исследователи, финансируемые NIBIB, разрабатывают вычислительные модели, которые преобразуют потоковые данные о здоровье в полезную форму. Новые модели обеспечат физиологический мониторинг в режиме реального времени для принятия клинических решений в Национальной детской больнице. Команда математиков, биомедицинских информатиков и персонала больниц будет создавать общедоступные данные и программное обеспечение. Проект будет использовать рынок беспроводных медицинских услуг стоимостью 11 миллиардов долларов, чтобы значительно улучшить здравоохранение.

Человеческое и машинное обучение для индивидуального управления вспомогательными роботами. Чем серьезнее двигательные нарушения человека, тем сложнее ему управлять вспомогательными механизмами, такими как кресла-коляски с электроприводом и роботизированные руки. Доступные средства контроля, такие как устройства для вдоха и выдоха, не подходят для людей с тяжелым параличом. Исследователи, финансируемые NIBIB, разрабатывают систему, позволяющую людям с тетраплегией управлять роботизированной рукой, одновременно продвигая физические упражнения и поддерживая остаточные двигательные навыки. В технологии используются интерфейсы «тело-машина», которые реагируют на минимальное движение конечностей, головы, языка, плеч и глаз. Первоначально, когда пользователь двигается, машинное обучение усиливает сигнал для выполнения задачи с помощью робота-манипулятора. Помощь сокращается по мере того, как машина передает управление все более опытному пользователю. Этот подход направлен на то, чтобы расширить возможности людей с тяжелым параличом и предоставить интерфейс для безопасного обучения управлению роботами-помощниками.

Существует множество различных типов моделей, выраженных в разнообразных языках моделирования и наборах инструментов. В этой статье предлагается классификация типов моделей и рассказывается, как различные модели должны работать вместе, чтобы поддерживать более широкие инженерно-технические усилия.

Содержание

Классификация моделей

Существует множество различных типов моделей и связанных с ними языков моделирования Языки моделирования для решения различных аспектов системы и различных типов систем. Поскольку разные модели служат разным целям, классификация моделей может быть полезна для выбора правильного типа модели для предполагаемой цели и области применения.

Формальные и неформальные модели

Поскольку системная модель системы представляет собой представление системы, моделями можно считать множество различных выражений, различающихся по степени формализма. В частности, можно нарисовать систему и считать ее моделью. Точно так же можно написать описание системы в виде текста и ссылаться на него как на модель. Оба примера являются представлениями системы. Тем не менее, если нет согласия относительно значения терминов, существует потенциальная неточность и возможность двусмысленности в представлении.

Основной задачей системного моделирования является использование моделей, поддерживаемых четко определенным языком моделирования. Хотя менее формальные представления могут быть полезны, модель должна соответствовать определенным ожиданиям, чтобы ее можно было рассматривать в рамках системной инженерии на основе моделей (MBSE) системной инженерии на основе моделей (MBSE).В частности, исходная классификация различает неформальные и формальные модели, поддерживаемые языком моделирования с определенным синтаксисом и семантикой семантики для соответствующей предметной области, представляющей интерес.

Физические модели и абстрактные модели

Глоссарий Министерства обороны США по моделированию и моделированию (M&S) утверждает, что «модель может быть [] физическим, математическим или иным логическим представлением системы» (1998 г.). Это определение обеспечивает отправную точку для классификации моделей высокого уровня. Физическая модель Физическая модель — это конкретное представление, отличающееся от математических и логических моделей, которые являются более абстрактными представлениями системы. Абстрактная модель может быть дополнительно классифицирована как описательная (аналогичная логической) или аналитическая (аналогичная математической). Некоторые примеры моделей показаны на рис. 1.

Рис. 1. Системная инженерия на основе моделей (Паредис, 2011 г.). Перепечатано с разрешения Криса Паредиса из Технологического института Джорджии. Все остальные права принадлежат правообладателю.

Описательные модели

Описательная модель. Описательная модель описывает логические отношения, такие как отношение целое-часть системы, которое определяет дерево ее частей, взаимосвязь между ее частями, функции функций, которые выполняют ее компоненты, или тестовые примеры, которые используются для проверки проверить системные требования требования. Типичные описательные модели могут включать те, которые описывают функциональную или физическую архитектуру системы или трехмерное геометрическое представление системы.

Аналитические модели

Аналитическая модель Аналитическая модель описывает математические отношения, такие как дифференциальные уравнения, которые поддерживают количественный анализ параметров системы. Аналитические модели можно разделить на динамические и статические. Динамические модели описывают изменяющееся во времени состояние системы, тогда как статические модели выполняют вычисления, которые не отражают изменяющееся во времени состояние системы. Динамическая модель может представлять характеристики системы, такие как положение самолета, скорость, ускорение и расход топлива во времени. Статическая модель может представлять собой оценку массовых свойств или прогноз надежности надежности системы или компонента.

Гибридные описательные и аналитические модели

Определенная модель может включать описательные и аналитические аспекты, как описано выше, но модели могут отдавать предпочтение тому или иному аспекту. Также можно анализировать логические отношения описательной модели и делать выводы о системе. Тем не менее, логический анализ дает иную информацию, чем количественный анализ параметров системы.

Модели для конкретных доменов

Как описательные, так и аналитические модели можно дополнительно классифицировать в соответствии с областью, которую они представляют. Следующие классификации частично получены из презентации OWL, онтологии и профили SysML: представление знаний и моделирование (язык веб-онтологий (OWL) и язык системного моделирования (SysML)) (Jenkins 2010):

  • свойства системы, такие как производительность, надежность, массовые характеристики, мощность, структурные или тепловые модели;
  • проектировать дизайн и реализовывать технологии, такие как электрические, механические и программные модели проектирования программного обеспечения;
  • подсистемы и продукты, такие как средства связи, управление неисправностями или модели распределения питания; и
  • системные приложения, такие как информационные системы, автомобильные системы, аэрокосмические системы или модели медицинских устройств.

Классификация моделей, терминология и подход часто адаптируются к конкретной предметной области. Например, при моделировании организации организации или бизнес-бизнеса поведенческая поведенческая модель может называться моделью рабочего процесса или процесса, а моделирование производительности может относиться к затратам и плановым показателям, связанным с организацией или бизнес-процессом.< /p>

Одна модель может включать несколько категорий доменов из приведенного выше списка. Например, модель надежности, тепловой и/или энергетической модели может быть определена для электрической схемы подсистемы связи для аэрокосмической системы, такой как самолет или спутник.

Модели системы

Системные модели могут быть гибридными моделями, которые являются как описательными, так и аналитическими. Они часто охватывают несколько областей моделирования, которые должны быть интегрированы, чтобы обеспечить согласованное и связное представление связанной системы. Таким образом, модель системы должна предоставлять как системные конструкции общего назначения, так и конструкции, специфичные для предметной области, которые являются общими для областей моделирования.Модель системы может включать несколько представлений для поддержки планирования, требований, проектирования, анализа и верификации.

Уэйну Ваймору приписывают одну из первых попыток формального определения системной модели с использованием математической основы в Математическая теория системной инженерии: элементы (Wymore 1967). Ваймор создал строгую математическую основу для проектирования систем в контексте моделей. Краткое изложение его работы можно найти в обзоре методологий системного проектирования на основе моделей (MBSE).

Моделирование и модель

Термин имитационное моделирование , или, точнее, компьютерное моделирование компьютерное моделирование , относится к методу реализации модели во времени (DoD 1998). Компьютерное моделирование включает в себя аналитическую модель, представленную в виде исполняемого кода, входных условий ввода и других входных данных, а также вычислительную инфраструктуру. Вычислительная инфраструктура включает в себя вычислительный механизм, необходимый для выполнения модели, а также устройства ввода и вывода. О большом разнообразии подходов к компьютерному моделированию свидетельствует выбор, который должен сделать разработчик компьютерного моделирования, в том числе:

  • стохастический или детерминированный;
  • стационарное или динамическое;
  • непрерывный или дискретный; и
  • локальный или распределенный.

Другие классификации моделирования могут зависеть от типа моделируемой модели. Одним из примеров является моделирование на основе агентов, которое имитирует взаимодействие между автономными агентами для прогнозирования сложного эмерджентного эмерджентного поведения (Барри, 2009). Есть много других типов моделей, которые можно использовать для дальнейшей классификации симуляций. Как правило, моделирование предоставляет средства для анализа сложного динамического поведения систем, программного обеспечения, оборудования, людей и физических явлений.

Моделирование часто интегрируется с реальным оборудованием, программным обеспечением и операторами системы, чтобы оценить, как реальные компоненты и пользователи системы работают в моделируемой среде. В оборонном сообществе Соединенных Штатов принято называть симуляции живыми, виртуальными или конструктивными, где симуляция в реальном времени относится к живым операторам, работающим с реальными системами, виртуальное моделирование относится к живым операторам, управляющим смоделированными системами, а конструктивное моделирование относится к смоделированным операторам. работа с смоделированными системами. Виртуальные и конструктивные симуляции могут также включать реальное системное аппаратное и программное обеспечение в цикле, а также стимулы из реальной системной среды.

Помимо представления системы и ее окружения, моделирование должно предоставлять эффективные вычислительные методы для решения уравнений. Моделирование может потребоваться для работы в режиме реального времени, особенно если в цикле есть оператор. Другие виды моделирования могут потребоваться для работы намного быстрее, чем в режиме реального времени, и выполнения тысяч запусков моделирования для получения статистически достоверных результатов моделирования. Несколько вычислительных и других методов моделирования описаны в Имитационном моделировании и анализе (Law 2007).

Визуализация

Результаты компьютерного моделирования и другие аналитические результаты часто нуждаются в обработке, чтобы их можно было представить пользователям в осмысленном виде. Методы и инструменты визуализации используются для отображения результатов в различных визуальных формах, таких как простой график состояния системы в зависимости от времени для отображения параметрической зависимости. Другой пример этого происходит, когда входные и выходные значения из нескольких выполнений симуляции отображаются на поверхности отклика, показывающей чувствительность вывода к вводу. Дополнительный статистический анализ результатов может быть выполнен для получения вероятностных распределений для выбранных значений параметров. Анимация часто используется для виртуального представления системы и ее динамического поведения. Например, анимация может отображать трехмерное положение и ориентацию самолета в зависимости от времени, а также проецировать траекторию полета самолета на поверхность Земли, представленную подробными картами местности.

Интеграция моделей

Многие различные типы моделей могут быть разработаны как артефакты MBSE. Многие другие предметно-ориентированные модели создаются для проектирования и анализа компонентов. Различные описательные и аналитические модели должны быть интегрированы, чтобы в полной мере реализовать преимущества модельного подхода. Роль MBSE в том, что модели интегрируются в несколько доменов, является основной темой доклада INCOSE Systems Engineering Vision 2020 Международного совета по системной инженерии (INCOSE) (INCOSE 2007).

Например, системные модели можно использовать для определения компонентов системы. Описательная модель архитектуры системы может использоваться для идентификации и разделения компонентов системы и определения их взаимосвязи или других отношений.Аналитические модели производительности, физических и других характеристик качества, таких как надежность, могут использоваться для определения требуемых значений конкретных свойств компонентов для удовлетворения системных требований. Модель исполняемой системы Модель исполняемой системы, которая представляет взаимодействие компонентов системы, может использоваться для подтверждения того, что требования к компонентам могут удовлетворять требованиям к поведению системы. Описательная, аналитическая и исполняемая системные модели представляют разные аспекты одной и той же системы.

Конструкции компонентов должны удовлетворять требованиям к компонентам, указанным в моделях системы. В результате модели проектирования и анализа компонентов должны иметь некоторый уровень интеграции интеграции, чтобы гарантировать, что модель проектирования прослеживается до модели требований. Различные дисциплины проектирования электрических, механических и программных систем создают свои собственные модели, представляющие различные аспекты одной и той же системы. Очевидно, что различные модели должны быть достаточно интегрированы, чтобы обеспечить единое системное решение.

Для поддержки интеграции модели должны установить семантическую совместимость. Семантическая совместимость гарантирует, что конструкция в одной модели имеет то же значение, что и соответствующая конструкция в другой модели. Эта информация также должна передаваться между инструментами моделирования.

Один из подходов к семантической совместимости заключается в использовании преобразований моделей между различными моделями. Определены преобразования, устанавливающие соответствие между понятиями одной модели и понятиями другой. В дополнение к установлению соответствия, инструменты должны иметь средства для обмена данными модели и обмена информацией о преобразовании. Существует несколько способов обмена данными между инструментами, включая обмен файлами, использование интерфейсов прикладных программ (API) и общий репозиторий.

Использование стандартов моделирования для языков моделирования, преобразования моделей и обмена данными является важным фактором интеграции между областями моделирования.

Ссылки

Процитированные работы

Министерство обороны. 1998. «Глоссарий по моделированию и моделированию (M&S) Министерства обороны США» в Руководстве Министерства обороны США 5000.59-M. Арлингтон, Вирджиния, США: Министерство обороны США. Январь 1998 г.

Ваймор, А. 1967. Математическая теория системной инженерии: элементы. Нью-Йорк, штат Нью-Йорк, США: Джон Уайли.

Ваймор, А. 1993. Разработка систем на основе моделей. Бока-Ратон, Флорида, США: CRC Press.

Основные ссылки

Law, A. 2007. Имитационное моделирование и анализ, 4-е изд. Нью-Йорк, штат Нью-Йорк, США: McGraw Hill.

Ваймор, А. 1993. Разработка систем на основе моделей. Бока-Ратон, Флорида, США: CRC Press.

Дополнительные ссылки

Эстефан, Дж. 2008. Обзор возможных методологий системной инженерии на основе моделей (MBSE), редакция Б. Пасадена, Калифорния, США: Международный совет по системной инженерии (INCOSE), INCOSE-TD -2007-003-02.

Хибертсон, Д. 2009. Модельно-ориентированная системная инженерия: унифицирующая структура для традиционных и сложных систем. Бока-Ратон, Флорида, США: Auerbach/CRC Press.

ДОХОД. 2007. Systems Engineering Vision 2020. Сиэтл, Вашингтон, США: Международный совет по системной инженерии. Сентябрь 2007 г. INCOSE-TP-2004-004-02.

Рукет Н. и С. Дженкинс. 2010. Онтологии OWL и профили SysML: представление знаний и моделирование. Материалы семинара NASA-ESA PDE, июнь 2010 г.

В этом введении в машинное обучение представлен обзор его истории, важных определений, приложений и проблем современного бизнеса.

Что такое машинное обучение?

Машинное обучение — это область искусственного интеллекта (ИИ) и компьютерных наук, в которой основное внимание уделяется использованию данных и алгоритмов для имитации того, как люди учатся, с постепенным повышением его точности.

IBM имеет богатую историю машинного обучения. Одному из них, Артуру Сэмюэлю, приписывают создание термина «машинное обучение» в его исследовании (PDF, 481 КБ) (ссылка находится вне IBM) игры в шашки. Роберт Нили, самопровозглашенный мастер шашек, играл в эту игру на компьютере IBM 7094 в 1962 году и проиграл компьютеру. По сравнению с тем, что можно сделать сегодня, этот подвиг кажется почти тривиальным, но он считается важной вехой в области искусственного интеллекта. В течение следующих нескольких десятилетий технологические разработки, связанные с хранением и вычислительной мощностью, позволят создать ряд инновационных продуктов, которые мы знаем и любим сегодня, таких как система рекомендаций Netflix или беспилотные автомобили.

Машинное обучение — важный компонент растущей области науки о данных. Благодаря использованию статистических методов алгоритмы обучаются делать классификации или прогнозы, раскрывая ключевые идеи в рамках проектов интеллектуального анализа данных.Эти идеи впоследствии влияют на принятие решений в приложениях и компаниях, в идеале влияя на ключевые показатели роста. Поскольку большие данные продолжают расширяться и расти, рыночный спрос на специалистов по данным будет расти, что потребует от них помощи в определении наиболее важных бизнес-вопросов, а затем и данных для ответов на них.

Машинное обучение, глубокое обучение и нейронные сети

Поскольку глубокое обучение и машинное обучение, как правило, используются взаимозаменяемо, стоит обратить внимание на нюансы между ними. Машинное обучение, глубокое обучение и нейронные сети — все это подобласти искусственного интеллекта. Однако на самом деле глубокое обучение — это часть машинного обучения, а нейронные сети — часть глубокого обучения.

Способ, которым глубокое обучение и машинное обучение отличаются, заключается в том, как каждый алгоритм обучается. Глубокое обучение автоматизирует большую часть процесса извлечения признаков, устраняя часть необходимого ручного вмешательства человека и позволяя использовать большие наборы данных. Вы можете думать о глубоком обучении как о «масштабируемом машинном обучении», как отмечает Лекс Фридман в этой лекции Массачусетского технологического института (01:08:05) (ссылка находится вне IBM). Классическое или «неглубокое» машинное обучение в большей степени зависит от вмешательства человека. Эксперты-люди определяют набор функций, чтобы понять различия между входными данными, обычно требуя более структурированных данных для изучения.

"Глубокое" машинное обучение может использовать помеченные наборы данных, также известное как обучение с учителем, для информирования своего алгоритма, но для этого не обязательно требуется помеченный набор данных. Он может принимать неструктурированные данные в необработанном виде (например, текст, изображения) и может автоматически определять набор функций, которые отличают разные категории данных друг от друга. В отличие от машинного обучения, для обработки данных не требуется вмешательство человека, что позволяет масштабировать машинное обучение более интересными способами. Глубокое обучение и нейронные сети в первую очередь способствуют ускорению прогресса в таких областях, как компьютерное зрение, обработка естественного языка и распознавание речи.

Нейронные сети, или искусственные нейронные сети (ИНС), состоят из слоев узлов, содержащих входной слой, один или несколько скрытых слоев и выходной слой. Каждый узел или искусственный нейрон соединяется с другим и имеет соответствующий вес и порог. Если выход любого отдельного узла превышает указанное пороговое значение, этот узел активируется, отправляя данные на следующий уровень сети. В противном случае данные не передаются на следующий уровень сети. «Глубокое» в глубоком обучении просто относится к глубине слоев в нейронной сети. Нейронная сеть, состоящая из более чем трех слоев, включая входные и выходные данные, может считаться алгоритмом глубокого обучения или глубокой нейронной сетью. Нейронная сеть, состоящая только из двух или трех слоев, — это просто базовая нейронная сеть.

См. сообщение в блоге "Искусственный интеллект, машинное обучение, глубокое обучение и нейронные сети: в чем разница?" для более подробного изучения взаимосвязи различных концепций.

Как работает машинное обучение

Калифорнийский университет в Беркли (ссылка находится за пределами IBM) разбивает систему обучения алгоритма машинного обучения на три основные части.

  1. Процесс принятия решения. Как правило, алгоритмы машинного обучения используются для прогнозирования или классификации. На основе некоторых входных данных, которые могут быть помечены или не помечены, ваш алгоритм произведет оценку закономерности в данных.
  2. Функция ошибки. Функция ошибки служит для оценки предсказания модели. Если есть известные примеры, функция ошибок может провести сравнение для оценки точности модели.
  3. Процесс оптимизации модели. Если модель может лучше соответствовать точкам данных в обучающем наборе, веса корректируются, чтобы уменьшить несоответствие между известным примером и оценкой модели. Алгоритм будет повторять этот процесс оценки и оптимизации, автономно обновляя веса, пока не будет достигнут порог точности.

Методы машинного обучения

Классификаторы машинного обучения делятся на три основные категории.

Машинное обучение под наблюдением

Обучение с учителем, также известное как машинное обучение с учителем, основано на использовании помеченных наборов данных для обучения алгоритмов, позволяющих точно классифицировать данные или прогнозировать результаты. Когда входные данные поступают в модель, она корректирует свои веса до тех пор, пока модель не будет подогнана должным образом. Это происходит как часть процесса перекрестной проверки, чтобы гарантировать, что модель избегает переобучения или недообучения. Обучение под наблюдением помогает организациям решать множество реальных проблем в масштабе, например классифицировать спам в отдельной папке из папки «Входящие». Некоторые методы, используемые в обучении с учителем, включают нейронные сети, наивный байесовский метод, линейную регрессию, логистическую регрессию, случайный лес, метод опорных векторов (SVM) и другие.

Машинное обучение без учителя

Неконтролируемое обучение, также известное как неконтролируемое машинное обучение, использует алгоритмы машинного обучения для анализа и кластеризации немаркированных наборов данных. Эти алгоритмы обнаруживают скрытые шаблоны или группы данных без необходимости вмешательства человека. Его способность обнаруживать сходства и различия в информации делает его идеальным решением для исследовательского анализа данных, стратегий перекрестных продаж, сегментации клиентов, распознавания изображений и образов. Он также используется для уменьшения количества функций в модели посредством процесса уменьшения размерности; Анализ основных компонентов (PCA) и разложение по сингулярным числам (SVD) являются двумя распространенными подходами для этого. Другие алгоритмы, используемые в неконтролируемом обучении, включают нейронные сети, кластеризацию k-средних, вероятностные методы кластеризации и многое другое.

Обучение под наблюдением

Обучение с частичным учителем предлагает золотую середину между обучением с учителем и обучением без учителя. Во время обучения он использует меньший помеченный набор данных для классификации и извлечения признаков из большего неразмеченного набора данных. Полууправляемое обучение может решить проблему нехватки помеченных данных (или невозможности пометить достаточно данных) для обучения алгоритма обучения с учителем.

Чтобы глубже понять различия между этими подходами, ознакомьтесь с разделом "Обучение с учителем и без учителя: в чем разница?"

Машинное обучение с подкреплением

Машинное обучение с подкреплением — это поведенческая модель машинного обучения, аналогичная обучению с учителем, но алгоритм не обучается на примерах данных. Эта модель учится на ходу путем проб и ошибок. Последовательность успешных результатов будет подкреплена для разработки наилучшей рекомендации или политики для данной проблемы.

Хорошим примером является система IBM Watson®, победившая в конкурсе Jeopardy! в 2011 году. Система использовала обучение с подкреплением, чтобы решить, стоит ли пытаться ответить (или как бы задать вопрос), какую клетку выбрать на доске и сколько ставить, особенно на ежедневные удвоения.

Реальные примеры использования машинного обучения

Вот несколько примеров машинного обучения, с которыми вы можете сталкиваться каждый день:

Распознавание речи. Оно также известно как автоматическое распознавание речи (ASR), компьютерное распознавание речи или преобразование речи в текст. Это функция, использующая обработку естественного языка (NLP) для преобразования человеческой речи в письменный формат. . Многие мобильные устройства включают в свои системы распознавание речи для осуществления голосового поиска. Siri — или предоставьте дополнительные возможности для текстовых сообщений.

Обслуживание клиентов. Онлайн-чат-боты заменяют людей на пути к покупке. Они отвечают на часто задаваемые вопросы (FAQ) по таким темам, как доставка, или предоставляют персональные советы, перекрестные продажи продуктов или предлагают размеры для пользователей, изменяя наше представление о взаимодействии с клиентами на веб-сайтах и ​​платформах социальных сетей. Примеры включают боты для обмена сообщениями на сайтах электронной коммерции с виртуальными агентами, приложения для обмена сообщениями, такие как Slack и Facebook Messenger, а также задачи, обычно выполняемые виртуальными помощниками и голосовыми помощниками.

Компьютерное зрение. Эта технология искусственного интеллекта позволяет компьютерам и системам извлекать значимую информацию из цифровых изображений, видео и других визуальных входных данных и на основе этих входных данных выполнять действия. Эта способность давать рекомендации отличает его от задач распознавания изображений. Компьютерное зрение, основанное на сверточных нейронных сетях, применяется для пометки фотографий в социальных сетях, рентгенологических изображений в здравоохранении и беспилотных автомобилей в автомобильной промышленности.

Системы рекомендаций. Алгоритмы искусственного интеллекта, используя данные о прошлом потреблении, могут помочь обнаружить тенденции данных, которые можно использовать для разработки более эффективных стратегий перекрестных продаж. Это используется для предоставления релевантных дополнительных рекомендаций покупателям в процессе оформления заказа для интернет-магазинов.

Автоматизированная торговля акциями. Платформы для высокочастотной торговли на основе искусственного интеллекта, предназначенные для оптимизации портфелей акций, совершают тысячи и даже миллионы сделок в день без вмешательства человека.

Проблемы машинного обучения

Развитие технологий машинного обучения, безусловно, сделало нашу жизнь проще. Однако внедрение машинного обучения в бизнесе также вызвало ряд этических проблем, связанных с технологиями искусственного интеллекта. Некоторые из них включают:

Технологическая особенность

Хотя эта тема привлекает большое внимание общественности, многих исследователей не волнует идея о том, что ИИ превзойдет человеческий интеллект в ближайшем или ближайшем будущем. Это также называют сверхразумом, который Ник Бострум определяет как «любой интеллект, который значительно превосходит лучшие человеческие мозги практически во всех областях, включая научное творчество, общую мудрость и социальные навыки.«Несмотря на то, что Сильный ИИ и суперинтеллект не являются неизбежными в обществе, идея этого поднимает некоторые интересные вопросы, поскольку мы рассматриваем использование автономных систем, таких как беспилотные автомобили. Нереально думать, что беспилотный автомобиль никогда не попадет в автомобильную аварию, но кто несет ответственность в таких обстоятельствах? Должны ли мы по-прежнему стремиться к автономным транспортным средствам, или мы ограничим интеграцию этой технологии, чтобы создавать только полуавтономные транспортные средства, которые способствуют безопасности водителей? Присяжные по этому поводу еще не пришли к единому мнению, но именно такие этические дебаты происходят по мере развития новых инновационных технологий искусственного интеллекта.

Влияние ИИ на рабочие места

Хотя общественное мнение об искусственном интеллекте во многом связано с потерей работы, эту озабоченность, вероятно, следует переосмыслить. Мы видим, что с появлением каждой прорывной новой технологии меняется рыночный спрос на конкретные должности. Например, когда мы смотрим на автомобильную промышленность, многие производители, такие как GM, переключаются на производство электромобилей, чтобы соответствовать экологическим инициативам. Энергетика не исчезает, но источник энергии переходит от экономии топлива к электричеству. Искусственный интеллект следует рассматривать аналогичным образом, поскольку искусственный интеллект сместит спрос на рабочие места в другие области. Потребуются люди, которые помогут управлять этими системами, поскольку данные растут и меняются каждый день. По-прежнему потребуются ресурсы для решения более сложных проблем в отраслях, на которые, скорее всего, повлияет изменение спроса на рабочие места, таких как обслуживание клиентов. Важным аспектом искусственного интеллекта и его влияния на рынок труда будет помощь людям в переходе к этим новым сферам рыночного спроса.

Конфиденциальность

Конфиденциальность, как правило, обсуждается в контексте конфиденциальности данных, защиты данных и безопасности данных, и эти проблемы позволили политикам добиться большего прогресса в этом вопросе в последние годы. Например, в 2016 году было принято законодательство GDPR для защиты персональных данных людей в Европейском союзе и Европейской экономической зоне, что дало людям больший контроль над своими данными. В Соединенных Штатах отдельные штаты разрабатывают политику, такую ​​как Калифорнийский закон о конфиденциальности потребителей (CCPA), который требует от компаний информировать потребителей о сборе их данных. Это недавнее законодательство заставило компании переосмыслить то, как они хранят и используют персональные данные (PII). В результате инвестиции в безопасность становятся все более приоритетными для компаний, поскольку они стремятся устранить любые уязвимости и возможности для наблюдения, взлома и кибератак.

Предвзятость и дискриминация

Случаи предвзятости и дискриминации в ряде интеллектуальных систем подняли множество этических вопросов, касающихся использования искусственного интеллекта. Как мы можем защититься от предвзятости и дискриминации, когда сами обучающие данные могут привести к предвзятости? В то время как компании обычно имеют благие намерения в отношении своих усилий по автоматизации, Reuters (ссылка находится за пределами IBM) подчеркивает некоторые непредвиденные последствия включения ИИ в практику найма. Стремясь автоматизировать и упростить процесс, Amazon непреднамеренно предвзято относился к потенциальным кандидатам на работу по полу для открытых технических должностей, и в конечном итоге им пришлось отказаться от проекта. По мере появления подобных событий журнал Harvard Business Review (ссылка находится за пределами IBM) поднял другие острые вопросы, связанные с использованием ИИ при приеме на работу, например, какие данные вы должны иметь возможность использовать при оценке кандидата на роль.

Предвзятость и дискриминация не ограничиваются работой отдела кадров. его можно найти в ряде приложений, от программного обеспечения для распознавания лиц до алгоритмов социальных сетей.

По мере того, как компании все больше осознают риски, связанные с ИИ, они также активнее обсуждают этику и ценности ИИ. Например, в прошлом году генеральный директор IBM Арвинд Кришна сообщил, что IBM прекратила выпуск продуктов IBM для распознавания и анализа лиц общего назначения, подчеркнув, что «IBM решительно выступает против и не будет мириться с использованием любых технологий, включая технологии распознавания лиц, предлагаемые другими поставщиками, для массовых слежка, расовое профилирование, нарушение основных прав и свобод человека или любые цели, не соответствующие нашим ценностям и принципам доверия и прозрачности».

Чтобы узнать больше об этом, посетите блог IBM, посвященный политике, в котором излагается ее точка зрения на «Подход точного регулирования к контролю за экспортом технологий распознавания лиц».

Подотчетность

Поскольку не существует серьезного законодательства, регулирующего использование ИИ, нет и реального механизма обеспечения соблюдения этических норм ИИ. Нынешние стимулы для компаний придерживаться этих рекомендаций являются негативными последствиями неэтичной системы искусственного интеллекта для прибыли.Чтобы восполнить этот пробел, в рамках сотрудничества между специалистами по этике и исследователями возникли этические рамки для управления созданием и распространением моделей ИИ в обществе. Однако на данный момент они служат только для руководства, и исследования (ссылка находится за пределами IBM) (PDF, 1 МБ) показывают, что сочетание распределенной ответственности и отсутствия предвидения потенциальных последствий не обязательно способствует предотвращению вреда обществу. .

Чтобы узнать больше о позиции IBM в отношении этики ИИ, читайте здесь.

Машинное обучение и IBM Cloud

IBM Watson Studio в IBM Cloud Pak for Data поддерживает сквозной жизненный цикл машинного обучения на платформе данных и искусственного интеллекта. Вы можете создавать, обучать и управлять моделями машинного обучения, где бы ни хранились ваши данные, и развертывать их в любом месте гибридной многооблачной среды.

Глубокое обучение — это область машинного обучения, связанная с алгоритмами, вдохновленными структурой и функциями мозга, которые называются искусственными нейронными сетями.

Если вы только начинаете заниматься глубоким обучением или некоторое время назад уже имели опыт работы с нейронными сетями, вы можете запутаться. Я знаю, что поначалу я был в замешательстве, как и многие мои коллеги и друзья, которые изучали и использовали нейронные сети в 1990-х и начале 2000-х годов.

Лидеры и эксперты в этой области имеют представление о том, что такое глубокое обучение, и эти конкретные и детальные взгляды проливают свет на то, что такое глубокое обучение.

В этом посте вы узнаете, что такое глубокое обучение, услышав мнение целого ряда экспертов и лидеров в этой области.

Начните свой проект с моей новой книги Deep Learning With Python, включающей пошаговые руководства и файлы исходного кода Python для всех примеров.

Что такое глубокое обучение?
Фото Киран Фостер, некоторые права защищены.

Глубокое обучение — это большие нейронные сети

Эндрю Нг из Coursera и главный научный сотрудник Baidu Research официально основал Google Brain, что в конечном итоге привело к внедрению технологий глубокого обучения в большое количество сервисов Google.

Он много говорил и писал о том, что такое глубокое обучение и с чего начать.

В ранних докладах о глубоком обучении Эндрю описал глубокое обучение в контексте традиционных искусственных нейронных сетей. В докладе 2013 года под названием «Глубокое обучение, самообучение и неконтролируемое функциональное обучение» он описал идею глубокого обучения следующим образом:

Используя симуляции мозга, мы надеемся:

– Сделать алгоритмы обучения намного лучше и проще в использовании.

– Сделать революционные достижения в области машинного обучения и ИИ.

p>

Я считаю, что это наш лучший шанс на пути к настоящему ИИ

Позже его комментарии стали более тонкими.

По словам Эндрю, ядро ​​глубокого обучения заключается в том, что теперь у нас есть достаточно быстрые компьютеры и достаточно данных для обучения больших нейронных сетей. Обсуждая, почему сейчас самое время для глубокого обучения, на ExtractConf 2015 в докладе под названием «Что ученые, работающие с данными, должны знать о глубоком обучении», он прокомментировал:

теперь мы можем иметь очень большие нейронные сети и… огромные объемы данных, к которым у нас есть доступ

Он также отметил важный момент: все дело в масштабе. По мере того, как мы создаем более крупные нейронные сети и обучаем их все большему количеству данных, их производительность продолжает расти. Как правило, это отличается от других методов машинного обучения, которые достигают плато в производительности.

для большинства разновидностей алгоритмов обучения старых поколений… производительность будет стабильной. … глубокое обучение … это первый класс алгоритмов … масштабируемых. … производительность становится все лучше по мере того, как вы предоставляете им больше данных

Он показывает это на своих слайдах:

Почему глубокое обучение?
Слайд: Эндрю Нг, все права защищены.

Наконец, он ясно указывает на то, что преимущества глубокого обучения, которые мы видим на практике, связаны с контролируемым обучением. Из доклада ExtractConf 2015 года он прокомментировал:

почти вся ценность глубокого обучения сегодня заключается в обучении с учителем или обучении на размеченных данных

Ранее в 2014 году в Стэнфордском университете на тему "Глубокое обучение" он сделал аналогичный комментарий:

одна из причин, по которой глубокое обучение стало безумно популярным, заключается в том, что оно великолепно подходит для контролируемого обучения

Эндрю часто упоминает, что мы должны и будем видеть больше преимуществ, связанных с неконтролируемой частью треков, по мере того, как поле становится более зрелым, чтобы справляться с обилием доступных неразмеченных данных.

Джефф Дин — волшебник и старший научный сотрудник Google в группе систем и инфраструктуры Google. Он участвовал и, возможно, частично отвечал за масштабирование и внедрение глубокого обучения в Google. Джефф участвовал в проекте Google Brain и разработке крупномасштабного программного обеспечения для глубокого обучения DistBelief, а затем и TensorFlow.

В 2016 году в докладе под названием "Глубокое обучение для создания интеллектуальных компьютерных систем" он сделал комментарий в том же ключе, что глубокое обучение на самом деле связано с большими нейронными сетями.

Когда вы слышите термин «глубокое обучение», просто подумайте о большой глубокой нейронной сети. Глубокий обычно относится к количеству слоев, поэтому этот популярный термин был принят в прессе. Я думаю о них как о глубоких нейронных сетях в целом.

Он выступал с этим докладом несколько раз, а в измененном наборе слайдов для того же доклада он подчеркивает масштабируемость нейронных сетей, указывая на то, что результаты становятся лучше с большим объемом данных и более крупными моделями, которые, в свою очередь, требуют больше вычислений для поезд.

Результаты становятся лучше благодаря большему объему данных, более крупным моделям, большему объему вычислений
Слайд Джеффа Дина, все права защищены.

Глубокое обучение — это иерархическое функциональное обучение

Помимо масштабируемости, еще одним часто упоминаемым преимуществом моделей глубокого обучения является их способность выполнять автоматическое извлечение признаков из необработанных данных, что также называется изучением признаков.

Йошуа Бенжио – еще один лидер в области глубокого обучения, хотя он начал с большого интереса к автоматическому обучению признаков, которого могут достичь большие нейронные сети.

Он описывает глубокое обучение с точки зрения способности алгоритмов обнаруживать и изучать хорошие представления с помощью обучения признакам. В своей статье 2012 года под названием «Глубокое изучение представлений для обучения без учителя и передачи» он прокомментировал:

Алгоритмы глубокого обучения стремятся использовать неизвестную структуру во входном распределении, чтобы обнаружить хорошие представления, часто на нескольких уровнях, с изученными функциями более высокого уровня, определенными с точки зрения функций более низкого уровня

< /цитата>

Подробный взгляд на глубокое обучение в этом направлении представлен в его техническом отчете за 2009 год под названием "Изучение глубоких архитектур для ИИ", где он подчеркивает важность иерархии в изучении функций.

Методы глубокого обучения нацелены на изучение иерархий функций с функциями из более высоких уровней иерархии, образованных композицией функций более низкого уровня. Автоматическое изучение функций на нескольких уровнях абстракции позволяет системе изучать сложные функции, преобразующие входные данные в выходные данные, непосредственно из данных, не полагаясь полностью на функции, созданные человеком.

В готовящейся к публикации книге под названием "Глубокое обучение", написанной в соавторстве с Яном Гудфеллоу и Аароном Курвиллем, они определяют глубокое обучение с точки зрения глубины архитектуры моделей.

Иерархия понятий позволяет компьютеру изучать сложные понятия, строя их из более простых. Если мы нарисуем график, показывающий, как эти концепции строятся друг над другом, то график будет глубоким, со многими слоями. По этой причине мы называем такой подход к глубокому обучению ИИ.

Это важная книга, которая, вероятно, на какое-то время станет исчерпывающим источником знаний в этой области. Далее в книге многослойные персептроны описываются как алгоритм, используемый в области глубокого обучения, что дает представление о том, что глубокое обучение включает в себя искусственные нейронные сети.

Важнейшим примером модели глубокого обучения является глубокая сеть с прямой связью или многослойный персептрон (MLP).

Питер Норвиг — директор по исследованиям в Google. Он известен своим учебником по искусственному интеллекту под названием "Искусственный интеллект: современный подход".

В 2016 году он выступил с докладом под названием "Глубокое обучение и понятность в сравнении с программной инженерией и проверкой". >

вид обучения, при котором представление, которое вы формируете, имеет несколько уровней абстракции, а не прямой ввод для вывода

Почему это называется «Глубокое обучение»?
Почему бы не просто «искусственные нейронные сети»?

Джеффри Хинтон – пионер в области искусственных нейронных сетей. Он стал соавтором первой статьи об алгоритме обратного распространения ошибки для обучения многослойных персептронных сетей.

Возможно, он начал использовать фразу «deep» для описания разработки больших искусственных нейронных сетей.

В 2006 году он стал соавтором статьи под названием «Алгоритм быстрого обучения для сетей с глубоким доверием», в которой описывается подход к обучению «глубоких» (как в многоуровневой сети) ограниченных машин Больцмана.

Используя комплементарные априорные предположения, мы получаем быстрый жадный алгоритм, который может изучать глубокие направленные сети убеждений по одному слою за раз, при условии, что два верхних слоя формируют ненаправленную ассоциативную память.

Эта статья и связанная с ней статья, написанная Джеффом в соавторстве, под названием «Глубокие машины Больцмана» о ненаправленной глубокой сети, были хорошо восприняты сообществом (теперь цитируются сотни раз), потому что они были успешными примерами жадного послойного обучения сетей, что позволяет использовать гораздо больше уровней в сетях прямой связи.

В соавторской статье в журнале Science под названием «Уменьшение размерности данных с помощью нейронных сетей» они придерживались того же определения «глубокий», чтобы описать свой подход к разработке сетей с гораздо большим количеством слоев, чем это было раньше.

Мы описываем эффективный способ инициализации весов, который позволяет глубоким сетям автоэнкодера изучать низкоразмерные коды, которые работают намного лучше, чем анализ основных компонентов, как инструмент для уменьшения размерности данных.

В той же статье они делают интересный комментарий, который перекликается с комментарием Эндрю Нг о недавнем увеличении вычислительной мощности и доступа к большим наборам данных, что высвободило неиспользованные возможности нейронных сетей при использовании в больших масштабах.

С 1980-х годов было очевидно, что обратное распространение через глубокие автоэнкодеры будет очень эффективным для нелинейного уменьшения размерности при условии, что компьютеры достаточно быстры, наборы данных достаточно велики, а начальные веса достаточно близки к хорошему. решение. Теперь все три условия выполнены.

В своем выступлении перед Королевским обществом в 2016 году под названием "Глубокое обучение" Джефф отметил, что сети глубокого убеждения положили начало глубокому обучению в 2006 году и что первым успешным применением этой новой волны глубокого обучения стало распознавание речи в 2009 г. под названием «Акустическое моделирование с использованием сетей Deep Belief Networks», достижение самых современных результатов.

Именно результаты привлекли внимание сообщества специалистов по распознаванию речи и нейронных сетей, а использование термина «глубокий» в качестве отличительного признака от предыдущих методов нейронных сетей, вероятно, привело к изменению названия.

Описания глубокого обучения в докладе Королевского общества во многом ориентированы на обратное распространение, как и следовало ожидать. Интересно, что он приводит 4 причины, по которым обратное распространение (читай «глубокое обучение») не получило распространения в последний раз примерно в 1990-х годах. Первые два пункта соответствуют комментариям Эндрю Нг выше о том, что наборы данных слишком малы, а компьютеры слишком медленны.

Что на самом деле было не так с обратным распространением в 1986 году?
Слайд Джеффа Хинтона, все права защищены.

Глубокое обучение как масштабируемое обучение в разных предметных областях

Глубокое обучение превосходно работает в проблемных областях, где входные данные (и даже выходные данные) являются аналоговыми. Это означает, что это не несколько величин в табличном формате, а изображения пиксельных данных, документы текстовых данных или файлы аудиоданных.

Ян ЛеКун (Yann LeCun) — директор исследовательского отдела Facebook и основатель сетевой архитектуры, отличающейся превосходным распознаванием объектов в графических данных, которая называется сверточной нейронной сетью (CNN). Этот метод пользуется большим успехом, потому что, как и многослойные персептронные нейронные сети с прямой связью, он масштабируется с данными и размером модели и может обучаться с помощью обратного распространения ошибки.

Это искажает его определение глубокого обучения как развития очень больших CNN, которые добились больших успехов в распознавании объектов на фотографиях.

В своем выступлении в 2016 году в Ливерморской национальной лаборатории Лоуренса под названием «Ускорение понимания: глубокое обучение, интеллектуальные приложения и графические процессоры» он описал глубокое обучение в целом как изучение иерархических представлений и определил его как масштабируемый подход к созданию систем распознавания объектов:

глубокое обучение [является] … конвейером модулей, каждый из которых поддается обучению. … глубокий, потому что [имеет] несколько этапов в процессе распознавания объекта, и все эти этапы являются частью обучения»

Глубокое обучение = изучение иерархических представлений
Слайд Ян ЛеКун, все права защищены.

Юрген Шмидхубер является отцом другого популярного алгоритма, который, как и MLP и CNN, также масштабируется в зависимости от размера модели и размера набора данных и может обучаться с помощью обратного распространения ошибки, но вместо этого предназначен для изучения данных последовательности, который называется Long Short-Term Memory Network (Long Short-Term Memory Network). LSTM), тип рекуррентной нейронной сети.

Мы видим некоторую путаницу в формулировке области как «глубокое обучение». В своей статье 2014 года под названием «Глубокое обучение в нейронных сетях: обзор» он комментирует проблемное название области и различие между глубоким и поверхностным обучением. Он также интересно описывает глубину с точки зрения сложности проблемы, а не модели, используемой для решения проблемы.

На какой глубине задачи заканчивается поверхностное обучение и начинается глубокое? Обсуждения со специалистами DL пока не дали однозначного ответа на этот вопрос. […], позвольте мне уточнить для целей этого обзора: задачи глубины > 10 требуют очень глубокого обучения.

Демис Хассабис – основатель компании DeepMind, позже приобретенной Google. DeepMind совершила прорыв, объединив методы глубокого обучения с обучением с подкреплением для решения сложных проблем обучения, таких как игры, что хорошо продемонстрировано в играх Atari и игре Go with Alpha Go.

В соответствии с названием они назвали свою новую технику Deep Q-Network, сочетающей Deep Learning с Q-Learning. Они также называют более широкую область исследования «Глубокое обучение с подкреплением».

В своей научной статье 2015 года под названием "Управление на уровне человека с помощью глубокого обучения с подкреплением" они комментируют важную роль глубоких нейронных сетей в их прорыве и подчеркивают необходимость иерархической абстракции.

Для этого мы разработали новый агент, глубокую Q-сеть (DQN), которая способна сочетать обучение с подкреплением с классом искусственных нейронных сетей, известных как глубокие нейронные сети. Примечательно, что недавние достижения в области глубоких нейронных сетей, в которых несколько слоев узлов используются для создания все более абстрактных представлений данных, позволили искусственным нейронным сетям изучать такие понятия, как категории объектов, непосредственно из необработанных сенсорных данных. /p>

Наконец, Янн ЛеКун, Йошуа Бенджио и Джеффри Хинтон опубликовали в журнале Nature статью под названием «Глубокое обучение», которую можно считать определяющей в этой области. В нем они начинаются с четкого определения глубокого обучения, подчеркивая многоуровневый подход.

Глубокое обучение позволяет вычислительным моделям, состоящим из нескольких уровней обработки, изучать представления данных с несколькими уровнями абстракции.

Позже многоуровневый подход описывается с точки зрения изучения представления и абстракции.

Методы глубокого обучения — это методы обучения представлению с несколькими уровнями представления, полученные путем составления простых, но нелинейных модулей, каждый из которых преобразует представление на одном уровне (начиная с необработанных входных данных) в представление на более высокий, несколько более абстрактный уровень. […] Ключевым аспектом глубокого обучения является то, что эти уровни функций не разрабатываются инженерами-людьми: они изучаются из данных с использованием процедуры обучения общего назначения.

Это хорошее и общее описание, которое может легко описать большинство алгоритмов искусственных нейронных сетей. Это также хорошая заметка для завершения.

Обзор

В этом посте вы узнали, что глубокое обучение — это просто очень большие нейронные сети с гораздо большим объемом данных, требующие больших компьютеров.

  • Многослойные сети персептрона.
  • Сверточные нейронные сети.
  • Рекуррентные нейронные сети с длительной кратковременной памятью.

Надеюсь, теперь стало понятно, что такое глубокое обучение и как основные определения сочетаются под одним зонтиком.

Если у вас есть какие-либо вопросы о глубоком обучении или об этом посте, задавайте их в комментариях ниже, и я сделаю все возможное, чтобы ответить на них.

Разрабатывайте проекты глубокого обучения с помощью Python!

Что, если бы вы могли разработать сеть за считанные минуты

<р>. всего несколькими строками Python

Он охватывает комплексные проекты по таким темам, как
Многослойные персептроны, Сверточные сети и Рекуррентные нейронные сети, и многое другое.

Читайте также: