Что такое машинное обучение?

Машинное обучение — это форма искусственного интеллекта, позволяющая системе обучаться на основе данных, а не путем программирования в явном виде. Однако это не простой процесс. По мере того как алгоритмы обрабатывают наборы обучающих данных, на основе таких данных могут создаваться более точные модели. Модель машинного обучения представляет собой результат, получаемый при обучении алгоритма на основе данных. После завершения обучения модель выдает выходные данные, когда в нее вводятся входные данные. Например, алгоритм прогнозирования создает модель прогнозирования. Затем, когда в модель прогнозирования вводятся данные, она выдает прогноз на основе тех данных, которые использовались для обучения модели.

Иллюстрация машинного обучения

Итеративное обучение

Машинное обучение позволяет обучать модели на основе наборов данных до использования моделей. Некоторые модели машинного обучения работают постоянно. Такой итеративный процесс обучения моделей позволяет улучшать типы связей между элементами данных. Человек не всегда обнаруживает такого рода зависимости и связи вследствие их сложности и большого объема данных. После завершения обучения модели она может использоваться в режиме реального времени для продолжения обучения на основе поступающих данных. Повышение точности достигается в результате процесса обучения и автоматизации, которые являются частью машинного обучения.

Большие данные в контексте машинного обучения

В процессе машинного обучения необходимо применять надлежащие наборы данных. Для использования технологий машинного обучения организации не требуется наличие больших данных, однако они могут повысить точность моделей машинного обучения. Технологии больших данных позволяют виртуализировать данные и хранить их наиболее эффективным и экономичным способом, локально или в облаке. Кроме того, повышение пропускной способности и надежности передачи данных по сети устраняет и другие физические ограничения, связанные с обращением с большими объемами данных с приемлемой скоростью. Все это, в сочетании с последствиями падения стоимости компьютерной памяти и ее усовершенствования, открывает перед компаниями такие возможности работы с данными, какие еще лет пять назад невозможно было представить.

Подходы к машинному обучению

Для повышения точности прогнозных моделей необходимо применять соответствующие методы машинного обучения. В зависимости от характера рассматриваемых бизнес-задач применяются различные подходы, учитывающие типы и объемы данных. В этом разделе рассказывается о категориях машинного обучения.

Контролируемое обучение

Обычно контролируемое обучение начинается с определенного набора данных и понимания того, как эти данные могут быть классифицированы. Контролируемое обучение предназначено для поиска закономерностей в данных, которые могут использоваться в процессе анализа. Эти данные характеризуются рядом особенностей, которые определяют значение данных. Например, можно создать приложение машинного обучения, которое будет различать миллионы животных, опираясь на их изображения и текстовые описания.

Неконтролируемое обучение

Неконтролируемое обучение используется, когда задача включает огромные объемы непомеченных данных. Например, все приложения социальных сетей, такие как Twitter, Instagram и Snapchat, содержат большие объемы непомеченных данных. Понимание смысла таких данных требует наличия алгоритмов для классификации данных на основе найденных закономерностей или кластеров. Неконтролируемое обучение представляет собой итеративный процесс анализа данных без участия человека. Такое обучение применяется в технологии обнаружения спама в электронной почте. Аналитику необходимо было учитывать слишком большое число переменных, для того чтобы отличить легитимное электронное сообщение от спама и пометить рекламные групповые рассылки. Вместо этого, для идентификации нежелательной электронной почты применяются классификаторы машинного обучения, основанные на кластеризации и ассоциации.

Обучение с подкреплением

Обучение с подкреплением представляет собой поведенческую модель обучения. Алгоритм получает обратную связь в результате анализа данных и направляет пользователя на получение наилучшего результата. Обучение с подкреплением отличается от других видов контролируемого обучения, поскольку система не проходит обучение на основе эталонного набора данных. Система, скорее, обучается методом проб и ошибок. Таким образом, последовательность успешных решений приводит к закреплению процесса, поскольку задача решается наилучшим образом.

Глубокое обучение

Глубокое обучение — это специализированный метод последовательного итеративного обучения нейронных сетей на основе данных. Глубокое обучение оказывается особенно эффективным для выявления закономерностей в неструктурированных данных. Глубокое обучение сложных нейронных сетей призвано моделировать работу человеческого мозга, чтобы компьютеры могли научиться работать с нечетко определенными абстракциями и задачами.Обычный пятилетний ребенок может легко отличить лицо учителя музыки от лица учителя физкультуры. Компьютеру же приходится выполнить массу работы, чтобы выяснить, кто есть кто. Нейронные сети и глубокое обучение часто используются в программах для распознавания изображений и речи, а также машинного зрения.

Изображение для машинного обучения

Применение машинного обучения для решения бизнес-задач

Машинное обучение имеет потенциальную ценность для компаний, которые пытаются работать с большими данными, и помогает лучше понимать незначительные изменения поведения, предпочтений или степени удовлетворенности клиентов. К руководителям бизнеса начинает приходить понимание того факта, что во многих вещах, происходящих внутри их организаций и отраслей, невозможно разобраться путем простых запросов. Это не те вопросы, которые вы знаете, а закономерности и аномалии, скрытые в данных, которые могут либо помочь, либо навредить вам.

Как объединить все элементы

Преимущества, которые дает машинное обучение, заключаются в возможности использования алгоритмов и моделей для прогнозирования результатов. Весь секрет в том, чтобы специалисты, работающие с данными, применяли правильные алгоритмы, подбирали наиболее подходящие данные (которые являются точными и чистыми) и использовали самые эффективные модели. Если удается объединить все эти элементы, то можно обеспечить постоянное обучение модели и учиться на результатах, получаемых на основе данных. Автоматизация процесса моделирования, обучения и тестирования модели позволяет повысить точность прогнозирования для поддержки изменений бизнеса.

Искусственный интеллект

Продукты

IBM Watson Studio

Решение, развертываемое локально либо в частном или общедоступном облаке, предлагает корпоративную платформу машинного обучения для исследования, моделирования и внедрения решений для работы с данными с помощью ведущих инструментов с открытым исходным кодом.

IBM Machine Learning для z/OS

Локально развертываемое решение для машинного обучения, которое позволяет выявлять возможности, скрытые в корпоративных данных. Оперативная обработка и преобразование данных для создания, развертывания и управления высокоточными самообучающимися моделями на основе данных IBM z Systems®.

IBM SPSS® Modeler

Платформа графической аналитики, которая помогает пользователям с любым уровнем знаний реализовывать идеи на основе широкого диапазона алгоритмов и функций, включая анализ текстов, геопространственный анализ и оптимизацию.

IBM Watson Explorer

Платформа аналитики контента и когнитивного поиска на базе машинного обучения, предоставляющая пользователям доступ к действенным идеям на основе всех данных и помогающая добиться лучших бизнес-результатов.

Примеры использования

Watson Explorer дает клинике Ahus новые идеи для повышения качества медицинского обслуживания

Университетская клиника Акерсхуса (Ahus) в сотрудничестве с компанией Capgemini применяет Watson Explorer для анализа тысяч отчетов о радиологических исследованиях, чтобы обеспечить соблюдение современных требований и поддерживать высокие стандарты здравоохранения в клинике.

Анализ контента в режиме реального времени помогает центрам обработки вызовов повысить эффективность обслуживания клиентов

Mizuho Bank Ltd. повышает эффективность взаимодействия с клиентами и сокращает время обслуживания клиентов благодаря возможностям IBM Watson Explorer для обработки на естественном языке в реальном времени.

Ресурсы

Пошаговое руководство по созданию модели машинного обучения для прогнозирования оттока клиентов в IBM Watson Studio

Ознакомьтесь с другими руководствами по приложениям для машинного обучения и глубокого обучения

Начните работу с бесплатной пробной версией Watson Studio уже сегодня