Визуализация и анализ цепочек поставок

Графический анализ данных

Цепочка поставок — это уже не только поток физических товаров. Помимо движения продуктов и денег, переходящих из рук в руки, это в не меньшей степени движение информации. С появлением технологий управления корпоративными ресурсами (Enterprise Resource Planning, ERP) соответствующие данные стали доступны, но превращение этих данных в ценную информацию является задачей бизнес-аналитиков. Если данные визуализированы, то извлекать информацию и выявлять особенности значительно проще, чем при работе с исходными данными. Данная статья поможет разработчикам визуализировать данные цепочек поставок.

Ариб Камран, консультант по ERP-решениям, консультант

Areeb Kamran photoАриб Камран (Areeb Kamran) имеет ученую степень по технологиям вычислительных систем. Последние три года он работает в многонациональной компании, входящей в список Fortune 500, как консультант по ERP-технологиям, главным образом для управления материалами и цепочками поставок. Он также принимает активное участие в научных исследованиях в области машинного обучения и его применения в бизнесе для составления отчетов, прогнозирования и анализа.



Уль Хак, генеральный директор, TunaCode

Photo of Salman Ul HaqСалман Хак (Salman Haq) — один из основателей и генеральный директор компании TunaCode Inc., разрабатывающей высокопроизводительные вычислительные решения для визуализации данных с использованием собственной библиотеки CUVI GPU Imaging в таких отраслях, как производство, оборона, медицина и развлечения. Кроме того, компания является разработчиком решения gKrypt, обеспечивающего сверхскоростное шифрование в оборонной промышленности. Адрес электронной почты: salman@tunacode.com.



14.06.2013

Введение


Цепочка поставок — это планирование и прогнозирование

Физически цепочка поставок — это движение товаров. Однако в современном стремительном мире недопустима потеря даже одной минуты, поскольку простаивающие производственные мощности означают напрасное расходование ресурсов, причем потери измеряются не только актуальными, но и потенциальными показателями (цена упущенных возможностей). Цепочки поставок стали значительно больше, чем простое движение запасов и привязанное ко времени позиционирование ресурсов.

Цепочки поставок стали сложными, комбинированными и тесно интегрированными системами. Настолько сложными, что уже невозможно управлять ими эффективно без значительной поддержки со стороны современных вычислительных технологий и систем представления трудных для понимания данных. ERP-системы обеспечили доступность данных, но превращение этих данных в ценную информацию остается проблемой.


Текущее состояние анализа цепочек поставок: отчеты на основе исходных данных

Сама природа работы ERP-систем делает из отчетности проблему. Каждую минуту в ERP-системах регистрируются транзакции, создающие данные. Для формирования отчетов данные объединяются снизу вверх. Эти ежеминутные детальные данные собираются и сводятся на каждом шаге для формирования отчета по конкретному уровню функционирования. Например, отчет для кладовщика может содержать каждый выпуск одного материала из хранилища, а отчет для управляющего складом может охватывать совокупность изделий, поступающих на склад или покидающих его. Если управляющему складом требуется какой-либо детальный анализ, то движение товаров за шесть месяцев может превратиться в отчет из 50000 строк, работать с которым весьма утомительно. Пример фрагмента подобного отчета представлен на рисунке 1 (из ERP-системы SAP):

Рисунок 1. ERP-система SAP
SAP ERP system

Потребность в представлении данных: преобразование или обработка в связи с большими размерами наборов данных

Главная проблема использования данных в отчетах заключается в их огромном размере. Если оставить в стороне сложность цепочек поставок и сконцентрироваться только на одном аспекте цепочки, то существуют, например, следующие движения запасов:

  • Один продукт по всей цепочке за несколько месяцев
  • Все продукты на одном заводе за месяц
  • Продажи одного конкретного бизнес-подразделения

Во всех этих примерах данные могут быть легко извлечены с использованием стандартных отчетов, предлагаемых большинством основных ERP-систем, или специально разработанных отчетов, однако количество данных в них может быть чрезмерно большим для использования в традиционных форматах отчетов. Традиционные отчеты представляют данные по строкам/столбцам, как показано на рисунке 1. Но даже если в отчете для любого из упомянутых выше сценариев содержится всего около 2000 строк, есть четыре способа анализа такого отчета:

  • Вариант 1: Изучить все 2000 показанных строк
  • Вариант 2: Ограничить количество выводимых данных с применением критериев или фильтров
  • Вариант 3: Сгруппировать данные (по диапазонам данных или по сериям продуктов, или по характеристикам физических хранилищ), либо использовать усреднение чисел
  • Вариант 4: Использовать линейные графики для анализа тенденций

Вариант 1 является трудоемким, и он не может быть полезен для анализа тенденций или выявления аномалий по причине большого объема данных. Вариант 2 ограничивает данные, которые могут быть проанализированы, что обычно приводит к потере знаний или взаимосвязей. Варианту 3 свойственны такие же потери, связанные с группировкой или усреднением данных. Единственным приемлемым вариантом для учета всех данных является вариант 4, который представляет простейшую разновидность визуализации — с использованием графиков. Графики работают хорошо, если вы просматриваете их в одном измерении, например в виде временных рядов, или сравнивая данные о продажах с данными о производстве. А если требуются данные о продажах и производстве в виде временных рядов? В этом случае ограничения обычных графиков препятствуют дальнейшему анализу.


Нетрадиционные методы визуализации данных о цепочках поставок: пример

Прежде всего, почему визуализация работает? Цель визуализации — помочь вам понимать данные, эффективно используя развитую способность зрительной системы человека видеть закономерности, выявлять тенденции и обнаруживать отклонения. Единственным реально пригодным вариантом для глубокого и точного анализа является визуализация данных и превращение чисел в наглядные представления. Все три других типа отчетов ограничивают такой анализ. На рисунке 2 представлен пример визуализации объемов запасов и продаж по времени.

Рисунок 2. Визуализация запасов и продаж по времени
Stock vs. sales against time visualization

Этот график используется для представления данных о благосостоянии и здоровье жителей разных стран The Wealth & Health of Nations (см. Ресурсы), однако сходная природа проблемы с точки зрения представления данных позволяет применять такую визуализацию и к движению запасов.

Использование кругов разного диаметра на рисунке 2 добавляет третье измерение, независимое от двух других (оси X и Y). Таким образом график получает дополнительное измерение. Если сделать такой график интерактивным и обеспечить изменение времени с использованием анимации или управляя движением вручную перемещением указателя мыши, то добавится четвертое измерение. На рисунке 2 представлены диаграммы в двух временных точках. Это обеспечивает два преимущества:

  1. Можно легко видеть закономерности даже при значительном количестве строк исходных данных.
  2. Можно представлять данные по большему количеству измерений (в данном случае четыре измерения вместо обычных двух для линейных графиков или двумерных диаграмм).

Причина, почему такой подход работает, проста — он применяет принцип Эдварда Тафти для визуализации, обеспечивая простоту и лаконичность и представляя информацию наглядно, а не в виде чисел, поскольку зрительная система человеческого мозга значительно более развита, чем любой другой орган восприятия.

Еще одним примером эффективной визуализации, которую вы можете применять к множеству аспектов цепочки поставок, является картограмма, пример которой представлен на рисунке 3.

Рисунок 3. Визуализация с использованием картограммы
Choropleth map visualization

Рисунок 3 является примером статичной визуализации с использованием уникального метода. Хотя картограммы обычно используются при переписи или опросах населения, вы можете использовать их не менее эффективно для цепочек поставок, охватывающих разные географические регионы. Сама форма диаграммы добавляет еще одно измерение, передающее информацию о местоположении. Вы можете добавить еще одно измерение, меняя интенсивность цвета. Здесь нужно отметь интересную особенность — вообще говоря, карта на рисунке 3 дает нам только два измерения, как и обычный график. Однако сам метод отображения информации делает ее интуитивно понятной. Никакой текст или числа не могут передать географическую информацию так хорошо, как эта иллюстрация. Например, используя такую картограмму в цепочке поставок для представления карт горячих точек продаж для регионов, поставщиков и объемов продаж, складов и товарных позиций, или заказов на покупку и уровней спроса в регионах, вы можете проще и лучше понимать информацию, что также помогает в принятии других решений. Например, может быть полезным пополнение запасов на разных складах в соответствии с наблюдаемым спросом. Принятие таких решений без использования картограмм потребовало бы долгих размышлений, а благодаря подобной наглядной помощи действия, которые вам необходимо предпринять, становятся очевидными.

Существует одна проблема, которую вы должны решить при использовании такой визуализации — если данные, представляемые в отчетах или в числовых форматах, отбираются по времени или пространству, то могут быть отсутствующие, нулевые, или иногда экстремальные значения. При использовании цифровых отчетов это не создает никаких проблем, однако в случае преобразования в визуальные представления вам необходимо очистить и сгладить данные. В противном случае анимированные визуализации будут практически прыгать с места на место, и промежуточные цифры (представляющие недостающие значения) могут пропадать. Это оказывает негативное влияние на цель, которую вы пытаетесь достичь — увидеть закономерности. Такие данные искажают закономерности, а неустойчивое поведение смещает фокус, затрудняя наблюдение тенденций. Так же как верхние и нижние экстремальные значения в линейном графике усложняют наблюдение тенденций, так и подобные данные делают визуализации менее эффективными.

Для решения этой проблемы вы можете выполнить сглаживание данных (удаляя очевидные экстремальные значения или шум) и заполнять недостающие значения с использованием интерполяции, чтобы конечный результат был гладким и легко отображал тенденции.

Вы можете применять все описанные методики в бизнес-сценариях, используя следующую цепочку:

Извлечение -> Аналитический механизм (может быть встроенной системой бизнес-анализа) -> Визуализация

Для большинства систем разработка всей цепочки с нуля будет бесполезным занятием. Как я уже отмечал, в этом подходе кардинально другими являются не столько данные, как представление данных. Поэтому вы можете использовать обычные источники данных от уже развернутых и работающих отчетов.

Для второй части цепочки начинать с нуля также неправильно. В большинстве развернутых ERP-систем уже используется какое-либо решение для бизнес-анализа (Business Intelligence, BI). Задачей этих BI-решений является получение данных, затем их выборка с использованием различных срезов. Это позволяет исследовать данные с разных точек зрения. Однако это не решает проблему, с которой справляется визуализация — значительный объем данных.

После того как BI-системы обработали данные, вы можете их забрать (в большинстве случаев в формате электронных таблиц, в виде CSV-файлов, или даже в формате JSON) и затем применить к ним визуализацию. Существует множество библиотек, значительная часть которых использует JavaScript и работает в браузере, получая данные с использованием JSON или простых CSV-файлов. Одним из значительных преимуществ использования таких библиотек является то, что работа в браузере не требует установки каких-либо компонентов, поэтому простой запуск решения на том же сервере, где установлена ERP-система, обеспечивает его доступность для пользователей без значительных трудностей.

Одной из лучших является библиотека D3.js. Это библиотека на базе JavaScript, которая позволяет привязывать произвольные данные к модели Document Object Model (DOM) и затем применять к документу преобразования, управляемые данными. Для подготовки таких визуализаций библиотека использует стандарт SVG (масштабируемая векторная графика) и поэтому работает только с современными браузерами (IE 8 и более старые версии ее не поддерживают). D3.js хорошо документирована и предлагает множество примеров, которые могут служить отличной отправной точкой.

Но не все отчеты столь сложны. Следуя тому же циклу, можно развертывать и простые визуализации. Они сохраняют преимущество наглядного представления перед цифровым, поэтому вы можете эффективно использовать простые линейные графики, столбиковые диаграммы, графики рассеяния, диаграммы типа «ящик с усами» или картограммы.

Например, представленный на рисунке 4 график из газеты New York Times (см. Ресурсы) демонстрирует проект президента Барака Обамы по распределению бюджета на 2013 год. Точно такой же график можно использовать для представления распределения затрат на запасы или производство. Подводя указатель мыши к конкретному кругу, можно увидеть детальную информацию, а в целом такая графика дает привлекательное и интуитивно понятное представление о распределении расходов, которое вы не смогли бы получить с использованием только цифровых отчетов.

Рисунок 4. Проект бюджета президента Барака Обамы на 2013 год
President Obama's 2013 budget proposal

Другим доступным вариантом является программный пакет Circos для визуализации данных и информации. Он визуализирует данные только в виде кругов.


Анализ тенденций и прогнозирование цепочек поставок: методы и средства

Кроме того, доступны такие инструменты, как IBM SPSS, но они чаще всего используются на корпоративном уровне (см. Ресурсы). Инструменты, подобные SPSS, также можно использовать в аналитической части цепочки. Далее перечислены некоторые другие полезные инструменты для создания визуализаций.

Google Refine— Позволяет легко использовать данные и манипулировать ими. Практически все то же самое можно сделать и с помощью электронных таблиц, но Refine значительно быстрее и проще. Он выполняет функции электронной таблицы и базы данных, поддерживая операции со строками и столбцами, как реляционные базы данных. Google Trends позволяет упростить предварительную обработку, переразметку, комбинирование и сопоставление данных, вычисления и другие математические и статистические функции. Он также имеет свой собственный язык сценариев (см. Ресурсы).

Платформа R— — Технически подкованные и заинтересованные в детальной информации пользователи могут выбрать платформу с открытым исходным кодом R для статистического анализа данных сразу после их извлечения из системы. R можно использовать в разных интегрированных средах разработки (IDE), самой популярными из которых являются собственная IDE проекта R, а также кроссплатформенная IDE RStudio (см. Ресурсы). Эта платформа обладает возможностями, которые обычно недоступны в виде готовых систем и, как правило, чрезмерно сложны для обычного бизнес-пользователя. В списке ресурсов есть ссылка на статью из New York Times, в которой платформа R сравнивается с другими имеющимися на рынке системами.


Заключение

Невозможно управлять тем, что нельзя измерить, и невозможно измерять, если вы не понимаете, какие данные у вас есть. Лучшим способом понять данные является использование чрезвычайно развитой зрительной системы человеческого мозга. В этой статье описаны некоторые полезные инструменты для визуализации данных. Однако вам не нужно изобретать колесо и развертывать все с нуля или менять используемые решения. Web-утилиты представляют собой отличную отправную точку для использования извлеченных данных и их оперативной визуализации. Если такие утилиты приобретут популярность и пользователи увидят в них реальную ценность, то существуют и пакеты для разработки более сложных решений. Но для начала вы можете использовать методологию и инструменты, описанные в этой статье, для создания простых и понятных демонстраций с целью проверки концепции.

Ресурсы

Научиться

Получить продукты и технологии

  • D3.js— JavaScript-библиотека для манипулирования документами на базе данных.
  • Google Refine— мощный инструмент для работы со смешанными данными, их очистки, преобразования из одного формата в другой, расширения с использованием web-сервисов и связывания с базами данных, такими как Freebase.
  • Загрузите программный пакет Circos для визуализации данных и информации.
  • IBM SPSS Statistics 20 (ранее SPSS Statistics) предоставляет мощные средства статистического анализа. Этот пакет позволяет удовлетворить потребности как начинающих, так и опытных специалистов по статистике.

Комментарии

developerWorks: Войти

Обязательные поля отмечены звездочкой (*).


Нужен IBM ID?
Забыли Ваш IBM ID?


Забыли Ваш пароль?
Изменить пароль

Нажимая Отправить, Вы принимаете Условия использования developerWorks.

 


Профиль создается, когда вы первый раз заходите в developerWorks. Информация в вашем профиле (имя, страна / регион, название компании) отображается для всех пользователей и будет сопровождать любой опубликованный вами контент пока вы специально не укажите скрыть название вашей компании. Вы можете обновить ваш IBM аккаунт в любое время.

Вся введенная информация защищена.

Выберите имя, которое будет отображаться на экране



При первом входе в developerWorks для Вас будет создан профиль и Вам нужно будет выбрать Отображаемое имя. Оно будет выводиться рядом с контентом, опубликованным Вами в developerWorks.

Отображаемое имя должно иметь длину от 3 символов до 31 символа. Ваше Имя в системе должно быть уникальным. В качестве имени по соображениям приватности нельзя использовать контактный e-mail.

Обязательные поля отмечены звездочкой (*).

(Отображаемое имя должно иметь длину от 3 символов до 31 символа.)

Нажимая Отправить, Вы принимаете Условия использования developerWorks.

 


Вся введенная информация защищена.


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=40
Zone=Information Management
ArticleID=934065
ArticleTitle=Визуализация и анализ цепочек поставок
publish-date=06142013