Data Monitoring and Analysis Center

Услуги экспресс-аудита данных на содержание в них новых знаний. Express-audit data on the content of new knowledge in them. Knowledge mining from data.

Полезны ли ваши данные для извлечения знаний из них?

В кратчайшие сроки мы проводим экспресс-аудит качества собираемых данных и состояния ваших процессов. Условия проведения аудита оговариваются дополнительно.

 

Зачем нужен аудит исходных данных

 

Важные данные собираются ради самой процедуры сбора, а ранее разработанные регламенты для сбора игнорируются. Достоверность таких данных всегда вызывает сомнения.

 

Данные упорно собираются, но никто оперативно не анализирует их. Это не позволяет своевременно отреагировать на сигналы сбоев в процессах или заняться корректировкой процедуры измерения, сбора и записи данных.

 

Увлечение агрегированными (расчетными) показателями и дашбордами скрывающими исходные данные не позволяет услышать голос процессов.

 

Случайное блуждание по имеющимся (каким есть) данным. Модные направления цифровизации, одно из них машинное обучение (англ. machine learning, ML) будоражат умы, как будто можно "залить" данные, много данных, в умную машину и она выдаст ответы на все вопросы без необходимости использования научных знаний об исследуемой области и понимания контекста.

"Сегодняшнее программное обеспечение позволяет искать все виды отношений между переменными, содержащимися в базе данных. Но владение киркой и лопатой не принесет вам много пользы, если вы не знаете разницы между золотом и железным пиритом".


Дональд Уилер (Donald J. Wheeler)

Д-р Дональд Дж. Уилер является членом Американской статистической ассоциации и Американского общества качества, лауреат медали 2010 года Деминга. Являясь автором 25 книг и сотен статей, он является одним из ведущих авторитетов в области статистического управления процессами и прикладного анализа данных

Изучение контекста образования данных и работа с экспертами в исследуемой области — наши основополагающие принципы.

 

См. примеры извлечения знаний из данных.

 

ТИПЫ АНАЛИЗИРУЕМЫХ ДАННЫХ

 

Для идентификации сбоев и выработки необходимых мер для их предотвращения, оценки текущего состояния и прогнозирования будущего поведения процессов, могут быть использованы данные удаленного мониторинга и исторические данные, собираемые автоматизировано или вручную (измерения или агрегированные показатели), например: данные вибрации, зазора, расхода, уровня жидкости, давления, температуры, влажности, газового анализа, положения, скорости, силы, вязкости, плотности, твердости, радиоактивности, размера, освещенности, запыленности, концентрации, загрязненности, акустические измерения, электрические измерения, время, нагрузка сети, доля брака, частота событий, медицинские данные, любые финансовые показатели.

Хотим заметить, что агрегированные данные менее полезны для совершенствования процессов, чем используемые для их вычисления исходные данные.

 

ТРЕБОВАНИЯ К ДАННЫМ

 

Пакет данных для анализа должен содержать:

- исторические данные метрик ваших процессов в табличном формате с указанием для каждого наблюдения (строки) даты, времени, значения отслеживаемой метрики, места сбора данных и максимального числа идентифицируемых вами влияющих факторов (каждый фактор в отдельном столбе со значением метрики фактора, как измерение, например, температура, давление, вибрация и т. д. или справочное (дискретное) значение, например, смена, станок, оператор, производитель и партия сырья, измерительное оборудование, контролер и т. д.), иначе говоря, каждая строка является наблюдением, каждый столбец является независимой переменной;

- описание анализируемого процесса (контекст образования данных);

- используемые единицы измерения для всех факторов;

- требования к параметрам процессов, нормативы, допуски или спецификации;

- методология измерений (используемые инструменты, метод отбора образцов и подробная процедура измерения).

 

Для сохранения коммерческой тайны вы можете предварительно зашифровать свои данные по алгоритму, который не окажет влияния на выводы: делением или умножением всего ряда данных отслеживаемой метрики (каждого значения) на любое постоянное число (коэффициент). Такую процедуру можно осуществлять только для непрерывных величин (например, результатов измерений), но не для данных полученных путем подсчета.

Россия, Санкт-Петербург, Лахтинский проспект, 2 к.3               |               Тел.: +7 (911) 711-93-27        |        E-mail: info@dma.center