Всего на сайте:
183 тыс. 477 статей

Главная | Информатика

Для поддержки принятия решений  Просмотрен 402

В базе данных интегрированной корпоративной информационной системы накапливается огромный объем информации. Перед менеджерами предприятия встает вопрос: как и для каких целей использовать это море информации? Чаще всего пользователи ограничиваются простыми запросами, например: выдать отчет по всем заказчикам, задерживающим по данным на сегодняшний день оплату отгруженной в их адрес продукции. Но можно поставить и более сложное задание: каков информационный «портрет» (т.е. характерные черты) заказчика, задерживающего оплату? Кто по преимуществу эти заказчики: крупные или малые предприятия? К какой отрасли они чаще всего относятся - транспортники, сельхозпроизводители, связисты? В каких регионах находятся? Есть ли сезонные закономерности в поведении таких недобросовестных заказчиков? И самое главное - есть ли ассоциации (т.е. одновременное присутствие) между перечисленными атрибутами предприятий?

Если удастся получить такой информационный «портрет», то может быть принято решение об особом порядке взаимоотношений с подобными заказчиками - например, требовать от них полную предоплату за выполнение заказа. Вторая задача на два порядка сложнее первой. Если первую задачу можно решить, используя стандартный аппарат запросов к базам данных, то для решения второй придется применить методы интеллектуального анализа данных. Однако результаты решения и первой, и второй задачи можно использовать для поддержки принятия решений.

Выделяют три основные технологии поддержки принятия управленческих решений на основе накопленной информации [29,30]:

- технологии, ориентированные на оперативную (транзакционную) обработку данных и реализованные в большинстве транзакционных систем (OLTP). Сфера действия таких технологий - область детализированных данных. Классические реляционные СУБД нормально справляются с подобными задачами, поэтому в подробном их рассмотрении нет необходимости;

- технологии OLAP (On-line Analytical Processing – интерактивная аналитическая обработка данных), ориентированные на область агрегированных показателей;

- технологии интеллектуальной обработки данных, ориентированные на область закономерностей. Интеллектуальная обработка проводится методами интеллектуального анализа данных (ИАД, в западной литературе - Data Mining [20]). С помощью этих технологий решаются задачи поиска функциональных и логических закономерностей в накопленной информации, объяснения аномалий в данных. Итак, по очереди.

Технологии OLAP основаны на понятии хранилище данных, которое определено родоначальником этого направления Биллом Инмоном (W. Inmon) как «предметно-ориентированное, интегрированное, поддерживающее хронологию собрание данных для поддержки процесса принятия управленческих решений».

Данные в хранилище поступают из оперативных систем (OLTP-систем), из внешних источников, например статистических отчетов, «скачанных» из Интернета прайс-листов других компаний и т.п.

Зачем создавать хранилища данных, ведь информация и так находится в файлах оперативных систем? Еще несколько лет назад в качестве главных причин назывались различие форматов хранящихся данных, их разрозненность, локализация в разных местах корпоративной сети. Действительно, до 1998-2000 гг. хранение всех данных на центральном сервере БД было редким явлением.

Сейчас в связи с интенсивным внедрением ИКИС положение меняется. Однако принципиальны такие причины необходимости создания хранилищ данных:

- сложные аналитические запросы к оперативным данным «забирают» ресурсы сервера и тормозят работу информационной системы;

- оперативные данные мало пригодны для непосредственного сложного анализа;

- системы OLTP предназначены для оперативной обработки данных, поэтому они не приспособлены для хранения информации за длительный (более нескольких месяцев) период, в то время как для OLAP интересен анализ объекта «в исторической ретроспективе».

Оперативные корпоративные данные, а также данные из различных внешних источников «очищаются», интегрируются, «складываются» в хранилище, затем готовятся для OLAP-анализа и ИАД.

В основе OLAP лежит наглядная модель данных, организуемая самим пользователем в виде многомерных кубов (гиперкубов).

Осями многомерной системы координат служат атрибуты анализируемого бизнес-процесса (измерения). Данные, количественно характеризующие бизнес-процесс, называются мерами.

Наличие в ERP-системе «встроенной OLAP-аналитики» станет в ближайшие годы важным конкурентным преимуществом ИКИС.

 

Технологии интеллектуальной обработки данных (ИАД)

ИАД - это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). Большинство методов ИАД было первоначально разработано в рамках теории искусственного интеллекта (ИИ) в 70-80-х гг. XX в., но получило распространение только в последние годы, когда проблема обработки быстро растущих объемов корпоративных данных потребовала их использования в качестве надстройки над хранилищами данных.

«Сырьем» для ИАД могут быть плоские таблицы реляционных СУБД. Именно с них и начиналась история ИАД. Во многих случаях более эффективным является применение ИАД к данным, полученным после обработки с помощью OLAP-технологий.

Задачи ИАД классифицируются прежде всего по типам извлекаемой информации, т.е. по видам находимых закономерностей.

Выделяют следующие пять видов.

1. Классификация - позволяет выявить признаки, характеризующие однотипные группы объектов (классы), для того чтобы по известным значениям этих характеристик можно было отнести новый объект к тому или иному классу. Предполагается, что характеристики классов заранее (до анализа) известны. В качестве методов решения задачи классификации применяют алгоритм ближайшего соседа (Nearest Neighbor), индукцию деревьев решений, «обучаемые учителем» нейронные сети [11,21,30].

2. Кластеризация - распространение идеи классификации на более сложный случай, когда сами классы не предопределены. В результате выполнения процедуры кластеризации исходные данные разбиваются на однородные группы (кластеры).

Это позволяет предприятию выработать по отношению к каждой из групп (например, к группам покупателей) определенную политику. Задача кластеризации значительно сложнее задачи классификации.

В настоящее время наиболее часто задачи кластеризации решаются методом «обучения без учителя» специального вида нейронных сетей - сетей Кохонена [11,21].

3. Выявление ассоциаций. Ассоциация - закономерность в данных, фиксирующая наступление двух (или более) одновременных событий. Типичный пример ассоциации исследуется в задаче определения пар одновременно покупаемых продуктов (телевизоры и DVD-проигрыватели, зубные пасты и зубные щетки и т.д.).

4. Выявление последовательностей. Последовательность – закономерность в данных, фиксирующая наступление событий не одновременно, а с некоторым определенным разрывом во времени.

Таким образом, ассоциация есть частный случай последовательности с нулевым временным лагом. Так, например, если DVD-проигрыватель не был куплен вместе с телевизором, то в течение месяца после покупки нового телевизора покупка DVD-проигрывателя производится в 51% случаев [30].

5. Прогнозирование - формализованная процедура предсказания, которая на основе исследования текущих и прошлых данных позволяет оценить будущие значения числовых показателей.

В задачах подобного типа наиболее часто используются традиционные методы математической статистики, а также нейронные сети. Из всего многообразия методов, применяемых для решения задач ИАД, наиболее часто применяются нейронные сети (более правильно говорить об искусственных нейронных сетях (ИНС)), моделируемые на ПК, и системы поиска логических правил в данных.

 

 

Контрольные вопросы и задачи

10.1. В чём заключается сущность подхода к реализации методологии «синхронное планирование и оптимизация» (СПО) ?

10.2. Охарактеризуйте взаимодействие систем СПО и ERP.

10.3. Дайте краткую характеристику современных технологий, используемых для поддержки принятия управленческих решений.

10.4. На чём основаны технологии OLAP ?

10.5. Назовите основные причины необходимости создания хранилищ данных.

10.6. Дайте определение технологий интеллектуальной обработки данных (ИАД).

 

 

Предыдущая статья:Экономических информационных систем Следующая статья:Сбор и анализ данных
page speed (0.0095 sec, direct)