Помощь в написании студенческих работ
Антистрессовый сервис

Инструменты извлечения (добывания) знаний Система Scenario

РефератПомощь в написанииУзнать стоимостьмоей работы

Для проведения быстрого начального анализа задачи, отсева незначительных факторов и фокусирования внимания на ключевых параметрах рекомендуется использовать режим исследования. Этот режим позволяет выигрывать во времени за счет некоторого снижения точности результатов. Поскольку в дальнейшем допускается проведение более детального анализа, требования к надежности не выдвигаются. Размер выборки… Читать ещё >

Инструменты извлечения (добывания) знаний Система Scenario (реферат, курсовая, диплом, контрольная)

предназначена для выявления взаимосвязей в данных. Анализируемая информация представляется в виде таблиц, столбцами которых задаются факторы (переменные), описывающие ПрО. При этом один из этих столбцов выделяется пользователем как целевой показатель. Scenario фокусирует внимание аналитиков на измеряемых показателях и факторах, что позволяет им переходить от качественных рассуждений к построению более точных количественных моделей. В Scenario реализовано автоматическое выявление зависимостей по критерию %-квадрат (метод CHAID) для нахождения однородных групп (сегментов) данных с «аналогичным» поведением относительно целевого показателя.

Система использует метод деревьев решений и строит правила классификации, которые можно применять к новым данным для построения прогнозов относительно возможных значений целевого показателя. Ядро системы составляют методы статистики. Основная статистическая информация отображается методами наглядной графики, а более детальные сведения пользователь в случае необходимости может запросить сам. Собственно методы интеллектуального анализа данных являются основанием для реализации типовых видов анализа, которые используются аналитиками и лицами, принимающими решение.

Поскольку этот метод почти всегда требует значительных затрат времени и вычислительных ресурсов, в Scenario реализованы три стратегии анализа.

  • 1. Для проведения быстрого начального анализа задачи, отсева незначительных факторов и фокусирования внимания на ключевых параметрах рекомендуется использовать режим исследования. Этот режим позволяет выигрывать во времени за счет некоторого снижения точности результатов. Поскольку в дальнейшем допускается проведение более детального анализа, требования к надежности не выдвигаются. Размер выборки не ограничивается.
  • 2. Более точный анализ может быть проведен в режиме тестирования. Использование этого режима обеспечивает очень высокую точность и достаточную надежность результатов. Для его проведения требуется не менее 300 записей в БД.
  • 3. Наилучшие по точности и надежности результаты можно получить в режиме верификации. Этот режим, требующий не менее 1000 записей, рекомендуется использовать для проверки и уточнения результатов, полученных в ходе тестирования.
Показать весь текст
Заполнить форму текущей работой