В состав линейки продуктов Oracle 9i входит инструментальная среда класса Data Mining под названием Darwin. Эта система поддерживает все этапы технологии извлечения знаний, включая постановку задачи, подготовку данных, автоматическое построение моделей, анализ и тестирование результатов, использование моделей в реальных приложениях.
На этапе подготовки данных обеспечивается доступ к любым реляционным БД, текстовым файлам, SAS-файлам. Darwin поддерживает построение пяти различных типов моделей — нейронные сети, классификационные и регрессионные деревья решений, ближайшие-окрестности, байесовское обучение и кластеризацию.
Развитые графические средства предоставляют широкие возможности для анализа полученных результатов, верификации моделей на тестовых наборах данных, оценки точности и устойчивости результатов. Уточненные и проверенные модели можно включать в существующие приложения путем генерации их описаний на С, C++, Java, а также разрабатывать новые специализированные приложения с помощью входящей в состав Darwin среды разработки (SDK).
Важной особенностью системы Darwin, выделяющей его среди других средств извлечения знаний, являются его технические характеристики: работа в архитектуре «клиент-сервер», широкое использование техники параллельных вычислений, высокая степень масштабируемости при увеличении вычислительных ресурсов. Все это позволяет выполнять процедуры автоматического анализа данных огромных объемов, достигая очень высоких временных показателей.