Термин Big Data объединяет подходы, инструменты и методы обработки структурированных и неструктурированных данных огромных объемов для получения из них требуемых человеку результатов, информации. Примерами источников возникновения больших данных являются измерительные устройства мониторинговых систем, потоки сообщений социальных сетей, метеорологические измерения, сети мобильной связи, устройства аудиои видеорегистрации и т. п. Технологии больших данных могут использоваться в научноисследовательской деятельности, в коммерческом секторе, сферах государственного управления и государственной безопасности, а в будущем для всеобъемлющего мониторинга среды обитания человека. Особое место занимает аналитика больших данных, так как в рамках этого направления компьютерные технологии используются не столько как инструмент для ускорения расчетов, а как помощник, расширяющий человеческие возможности в выборе информации и принятии решений (за минимальное время и при максимуме адекватности ситуации).
Производители предлагают целый ряд специализированных программно-аппаратных систем: SAP HANA, Oracle Big Data Appliance, Oracle Exadata Database Machine и Oracle Exalytics Business Intelligence Machine, Teradata Extreme Performance Appliance, Net App E-Series Storage Technology, IBM Netezza Data Appliance, EMC Greenplum, Vertica Analytics Platform на базе HP Converged Infrastructure [ 47 ].
Big Data Analytics требуют для себя не только новых технологий, но и качественного иного уровня системного мышления. Новые средства анализа требуются потому, что данных становится не просто больше, чем раньше. Больше становится их внешних и внутренних источников. Теперь они сложнее и разнообразнее (структурированные, неструктурированные и квазиструктурированные), используют различные схемы индексации (реляционные, многомерные, noSQL), временной шаг их поступления сокращается.
Для сбора сырых данных используются соответствующие аппаратные и программные технологии, какие именно — зависит от природы объекта и решаемой задачи. Такие данные поступают на вход аналитической машины, которая базируется на современной программно-аппаратной платформе. Системы этого типа называют Analytic Appliance или Data Warehouse Appliance [85].