Анализ загрязнения атмосферного воздуха в регионах Северо-Кавказского федерального округа методами визуальной аналитики Tableau Public 9.0
Основные достоинство метода — простота процедуры вычислений и возможность учета весов исходной информации. В этом методе большие значения веса придаются более поздним отсчетам, т. е. более старым данным придаются экспоненциально убывающие значения веса. Поэтому последние наблюдения дают относительно больший вес, чем более старые наблюдения. Однако, так как для получения прогноза на несколько… Читать ещё >
Анализ загрязнения атмосферного воздуха в регионах Северо-Кавказского федерального округа методами визуальной аналитики Tableau Public 9.0 (реферат, курсовая, диплом, контрольная)
АНАЛИЗ ЗАГРЯЗНЕНИЯ АТМОСФЕРНОГО ВОЗДУХА В РЕГИОНАХ СЕВЕРО-КАВКАЗСКОГО ФЕДЕРАЛЬНОГО ОКРУГА МЕТОДАМИ ВИЗУАЛЬНОЙ АНАЛИТИКИ TABLEAU PUBLIC 9.0
В настоящее время все шире используются специализированные порталы открытых данных, повсеместно применяются специализированные витрины для хранения и извлечения статистических данных [2]. Вследствие этого упрощается сложный цикл подготовки, очистки, унификации данных. Также за последний год произошел качественный скачок в возможностях инструментов визуальной аналитики ведущих мировых вендоров информационных систем класса Business Intelligence. За счет простоты интерфейсов, проработки структуры и способов визуализации информации, организации совместной работы компании Tableau Software и QlikTech, предоставляя бесплатно клиентские версии своих платформ: Tableau Public и Qlik Sense, дают возможность специалистам разных областей за несколько кликов самостоятельно провести сложный визуальный анализ данных и поделиться его результатами с коллегами. В комплексе это приводит к серьезному расширению числа пользователей, способных без привлечения IT-специалистов, проводить анализ данных и получать практически полезные результаты.
Цель статьи является анализ выбросов загрязняющих веществ в атмосферный воздух в регионах Северо-Кавказского федерального округа средствами визуализации Tableau Public 9.0 с целью выявления проблемных регионов и поддержки принятия управленческих решений.
Наибольшие загрязнения в окружающую среду СКФО вносит автотранспорт (рис. 1).
Рисунок 1 — Dashboard динамика выбросов загрязняющих веществ от передвижных и стационарных источников, тыс. тонн.
В Tableau Public легко проводить сравнительный анализ одновременно по нескольким показателям для комплексной оценки объемов выбросов загрязняющих веществ (ЗВ) регионов СКФО (рис. 2) [3].
Рисунок 2 — Диаграмма сравнительного анализа общего объема выбросов загрязняющих веществ, а также объемов выбросов на единицу населения, площади и ВРП в 2014 году в регионах СКФО, тыс. тонн.
Как видно из рисунка 2, схожая ситуация наблюдается в Ставропольском крае и Республике Дагестан: имея высокие показатели по общему объему выбросов ЗВ и объему выбросов на единицу населения, в тоже время показатели выбросов ЗВ на единицу площади и ВРП — ниже среднего (среди регионов СКФО). Это объясняется сравнительно низкой плотностью населения и высоким ВРП среди регионов СКФО. В Чеченской Республике и Карачаево-Черкесской Республике также наблюдается похожая ситуация: низкие значения общего объемов выбросов ЗВ и объема выбросов на ед. площади; высокие значения объемов выбросов на ед. населения и ВРП. Кабардино-Балкарская Республика имеет высокий уровень выбросов ЗВ только на единицу населения, остальные показатели — ниже среднего. В Республике Северная Осетия-Алания высокие показатели выбросов ЗВ на единицу населения и площади, низкие — на ед. ВРП и общий объем выбросов ЗВ. Республике Ингушетия имеет высокий уровень выбросов ЗВ только на единицу ВРП.
Рисунок 3 — Карта общего объема выбросов ЗВ и объема выбросов ЗВ на единицу населения в 2014 году в регионах СКФО, тыс. тонн.
Результаты проведенного анализа можно проверить, используя визуализацию данных на географических картах. В Tableau наряду с долготой и широтой и другим полям набора данных можно назначить географическую роль, например, почтовый индекс, город, регион, страну и др., также можно самостоятельно дополнить базу геокодирования Tableau. После этого на динамическую карту легко можно накладывать данные одновременно по двум показателям (рис. 3−4).
Основной вклад в загрязнение атмосферы вносят автомобили, работающие на бензине, автомобили с дизельными двигателями, тракторы, другие сельскохозяйственные машины и железнодорожный транспорт (рис. 5). К основным загрязняющим атмосферу веществам, которые выбрасывают подвижные источники, относятся углеводороды и оксид углерода. Оксид углерода поступают в атмосферу только с выхлопными газами, тогда как не полностью сгоревшие углеводороды поступают как вместе с выхлопными газами, так и из картера, топливного бака и карбюратора; твердые примеси поступают в основном с выхлопными газами и из картера.
Рисунок 5 — Dashboard основные виды загрязняющих веществ, обезврежено и утилизировано всего и в %, тыс. тонн.
Легко в Tableau добавлять на график линии тренда, эталонные линии, полосы и распределения. На рис. 5 показан 95% доверительный интервал для линии регрессии, т. е., с 95% вероятностью линия регрессии проходит между двумя пунктирными кривыми. выброс загрязняющий тренд визуальный Так же в Tableau можно проводить прогнозирование временных рядов при помощи метода экспоненциального сглаживания (рис. 6):
Рисунок 6 — График динамики общего объема выбросов загрязняющих веществ в СКФО с прогнозным значением в 2015 г.
г.
Рисунок 7 — График общего объема выбросов загрязняющих веществ в СКФО, линия линейного тренда, медианы и среднего значения
де — сглаженный ряд; - исходный ряд; - коэффициент сглаживания ().
Основные достоинство метода — простота процедуры вычислений и возможность учета весов исходной информации. В этом методе большие значения веса придаются более поздним отсчетам, т. е. более старым данным придаются экспоненциально убывающие значения веса. Поэтому последние наблюдения дают относительно больший вес, чем более старые наблюдения. Однако, так как для получения прогноза на несколько число шагов используются вычисленные прогнозной моделью результаты, а не фактические данные, то ошибка такого прогноза может быть очень велика. Поэтому при построении прогноза не следует заглядывать слишком далеко вперед, так как с увеличением погрешности ценность полученного прогноза очень быстро падает. В прогнозной модели имеется возможность учитывать меняющийся тренд или сезонность в данных и экстраполировать их в будущее. Прогнозирование осуществляется полностью автоматически, но можно использовать настраивающиеся параметры [1].
Проверим полученные в Tableau результаты в других программных продуктах, используемых для анализа данных (рис. 8−12).
Рисунок 8 — Общий объем выбросов загрязняющих веществ в СКФО с линиями уравнений тренда и диаграмма остатков в среде Matlab.
Рисунок 9 — Общий объем выбросов загрязняющих веществ в СКФО с линиями уравнений тренда в MS Excel.
Рисунок 10 — Отчет по линейной регрессии в Deductor Studio.
Рисунок 11 — Настройка линейного тренда и сезонных индексов в Deductor Studio.
Рисунок 12 — Коэффициенты уравнений линий полиномиальных трендов динамики общего объема выбросов загрязняющих веществ в СКФО в Mathcad.
Рисунок 13 — Dashboard источники выбросов и тренд выбросов загрязняющих веществ в атмосферу от стационарных источников.
Как и предполагалось, значения коэффициентов линейного, полиномиального тренда второго и третьего порядков, найденные в Tableau Public, Deductor Studio, Matlab, Mathcad и Excel отличаются незначительно. Важным достоинством Tableau Public по сравнению с ними, является простота построения моделей логарифмического и экспоненциального тренда и оценка их параметров. Как видно из рис. 13, после краткосрочного роста в 2008 г. объема выбросов ЗВ от стационарных источников, связанного с увеличением числа неорганизованных источников выбросов на 2039 ед. по сравнению с 2007 г., в 2009 г. наблюдается минимум объемов выбросов ЗВ от стационарных источников. Но в дальнейшем, вплоть до 2014 года прослеживается постепенное увеличение объемов выбросов. Тем более, что рост объемов выбросов за последние пять лет сопровождался одновременным уменьшением доли выбросов ЗВ с очисткой. Так в 2014 году мы наблюдаем максимум объемов выбросов ЗВ, отходящих от стационарных источников, за последние 10 лет. (7,8 тыс. тонн), что объясняется увеличением числа предприятий, являющимися источниками выбросов.
Рисунок 14 — Диаграмма динамики выбросов ЗВ, отходящих от стационарных источников, тыс. тонн.
Tableau позволят создавать вычисляемые поля со множеством уровней детализаций. На рис. 14 представлена диаграмма динамики выбросов ЗВ от стационарных источников, под ней — значения разницы выбросов с предыдущим годом, еще ниже — процент этой разницы. Такое построение позволяет выявить сильные изменения показателя выбросов в абсолютных единицах и процентах: после снижения в 2010 г. объемов выбросов ЗВ от стационарных источников, в основном за счет их уменьшения в Чеченской Республике на 33 тыс. тонн (56,9% по сравнению с предыдущим периодом), в 2014 г. объем выбросов вырос на 10,8 тыс. тонн (на 51,4% по сравнению с предыдущим годом). В остальных регионах выбросы ЗВ увеличиваются незначительно. Резкие изменения в процентом отношении с предыдущим годом наблюдаются только в Республике Ингушетия, однако в абсолютных единицах изменения малосущественны. Наибольшие значения выбросов ЗВ, отходящих от стационарных источников за 2010;2014 гг. наблюдались в Ставропольском крае, что объясняется развитой химической промышленностью и в целом сравнительно высоким в СКФО уровнем ВРП, что подтверждается картой выбросов на рис. 3−4. На втором, третьем и четвертом местах — Чеченская Республика, Республика Дагестан и Карачаево-Черкесская Республика, с объемом выбросов ЗВ от стационарных источников в сумме меньшей, чем на Ставрополье. Лидерами по улавливанию выбросов ЗВ (рис. 15) являются Карачаево-Черкесская Республика, Республика Северная Осетия-Алания и Ставропольский край. Однако, настораживающей тенденцией стало снижение, особенно за 2014 г. (на 156,1 тыс. тонн, что составляет 50,8% от показателя 2013 г.) этого показателя природоохранной деятельности в Карачаево-Черкесской Республике, что частично объясняется снижением объемов выбросов ЗВ (рис. 14).
Рисунок 15 — Диаграмма динамики улавливания выбросов ЗВ, тыс. тонн.
Рисунок 16 — Карта выбросов и улавливания ЗВ, отходящих от стационарных источников в 2014 году, тыс. тонн.
Недостатком визуальной аналитики являются неспособность даже экспертов обнаружить достаточно сложные и нетривиальные зависимости, для обнаружения которых необходимы инструменты предикативной «продвинутой» аналитики, однованной на построении моделей, способных обучаться на данных. Такие возможности предоставляет платные флагманские продукты Tableau Desktop и Tableau Server, в которых предусмотрена интеграция с популярным статистическим языком R, используемым для выполнения сложного статистического анализа и прогнозной аналитики, такие как линейное и нелинейное моделирование, статистические тесты, анализ временных рядов, классификация, кластеризация и др.
- 1. Обзор: Бизнес-аналитика и большие данные в России 2014
- 2. Числовые и картографические данные о состоянии окружающей среды.