Диссертационная работа затрагивает одно из актуальных направлений современных исследований, связанных с возможностью оценки углеводородного потенциала геологических структур на основе автоматизированной обработки результатов космических съемок. Использование аэрои космических съемок сегодня является ключевым фактором повышения эффективности и снижения стоимости работ по поиску и прогнозированию месторождений нефти и газа, особенно для малоисследованных геологическими и геофизическими методами районов.
Преимуществами дистанционных методов исследования Земной поверхности по сравнению с традиционными являются более высокая плотность получаемых данных, масштабность обзора, возможность получения глобальной и локальной информации о природных объектах, а также контроля динамики процессов в реальном масштабе времени. Космические снимки, являясь самым новейшим и совершенным материалом, позволяют в более короткие сроки составлять и обновлять различные тематические карты Земной поверхности, картографировать слабоизученные и труднодоступные территории [1,11,17,18,21,22,39]. Данные обстоятельства в свою очередь позволяют повысить эффективность и достоверность, а также снизить временные и материальные затраты при решении многих прикладных задач в области поиска и освоения полезных ископаемых.
Прогнозирование степени нефтегазоносности предполагаемых месторождений углеводородов с использованием данных авиационного и космического зондирования Земной поверхности является в настоящее время одним из наиболее перспективных направлений в области проведения нефтегазопоисковых работ. Полный комплекс работ, направленных на решение данного класса задач включает в себя несколько этапов, на каждом из которых решается множество специфических задач, требующих привлечения экспертов из различных областей, а также разнообразного методологического и математического аппарата.
Первым этапом является непосредственное получение космических снимков. Поскольку в настоящее время существует большое количество космических аппаратов, осуществляющих мониторинг земной поверхности и имеющих на борту различную целевую аппаратуру, на данном этапе необходимо провести анализ требований, предъявляемым к снимкам в рамках решаемой технической задачи, в результате которого будут определены возможные источники получения исходных данных.
После непосредственного получения космических снимков следующим этапом является их дешифрирование. Основными задачами, решаемыми на данном этапе, являются предварительная обработка снимка с целью улучшения его качества, построение полей физических параметров, а также непосредственно дешифрирование, в результате которого выделяются границы прогнозируемых структур, в которых предположительно имеются залежи углеводородов. Решение задач дешифрирования предполагают анализ и интерпретацию больших объемов разнородной информации, а также наличие определенного опыта решения подобных задач и, зачастую некоторой интуиции. Вследствие этого в настоящее время задачи дешифрирования решаются в основном с привлечением экспертов геологов. Отметим также, что весьма перспективным направлением в данной области является разработка систем и алгоритмов автоматического дешифрирования.
Заключительным этапом является интерпретация результатов космических съемок непосредственно с целью оценки нефтегазоносного потенциала предварительно выделенных локальных структур. Наиболее часто интерпретация предполагает отнесение прогнозируемой структуры к одному из нескольких классов, в качестве которых могут, например, выступать класс нефтегазоносных структур и класс пустых структур. В более общем случае структуры могут дифференцироваться по объемам залежей углеводородов, например нефтегазоносные, с непромышленным содержанием углеводородов и пустые. В качестве теоретической базы для решения данной задачи используются методы классификации, имеющие общей целью обоснованное принятие решений об отнесении различных наблюдаемых объектов и явлений к конкретным, заранее известным, либо неизвестным (кластерный анализ) классам. Однако, как будет показано далее, задача прогнозирования перспектив нефтегазоносности по данным космических съемок имеет ряд особенностей, вызывающих определенные затруднения на этапе решения задачи классификации. Решению данной проблемы посвящена настоящая диссертационная работа.
Краткая характеристика диссертационной работы.
Анализ состояния и тенденций развития современных методов классификации показывает, что на данный момент существует огромное разнообразие технических задач, требующих в той или иной степени применения методов классификации и распознавания образов. Во многих случаях решение этих задач может быть достигнуто за счет тех возможностей, которые предлагают современные методы классификации. Однако, несмотря на значительный теоретический задел в области классификации, применение известных методов для целей обработки и анализа космических снимков может столкнуться с серьезными проблемами. Специфика задачи анализа космических снимков выбранного участка земной поверхности проявляется в том, что их качество в существенной степени зависит от состояния атмосферы, прежде всего наличия облачности, закрывающей отдельные фрагменты интересующего участка. Кроме того, ограниченность полосы захвата целевой аппаратуры является причиной того, что большие по площади районы не могут быть отражены на одном снимке. Эти обстоятельства приводят к необходимости использования серии снимков, полученных в различные периоды времени. С точки зрения последующей интерпретации этих снимков мы сталкиваемся с нетипичной для задач классификации ситуацией, когда данные привлекаемые в качестве обучающей выборки, и, более того, данные о распознаваемых объектах получены в различные моменты времени.
Учитывая это обстоятельство, целью диссертационной работы является повышение достоверности результатов интерпретации космических снимков путем разработки эффективных алгоритмов решения задач классификации с обучением в случае, если имеет место временная несинхронизированность данных ОВ и РО, то есть данные об объектах ОВ и РО получены в различные моменты времени. Данная задача является особенно актуальной, если признаки РО и объектов ОВ изменяются во времени.
В Главе 1 «Актуальность проблемы временной несинхронизированности данных обучающей выборки и распознаваемого объекта. Постановка технической задачи» описана современная технология обработки и анализа результатов космических съемок, рассмотрены физическо-технические основы использования космических снимков для целей прогноза нефетгазоносности геологических структур, а также современные технические средства, используемые для получения исходных данных (космических снимков). Также рассмотрены причины возникновения и суть проблемы временной несинхронизированности данных ОВ и РО. Проведен анализ методических трудностей, возникающих при решении задачи классификации, в случае, если данные о РО и объектах ОВ не синхронизированы во времени. Рассмотрены возможные пути решения задачи классификации в описываемых условиях. Одним из таких путей, позволяющих исключить временную несогласованность данных является объединение данных об объектах ОВ, полученных в различные моменты времени, в единую обучающую выборку. Однако, такое объединение равносильно тому, предположению о том, что характеристики излучения земной поверхности не зависят от времени, что на самом деле является неверным. Вследствие этого попытка объединения разновременных данных в единую обучающую выборку и последующее использование традиционных методов классификации, как показано в работе, сопровождается недопустимыми ошибками классификации.
В соответствии с вышеизложенными обстоятельствами, наиболее привлекательным представляется путь, связанный с предварительной временной синхронизацией данных, что делает возможным последующее использование любого известного метода классификации с обучением. Разработке такого метода посвящена последующая часть диссертационной работы.
В заключении главы 1 сформулирована математическая постановка задачи классификации в условиях временной несинхронизированности данных ОВ и РО.
Глава 2 посвящена разработке нового подхода к решению задач классификации с обучением в условиях временной несогласованности данных об эталонных и распознаваемых объектах. Проведен анализ традиционной схемы классификации, практическая реализация которой предполагает наличие следующих этапов:
• выбор метода, обеспечивающего наилучшее качество классификации;
• адаптация выбранного метода (с привлечением обучающей выборки) к конкретным условиям распознавания;
• отнесение распознаваемого объекта к одному из эталонных классов с использованием выбранного метода.
Оценка возможности применения этой традиционной схемы для целей анализа разновременных космических снимков показала, что игнорирование временной несогласованности данных ОВ и РО приводит к недопустимо большим ошибкам. Учитывая это, предложена модификация изложенной традиционной схемы классификации, в основе которой лежит ее расширение дополнительным этапом, обеспечивающим предварительную синхронизацию данных, то есть их привязку к некоторому единому моменту времени. Указанная синхронизация в диссертационной работе достигается за счет применения методов теории случайных процессов. Зависимости, описывающие изменение во времени значений признаков распознавания, интерпретируются как гауссовские случайные процессы. В рамках такого представления в качестве прогнозируемых оценок векторов признаков для объектов ОВ и РО в любой единый для всех произвольный момент времени могут рассматриваться их условные математические ожидания, рассчитанные на основе измерений, проведенных в известные моменты времени. Проблема состоит в том, чтобы на основе имеющейся обучающей информации сформировать наилучшую в определенной смысле модель гауссовского случайного процесса, используемую в качестве основы для временной синхронизации данных. Известно, что статистические свойства гауссовского случайного процесса исчерпывающе описываются функцией математического ожидания и корреляционной функцией. В работе предложены методы оптимизации, позволяющие определять оптимальные (в смысле минимума вероятности ошибочной классификации объектов обучающей выборки, отнесенных к некоторому прогнозируемому моменту времени) их оценки, как в условиях изолированной оптимизации функции математических ожиданий, так и в условиях совместной оптимизации функций математических ожиданий и элементов корреляционной матрицы.
Учитывая ограниченное число объектов обучающей выборки (разведанных геологических структур), общие свойства разработанного метода иллюстрируются и анализируются на модельных примерах, отражающих особенности процесса анализа космических снимков. В рамках модельного представления показано, что решение задачи классификации может быть достигнуто с использованием традиционной схемы решения задачи классификации с обучением при условии стационарности случайных процессов, описывающих временные изменения значений яркостей. На примерах, моделирующих решение задач классификации в условиях нестационарности случайных процессов, продемонстрировано, что применение традиционной схемы сопровождается недопустимыми ошибками классификации, что однозначно указывает на необходимость ее адаптации.
Использование разработанной в диссертационной работе методики классификации в подобных условиях позволило почти в 2 раза уменьшить вероятность ошибочной классификации, что указывает на возможность её использования в практических задачах. Достигнутое уменьшение вероятность ошибочной классификации достигнуто за счет мер по оптимизации оцениваемых параметров гауссовских случайных процессов, описывающих временные вариации признаков. В работе даются оценки эффективности применения методик и изолированной оптимизацией параметров функции математического ожидания, а также с совместной оптимизацией параметров функции математического ожидания и компонент матричной корреляционной функции.
Глава 3 диссертационной работы посвящена анализу результатов применения разработанной методики классификации с обучением в условиях временной несогласованности данных обучающей выборки и распознаваемого объекта в процессе интерпретации космических снимков, полученных аппаратурой ИСЗ «LandSat-7» для различных периодов съемки, в интересах оценки перспектив нефтегазоносности геологических структур.
Объекты обучающей выборки представлены совокупностью геологических структур, нефтегазоносный потенциал которых определенно установлен. В качестве компонент вектора признаков распознавания в данном случае выступают средние по площади значения яркостей, соответствующих семи спектральным диапазонам, полученные в результате предварительной обработки космических снимков для четырех моментов съемки. То обстоятельство, что компонентами вектора признаков выступают значения спектральных яркостей, полученных в результате усреднения по большому числу точек (пикселей) в границах структуры, позволяет использовать в качестве статистической модели, описывающей их временные эволюции, гауссовский случайный процесс.
С целью обоснования возможности использования средних значений спектральных яркостей для решения задачи классификации приведены данные, подтверждающие наличие классифицирующих возможностей данных величин. Также проведен анализ корреляционных зависимостей разновременных данных, показавший, что существует устойчивая корреляционная связь данных, полученных в период май — сентябрь, для класса нефтегазоносных структур. При этом для класса пустых структур аналогичной связи не обнаруживается.
Для окончательного подтверждения эффективности разработанного метода проведена его апробация в процессе обработки реальных космических снимков геологических структур в районе Тимано-Печорского бассейна. Показано, что в условиях существенной сезонной вариабельности значений спектральных яркостей применение традиционных методов классификации без предварительной синхронизации обучающих данных сопровождается вероятностью ошибочных решений на уровне 0,56. Применении разработанной в диссертационной работе модифицированной схемы на основе процедуры предварительной синхронизации данных позволило уменьшить вероятность ошибочной классификации почти в 1,5 раза. Этот результат указывает на необходимость широкого применения предложенного решения в практику обработки и анализа результатов космических съемок.
В результате исследований, проведенных в диссертационной работе, получены следующие новые научные результаты:
1. Проведен анализ процесса обработки и интерпретации космических снимков земной поверхности в целях оценки углеводородного потенциала перспективных геологических структур. Показано, что реализация этого процесса приводит к необходимости решения задачи классификации, осложненной временной несогласованностью данных обучающей выборки и распознаваемого объекта.
2. Рассмотрены существующие методы решения задач классификации, которые не учитывают факт временной несогласованности данных. На основании обработки реальных результатов космических съемок показано, что применение традиционных методов в условиях несинхронизированности данных приводит к недопустимым ошибкам классификации.
3. Предложен подход к решению задачи классификации для условий, когда данные по объектам обучающей выборки и о распознаваемом объекте не синхронизированы во времени. В его основе лежит дополнение традиционной схемы этапом временной синхронизации.
4. Предложен метод синхронизации данных обучающей выборки и распознаваемого объекта, базирующийся на гауссовской аппроксимации процессов, описывающих временную динамику признаков распознавания. В рамках такого представления привязка данных обучающей выборки и распознаваемого объекта к единому (прогнозируемому) моменту времени достигается путем вычисления оценок их условных математических ожиданий.
5. Разработаны алгоритмы синхронизации данных, обеспечивающие максимум частоты правильной классификации на основе изолированной оптимизации функции математического ожидания и на основе совместной оптимизации функции математического ожидания и матричной корреляционной функции случайного процесса, описывающего изменение вектора признаков объектов во времени.
7. Создан специализированный программный комплекс, реализующий предложенный метод синхронизации данных и разработанные алгоритмы, предназначенный для проведения классификации в условиях временной несогласованности данных обучающей выборки и распознаваемых объектов.
8. На серии тестовых примеров, имитирующих решение задачи прогнозирования перспектив нефтегазоносности геологических структур с использованием разновременных космических снимков проведен анализ возможности использования разработанного метода классификации для решения поставленной технической задачи. При этом показана возможность повышения достоверности результатов классификации как за счет изолированной оптимизации функции математических ожиданий, так и за счет совместной оптимизации функций математических ожиданий и матричной корреляционной функции вектора признаков.
9. На примере обработки космических снимков геологических объектов Тимано-Печорского бассейна показано, что использование разработанного метода классификации с синхронизацией данных обучающей выборки и распознаваемого объекта статистически достоверно увеличивает частоту правильной оценки углеводородного потенциала в 1,6 раза. Причем основное увеличение величины частоты правильной классификации достигается за счет изолированной оптимизации функции математических ожиданий, и в меньшей степени эффект проявляется за счет оптимизации элементов корреляционной матрицы.
Работа выполнена на кафедре «Информационно-управляющие комплексы» Московского Авиационного Института (Государственного технического университета) под руководством профессора В. Н. Евдокименкова.
Результаты диссертационной работы обсуждались на:
— 11-ой Международной конференции «Системный анализ, управление и навигация». Крым, Евпатория, 3 июля — 9 июля 2006 г.
— Юбилейной научно-технической конференции «Информационно-управляющие системы — 2006» г. Королев, ФГУП «НПО ИТ» 12−13 октября 2006 г.;
— 12-ой Международной конференции «Системный анализ, управление и навигация». Крым, Евпатория 1 июля — 8 июля 2007 г.;
Научном семинаре кафедры «Информационно-управляющие комплексы» Московского Авиационного института;
— Научном семинаре кафедры «Системный анализ» Московского Авиационного Института, а также были отражены в следующих публикациях:
1. Ким P.B., Евдошшенков B.H. Развитие методов классификации в условиях временной несогласованности данных обучающей выборки и распознаваемого объекта и их применение для анализа результатов космических съемок земной поверхности // Вестник информационных и компьютерных технологий. 2008, № 9.
2. Ком Р. В., Евдошшенков В. Н. Временная синхронизация данных обучающей выборки и распознаваемых объектов в задачах классификации в процессе интерпретации космических снимков земной поверхности. // Известия РАН. Теория и системы управления. 2009, № 1.
На защиту выносятся следующие основные положения диссертационной работы:
1) модифицированная с учетом особенностей процесса интерпретации космических снимков схема решения задачи классификации с обучением, адаптированная к условиям временной несогласованности данных обучающей выборки и распознаваемого объекта путем включения в традиционную схему дополнительного этапа синхронизации данных;
2) метод временной синхронизации данных обучающей выборки и распознаваемых объектов, основу которого составляет процедура оптимального оценивания параметров гауссовского случайного процесса;
3) методы оптимизации параметров гауссовского случайного процесса в процессе синхронизации данных, обеспечивающие минимизацию частоты ошибочной классификации;
4) комплекс алгоритмов решения задач классификации в условиях временной несогласованности данных обучающей выборки и распознаваемых объектов, объединяющих традиционные методы классификации с предварительной процедурой синхронизации данных;
5) программно-математическое обеспечение на основе объектно-ориентированного подхода, реализующее комплекс разработанных алгоритмов, разработанное;
6) результаты решения задачи оценки перспектив нефтегазоносности геологических структур Тимано-Печорского бассейна по результатам космических съемок, проведенных в различные периоды времени, подтверждающие эффективность предложенных алгоритмов.
Достоверность результатов, полученных в работе, подтверждается: математической обоснованностью и адекватностью моделей, применяемых в методе синхронизации данных ОВ и РОиспользованием большого объема тестовых примеров, имитирующих процесс обработки космических снимковрезультатами обработки реальных космических снимков района Тимано-Печорского нефтегазоносного бассейна в процессе оценки перспектив нефтегазоносности геологических структур и их сопоставлением с данными по ранее разведанным месторождением.
Выводы по главе 3.
1. На примере обработки разновременных космических снимков геологических объектов Тимано-Печорского бассейна подтверждена эффективность разработанной схемы классификации с предварительной синхронизацией данных обучающей выборки и распознаваемого объекта.
2. Показано, что использование в алгоритме синхронизации данных обучающей выборки и распознаваемого объекта изолированной процедуры оптимизации параметров регрессионной зависимости, описывающей изменение во времени средних значений спектральных яркостей, повышает частоту правильной классификации нефтесодержащих и пустых геологических структур в 1.4 раза.
3. Использование в алгоритме синхронизации данных совместной оптимизации функций математических ожиданий, описывающих изменение во времени средних значений яркостей в каждом из спектральных каналов и элементов корреляционных матриц, описывающих статистическую взаимосвязь значений спектральных яркостей, соответствующих различным периодам съемки, повышает частоту правильной классификации нефтесодержащих и пустых геологических структур в 1.64 раза.
Заключение
.
В результате проведенных исследований получены следующие основные результаты:
1. Проведен анализ процесса обработки и интерпретации космических снимков земной поверхности в целях оценки углеводородного потенциала перспективных геологических структур. Показано, что реализация этого процесса приводит к необходимости решения задачи классификации, осложненной временной несогласованностью данных обучающей выборки и распознаваемого объекта.
2. Рассмотрены существующие методы решения задач классификации, которые не учитывают факт временной несогласованности данных. На основании обработки реальных результатов космических съемок показано, что применение традиционных методов в условиях несинхронизированности данных приводит к недопустимым ошибкам классификации.
3. Предложен подход к решению задачи классификации для условий, когда данные для объектов обучающей выборки и для распознаваемого объекта не синхронизированы во времени. Основу подхода составляет дополнение традиционной схемы этапом временной синхронизации.
4. Предложен метод синхронизации данных обучающей выборки и распознаваемого объекта, использующий для временной синхронизации данных методы теории случайных процессов, и базирующийся на гауссовской аппроксимации процессов, описывающих временную динамику признаков распознавания. В рамках такого представления привязка данных обучающей выборки и распознаваемого объекта к единому (прогнозируемому) моменту времени достигается путем вычисления оценок их условных математических ожиданий.
5. Разработан алгоритм синхронизации данных, обеспечивающий максимум вероятности правильной классификации на основе изолированной оптимизации функции математического ожидания случайного процесса, описывающего изменение вектора признаков объектов во времени.
6. Предложен алгоритм синхронизации данных, обеспечивающий максимум вероятности правильной классификации на основе совместной оптимизации функции математического ожидания и матричной корреляционной функции случайного процесса, описывающего изменение вектора признаков объектов во времени.
7. Создан специализированный программный комплекс, реализующий предложенную модифицированную методику и предназначенный для проведения классификации в условиях поставленной задачи, а также для исследования влияния различных параметров предложенных алгоритмов на результаты решения задачи классификации.
8. На серии тестовых примеров, имитирующих решение задачи прогнозирования перспектив нефтегазоносности геологических структур с использованием разновременных космических снимков, проведен анализ возможности использования разработанного метода классификации для решения поставленной технической задачи. При этом показанавозможность повышения достоверности результатов классификации как за счет изолированной оптимизации функции математических ожиданий, так и за счет совместной оптимизации функций математических ожиданий и матричной корреляционной функции вектора признаков.
9. На примере обработки разновременных космических снимков геологических объектов Тимано-Печорского бассейна показано, что использование разработанного метода классификации с синхронизацией данных обучающей выборки и распознаваемого объекта статистически достоверно увеличивает частоту правильной оценки углеводородного потенциала в 1,5 раза. Причем основное увеличение величины частоты правильной классификации достигается за счет изолированной оптимизации функции математических ожиданий, и в меньшей степени эффект проявляется за счет оптимизации элементов корреляционной матрицы.