Постановка задачи, описание бизнес-процессов и требований к системе
Сегодня за рубежом ведутся активные исследования в области автоматизации распознавания пыльцевых зерен, за счет которых уже достигнуты некоторые успехи. Однако до сих пор нет качественной отечественной разработки, которая бы полностью автоматизировала распознавание пыльцевых зерен и предоставляла результаты высокой точности. Поэтому распознавание пыльцевых зерен — это часть активно развивающейся… Читать ещё >
Постановка задачи, описание бизнес-процессов и требований к системе (реферат, курсовая, диплом, контрольная)
В данной части сформулирована задача распознавания, описаны автоматизируемые бизнес-процессы, сформулированы требования к системе, обоснована необходимость создания системы, а так рассмотрены наиболее значимые решения в данной предметной области.
Математическая формулировка задачи распознавания следующая: пусть X — пространство объектов (в данной случае, изображений), Y — классы (в данном случае, вида). Дана обучающая выборка: (x1,y1) … (xm, ym), где xi принадлежит X, yi принадлежит Y и i принимает значения из интервала [1; m]. Требуется построить функцию F: X > Y (распознаватель), сопоставляющий класс Y произвольному объекту X.
То есть необходимо разработать прототип настольной автоматизированной программы, реализующей распознавание изображений пыльцевых зерен с помощью комбинаций функций OpenCV и метода голосования.
Программа должна выполнять следующие функции:
- 1. Загрузка обучающего и тестируемого набора данных изображений пыльцевых зерен.
- 2. Управление наборами данных (добавление, удаление, изменение, сохранение, загрузка).
- 3. Обучение системы.
a. Разбиение загруженных изображений на классы.
b. Предобработка изображений.
c. Обучение.
4. Распознавание:
a. Предобработка изображения пыльцевого зерна.
b. Отнесение распознаваемого изображения к одному из классов с использованием алгоритма голосования.
5. Сбор и анализ полученных данных и предоставление их пользователю в наглядной таблице с возможностью экспорта в Excel.
Для достижения поставленной задачи необходимо будет автоматизировать процедуру распознавания пыльцевых зерен (модель «AS-IS» см. рис. 1.5). Данный процесс выполняет эксперт в лаборатории путем микроскопического анализа предметных стекол, после чего сам, либо с помощью помощника заносит сделанные выводы в компьютер.
После автоматизации процедура распознавания будет включать в себя три бизнес-процесса: обучение системы, распознавание пыльцевых зерен и формирование отчета (модель «TO-BE» см. рис. 1.6 и 1.7). Не смотря на увеличение количества бизнес-процессов количество необходимых затрат значительно снижается. Причем процесс обучения системы будет выполнятся единожды.
Рисунок 1.6. Бизнес-процесс «Обучение системы» на модели «TO-BE».
Рисунок 1.7. Бизнес-процессы «Распознавание пыльцевых зерен» и «Формирование отчета» на модели «TO-BE».
изображение пользовательский распознавание программный Бизнес-процесс «Обучение системы» будет выполняться пользователем с помощью системы (см. табл. 1.1). Сначала пользователю необходимо загрузить обучающий набор данных изображений и разбить его по классам. После чего программа выполнит обучение и будет готова для выполнения своей основной функции — распознавание пыльцевых зерен.
Бизнес-процесс «Распознавание пыльцевых зерен» выполняется пользователем с помощью системы (см. табл. 1.2). Для выполнения распознавания пользователю необходимо загрузить изображение в программу. После чего программа выполнить обработку изображения и классификацию, по завершению этапа распознавания программа перейдет к бизнес-процессу «Формирование отчета» (см. табл. 1.3), где предоставит результаты в таблице, которые пользователь может выгрузить в Excel.
Таблица 1.1. Операции бизнес-процесса «Обучение программы».
№. | Операция. | Исполнитель. | Входящие данные. | Исходящие данные. | |
Загрузка обучающего множества изображений пыльцевых зерен. | Пользователь, программа. | Изображения пыльцевых зерен. | Сообщение об успешной загрузке изображений. | ||
Разбиение на классы. | Пользователь, система. | Название классов введенных пользователем или извлеченные из имен файлов изображений. | ; | ||
Обучение программы. | Программа. | Изображения добавленные пользователем и разбитые по классам. | Сообщение об успешном выполнении обучения. | ||
Таблица 1.2. Операции бизнес-процесса «Распознавание пыльцевых зерен».
№. | Операция. | Исполнитель. | Входящие данные. | Исходящие данные. | |
Загрузка изображений пыльцевых зерен. | Пользователь, программа. | Изображения пыльцевых зерен. | Сообщение об успешной загрузке изображений. | ||
Предобработка изображений. | Программа. | Изображения загруженные пользователем. | ; | ||
Классификация. | Программа. | Изображения загруженные пользователем. | Результаты. | ||
Таблица 1.3. Операции бизнес-процесса «Формирование отчета».
№. | Операция. | Исполнитель. | Входящие данные. | Исходящие данные. | |
Формирование отчета. | Программа. | Результаты этапа классификации. | Результаты сформированные в таблице. | ||
Экспорт отчета в Excel. | Программа. | Результаты сформированные в таблице. | Отчет в Excel. | ||
Функциональные требования. Система должна поддерживать следующие функции:
- 1. Загрузка обучающего и тестируемого набора данных изображений пыльцевых зерен.
- 2. Управление наборами данных (добавление, удаление, изменение, сохранение, загрузка).
- 3. Обучение программы на обучающем наборе данных:
a. Разбиение загруженных изображений на классы.
b. Предобработка изображений.
c. Обучение.
4. Распознавание:
a. Предобработка изображений.
b. Отнесение распознаваемого изображения к одному из классов с использованием алгоритма голосования.
5. Сбор и анализ полученных данных и предоставление их пользователю в наглядной таблице с возможностью экспорта в Excel.
Требования к входным/выходным данным. Все входные данные должны быть корректно обработаны, включая всевозможные исключительные ситуации, связанные с вводом неверных входных данных.
В качестве входных данных принимаются изображения форматов: jpeg, bmp, tif, gif. Должна поддерживаться функция загрузки нескольких изображений одновременно. После загрузки пользователем изображений в программу, загруженные изображения должны корректно отображаться в таблице обучающего набора и в таблице распознавания.
Результаты распознавания должны быть представлены в наглядной таблице с возможностью экспорта в Excel.
Требования к интерфейсу пользователя. Интерфейс пользователя должен быть понятным и легко осваиваемым. В программе должны использоваться подсказки для более простой навигации пользователей по функциям. Также программа должна содержать руководство пользователя в виде справки.
Требования к устойчивости. Программа не должна аварийно завершаться, за исключением ситуаций, связанных с неполадками в работе оборудования. Программа должна поддерживать возможность прерывания процессов обучения, предобработки изображений и классификации в процессе их выполнения.
Требования к безопасности. Требования к безопасности не предъявляются.
Требования к масштабируемости. Программа должна запускаться и работать на одном компьютере. На одном компьютере должна поддерживаться возможность запуска нескольких экземпляров программы.
Требования к производительности.
Интервал загрузки одного изображения не должен превышать 2 секунды. Интервал распознавания изображения (предобработки изображения и классификация) не должен превышать 10−20 секунд. Интервал обучения на 100 изображениях не должен превышать 10−15 минут.
Автоматизированным распознаванием пыльцевых зерен в настоящее время достаточно серьезно занимаются ученые многих стран. Распознавание пыльцевых зерен применяется для решения многих задач в медицине, биологии, геологии.
Сегодня за рубежом ведутся активные исследования в области автоматизации распознавания пыльцевых зерен, за счет которых уже достигнуты некоторые успехи. Однако до сих пор нет качественной отечественной разработки, которая бы полностью автоматизировала распознавание пыльцевых зерен и предоставляла результаты высокой точности. Поэтому распознавание пыльцевых зерен — это часть активно развивающейся и популярной в настоящее время области — распознавания образов и компьютерного зрения.
Использование стандартных методов классификации показывают довольно средние результаты точности. Именно поэтому так важно исследовать результаты применения метода голосования для распознавания пыльцевых зерен, поскольку с помощью данного метода можно добиться результатов высокой точности, однако данный алгоритм сложен в подборе эффективной формулы вычисления.
На сегодняшний день для точной идентификации пыльцевых зерен используют микроскопический анализ, который проводится вручную экспертами в лабораторных условиях, данный процесс очень дорогостоящий и занимает много времени [9]. Разработав полноценный и высокоточный метод автоматизации распознавания пыльцы, можно будет не только сэкономить на трудоемкости и трудозатратах, а также использовать данный метод для обучения специалистов.
Настоящая работа была выполнена по заказу ученых-биологов ПГНИУ. Они ведут работы по выявлению периода пыления растений-аллергенов. Это необходимо для информирования аллергиков, страдающих поллинозом и бронхиальной астмой. Вторая задача, которая решается биологами — определение качества меда. На текущий момент времени распознавание пыльцевых зерен не автоматизировано, а существующие зарубежные разработки недоступны.