Поиск и оптимизация условий культивирования, влияющих на синтез микроорганизмами экономически значимого продукта
Критериями оптимальности отсеивающих экспериментов можно считать учет парных сочетаний факторов с равными частотами (ортогональность вектор — столбцов), что позволяет более полно учесть сочетания высших порядков и увеличить качественное разнообразие испытуемых вариантов питательных сред при ограниченном количестве опытов в серии, обеспечить близкое к максимальному разнообразие для выбранного… Читать ещё >
Поиск и оптимизация условий культивирования, влияющих на синтез микроорганизмами экономически значимого продукта (реферат, курсовая, диплом, контрольная)
Поиск и оптимизация условий культивирования, влияющих на синтез микроорганизмами экономически значимого продукта Шулюпин О.К.
Пущино 2012
Список используемых сокращений.
ПК — персональный компьютер ЦП — целевой продукт микробиологического синтеза ВП — выход процесса (уровень синтеза целевого продукта) ОЭ — отсеивающий эксперимент, задача которого состоит в уменьшении количества изучаемых переменных, нахождении сильнодействующих на ВП факторов и отбрасывании нейтральных ПФЭ — полный факторный эксперимент ДУПФЭ — двухуровневый полный факторный эксперимент ПОСЛУ — плохо обусловленная система линейных уравнений СЛУ — система линейных уравнений ИФА — иммуноферментный анализ Аннотация В предлагаемой работе рассмотрена задача прикладной микробиологии по поиску компонентов питательной среды и условий культивирования, влияющих на синтез экономически значимого продукта (ферменты, антигены, антибиотики).
Представлен разработанный двухуровневый план отсеивающего эксперимента с 15ю проверяемыми факторами на 16ти экспериментальных точках, близкий к оптимальному по равномерному учету сочетаний пар факторов в серии экспериментов. План единственный и оптимальный для случая отсутствия априорной информации и указанных количеств факторов, позволяет проверить до 30 факторов при размещении нового фактора на каждом уровне.
Предлагается алгоритм построения двухуровневых планов второго шага, уточняющих найденные факторы, увязанные с полученной информацией. Построен близкий к оптимальному трехуровневый план переходного к оптимизации эксперимента, позволяющий уточнить уровни и факторы при проверке 5 факторов на 8 экспериментальных точках. Предлагается новая форма записи, уменьшающая вероятность ошибки при экспериментальной постановке.
Рассмотрены ограничения двухуровневого полного факторного эксперимента при решении задач нахождения оптимальных условий культивирования как некорректно поставленной задачи и предложен путь регуляризации через оценки значимости коэффициентов полинома с применением непараметрических критериев, построения графиков, корреляционных таблиц и корреляционных полей до решения системы линейных уравнений.
Предисловие Развитие биотехнологии, совершенствование рационов вскармливания сельскохозяйственных животных и растений, расширение производства пищевых добавок для людей ставят задачу быстрого поиска компонентов питания с повышенной биологической активностью. В опубликованной литературе задачи оптимизации рационов разработаны достаточно глубоко, но задачи оптимального поиска компонентов питания с повышенной биологической активностью разработаны слабее и на наш взгляд не отвечают современным потребностям промышленности и сельского хозяйства.
В предлагаемой работе рассмотрены в первую очередь задачи поиска, близкого к оптимальному, физиологически активных компонентов пищи (нутриентов), необходимых разнообразным живым системам для интенсивного роста и синтеза биологически активных соединений (экономически важного целевого продукта).
Наиболее полно в существующей литературе эти вопросы рассмотрены для микроорганизмов в классическом руководстве Максимова, Федорова /1/, но эта монография уже давно стала библиографической редкостью. К тому же методы обработки результатов активного поиска (отсеивающего эксперимента) рассмотрены недостаточно полно, не отражено применение компьютеров при обработке результатов, слабо рассмотрены ограничения ДУПФ, сильный акцент на ручные вычислительные операции и от читателя требуется достаточно высокая математическая подготовка, что ограничивает контингент потенциальных пользователей.
В предлагаемой работе предпринята попытка ликвидировать или сократить перечисленные пробелы. Первоначально рассмотрены задачи планирования и обработки результатов активных экспериментов при проведении поиска, близкого к оптимальному. Предложены критерии оптимальности построения серии поисковых экспериментов на основе насыщенных и сверхнасыщенных планов отсеивающего эксперимента. Эта часть работы не требует повышенной математической подготовки, но подразумевает достаточно развитую интуицию исследователя. По нашему мнению, без интуиции поисковые работы проводить не рационально, поскольку первоначальный выбор подозреваемых переменных и их уровней (интенсивностей) не формализуем, и лежит вне математики.
Далее рассмотрены ограничения двухуровневых полного и дробного факторных экспериментов для нахождения области, близкой к оптимальной. Эта часть предполагает наличие повышенной математической подготовки и более углубленного рассмотрения материала при наличии хорошего пространственного воображения, но без участия интуиции.
На основании собственных и опубликованных в доступной литературе результатов, рассмотрено применение отсеивающего эксперимента (ОЭ) и двухуровневого полного факторного эксперимента (ДПФЭ) при изучении влияния условий культивирования бактерий на синтез белков (ферменты антигены), представляющих экономический интерес. Экспериментальная часть работы была сделана на базах ИБФМ РАН (Пущино) и бывшего ВНИИ прикладной микробиологии, ныне Гос НИИ ПМ, бывшей фирмы «Диавак «(Оболенск, Моск. Обл.).
Поскольку личный опыт автора основан на работе с бактериями, а так же то, что микроорганизмы являются наиболее простыми из самостоятельно живущих организмов и, возможно, наиболее значимыми элементами в процессах биотехнологии, то основные примеры приведены из области микробиологии. По нашему мнению, предлагаемые математические и методологические подходы могут быть легко обобщены и для более сложных продуцентов, поскольку регуляция активности оперона условиями внешней среды одинакова для всех известных организмов / 15/.
Методологическое обоснование Из всех биологических наук микробиология — наиболее точная и наиболее математизированная. Ряд задач микробиологии невозможно решить без математической обработки результатов измерений, по крайней мере, некоторых свойств и параметров микробиологической популяции и без применения хотя бы простейших математических моделей. Важность такого подхода подтверждается тем, что микроорганизмы являются продуцентами многих уникальных физиологически активных соединений, к которым можно отнести ферменты, антигены, антибиотики как наиболее значимые.
Современные технологические процессы невозможно вести без применения математики. Рост фармацевтической промышленности и биотехнологии в последнее время вызывает увеличение спроса на промышленно важные микроорганизмы.
Многие микроорганизмы способны синтезировать ряд ЦП, которые не синтезируют другие организмы. Но нередко перспективный штамм производит синтез экономически важного целевого продукта при выращивании на плотной питательной среде и не способен синтезировать его при глубинном культивировании. Возможен вариант, когда глубинное культивирование на питательных средах с использованием гидролизатов и вытяжек из сырья природного происхождения не обеспечивает стабильного получения ЦП и выход ЦП сильно зависит от партии питательной среды. Это ухудшает технологические показатели продуцента и может служить основанием для отказа от такого микроба при использовании в промышленных масштабах. В таком случае можно говорить о наличии метаболизируемых ингибиторов или индукторов нужного синтеза. Молекулярное клонирование и прочие генно-инженерные операции не решают проблемы, поскольку в изученный продуцент переносят рекомбинантную ДНК вместе с регуляторными участками. Необходимо проводить комплексное изучение продуцента.
Встает вопрос о возможности нахождения регуляторных факторов и переходе к управляемому культивированию. Названную операцию можно осуществить, если производить целенаправленный активный поиск регуляторных факторов.
Процесс поиска осложняется тем, что в качестве регуляторного фактора могут выступать несколько индивидуальных химических соединений разных классов (минеральные компоненты, углеводы, источники азота и т. д.), либо иных условий культивирования (рН, аэрация) действующих одновременно и взаимовлияюще [1]
На наш взгляд, проще производить поисковую работу, если проводить поиск на синтетических средах и средах контролируемого химического состава, что достаточно доступно на современном уровне. Поскольку теоретически возможное сочетание различных комбинаций факторов весьма велико, то необходимо вести некий оптимальный поиск. Так как каждый микроб достаточно ограничен в своих потенциальных возможностях, то задача имеет решение. Подобные работы уже проводили неоднократно и в литературе описаны ряд планов поиска, близких к оптимальному. Критерии оптимальности в большинстве случаев не сформулированы. Отсутствуют опубликованные правила построения и условия применения планов поиска, работу во многом производили на интуитивном уровне, не указаны ряд, на наш взгляд, существенных моментов поиска.
Применение микроорганизмов в технологическом процессе предъявляет ряд требований к свойствам промышленного штамма — глубинное культивирование, рентабельный выход ЦП, безопасность для окружающей среды, наличие нескольких селективных маркеров, желателен выход ЦП в культуральую среду, низкий уровень спонтанного мутагенеза и т. д.
Знание общих закономерностей питания микроорганизмов мало что дает при работе с конкретным продуцентом. Необходима стратегия поиска лимитирующих, ингибирующих и индуцирующих нужный синтез факторов (регуляторных факторов) среди множества возможных кандидатов из многочисленных потенциально осуществимых условий культивирования.
Выяснение количества и роли регуляторных факторов позволяет решить вопрос о целесообразности применения мутагенеза и перехода от дикого штамма к более технологичному мутанту.
Задача поиска регуляторных факторов осложняется наличием значительного межфакторного взаимодействия (сильная кривизна поверхности отклика — зависимости ВП от условий культивирования). При таких начальных условиях серия однофакторных экспериментов дает мало информации, а в ряде случаев, при наличии нескольких регуляторных факторов, в принципе не позволяет решить задачу поиска. Необходимо проводить многофакторный поиск, используя индивидуальные химические соединения в серии многофакторных экспериментов по планам, близким к оптимальным для поиска.
Последовательность применения математики в микробиологической работе — количественное измерение одного или нескольких свойств, построение таблиц, построение графиков, разработка регрессионных зависимостей, построение математических моделей. Для проведения поиска регуляторных факторов, близкого к оптимальному, нередко достаточно даже качественных измерений с неизвестной ошибкой, построения на этих основаниях таблиц и графиков, что не требует ни большого количества арифметических вычислений, ни повышенной математической подготовки.
Вступление Успехи, достигнутые при изучении и оптимизации процессов, зависящих от большого количеств факторов, стали возможными благодаря широкому внедрению математических методов планирования эксперимента. Возникает необходимость изменения методологии биологических исследований. Принцип поочередного изменения в эксперименте каждого фактора на фоне постоянного уровня остальных (метод Зайделя-Гаусса /1/) не является универсальным и окончательным, а всего лишь часть комплексного исследования объекта, нередко применимого только на ранних стадиях исследования. Биологические системы, зависящие от большого количества факторов с сильным межфакторным взаимодействием при современных требованиях практики сложно изучать, моделировать и управлять процессами на основе мало связанных однофакторных зависимостей. Методология проведения и трактовки однофакторных зависимостей хорошо разработана и в дополнительных объяснениях, на наш взгляд, не нуждается /1/.
Представление полученных нередко весьма разнородных результатов измерений в виде графиков, таблиц, корреляционных полей, нахождение аналогий с более изученными родственными объектами служат основой к проведению активных поисковых работ и дальнейшей оптимизации процесса с количественным учетом влияния нескольких факторов на синтез ЦП.
Состояние популяции микробов существенно зависит от разнообразных по своему характеру (качественно различных) и по интенсивности (количественно различных) факторов. Поэтому пред современным микробиологом стоит задача — комплексное исследование объекта, установление причинно-следственных связей между различными явлениями, выделение управляемых факторов и воздействие на них.
Активные поисковые работы с учетом ожидаемой зависимости изучаемого параметра от нескольких факторов лучше начинать с отсеивающего эксперимента.
Общая часть Отсеивающий эксперимент Микроорганизмы способны расти на субстратах, недоступных другим живым системам /2/, а так же имеют большое прикладное значение в качестве вакцин в медицине и ветеринарии и продуценты антибиотиков и других физиологически активных веществ. Но геном каждого микроорганизма кодирует 2 — 3 тысячи белков /2,3/, далеко не все из которых представляют интерес. Кроме того, нередко гены, ответственные за такие белки, находятся под сложной регуляцией компонентами питательной среды /1- 4/.
Среди микробиологов известны следующие задачи — есть некий штамм, который продуцирует нужный продукт при культивировании на плотной среде, либо в организме животного, но не продуцирует при глубинном культивировании или на простых питательных средах на основе гидролизатов и вытяжек природного сырья. Возможен случай, когда синтез представляющего интерес продукта при глубинном культивировании зависит от партии питательной среды. Как правило, это означает, что в питательной среде должны присутствовать индукторы или метаболизируемые ингибиторы нужных синтезов.
С точки зрения молекулярной биологии, структурный ген может находиться под регуляцией любым промоторно — операторным участком и регуляторным фактором может быть любая комбинация из индивидуальных компонент питательной среды или интенсивностей физико-химических факторов (температура, рН и т. д.). Причем за счет рекомбинационных процессов, прочих внутригеномных перестроек и спонтанного мутагенеза конкретное сочетание промоторно-операторный участок — структурный ген будут носить штаммовоспецифичный характер /1- 4,15/.
Молекулярное клонирование приведет к переносу в изученный продуцент структурных генов с прежними регуляторными участками ДНК и задача останется. Работу по выяснению особенностей регуляции какого-либо оперона необходимо проводить заново с каждым конкретным продуцентом.
Кроме того, среди известных таксономических групп микробов могут быть некультивируемые штаммы. Описаны некультивируемые легионеллы, которые обнаруживаются при микроскопировании. в мазках клинического материала со специфичными люминесцентными антисыворотками, но не растут на искусственных питательных средах. Нередко богатая среда на основе МПА с добавлением прогретой крови, известная в бактериологии как шоколадный агар, для успешного культивирования нейссерий, гемофилов и менингококков нуждается в добавках нескольких факторов роста /17/. Есть фирмы, которые выпускают многочисленные комплексные ростовые добавки. Но известные добавки не являются универсальными. Не всегда такие добавки обеспечивают рост наблюдаемых в микроскопе штаммов в мазках клинического материла или на стеклах обрастания, помещаемых в окружающую среду.
В общей микробиологии давно известно, что на стеклах обрастания исследователи наблюдали много клеток, которые не удается высеять на искусственные питательные среды. Следовательно, задача конструирования питательных сред в общей и клинической микробиологии не решена окончательно.
По нашему мнению, часть задач такого типа можно решить, если перейти к средам максимально известного, контролируемого химического состава, в том числе и к синтетическим питательным средам. Современная тонкая химическая технология дает в руки микробиолога широкий набор коммерчески доступных углеводов, аминокислот, витаминов и прочих соединений, химиками разработаны методы разделения сложных смесей разнородных соединений и синтеза аналогов.
Математиками разработаны поисковые и оптимизационные планы многофакторных экспериментов, методы статистической обработки результатов качественных измерений или измерений с большой ошибкой, сравнимой с ответом системы. Существует много доступных программ для ПК, устранившие длительные, утомительные и ненадежные ручные вычислительные операции.
Вычислительная часть работы по поиску и оптимизации в микробиологии хорошо изложена /1,4/, не требует мощной техники и нередко достаточно уметь работать только с программируемым калькулятором. Имеются большие, постоянно пополняемые достижения общей физиологии и генетики микробов, которые служат теоретическим фундаментом для изучения конкретного продуцента.
Проведение поиска возможных регуляторных факторов иногда бывает проще осуществить путем конструирования семейства сред известного химического состава из индивидуальных химических соединений, синтетических питательных сред и добавок известных компонентов к питательным средам неизвестного состава, уменьшив до минимума компоненты типа сыворотки, крови или иного продукта из сырья природного происхождения с неизвестным составом. В идеале, вообще отказавшись от таких добавок. Тем не менее, осталось ряд проблем, мешающих широкому применению вышеназванных возможностей.
Несмотря на то, что в литературе описано колоссальное количество сред известного химического состава и синтетических питательных смесей и добавок для представителей различных таксономических групп микроорганизмов и культур эукариотических клеток, в литературе описана лишь очень общая стратегия конструирования таких сред. Недостаточно подробно рассмотрена роль активного многофакторного отсеивающего эксперимента для поиска регуляторных факторов нужных синтезов /1,4/, отсутствуют четко сформулированные критерии оптимальности поиска, а также недостаточно подробно прокомментированы слабые места и области применимости двухуровневых оптимизационных экспериментов. Планы трех — и более уровней варьирования управляемых переменных в литературе упоминают, но не приводят в конкретных работах и руководствах. В предлагаемой работе сделана попытка восполнить указанные пробелы в практической теории планирования эксперимента на примере микробиологических задач.
ВП, синтез микроорганизмами экономически важного целевого продукта в зависимости от концентрации регуляторных компонентов питательной среды (интенсивности фактора) имеет сложный вид. В общем случае это многомерная поверхность (поверхность отклика), о форме которой можно сделать достаточно общие предположения на основании большой работы, проведенной при изучении значительного количества конкретных объектов и опубликованных в многочисленных статьях и руководствах, а так же на основании собственных неопубликованных ранее данных.
Рисунок 1. Зависимость выхода процесса от концентрации метаболизируемого индуктора в питательной среде В простейшем случае, когда ВП зависит от одного фактора, можно отобразить зависимость в виде двумерной кривой, рис. 1. Можно выделить следующие участки 0-А допороговый уровень концентрации регуляторного фактора, нераспознаваемый микроорганизмом, не вызывающий нужного синтеза, А-В участок лимитирования, В-С уровень насыщения влияния регуляторного фактора, С-D участок ингибирования нужного синтеза контролируемым фактором (группой факторов). На рис. 1 отображен наиболее общий случай. Углы наклона кривой (первая производная) в каждой точке будут строго индивидуальны и могут варьировать в широких пределах. В частности, некоторые факторы могут не достигать уровня ингибирования, прерываясь на т.С., например аэрация для аэробов, интенсивность перемешивания и т. д.
При влиянии на ВП второго фактора кривая может сильно изменится (кривые 1 и 2, рис.1). Горизонтальные участки на зависимости ВП от интенсивности фактора говорят о переключении внутренних механизмов, возможно о включении новых оперонов — диауксия.
Для каждого конкретного продуцента и конкретного ВП необходимо определить количественно эти концентрации (интенсивности) и выделить их как управляемые переменные, за которыми необходим первостепенный контроль; найти общий фон прочих питательных веществ и условий культивирования, обеспечивающих возможность нужного синтеза, как достаточно постоянных параметров технологического процесса. Наибольшую важность для технолога представляет знание ширины участка насыщения и границы переходов на уровни лимитирования и ингибирования регуляторным фактором (технологический оптимум). Необходимо не только найти условия максимального выхода ЦП, но и описать пограничные условия снижения ВП и, по возможности, знать хотя бы некоторые условия, влияющие на снижение уровня ЦП от желаемого уровня.
Рисунок 2. Один из возможных видов участка поверхности отклика в окрестности максимума (случай двух переменных)
В пространстве участок поверхности отклика вблизи максимума будет представлен фрагментом параболоида или двухполостного гиперболоида. Максимальное значение функция отклика будет достигать в некой точке. С учетом неизбежной в практической работе ошибки измерения ВП и неустранимой ошибки в задании управляемых переменных — некая ограниченная область. С точки зрения технолога — наиболее удобный для практической работы вариант, поскольку небольшие изменения управляемых переменных не приведут к значительному изменению ВП, процесс будет достаточно устойчив к небольшим возмущениям.
Рис 3. Возможные проекции сечений поверхности отклика. Линии равного выхода. Случай двух переменных На рис. 3 а — поверхность отклика типа рис. 2 (шапочка), работу можно считать завершенной, технологический оптимум найден. Вариант 3 б — стационарное возвышение. В этом случае максимальное значение сосредоточено вдоль некой линии и достаточно протяженно. В пространстве на небольшом интервале — параболический или гиперболический цилиндр. Случай 3 в — близкий к случаю 3 б, просто меньшая кривизна поверхности отклика на достаточно большом участке. Эти варианты — возможный переходный этап к последующей работе — прохождению вдоль хребта. Идеальный случай — если удастся найти неострую вершину типа 3 а. Неплохой вариант — найти плато на хребте. В крайнем случае — найти такой участок хребта, где максимально пологие склоны. Такой вариант тоже обеспечит устойчивость технологического процесса.
Случай 3 г — седло, в одном направлении функция отклика возрастает, в другом убывает. Самый неудобный для технолога случай — неустойчивый оптимум. Дальнейшая работа по поиску оптимальной области затруднительна и проблематична, хотя и не удобна для технолога. Достаточно интересный и перспективный случай для исследователя. Нельзя исключить варианта, что удастся найти некие дополнительные условия культивирования, которые принципиально повлияют на метаболизм продуцента и поверхность отклика радикально изменится, перейдет в поверхности типа 3 а или 3 б. В пространстве — гиперболический параболоид, седловидная поверхность.
Рассмотрены простейшие случаи, могут быть поверхности и более сложной конфигурации, особенно с увеличением числа переменных. Но если работать в узкой области и оперировать набором двумерных сечений, то рассмотренных случаев вполне достаточно, чтобы можно было построит локальную модель и делать обоснованные прогнозы. Наличие ПК и многочисленных программ по работе с многомерными пространствами значительно облегчают техническую часть работы, но нет смысла искать программу, чтобы можно было ввести экспериментальные результаты, нажать кнопку, а далее списать готовый ответ. Хотя кое-кто рассчитывает именно на это.
Многие микроорганизмы растут на достаточно богатых средах, содержащих гидролизаты и вытяжки из различного сырья природного происхождения. Наиболее часто применяют гидролизаты растительного и животного сырья и вытяжки из этих же источников, выдерживающие автоклавирование при сохранении прозрачности без образования осадков, что необходимо для глубинного культивирования, но не обязательно для плотных питательных сред и сред для хранения культур.
При конструировании синтетических питательных сред и добавок заменяют компоненты питательных сред неизвестного или сложного состава на смеси индивидуальных химических соединений меньшего разнообразия, либо значительно снижают концентрации неизвестных или вариабельных компонент.
Все компоненты питательных сред можно разбить на достаточно независимые группы. Первая группа — неорганические компоненты. В первую очередь макроэлементы. Это, прежде всего, соли фосфорной кислоты, натрий, калий, магний, железо. Потом необходимо отметить микроэлементы — сера, кобальт, никель, цинк, медь и т. д. /16/.
Следующий класс — органические соединения. На первом месте — источники углерода, чаще всего — углеводы, сахароспирты, карбоновые кислоты и липиды. Указанные соединения можно разбить на группы — необходимые, взаимозаменяемые, нейтральные, не утилизируемые и токсичные. Методом полного или ограниченного перебора в серии однофакторных экспериментов несложно обоснованно выбрать наилучшую добавку. Углеводы утилизируются каждый по своей схеме и конкурируют между собой, обычно глюкоза или фруктоза усваиваются в первую очередь. Углеводы нет смысла проверять в смесях. Так же и карбоновые кислоты. Нередко углеводы и карбоновые кислоты не конкурируют, а дополняют друг друга, утилизируясь продуцентом по разным биохимическим путям. Липиды тоже могут не конкурировать с углеводами и карбоновыми кислотами и могут быть заменены водорастворимыми твинами /2,16/. И уже на этой стадии серия однофакторных экспериментов ограничена в своей пользе. Особых сложностей при работе с этими компонентами нет. Особой чистоты прочих реактивов при их поиске не требуется. Достаточно лишь быть уверенным в отсутствии потенциально конкурирующих примесей, например отсутствие глюкозы в галактозе, химическая чистота или известный состав жирных кислот и т. д.
На первой стадии наиболее простым шагом будет использование минеральной основы, описанной для родственного микроорганизма, с добавлением смесей аминокислот и витаминов и испытание разнообразных источников углерода, при минимальных добавках компонент неизвестного или вариабельного состава. Эта часть работы может быть выполнена по классической схеме как серия однофакторных экспериментов. Но, если будет найдено, что желательно или необходимо одновременное присутствие в среде как некоторого углевода, так и какой — ни будь карбоновой кислоты и липида, то метод Зайделя-Гаусса приведет к не всегда оправданной необходимости постановки большого количества экспериментов.
Для хемоорганотрофов нужны соединения азота в виде аминокислот и коротких пептидов, остающихся в растворимом виде после автоклавирования (пептоны) /16/. Возможно позитивное влияние и биогенных аминов (аспарагин, глутамин и т. д.). В большинстве случаев можно ограничиться только набором наиболее распространенных индивидуальных 20ти, хотя в некоторых случаях пептиды могут быть регуляторными факторами при синтезе конкретного ЦП. Аминокислоты могут требоваться не все, наиболее часто применяемые 20, а лишь некоторые. Для этого необходимо поставить многофакторный активный отсеивающий эксперимент и выбрать минимальную группу аминокислот, обеспечивающих нужный ВП.
При этом наиболее логично фиксировать макро и микро элементы и источник витаминов, в большинстве случаев, дрожжевой экстракт в разбавленном виде, чтобы уменьшить вклад аминокислот. Иногда применяют какой — ни будь поливитаминный комплекс медицинского или ветеринарного назначения, стерилизованный фильтрованием. Это более подходящий вариант, поскольку не содержит собственных аминокислот и пептидов, шире по содержанию витаминов, а возможные углеводы и прочие добавки можно учесть, либо значительно уменьшить их влияние разбавлением.
Поиск минимальной группы необходимых аминокислот можно делать, ставя ОЭ по методу случайного баланса на основе сверхнасыщенного плана Бута и Кокса (число проверяемых факторов больше количества испытаний в серии экспериментов) таб.1 /цит. по 1/. Названная серия испытаний позволяет проверить 20 наиболее часто встречающихся незаменимых аминокислот на 12ти экспериментальных точках. Для этого делают различные групповые выборки аминокислот из общего числа, по близкому к оптимальному плану, который проще всего отобразить в виде таблицы.
Единственность плана таб.1 не доказана, возможны импровизации. План близок к оптимальному, поскольку практически все теоретически возможные парные сочетания факторов учтены с равными частотами (большинство вектор — столбцов ортогональны). Но это в литературе не указано /1/. Согласно личному опыту, поисковые многофакторные планы на основе серии экспериментов достаточно устойчивы к небольшим промахам типа пропущенной или лишней добавки, в какую-либо проверяемую комбинацию.
Если хотя бы в одном опыте из серии экспериментов ВП достоверно отличен от 0, то задачу отсеивания можно считать решенной, поскольку найдена активная комбинация факторов среди весьма большого количества первоначально выбранных подозреваемых.
Таблица 1
План ОЭ «первого шага» Бута и Кокса для поиска минимальной группы необходимых аминокислот /1/
В первом столбце таб. 1 — номера экспериментов, далее — проверяемые факторы, в последнем столбце — количество верхних уровней в эксперименте. Структура плана таб.1. и обозначения факторов отличаются от принятых в литературе по планированию эксперимента /1,4/. Вместо безликих общепринятых (±) для уровней каждого фактора, предлагается нумерация верхнего уровня и пробел для нижнего. Это более удобно и логично. Особенно когда на нижнем уровне нет добавок, отсутствие фактора, либо размещается качественно иной фактор. Столбцы и строки первоначально описанного плана /1/ переставлены и частично упорядочены, что облегчает постановку опытов и уменьшает вероятность ошибки. Естественно, что план таб. 1 применим не только для аминокислот, а для любого набора факторов числом не выше 20. Сократить число столбцов можно всегда, но для случая, когда количество проверяемых факторов не выше 16, описан более оптимальный план таб.3 /3/.
В столбце 21 таб.1 приведены количества верхних уровней в каждом эксперименте. Большинство этих чисел колеблется в районе 8 — 9, что соответствует оптимальной выборке (разбиению на группы) при поиске небольшой (не более 3х индивидуальных соединений) группы активных факторов на фоне большого количества подозреваемых факторов, среди которых основная часть — нейтральные по влиянию на ВП. При этом выборка в 2/3 или в 1/3 от всей группы наиболее оптимальна в смысле быстрого нахождения активной группы, особенно при последовательной схеме, с постановкой уточняющих испытаний, что давно доказано математиками для аналогичных задач.
Таблица 2
Число общих верхних уровней в паре столбцов (факторов) — отклонения от ортогональности.
Ф | ||||||||||||||||||||
В таблице 2 приведено число общих верхних уровней в паре столбцов (факторов). Это указывает близость к оптимуму по равномерности учета парных сочетаний факторов для некоторых столбцов. Такое построение позволяет построить максимальное количество качественно разнообразных сред (условий культивирования) для выбранного количества испытаний. Для остальных столбцов данные не приведены, но частоты встречаемости пар верхних уровней колеблются в интервале от 2 до 4, что близко к оптимальному сочетанию в 3 пары для приведенного плана.
После постановки серии активных экспериментов достаточно провести ранжировку (упорядочить полученные измерения по возрастанию или убыванию) и выбрать серию опытов с максимальным ВП. Анализируя лучшие эксперименты в парах с худшими испытаниями, несложно сделать выводы о значимости той или иной группы без явной математической обработки и арифметических вычислений. Представление результатов в виде корреляционной таблицы уже является первой стадией математической обработки. И эта стадия весьма информативна, не смотря на простоту получения. К сожалению, редко используется в массовой работе.
Применение сериального критерия, или метода парных сравнений, которые строго сформулированы и обоснованы математиками, позволяет при минимальных арифметических расчетах сделать минимально субъективные выводы и оценить их надежность /7/. При большой ошибке измерения ВП может быть сложно выбрать единственное сочетание в первой же серии. Скорее всего, будет найден группа из 2−3 примерно равноценных экспериментов, недостоверно отличающихся друг от друга по величине ВП. Уточнить влияние компонентов найденной группы несложно в следующей серии испытаний.
Лучше сравнивать группы, сильно отличающиеся по ВП, при, желательно, небольшом качественном различии. Это несложно сделать, представив результаты в виде корреляционной таблицы, переставляя строки и столбцы первоначального плана в наиболее удобном и наглядном виде. Такое построение можно быстро сделать на любом ПК, не выходя за возможности современных текстовых редакторов и без применения специализированных математических программ. Автоматическую ранжировку результатов позволяют сделать даже многие программируемые калькуляторы.
Постановка поискового опыта по плану, близкому к ДФЭ высокой степени дробности значительно облегчает обработку результатов и повышает надежность выводов. В микробиологии при посевах на искусственные питательные среды стоимость каждого опыта, как правило, невысока, поэтому значительно удобнее применять план близкий к ДФЭ из двух противоположных планов Бута — Кокса. Если есть возможность, то нужно ставить максимальное количество опытов в серии и не держаться за свернасыщенную схему, когда количество проверяемых факторов больше количества единичных испытаний.
При возможности постановки ДФЭ, лучше выбрать план, в котором все вектор — столбцы ортогональны, поскольку в планах Бута-Кокса есть отличающиеся от ортогональности пары вектор — столбцов. Но это не обязательно, поскольку слегка избыточный план (количество опытов незначительно превышает количество проверяемых факторов, в данном случае 24 опыта на 20 факторов) весьма устойчив к небольшим отклонениям от строгой оптимальности и не единственный. Если приходится использовать экспериментальных животных, либо иные дорогостоящие опыты, то нужно решать о целесообразности выбора того или иного плана в каждом конкретном случае.
Если позволяют экономические возможности, то лучше поставить избыточную серию экспериментов (количество экспериментов хотя бы не на много превышает количество проверяемых факторов). В первой серии можно зафиксировать концентрации аминокислот, принятые для близкородственных объектов, на верхнем уровне. На нижнем взять 0-вые концентрации. Во второй серии поменять уровни местами, если ограничится планом таб.1. Тогда каждый эксперимент в серии будет иметь противоположный, что значительно облегчает обработку результатов в случае большой ошибки измерений, позволяя эффективно применить метод парных сравнений /7/. Это строго доказано математиками и подтверждено многочисленными экспериментальными работами. Кроме того, эксперимент будет содержать 24 опыта для 20 аминокислот. Это уже не сверхнасыщенная схема, а близкий к ДФЭ (в строгом смысле не есть ДФЭ, т.к. 24 испытания не есть степень 2) с близким к оптимальному набором опытов для поиска при минимальных начальных ограничениях. Такой план эффективен на первых шагах, при наличии только априорной и аналоговой информации достаточно общего характера.
Выбрав минимальную группу аминокислот, можно поставить уточняющую часть работы, применяя дробный или полный факторный эксперимент, что определяется, прежде всего, экономическими возможностями.
Для поиска минимальной группы необходимых витаминов может подойти сверхнасыщенный план Бута и Кокса таб. 3 /цит. по 1/, позволяющий проверить различные выборки из 16 факторов на 12 экспериментах при фиксированном фоне неорганических компонент, углеводов, аминокислот и пептидов. Такой план несколько лучше в смысле разнообразия сред (условий), чем план таб.1 из которого случайным образом отброшены 4 столбца. Приводимая здесь запись плана таб. 3 тоже отличается от принятой в литературе /1/ и была подвергнута небольшим преобразованиям, аналогично плану таб.1. Микроэлементы тоже можно проверить, применяя указанный выше план таб.3 для витаминов на фиксированном фоне прочих соединений.
Если количество подозреваемых факторов невелико (около 10), то рациональнее взять в качестве плана дробную реплику максимальной дробности от ПФЭ и противоположный по уровням план, с превышением числа опытов над числом факторов, либо ДФЭ с подходящим количеством факторов и испытаний. На первых стадиях изучения объекта невозможно указать единственный оптимальный план, слишком велико разнообразие начальных условий. Необходимо прочувствовать логику выбора близкого к оптимальности плана, поскольку абсолютно оптимального и единственного не существует. Превышение числа единичных опытов над числом факторов только повысит надежность и скорость нахождения активной группы и определяется, прежде всего, экономическими возможностями.
Как и при поиске витаминов, поиск микроэлементов требует повышенной чистоты воды и посуды. Желательно применять посевной материал в виде отмытых клеток, чтобы уменьшит систематическую ошибку, вносимую с инокулятом, поскольку витамины и микроэлементы действуют в количествах от микрограммов на литр и могут очень сильно влиять на синтез целевого продукта /16/.
Последовательную процедуру поиска лучше проводить по схеме — макроэлементы; источники углерода; аминокислоты; витамины; микроэлементы; повышая степень чистоты на каждом этапе и уменьшая концентрации неконтролируемых по составу добавок, типа сыворотки или иных слабо охарактеризованных по составу вытяжек и гидролизатов из сырья природного происхождения.
Таблица 3
ОЭ План «первого шага» Бута и Кокса для поиска минимальных необходимых групп витаминов или микроэлементов /1/.
В таб. 3 — 17-й столбец содержит числа верхних уровней в каждом эксперименте, столбец 1 — порядковые номера единичных испытаний. Остальные обозначения аналогично таб. 1.
Таблица 4, план ОЭ первого шага поиска, близкий к оптимальному.
№ э/ф | 1−2 | 1−3 | 1−4 | 1−5 | 2−4 | 2−5 | 1−10 | 1−11 | 2−6 | 2−10 | 3−4 | 4−5 | 3−5 | 4−5 | 2−9 | В у | ||||||
Учет верхних уровней в серии экспериментов таб. 4
Верхних экспериментов уровней
7 — 2
8 — 4
9 — - 7
10 — 4
11 — 3
12 — 2
14 — 1
20 — 1
В оптимальный для поиска активной группы интервал 30 -70% выборки факторов попадают 19 из 20 экспериментов.
План содержит испытание № 12, в котором все факторы на верхнем уровне, что является внутренним стандартом для проверки влияния на ВП выборок с меньшим количеством факторов. Если испытание № 12 не является лучшим по значению ВП, то нужны не все выбранные факторы.
питательный среда фермент антиген антибиотик Таблица 5
Число верхних уровней в паре столбцов (факторов), — отклонения от ортогональности
В таб. 5 приведены числа верхних уровней в паре столбцов, что указывает близость к оптимуму по равномерности учета парных сочетаний факторов для первых двух столбцов. Для остальных столбцов данные не приведены, но частоты пар верхних уровней колеблются в интервале от 2 до 4, что близко к оптимальной частоте в 3 общих пары.
После постановки серии активных экспериментов достаточно провести ранжировку и выбрать серию опытов с максимальным выходом процесса. Анализируя эти эксперименты в парах с худшими, несложно сделать выводы о значимости той или иной группы без явной математической обработки и арифметических вычислений. При большой ошибке измерения ВП может быть сложно выбрать единственное сочетание в первой же серии. Скорее будет найден группа из 2−3 примерно равноценных экспериментов, недостоверно отличающихся друг от друга по величине ВП. Лучше сравнивать группы, сильно отличающиеся по выходу процесса, при, желательно, небольшом качественном различии. Это несложно сделать, представив результаты в виде корреляционной таблицы, переставляя строки и столбцы первоначального плана в наиболее удобном и наглядном виде. Для этого достаточно возможностей простейшего текстового редактора для любого ПК, без использования специализированных математических и статистических пакетов прикладных программ.
После нахождения сильно действующих групп факторов из разных классов, можно перейти к поиску многокомпонентной синтетической добавки, уменьшая компоненты неизвестного состава и применяя отсеивающие эксперименты по сверхнасыщенной схеме для большего количества факторов. Не исключена сильная связь между компонентами питательной среды из разных классов и при возможности это нужно проверить экспериментально. В руководстве Максимова, Федорова /1/ приведено много планов, позволяющих проверить до 32 факторов на 16 экспериментальных точках при обычной расстановке факторов и до 64 факторов при описанной выше расстановке двух факторов в одном столбце, размещая каждый фактор на своем уровне (сверхнасыщенность второго типа).
Сверхнасыщенные планы Бута и Кокса /цит. по 1/ в этом отношении предпочтительнее построенных путем комбинации случайных выборок из проверяемого множества подозреваемых факторов без каких-либо явно формализованных критериев.
Критериями оптимальности отсеивающих экспериментов можно считать учет парных сочетаний факторов с равными частотами (ортогональность вектор — столбцов), что позволяет более полно учесть сочетания высших порядков и увеличить качественное разнообразие испытуемых вариантов питательных сред при ограниченном количестве опытов в серии, обеспечить близкое к максимальному разнообразие для выбранного количества испытаний /5/. Для этого лучше всего подходят серии экспериментов с числом, кратным 4. Количественно выборки из проверяемой группы подозреваемых факторов в каждом опыте желательно должны попадать в интервал от 30 до 70% от всей проверяемой группы, незначительно отличаясь в большую или меньшую сторону в небольшом количестве опытов одной серии. Это близкая к оптимальной тактика поиска небольшой группы связанных между собой сильно действующих факторов среди достаточно большого подозреваемого множества и вероятного большого количества нейтральных, пассивных по влиянию на ВП, сочетаний факторов, строго доказанная математиками.
Как уже отмечалось выше, такие планы не единственные и устойчивы к небольшим и редким промахам (единичным) типа лишнего или не добавленного компонента в каком-либо опыте серии экспериментов. Промахи почти неизбежны в практической работе и давно описаны несложные методы их выявления и учета /7/. Таким методом, прежде всего является ранжировка результатов (упорядоченное расположение от большего к меньшему или наоборот) и отбрасывание «выскакивающих» значений, сильно отличающихся от средне ожидаемых. При поиске есть смысл более тщательно проверить «выскакивающие» результаты, поскольку они могут содержать в себе искомую группу регуляторных факторов.
Приведенные выше планы Бута и Кокса эффективны и при выяснении питательных потребностей ауксотрофов после мутагенеза некого штамма с известными питательными потребностями, отбора и характеристике полученных мутантов. Причем для этого случая названные планы более оптимальны, чем для случая поиска регуляторных факторов у неизученного штамма. После мутагенеза, как правило, новые потребности в витаминах или аминокислотах связаны с одним фактором роста, множественные мутации редки, работа проводится с объектом, физиология которого хорошо изучена. При работе с новым, плохо изученным продуцентом задача гораздо сложнее.
Нахождение известных компонент питательной среды, влияющих на синтез целевого продукта, дает хорошую основу для генетической модификации продуцента. Знание основных регуляторных факторов служит основой для селекции конститутивных мутантов после индуцированного мутагенеза исходного штамма. Это в принципе дает возможность применять дешевые компоненты питательных сред, минимально охарактеризованные по составу.
Возможен и другой путь — синтез аналогов регуляторных факторов, которые доставляют в клетки нужные питательные вещества, не реагируя с опероном синтеза целевого продукта. Такие работы проводили с большим количеством штаммов разные авторы и их конкретные результаты мало что дают при изучении нового объекта.
Для проведения поиска факторов, влияющих на синтез целевого продукта, можно выбрать план, представленный в таблице 4. В отличие от обозначений факторов двухуровневых планов, принятых в литературе /1,4/ в виде (+/-), введена нумерация каждого фактора на верхнем уровне и отсутствие обозначений для нижнего уровня. Номер столбца соответствует новому фактору.
Таблица 6
План разработанного отсеивающего эксперимента
№ эф | 1−2 | 1−3 | 1−4 | 2−3 | 2−4 | 3−4 | 3−5 | 4−5 | 4−6 | 4−8 | 7−8 | |||||
По горизонтали таб.6 приведена нумерация факторов, по вертикали в первой колонке — нумерация экспериментов. План таб.6 разработан для проверки 15 факторов на 16 экспериментах из ДПФЭ 24 путем добавления столбцов, которые получены линейной комбинацией исходных первых 4 х по правилу таб. 7 /1/. В верхней строке указаны номера основных исходных столбцов и номера столбцов, послужившие основой для построения нового. В этом смысле план единственный, поскольку дальнейшее увеличение количества столбцов по описанному выше алгоритму не приводит к получению новых столбцов, варианты повторяются.
Таблица 7
Правило построения столбца 5 из линейной комбинации столбцов 1 и 2
Предлагаемый план табл.6 лучше, чем план табл.8 /1/, так как скалярные произведения любых пар вектор — столбцов равны 0. Этот факт имеет понятную для экспериментатора интерпретацию — все возможные сочетания факторов по 2 в серии из 16 экспериментов входят с одинаковой частотой, что приводит к более полному и равномерному учету сочетаний факторов более высоких порядков и не дает априорного преимущества ни одному из выбранных сочетаний факторов, по крайней мере для уровня парных сочетаний. Это важно на первоначальном этапе работы, при минимальной начальной информации, поиску, близкому к случайному, слабо ограниченному какой-либо гипотезой или априорной информацией. При этом желательно рассмотреть максимальное количество качественно разнообразных вариантов условий культивирования при минимальном количестве экспериментов. Критерии разнообразия вариантов условий культивирования сформулировать непросто, их можно принять на интуитивном уровне.
Работа с сериями питательных сред позволяет уменьшить систематическую ошибку при оценке ВП и учесть сильное межфакторное взаимодействие между условиями культивирования. Необходимость учета взаимодействия факторов становится особенно ясной, если принять во внимание, что отдельные факторы, не оказывающие сами по себе прямого влияния на урожай, могут существенно влиять на него благодаря взаимодействию с другими факторами среды /1−5/.
Очень важно, что серия активных опытов по плану, близкому к оптимальному, позволяет оценить тенденцию влияния того или иного фактора или комбинации факторов на ВП. Это позволяет более рационально и обоснованно ставить последующие эксперименты.
Кроме этого, план табл.6 отвечает априорному предположению, что, согласно сериальному критерию /7/, наиболее значимый фактор — 1 — на верхнем уровне. Второй по значимости — фактор 2 на нижнем уровне — в предположении того, что остальные не значимы или малозначимы. Эти выводы (нуль — гипотеза) сделаны при условии, что самый лучший эксперимент -1, худший — 16, остальные по убыванию выхода процесса упорядоченно расположены по зависимости, убывающей по закону, близкому к обратно экспоненциальному, либо обратно пропорциональному (рис 4. кривая 1).
Поскольку ошибку измерения ВП бактериальной популяции сложно сделать менее 20%, то первые несколько экспериментов по уровню ВП могут достоверно между собой не отличаться. Согласно сериальному критерию /7/ выбор фактора 1 на верхнем уровне в качестве значимого при указанном распределении будет сделан с надежностью свыше 90% (группа факторов свыше 8), надежность выбора второго на нижнем уровне — не хуже 80% (группа факторов из 4-х). Такое расположение учитывает интуитивный выбор экспериментатором наиболее значимых факторов на первые места.
После постановки эксперимента и ранжировка согласно полученным результатам эта гипотеза может быть принята или отвергнута, если получится иное расположение экспериментов, отличающееся от распределения таб.6, которое предлагается назвать каноническим. Распределение рис. 2, кривая 1 — неплохой результат для первого ОЭ, поскольку есть серия экспериментов с ВП, достоверно отличным от 0 и есть серия с ВП, близким к 0, что позволяет сразу сократить количество подозреваемых факторов, отбросив явно нейтральные по влиянию на ВП комбинации факторов. Гораздо хуже, когда во всех экспериментах ВП практически одинаков. Но если ВП = 0 во всей серии, то означает, что среди выбранных факторов нет искомых регуляторных и это самый худший вариант.
Таблица 8
План отсеивающего эксперимента /1/
№ э. | |||||||||||||||
; | ; | ; | ; | ; | ; | ||||||||||
; | ; | ; | ; | ; | ; | ; | ; | ; | ; | ||||||
; | ; | ; | ; | ; | _ | ||||||||||
; | ; | ; | ; | ||||||||||||
; | ; | ; | ; | ; | ; | ; | ; | ; | ; | ||||||
; | ; | ; | ; | ||||||||||||
; | ; | ; | ; | ; | ; | ||||||||||
; | ; | ; | ; | ; | ; | ; | ; | ; | ; | ||||||
; | ; | ; | ; | ; | ; | ||||||||||
; | ; | ; | ; | ; | ; | ; | ; | ; | ; | ||||||
; | ; | ; | ; | ; | ; | ; | ; | ; | ; | ||||||
; | ; | ; | ; | ; | ; | ; | ; | ; | |||||||
; | ; | ; | ; | ; | ; | ||||||||||
; | ; | ; | ; | ; | ; | ||||||||||
; | ; | ; | ; | ||||||||||||
; | ; | ; | ; | ; | |||||||||||
В отличие от предлагаемого плана табл.6, описанный ранее /1/ насыщенный двухуровневый план ОЭ табл. 8 имеет недостатки. Пары вектор — столбцов 1−7, 1−8, 1−9. 1−10, 1−11, 1−12, 1−13, 1−14 неортогональны. Следствием этого является то, что число общих пар факторов в серии из 16 экспериментов отличается от 4.