Методы QSAR и его роль в общей процедуре тестирования генотоксичности

QSAR  в системе оценки мутагенности

 

Роль структуры химических мутагенов в эффективности индукции тех или иных генетических изменений изучается фактически с момента открытия химического мутагенеза. Не вдаваясь в историю этого вопроса, можно отметить, что исследования зависимости между структурой химического соединения и проявляемой им биологической активностью (в частности, мутагенной) опираются на основное положение структурной теории химии, утверждающее, что химическая структура определяет основные физико-химические свойства данного соединения. Это положение послужило основанием для выделения у химических соединений определенных факторов (дескрипторов) и установления связи, качественной (SAR) или количественной (QSAR), между ними и биологической активностью соединения. В качестве таких дескрипторов используются различные характеристики молекулы:

топологические – фрагменты структуры (подструктурные дескрипторы), индексы атомов и связей, каппа-индексы, описывающие форму молекулы, индексы молекулярных связей (MCI);

квантовые параметры – энергии HOMO (высшей занятой орбитали) и LUMO (низшей незанятой орбитали), заряды на различных атомах, электронные плотности, поляризуемости;

параметры, относящиеся к целой молекуле – молярная рефракция, коэффициент распределения октанол-вода.

Применительно к генотоксичности толчком к применению методологии SAR и QSAR послужили представления, развитые в конце 70-хх годов Миллером и Миллером [1] о решающей роли электрофильности в способности химических соединений реагировать с ДНК и индуцировать мутагенез и канцерогенез. Основываясь на этой концепции, Эшби ввел понятие “структурного алерта”, представляющего собой структурный сигнал опасности в молекулах химических соединений. Эшби и Теннан [2] сделали выборку наиболее часто встречаемых в молекулах генотоксикантов электрофильных групп – “структурных алертов” и объединили их в гиперструктурную молекулу. Сравнивая эту гипотетическую молекулу с молекулами соединений, для которых нужно предсказать генотоксические свойства, можно выявить в этих соединениях наличие “структурных алертов”. Тогда, следовательно, такие соединения могут считаться потенциальными мутагенами и канцерогенами. Прогностическая значимость оценки, основанной на наличии или отсутствии алертов в молекуле близка к показателям в тесте Эймса [2].

Но если “структурные алерты” показывают только потенциальную возможность молекулы проявлять генотоксическую активность, то возможные модуляторы биологической активности уменьшают или увеличивают этот потенциал. Такими модуляторами могут являться реактивность, растворимость соединения, существование специфических метаболических сайтов. Причем, при анализе нельзя смешивать функции “структурных алертов”, ответственных за активность, с функциями модуляторов, что может привести к ложным предсказаниям.

Определение множества дескрипторов для каждой молекулы, их корреляций с мутагенной/канцерогенной активностью, отбор наиболее значимых дескрипторов, вносящих наибольший вклад в биологическую активность, требуют использования специальных компьютерных программ. Наиболее перспективными с точки зрения предсказания генотоксичности можно считать пакеты программ CASE, MULTICASE, META [3, 4, 5].

 

Перспективные методы QSAR.

 

Программы CASE и MULTICASE.

Для анализа взаимосвязей между мутагенной/канцерогенной активностью и структурой наиболее применимыми и надежными считаются методы, базирующиеся на экспертной оценке, которая сравнивает и категоризирует структуры новых соединений в соответствии с информацией, извлекаемой из большой базы данных. Таковы программы CASE (Computer Automated Structure Evaluation) [3] и MULTICASE [4].  Последняя является модификацией первой, включающей иерархический отбор дескрипторов.

 CASE – обучаемая программа, начинает свою работу со считывания всех структур в обучающей выборке и их фрагментирования на цепочки по 2-10 связанных неводородных атомов, затем программа для этих фрагментов оценивает вероятность их соотношения с активностью, используя биноминальный и другие статистические методы. В отличие от CASE, MULTICASE отбирает наиболее значимые из этих фрагментов как биофоры, считая их ответственными за активность, наблюдаемую у соединений, содержащих эти фрагменты. Таким образом, биофор понимается как участок локализации основных реакций, приведших к появлению активности. Затем программа идентифицирует внутри уменьшенной обучающей выборки  молекул, содержащих биофоры, фрагменты и физико-химические свойства, играющие роль в модуляции активности биофоров.

CASE и MULTICASE –анализ полностью автоматизирован и  удобен для пользователя. Для оценки новой молекулы (анализируемая выборка) программа сначала проверяет наличие в ней биофоров, если их нет, то молекула предсказывается как неактивная; если молекула содержит биофоры, тогда исследуется наличие модуляторов для этих биофоров – результатом является качественное и количественное предсказание активности. Получаемые уравнения QSAR  действительны только внутри домена, определяемого соответствующими биофорами.

 

МЕТА – программа.

Канцерогенность и мутагенность часто ассоциируется с электрофильным потенциалом молекулы, однако, электрофильность молекулы может выявиться или сразу, или после одного или нескольких этапов метаболической трансформации. Для решения проблемы метаболической трансформации ксенобиотиков была создана экспертная программа МЕТА [5], которая  использует предварительно установленные правила в идентификации структурных  мишеней для некоторых ферментов и преобразует эти мишени, имитируя метаболическую трансформацию.

Множество известных метаболитов может быть классифицировано в соответствии с их потенциальной биологической активностью по различным критериям: терапевтически активный, неактивный экскретируемый, неактивный неэкскретируемый, потенциально токсичный т.д. Различные метаболиты могут локализоваться в различных тканях в зависимости от способа введения, коэффициента распределения, способности связываться различными белками и от специфических для соединения механизмов действия.

Взаимодействие специфического фермента и данной молекулы возможно при определенном уровне растворимости данной молекулы. Например, циотхром Р-450 имеет тенденцию к существованию в липофильном окружении, поэтому молекула с низкой липофильностью имеет меньшую вероятность подвергнуться воздействию этого фермента. Проблема влияния растворимости на метаболическую трансформацию решается с помощью программы LOGP, входящей в пакет МЕТА, и рассчитывающей коэффициенты распределения октанол-вода. В зависимости от расчетной величины logP, молекула подлежит или не подлежит трансформации соответствующим ферментом, также оценивается ее способность проходить через мембрану или двигаться от органа к органу.

Наиболее распространенным структурным элементом многих ксенобиотиков являются ароматические кольца с делокализованными двойными связями. Для оценки способности метаболитов таких молекул подвергаться, например, окислению цитохромом Р-450, привлекаются квантово-химические параметры.

Большинство данных касается путей биотрансформации различных метаболитов для животных, а не для человека. Поэтому первый этап оценки стабильности метаболитов, основывается на общих для всех видов реакциях, а специальные задачи могут быть решены с учетом различий метаболизма между видами. В отдельных случаях могут рассматриваться генетически обусловленные индивидуальные вариации метаболизма, такие как полиморфизм, связанный с N-ацетилированием и P-450-опосредованным окислением.

После каждого этапа трансформации программа с помощью словаря спонтанных реакций оценивает стабильность полученного метаболита и продолжает трансформировать структуру до образования конечного продукта, нестабильные метаболиты автоматически разрушаются. Метаболиты, оцениваемые как потенциально мутагенные/канцерогенные, вносятся в базу данных CASE или MULTICASE.

 

Уравнения QSAR.

 

Конечным результатом анализа является линейно-регрессионное QSAR-уравнение, содержащее наиболее значимые дескрипторы с соответствующими коэффициентами примерно такого вида: 

log(A)= Sxi*zi + m

где А - это какой-либо биологический ответ, xi - дескриптор, который описывает присутствие или отсутствие i-ого заместителя, zi - вклад i-ого заместителя в log(A), m -константа;

Как видно из этого уравнения они описывают линейную аддитивную комбинацию свойств заместителей в молекуле, между тем нелинейные взаимодействия вносят существенный вклад в биологическую активность. В основном, нелинейные эффекты обусловлены:

- кинетикой транспорта и распределения соединения в биологической системе;

- лимитом пространства для взаимодействия гидрофобных групп с сайтом связывания;

- аллостерическими эффектами;

- возрастающим метаболизмом липофильных аналогов;

-ингибированием конечного продукта липофильными продуктами ферментных реакций;

- ограниченной растворимостью высших аналогов;

- принципом минимальной оккупации рецептора.

Для математического описания основных нелинейных эффектов, связанных с липофильностью, Ханч сформулировал параболическую модель [6]. Его уравнение включает квадрат параметра, описывающего липофильность и  выглядит следующим образом:

log(A)= as  + bp + cp2 + dEs + eMR + f

где p Ханча измеряет липофильность (гидрофобность), Es Тафта - стерические факторы, MR - молярную рефракцию и дисперсионные силы, а s Хаммета  - электронные взаимодействия. Величины s, p, Es, MR относятся к отдельным заместителям и определяются по таблицам.

Была сделана компьютерная модель транспорта в биологической системе с гипотетическими константами и  она не показала существенного отклонения от  сторон параболы, что говорит о хорошем соответствии модели Ханча конкретным взаимодействиям.

Нами проведено сравнительное изучение мутагенной активности производных бифенила, флуоренона, фенантренхинона, пирена и его гетероциклических аналогов в тесте Эймса на штамме Salmonella typhimurium TA 1538 (всего 60 соединений). Большинство из исследованных соединений показало мутагенную активность и некоторые из них индуцируют до 7000 ревертантов/нмоль [7-10]. Анализ полученных данных выявил, что пара- положение нитро-, амино- групп определяет высокую мутагенную активность, наличие же заместителей (нитро-, ацетил-, карбонил- ) в других положениях ослабляет или усиливает эту активность.

Для получения уравнений QSAR  на выборке исследованных соединений были выбраны следующие дескрипторы:

d1 – энергия нижней незанятой молекулярной орбитали (LUMO);

d2 – величина максимального заряда на атоме азота;

d3 – величина максимального заряда на атоме кислорода;

d4 logP (липофильность);

d5 – наличие нитрогруппы в пара- положении;

d6 – наличие аминогруппы в пара- положении;

d7 – наличие заместителей в мета- и орто- положениях.

Квантово-химические параметры каждой молекулы рассчитывали по методу Хюккеля, анализ корреляций между дескрипторами и мутагенной активностью проводили с помощью программы “EMMA” (Effective Modeling of Molecular Activity),  которая позволяет осуществить множественный линейный регрессионный анализ [8, 9] .

Соединения были разделены на 2 группы: первая включала гетероциклические аналоги пирена, производные фенантрена и флуоренона; вторая – производные бифенила.

Была получена серия регрессионных уравнений со следующими параметрами:

Nhis+ - число his+ ревертантов при дозе 7.5 нмоль/чашку;

R – коэффициент корреляции между экспериментальными и прогнозируемыми значениями логарифма числа his+ ревертантов;

Sv – среднеквадратичная ошибка прогноза логарифма  his+ ревертантов в контрольной выборке;

F - значение критерия Фишера;

Для гетероциклических аналогов пирена и производных фенантрена и флуоренона (всего 39 соединений) были получены следующие уравнения QSAR:

ln(Nhis+) = 0.88 d1 + 2.08 d5 + 1.07                                                  (1)

R = 0.72; Sv = 1.31; F = 14.72

ln(Nhis+) = - 1.05 d1 + 1.84 d5 – 0.34 d7 + 1.04                                 (2)

R = 0.75; Sv = 1.24; F = 11.25

ln(Nhis+) = - 2.64 d1 – 1.10 d2 – 8.93 d3 – 1.34 d5 + 0.89 d6 – 3.93   (3)

R = 0.80; Sv = 1.21; F = 6.68

Для замещенных бифенилов (21 соединение) были получено следующее уравнение:

ln(Nhis+) = 2.1 d1 – 0.57 d4  - 0.13                                                     (4)

R = 0.82; Sv = 1.12; F = 16.37

Для всех соединений, т.е. для объединенной группы соединений, было получено уравнение:

ln(Nhis+) = 1.77 d1 – 0.22 d2 – 0.90 d5  – 0.52                                   (5)

R = 0.75;  Sv = 1.94; F = 18.80

Все эти соединения удовлетворительно прогнозировали мутагенную активность контрольных выборок соединений (3 производных пирена и фенантрена и 2 производных бифенила).

Следует отметить, что во всех уравнениях присутствует дескриптор d1 – энергия LUMO, которая характеризует способность соединения реагировать с нуклеофилами, т.е. его электрофильность. Для замещенных бифенилов (уравнение 4) QSAR-уравнение включает только 2 дескриптора: d1 и d4 , характеризующие энергию LUMO и степень липофильности, соответственно.

Анализ уравнений QSAR, характеризующих взаимосвязь структура-активность в группе разнородных соединений, включающей гетероциклические аналоги пирена, производные фенантрена и флуоренона показывают, что величина R зависит от числа включенных в уравнение дескрипторов (уравнения 1 – 3). Например, R = 0.80  достигается только при включении в QSAR-модель таких дескрипторов как d2 и d3, характеризующих величину максимального заряда на атомах азота и кислорода, соответственно. Вместе с тем наличие в этом уравнении дескрипторов d5  и d6 , характиризующих наличие нитро- и амино- группы в пара- положении, соответственно, отражает наши эмпирические выводы, сделанные на основе анализа экспериментальных данных.

Объединенная выборка описывалась уравнением 5 (R=0.75), которое включало такие дескрипторы как d1 – энергия LUMO (электрофильность), d4  - logP (липофильность), d5 – наличие нитро- группы в пара- положении молекулы.

Дальнейшее повышение коэффициента корреляции между экспериментальным и прогнозируемым значением мутагенной активности (логарифм числа his+ ревертантов) достигалось только при увеличении числа квантово-химических и подструктурных дескрипторов. Однако, как известно, увеличение числа дескрипторов в уравнениях QSAR, с одной стороны повышает точность прогноза, с другой стороны сужает круг прогнозируемых структур [11]. Это может привести к тому, что уравнение с высоким уровнем значения коэффициента корреляции (R>0.90) и общим количеством дескрипторов будет прогнозировать активность в реальной ситуации не лучше, чем уравнения с дескрипторами, характеризующими наиболее общие свойства обучающей выборки, поскольку речь идет о конкретных количественных показателях (количество his+ ревертантов, процент клеток с хромосомными аберрациями и т.д.), а не о качественных характеристиках, таких как “активен “ и “неактивен.”

В целом, прогностическая ценность уравнений QSAR зависит от ряда общих проблем, касающихся принципов подготовки материала для анализа методами SAR и QSAR. Это связано с тем, что сами подходы к изучению взаимосвязи структура-активность основаны на использовании и экспертной оценке существующих знаний о физико-химических свойствах исследуемых соединений и о механизмах их биологической активности. Все это зависит от современного уровня знаний, точек зрения, предположений, которые могут быть верными и неверными.

 

 

Общие проблемы использования методов SAR и QSAR.

 

Размер и неоднородность базы данных.

От размера и однородности обучающей выборки зависит прогностическая способность уравнений QSAR. Большая и однородная база данных, полученная на группе родственных соединений, позволяет получить уравнение с высокими предсказательными возможностями и с ограниченным числом дескрипторов, описывающих главные свойства химических соединений, с которыми связано наличие или отсутствие биологической активности (например, уравнение 4 для производных бифенила). Неоднородная база данных и, соответственно, такая же обучающая выборка, не позволяет получить уравнения с высокими предсказательными возможностями (уравнение 1). Увеличения значения R для таких выборок можно достичь только за счет увеличения ее размера или числа дескрипторов (уравнение 3).

 

Проблема выделения дескрипторов.

В принципе, в качестве дескрипторов для включения в уравнения QSAR можно использовать всевозможные квантовые, физико-химические свойства и структурные характеристики, а затем с помощью статистических процедур отбирать те из них, которые лучше всех коррелируют с активностью. Однако, такой подход нуждается в проведении большой предварительной работы, например, расчета квантово-химических параметров для каждого соединения, включенного в базу данных, с помощью специальных программ. Поэтому при анализе структура-активность химических мутагенов особое внимание уделяется механизмам мутагенного действия химических соединений (алкилирование, интеркаляция и др.). Так, известно, что мутагенная активность отражает способность молекул к реакции с азотистыми основаниями ДНК. В таком случае общим свойством соединений с мутагенной активностью является наличие в их молекуле электрофильных свойств или эти сайты образуются в результате метаболизма. Недостатком подобного подхода является то, что для выделения таких “структурных алертов” необходимы глубокие знания химии и метаболизма соединений, чего нет на практике, и то, что электрофильная теория не может быть признана единственно верной. Анализ существующих баз данных по мутагенной активности нитроароматических соединений и ароматических аминов показывает, что чтобы отличить мутагенные соединения от немутагенных при наличии у всех структурного алерта – нитро-  или амино- группы, необходимо обязательно учитывать наличие дескрипторов-модуляторов мутагенной активности. Из уравнений   2 и 3 следует, что включение в уравнение таких позиционных эффектов, как наличие заместителей в пара-, орто-, мета- положениях,  увеличивает его прогностическую значимость. Если энергию LUMO, отражающую электрофильность молекулы и logP - показатель ее биологической доступности, принять за основные дескрипторы, то другие дескрипторы являются модуляторами мутагенной активности.

Путем пошагового отбора квантово-химических дескрипторов с максимальным индивидуальным коэффициентом корреляции с мутагенной активностью нами было получено следующее уравнение  для   бифенильных  соединений:

ln(Nhis+) = - 111 d1 – 2.66 d2 – 36.7 d3 – 10.4 d4 + 0.967                (6)

R = 0.95; Sv = 0.69; F = 35

где d1 – минимальный квадрат коэффициента вклада атомной орбитали углерода в низшую свободную молекулярную орбиталь;

d2 – минимальный квадрат коэффициента вклада атомной орбитали азота в низшую свободную молекулярную орбиталь;

 d3 –максимальный индекс свободной валентности на атоме углерода;

d4 – среднее значение индекса свободной валентности на атомах кислорода.

Данное уравнение отличается от уравнения 4 для бифенилов высоким уровнем коэффициента корреляции R=0.95. Однако, оно не отражает возможного механизма мутагенного действия соединения и не имеет очевидного биологического смысла, что затрудняет его восприятие с точки зрения биолога-экспериментатора. Поэтому при выборе дескрипторов всегда возникает дилемма как поступить – выбрать дескрипторы исходя из одних механизмов мутагенного действия и результатов анализа экспериментальных данных или перебирать всевозможные квантовохимические параметры.

Как показывает опыт, в первом случае получаем уравнения с коэффициентом корреляции между экспериментальными и прогнозируемыми значениями показателя мутагенности R от 0.80 до 0.90, а во втором – более 0.90. Однако, реальная предсказательная ценность уравнений второго типа пока остается неизвестной.

 

Проблема экспертизы баз данных и выработки алгоритма

QSAR – анализа.

Следует отметить, что при существующем разнообразии программ QSAR  и баз данных по мутагенной активности химических соединений в различных тест-системах, достаточно корректное уравнение QSAR можно получить только при совместной работе биологов, химиков, математиков. Первая задача заключается в определении цели – получить коэффициент корреляции между активностью и структурными особенностями молекулы (качественный анализ – SAR) или получить коэффициент корреляции между экспериментальными и прогнозируемыми значениями мутагенной активности (количественный анализ – QSAR). В последнем случае количественные экспериментальные данные анализируются и формализуются (log числа his+ ревертантов/нмоль; log  числа хромосомных аберраций на 1 кл/на ед. дозы). Затем решается вопрос об однородности базы данных с точки зрения структур химических соединений. Если принимается обоснованное решение о разделении базы данных на подгруппы, исходя из химических структур, то дальнейший анализ проводится для каждой подгруппы по отдельности. Выбор дескрипторов зависит как от общих знаний механизма мутагенного действия, так и от возможности программ, которые предполагается использовать для расчета квантовохимических параметров и анализа фрагментов структур, а также для регрессионного анализа связи между рассматриваемыми дескрипторами и мутагенной активностью.

В конечном итоге выбираются те уравнения QSAR, которые достаточно удовлетворительно прогнозируют активность соединений, отнесенных к контрольной выборке.

 

Место QSAR в системе оценки мутагенности.

 

В большинстве исследований по изучению зависимости структура-активность использованы результаты тестирования химических соединений на мутагенную активность на штаммах S. typhimurium в тесте Эймса. Для QSAR – анализа были использованы самые различные подходы, однако наибольшее число исследований проведено с использованием метода CASE. В настоящее время имеются данные анализа почти всех основных групп химических соединений от алкилирующих агентов до полициклических ароматических углеводородов. Пока рано говорить об общеизвестных уравнениях, описывающих зависимость мутагенной активности от структуры тех или иных классов химических соединений. Вместе с тем, имеющиеся данные свидетельствуют о том,  что методология QSAR может быть с успехом использована для внеэкспериментального прогноза активности новых соединений, если они относятся к тому или иному ряду химических соединений, для которых уже имеются уравнения QSAR. Это имеет большое значение при установлении очередности, а в ряде случаев  глубины, экспериментальных исследований. Пока речи о замене теста Эймса или другого теста методологией QSAR нет. Возможно, такая постановка проблемы в будущем встанет. Но ясно одно, что  QSAR является хорошим инструментом для внеэкспериментального прогноза.

 

Литература

 

1.       Miller J.A., Miller E.C. / In: Hiatt H.H., Watson J.D., Winstein J.A. (Eds) Origins of Human Cancer // Cold Spring Harbor Laboratory. 1977. P. 605-628

2.       Ashby J., Tennant R.W. // Mutat. Res. 1991. V. 257. P. 229-306

3.       Rosenkranz H.S., Klopman G. // Toxicol. Ind. Health. 1988. V.4.          P. 533-540

4.       Klopman G., Rosenkranz H.S. // Mutat. Res. 1994. V. 305.   P.33-46

5.       Klopman G., Ddimayuga M., Talafos J. // J. Chem. Inf. Comput. Sci. 1994. V.34. P. 1320-1325

6.       Hansch C., Fujita T. // J. Ann. Chem. Soc. 1964. V.86. P . 1616-1626

7.       Любимова И.К., Абилев С.К., Мигачев Г.И. // Генетика, 1995. N 2. С. 268-272

8.       Баскин И.И., Любимова И.К., Абилев С.К., Палюлин В.А., Зефиров Н.С. // Доклады АН. 1993. Т. 332. N 5. С. 587-589.

9.       Баскин И.И., Любимова И.К., Абилев С.К., Палюлин В.А., Зефиров Н.С. // Доклады АН. 1994. Т. 339. N 1. С. 106-108.

10.   Любимова И.К. Зависимость мутагенной активности полициклических ароматических соединений от их структуры. Автореферат канд. диссертации. М. 1994. 25 с.

11.   Bengini R., Andreoli C., Giuliani A. // Mutat. Res. 1989. V. 221. P. 197-216

Hosted by uCoz