Тимур Маджидов, Георгий Куракин
«Природа» №3, 2020


Об авторах

Тимур Исмаилович Маджидов («Природа» №3, 2020)

Тимур Исмаилович Маджидов — кандидат химических наук, старший научный сотрудник научно-исследовательской лаборатории хемоинформатики и молекулярного моделирования Химического института имени А. М. Бутлерова Казанского федерального университета. Область научных интересов — хемоинформатика, квантовая и вычислительная химия, большие данные в химии, использование методов машинного обучения и искусственного интеллекта в химии.

Георгий Фёдорович Куракин («Природа» №3, 2020)

Георгий Фёдорович Куракин — ординатор кафедры биохимии с курсом клинической лабораторной диагностики Тверского государственного медицинского университета. Область научных интересов — биохимия, молекулярная биология, биоинформатика, хемоинформатика. Лауреат конкурса «Био/мол/текст-2019».

С начала текущего года весь мир следит за распространением коронавируса, который в декабре 2019 г. вызвал эпидемию в Китае, а затем перекинулся и на другие страны. Поскольку эпидемия охватила весь мир (пока нет случаев только в Черногории), 30 января Всемирная организация здравоохранения объявила вспышку нового коронавируса (поначалу именовался 2019-nCoV) чрезвычайной ситуацией в области общественного здравоохранения, имеющей международное значение, а 11 марта — пандемией. Серьезность ситуации требует искать решение проблемы всеми возможными путями.

Китайские исследователи оперативно расшифровали и охарактеризовали геном нового коронавируса, обнаружив большое сходство с вирусом SARS-CoV (аббревиатура от англ. severe acute respiratory syndrome — ‘коронавирус тяжелого острого респираторного синдрома’), который был причиной эпидемии в 2002–2003 гг., а также с двумя коронавирусами летучих мышей, что послужило основанием считать их природным резервуаром нового коронавируса, переименованного, соответственно, в SARS-CoV-2 [1–3]. Еще до публикации этих результатов его нуклеотидная последовательность была депонирована в базе данных GenBank. Сейчас на этом и подобных порталах собраны данные уже более 170 геномов пандемического коронавируса из образцов, полученных в разных странах. Геномные исследования SARS-CoV-2 позволяют разрабатывать тесты для его выявления, строить филогенетические деревья, чтобы проследить его происхождение и эволюцию, и т. д. Кроме того, изучаются 3D-структура белков, механизмы инфицирования, ищутся подходы для создания вакцины, моноклональных антител и, конечно, малых молекул (лекарств).

Все результаты исследований незамедлительно публикуются в открытом доступе на сайтах научных журналов (Nature, Science, The Lancet, Journal of Medical Virology) и препринтов (BioRxiv, MedRxiv и ChemRxiv). За последние два месяца только на BioRxiv опубликовано более 80 статей о самых разных аспектах изучения SARS-CoV-2 и борьбы с ним. Важно подчеркнуть, что на всех сервисах размещено объявление: статьи не прошли рецензирование и не должны рассматриваться как окончательные выводы, рекомендации по лечению или профилактике, а также не должны освещаться в СМИ как доказанная информация. Мы поддерживаем эти предостережения и призываем рассматривать нашу публикацию как научно-просветительный материал, изложенные в нем данные как предварительные, требующие дополнительного подтверждения, а сведения по лечению и профилактике COVID-2019 черпать только из официальных рекомендаций.

Откуда он взялся?

Впервые коронавирус человека был выделен в 1965 г. от больного ОРВИ, а вскоре выяснилось, что коронавирусов много и циркулируют они не только среди людей, но и среди домашних и диких животных [4]. Коронавирусы не считались опасными патогенами человека до тех пор, пока в 2002 г. мир не столкнулся с эпидемией SARS, которая началась в Китае и распространилась на 37 стран, поразив более 8 тыс. человек и погубив 774 (смертность более 9%) [5, 6]. В 2012 г. в Саудовской Аравии вспыхнула вторая эпидемия коронавируса, связанного с ближневосточным респираторным синдромом (англ. Middle-East respiratory syndrome, MERS), которым переболели почти 2,5 тыс. человек, 858 из которых погибли (смертность более 34%) [4]. После этих двух эпидемий стало ясно, что коронавирусы способны преодолевать межвидовые барьеры и переходить от животных к людям [7]. Эксперты предупреждали, что рано или поздно может возникнуть новая вспышка [8]. Это и случилось в 2019 г. и снова в Китае, но никто не ожидал, что она охватит весь мир, т.е. дорастет до размеров пандемии.

Во всех трех случаях естественным резервуаром коронавирусам послужили летучие мыши. Известно, что SARS-CoV изначально циркулировал среди подковоносых летучих мышей (Rhinolophus sinicus), а на человека перекинулся от малайской пальмовой циветты (Paradoxurus hermaphroditus) [9].

MERS-CoV также возник среди летучих мышей, а на пути передачи к человеку оказались одногорбые верблюды (Camelus dromedarius). Промежуточный хозяин SARS-CoV-2 пока точно не установлен. В конце февраля вышло несколько препринтов, в которых говорилось о довольно большом генетическом сходстве (85,5–92,4%) коронавирусов яванского панголина (Manis javanica) с вирусом, вызывающим COVID-19 [10]. Однако этого явно недостаточно, чтобы уверенно обвинить панголина (например, SARS-CoV имел 99,8% общих с коронавирусом циветты последовательностей, поэтому это животное стали считать источником вспышки «атипичной пневмонии»).

Интенсивные исследования нового коронавируса позволили Международному комитету по таксономии вирусов (International committee on taxonomy of viruses) определить место SARS-CoV-2: его отнесли к роду Betacoronavirus семейства Coronaviridae отряда Nidovirales царства Riboviria (рис. 1) [3].


Рис. 1. Филогенетическое древо коронавирусов, циркулирующих среди летучих мышей или людей («Природа» №3, 2020)

Как и у всех представителей Coronaviridae, вирион SARS-CoV-2 обрамляют булавовидные шипы гликопротеина, которые придают оболочке вируса сходство с солнечной короной (отсюда название), что хорошо заметно на электронной микрофотографии (рис. 2). Этот поверхностный гликопротеин, или S-белок (от англ. spike — ‘шип’), отвечает за проникновение вируса в клетку путем имитации молекул, на которые реагируют трансмембранные рецепторы клеток. Помимо липидной оболочки, в которую заякорены еще два структурных белка — E (от англ. envelope — ‘оболочка’) и М (membrane — ‘мембрана’), у коронавируса есть нуклеокапсид, внутри которого скрыты геном вируса (позитивная РНК) и связанный с ним N-белок (nucleocapsid). Белки вируса транслируются одним длинным полипротеином, из которого высвобождаются две протеазы — Mpro (от англ. major protease — ‘главная протеаза’) и PLpro (от англ. papain-like protease — ‘папаин-подобная протеаза’). Они и дальше «нарезают» сплошной геном вируса на отдельные белки [5, 7, 11].

Рис. 2. Электронная микрофотография зрелых вирионов SARS-CoV-2 и его 3D-модель («Природа» №3, 2020)

SARS-CoV отличался от своих сородичей тем, что его «шипы» связываются с ангиотензинпревращающим ферментом 2 (англ. angiotensin converting enzyme 2, ACE2) — тем самым, который блокирует лекарства для снижения давления. Фермент обильно представлен в легких, что, по-видимому, и придает вирусу такую высокую способность вызывать пневмонию [4]. MERS-CoV пошел иным путем, нежели его «старший брат» из Китая, — S-белок MERS-CoV связывается с дипептидилпептидазой-4 (англ. dipeptidyl-peptidase, DPP4) [12], которая расщепляет инкретиновые гормоны и служит терапевтической мишенью для лечения сахарного диабета II типа. В отличие от MERS-CoV, SARS-CoV-2 пошел по проторенной дорожке: его «шипы», как у SARS-CoV, связываются с ACE2 клетки хозяина [13].

По геномной последовательности SARS-CoV-2 — близкий родственник SARS-CoV, но отличается от него и MERS-CoV меньшей смертностью, хотя и гораздо большей заразностью. Это и позволило ему распространиться гораздо шире, чем в две предыдущие коронавирусные эпидемии. Очевидно, что против SARS-CoV-2 нужны специфические лекарства.

Как найти лекарство?

Несмотря на 15-летнюю историю контакта с опасными коронавирусами и ожидание новых вспышек, человечество не успело разработать специфического противокоронавирусного средства [14]. Даже более или менее испытанных терапевтических стратегий мало. Во время прежних вспышек применяли рибавирин и интерферон-альфа [6]. Эти препараты широкого спектра действия. В случае вирусов это означает, что эффект не гарантирован, а побочные действия не вполне предсказуемы. Впрочем, рибавирин продемонстрировал эффективность против SARS-CoV [15], но нужны более крупные и тщательные исследования.

На животных, зараженных SARS-CoV и MERS-CoV, показал эффективность другой противовирусный препарат широкого спектра — ремдесивир, который изначально был разработан для лечения лихорадки Эбола. На сайте Национальных институтов здоровья США (National Institutes of Health, NIH) 25 февраля появилось сообщение о начале его клинических испытаний для лечения COVID-19, которые планируется завершить к 2023 г.!

Комбинация препаратов для лечения СПИДа (ингибиторы протеазы ВИЧ) — лопинавира с ритонавиром — оказалась эффективна в эксперименте на клеточной культуре и в клинике [15], и именно ее китайские ведомства, ответственные за борьбу с коронавирусом, официально рекомендуют использовать для лечения COVID-19 [16].

Очевидно, что имеющегося арсенала крайне мало. Фармацевтическая отрасль оказалась застигнута врасплох, хотя ученые и прогнозировали появление нового коронавируса. Необходимо срочно разрабатывать новые лекарства для борьбы с инфекцией. На какие мишени они должны быть нацелены?

Рис. 3. Жизненный цикл SARS-CoV («Природа» №3, 2020)

Геномы коронавирусов — самые большие среди РНК-содержащих вирусов, но мало того, что размер генома SARS-CoV-2 — около 30 тыс. нуклеотидов [17], так у него еще и довольно сложный жизненный цикл (рис. 3). Однако сложное устройство легче «сломать», т.е. потенциальных мишеней для лекарственного воздействия в SARS-CoV-2 достаточно (рис. 4). Но лекарство должно защищать не только от текущей вспышки, но и от других инфекций, вызванных новыми разновидностями коронавирусов, которые могут появиться в любой момент. Здесь приходится включать эволюционную логику и «прицеливаться» в белки, которые в ходе эволюции у коронавирусов меняются мало (так называемые консервативные белки). Одним из таких белков является главная протеаза вируса (Mpro) — ее и используют как главную мишень для разработки антикоронавирусных лекарств [19, 20].

Рис. 4. Наглядное изображение генома коронавируса и его структурных элементов («Природа» №3, 2020)

Компьютерный дизайн лекарств

Главная идея дизайна молекул против коронавируса заключается в том, что времени на создание принципиально нового лекарства попросту нет. Даже если кандидата найти очень быстро, что далеко не факт, доклинические и клинические испытания продлятся годы.

К счастью, смертность от COVID-19, по сравнению с SARS и MERS, весьма невелика, но это накладывает существенные требования к безопасности потенциального лекарства. Риск от применения лекарства должен быть существенно ниже, чем от самой болезни. А значит, лекарство должно быть безопасным. Это сильно осложняет поиск: есть вероятность, что на этапе клинических испытаний будет выявлен слишком большой риск от лекарства, несоизмеримый с опасностью болезни.

Отсюда возникла идея — не надо разрабатывать новые лекарства! Нужно использовать старые, т.е. найти такие соединения, доклинические испытания которых проведены, безопасность доказана, и остается только проверить активность против SARS-CoV-2. Это называется перепрофилированием лекарств. В связи с этим можно выделить три стратегии разработки лекарства.

  1. Перепрофилирование других противовирусных препаратов. Как мы уже писали, можно попытаться использовать против SARS-CoV-2 препараты с широким противовирусным потенциалом, которые показали эффективность против РНК-вирусов (например, ВИЧ). Это самый быстрый и надежный способ, с высоким шансом на успех, правда эффективность может быть не очень велика, поскольку препарат не «настраивался» специально против коронавируса. Итак, можно попытаться использовать ингибиторы протеазы Mpro или РНК-полимеразы вируса, и именно по этому пути в настоящее время идут клинические испытания. Кроме того, этот подход не расширяет инструментария против вирусов. Он позволяет добиться тактической победы, но в долгосрочной перспективе — не самый лучший. А мы уже убедились, что новых коронавирусов нужно ждать постоянно. Да и не они одни образуют проблему «новых патогенов» — ранее не знакомых нам возбудителей с высоким эпидемическим потенциалом.
  2. Перепрофилирование других лекарств, не показавших активность против вирусов. Лекарства хороши тем, что их безопасность доказана или, как минимум, измерена. Если имеются сведения, что какое-либо лекарство может иметь активность против коронавируса, можно пропустить стадию изучения его безопасности (пожалуй, самая долгая и дорогая часть доклинических испытаний и первая стадия клинических). Необходимо только изучить его эффективность. Шанс на успех в этом случае меньше. К примеру, не раз было показано, что противомалярийный препарат хлорохин эффективен против вирусов in vitro. Сейчас проводятся клинические испытания против COVID-19, но этот препарат уже не раз проваливался в испытаниях на людях [21].
  3. Можно искать лекарства против коронавируса в существующих базах данных химических соединений или в базах данных виртуальных соединений. Можно пытаться придумать структуру, эффективную против коронавируса на основе структуры биологической мишени (какой-нибудь макромолекулы коронавируса, которую надо заблокировать), или использовать методы искусственного интеллекта, способные генерировать структуры молекул, потенциально обладающих нужными свойствами. В любом случае эти молекулы будут новыми, с неизвестной фармакокинетикой и фармакодинамикой, которые нужно изучать и оптимизировать. С одной стороны, на исследования уйдут годы, но с другой — будет создан препарат с принципиально новым видом активности, «настроенной» против коронавируса. В будущем от него может быть и другая польза. Так, препарат N3, который разрабатывался против коронавируса SARS-CoV 2003 г., пригодился при расшифровке структуры протеазы коронавируса 2019 г. Это лучший путь в долгосрочной перспективе, хотя он самый дорогой и долгий.

Таким образом, правильного пути нет. Каждый имеет достоинства и недостатки, но в целом эти три стратегии взаимодополняющие и способны помочь человечеству побороть COVID-19. По этой причине работы ведутся во всех направлениях.

Чаще всего в поиске новых лекарств используется методика докинга (или молекулярной стыковки). В докинге оценивается, возможно ли проникновение молекулы в связывающий пакет биологической мишени и эффективное взаимодействие с ней. Для последнего используется специальная оценочная функция, обычно основанная на использовании молекулярной механики. Это один из самых распространенных и эффективных методов компьютерного моделирования связывания лекарства с рецептором. Чаще всего при поиске новых лекарств используется библиотека соединений-кандидатов и трехмерная структура молекулярной мишени. В дальнейшую разработку поступают вещества-«победители», показавшие по результатам моделирования максимальную энергию связывания. Такой подход называется виртуальным скринингом.

Беда в том, что SARS-CoV-2 появился внезапно, а для расшифровки трехмерной структуры его белков требовалось время. Но геном уже был расшифрован, а следовательно, была известна и последовательность аминокислот в его белках! В таком случае можно получить приблизительную 3D-структуру путем моделирования по гомологии. С помощью специальных программ по базам данных находятся белки, сходные по последовательности с исследуемым, имеющие общее с ним эволюционное происхождение (это и называется гомологией), и, что важно, для которых уже расшифрована трехмерная структура. Ее используют как шаблон, на который с помощью других программ буквально «наматывают» исследуемый белок. Затем может следовать процедура небольшой «подгонки», чтобы смоделированный белок «улегся поудобнее» — скорее всего, так он и будет сворачиваться в естественных условиях.

Именно этот подход применили китайские ученые, которые использовали в качестве шаблона для моделирования Mpro SARS-CoV — ту самую «первую ласточку» из 2002 г. [20]. Эта структура доступна всем в банке данных PDB под кодом 2GTB [19]. Библиотека для докинга включала 1900 лекарств. Но более трети из них имели высокие значения расчетной энергии связывания. Сократить круг поиска помог отбор молекул, связывающихся с протеазой аналогично известным веществам. Этот поиск также проводился с помощью вычислительной техники. Так список сократился до 159.

Далее исследователи визуализировали модели полученных комплексов и «на глаз» выбрали 15 структур. Их использовали для более точного метода — моделирования движений молекул во времени (молекулярной динамики). В результате «победителем» оказался нелфинавир — противовирусное средство, которое уже используется против ВИЧ. Кроме того, исследователи посчитали потенциально интересными препарат для снижения холестерина питавастатин, антипсихотический препарат перампанел и празиквантел, применяющийся против гельминтов. Однако последние три интересны скорее как стартовые соединения для дальнейшей оптимизации.

26 января 2020 г. «на подмогу» исследователям подоспела экспериментально определенная структура Mpro самого SARS-CoV-2, да еще и в комплексе с известным блокатором N3! Она также доступна в банке данных PDB для «всеобщего обозрения» под кодом 6LU7 (рис. 5). Виртуальный скрининг стал проще. И снова в исследовании появляются препараты против ВИЧ: ученые использовали их как инструмент для сравнения связывающих участков Mpro «старого» (SARS-CoV) и «нового» (SARS-CoV-2) коронавирусов [22]. Моделирование показало, что исследуемые «карманы» в белке связывают лекарство сходным образом. Далее ученые предприняли виртуальный скрининг, используя в качестве библиотеки базу данных DrugBank. Они выявили 10 препаратов-«лидеров», но результаты несколько разочаровали. Большая часть этих соединений не имеет никакого отношения к вирусам, а сам спектр соединений довольно пестрый: от антипсихотиков до противогрибковых агентов. Ни проверки идеи, ни даже оптимизации «находок» не последовало. Впрочем, данная работа — препринт, как и предыдущая. А значит, пока это лишь предварительные данные.

Рис. 5. Наложение расшифрованной протеазы SARS-CoV-2 на гомологичную протеазу SARS-CoV («Природа» №3, 2020)

Другая группа китайских ученых получила более надежные результаты [24]. Их библиотека включала 8 тыс. лекарств. В результате скрининга обнаружилось 690 «лидеров». Однако эта группа исследователей, в отличие от предыдущей, исключила «неинтересные» молекулы: красители, токсичные вещества, препараты, применяемые в неврологии (в вирусологии им делать нечего) и противоопухолевые лекарства со значимым побочным эффектом. Это помогло не только снять один лишний вопрос к своей работе, но и сократить «шорт-лист»: теперь он включал в себя только 50 кандидатов. Из этого вполне разумного количества авторы выделили четыре соединения: прулифлоксацин (фторхинолоновый антибиотик), биктегравир (ингибитор интегразы ВИЧ), нелфинавир (уже упоминавшийся ингибитор протеазы ВИЧ) и тегобувир (препарат от гепатита С).

В общем, виртуальный скрининг и докинг показали свою привлекательность в деле борьбы с коронавирусом. Работы с использованием этого инструмента продолжаются очень активно, правда есть и проблема: пока у этих работ нет экспериментального подтверждения, но это дело времени. Нужно помнить, что в большинстве лабораторий этого штамма еще просто нет и обучение работе с ним займет время. В этом смысле создание международных консорциумов представляется особенно перспективным, и они в настоящее время уже формируются.

Перепрофилирование в пробирке

Насколько бы докинг ни был мощным, только эксперимент есть критерий истины. Молекулярная динамика более точна, но это крайне ресурсоемкий метод, и он не годится для скрининга больших библиотек. Производительность его низка. А что, если провести аналогичный скрининг не в компьютерной модели, а in vitro? На настоящей протеазе вируса? Одна большая группа специалистов провела такой масштабный эксперимент [25]. Мишенью вновь была та же самая Mpro. Скрининг проводился на основе измерения связывания соединения с Mpro методом на основе ферстеровского резонансного переноса энергии (FRET), часто применяющимся в молекулярной биологии. Причем размеру библиотеки могли бы позавидовать даже исследователи, проводившие куда менее затратные компьютерные исследования: более 10 тыс. соединений, среди которых одобренные лекарства, препараты, проходящие клинические испытания, и натуральные соединения. Так что по производительности этот биологический скрининг не уступал некоторым работам в области виртуального скрининга.

В этом испытании было выявлено 7 победителей. Вторым этапом эти 7 соединений протестировали на способность предотвращать заражение клеточной культуры вирусом SARS-CoV-2. «Победил» антиоксидант эбселен — селенорганическое вещество. Результаты похуже показал TDZD-8, который тестируется в настоящее время против болезни Альцгеймера, а также разработанный против SARS-CoV-2 ковалентный ингибитор N3.

Любопытно, что компьютерные методы на основе докинга не выделили ни одну из этих молекул! Но их вполне могло не быть в базах данных, использованных исследователями. А эбселен и N3 вдобавок являются сложными для докинга молекулами. В состав первого входит селен, параметры которого в силовых полях для расчета энергии докинга недостаточно надежны. А молекула N3 представляет собой ковалентный ингибитор — т.е. она ковалентно связывается с белком по реакции Михаэля. Использованные исследователями методы докинга этого учесть не могут, хоть и существуют специальные алгоритмы для ковалентного докинга.

Однако та же группа исследователей провела и компьютерные «эксперименты», несколько «реабилитировав» их. Ученые сделали компьютерный скрининг, в ходе которого победил цинансерин — антагонист серотонина, изначально разрабатывавшийся для фармакологического воздействия на нервную систему. Любопытно, что он уже зарекомендовал себя как ингибитор протеазы опасного коронавируса из 2002 г. — SARS-CoV [26]. В уже упоминавшемся тесте на клеточной культуре цинансерин также доказал свою эффективность [25].

Так что работа этой группы, скорее, убеждает в необходимости должного подхода к компьютерному скринингу и его комбинирования с экспериментальными исследованиями.

Искусственный интеллект на тропе войны

Докинг — это все же просто вычислительная методика, работающая по явно заданному компьютерному алгоритму. А как насчет более передовых технологий?

«Горячей» темой в разработке лекарств является использование подходов на основе машинного обучения и искусственного интеллекта. Несмотря на свою «молодость», такие разработки уже достигли неплохих успехов: искусственный интеллект предсказывает пути синтеза неорганических материалов [27], определяет, как «свернется» белок [28], разрабатывает новые ингибиторы DDR-киназ [29]. Это будущее, стремительно входящее в практику фармацевтических компаний. Однако коронавирус ждать не будет — нужно, чтобы будущее наступило экстренно.

Компания InSilico Medicine, которая специализируется на применении искусственного интеллекта в медицине, предложила использовать свои протоколы для разработки новых антикоронавирусных лекарств. В отличие от предыдущих работ, это не перепрофилирование, а «придумывание» новой молекулы. Изюминка в том, что «придумать» (сгенерировать) структуру должен был компьютер [30]. А генерировать предполагалось на основе уже знакомой нам протеазы Mpro.

Так как эта компания начала работу в числе первых, они «не успели» дождаться кристаллографической структуры и использовали модель по гомологии, «вставив» в нее лиганд, содержащийся в шаблоне, и оптимизировав его положение молекулярным моделированием. К этой информации было добавлено почти 6 тыс. известных антипротеазных соединений. Компьютер должен был «придумать» соединения как на основе структуры связывающего кармана, так и на основе известных блокаторов.

В программе для «придумывания» была реализована особая архитектура нейронной сети (имитирующая нейронные сети мозга). Здесь уже нет явного алгоритма — как и живой мозг, программа учится. Компания использовала весь имеющийся у них арсенал методик: сети-автокодировщики, состязательные сети (в таком методе две нейронные сети соревнуются между собой), языковые модели (работающие по принципу предсказания следующего слова в предложении).

«Придуманные» компьютером молекулы далее подвергались фильтрации и отсеву по нескольким критериям: подходящие физико-химические параметры, отсутствие «нехороших» групп, предсказанная активность, качество докинга в модели протеазы, показатели новизны и разнообразия.

Методология довольно впечатляющая и очень напоминает таковую в предыдущем исследовании этой группы по созданию ингибиторов DDR-киназ [29], опубликованном в журнале Nature Biotechnology (что говорит само за себя). В настоящее время группа занимается синтезом соединений для дальнейшей экспериментальной проверки, так что — ждем окончательных результатов и надеемся, что они будут хорошими!

Совсем другим путем пошли их конкуренты из компании BenevolentAI [31]. Они сконцентрировали внимание на перепрофилировании. Но на этот раз не использовали скрининг и докинг, а «предложили» искусственному интеллекту заняться процессом познания. Из научной литературы был извлечен граф знаний. На нем видно, что белок ACE2, с которым связывается коронавирус, участвует в эндоцитозе. Важным регулятором эндоцитоза является AP2-ассоциированная протеинкиназа-1 (AAK1). Соответственно, подавление ее может предотвратить эндоцитоз вируса.

Далее из 300 существующих ингибиторов ААК1 отобрали 40 одобренных для применения в клинической практике. Исключили препараты, обладающие выраженными побочными эффектами или требующие высоких дозировок лекарств. Среди шести высокоактивных ингибиторов особенно интересным является ингибитор янус-киназ бариситиниб (изначально разработанный для лечения ревматоидного артрита). Он ингибирует не только ААК1, но и циклин G-ассоциированную киназу (GAK), которая также участвует в эндоцитозе. Авторы полагают, что эта молекула может использоваться для профилактики и лечения коронавирусной инфекции. Идея хорошая, и — в кои-то веки — связана не с протеазой вируса, а с другой мишенью. Но это лишь модельные данные — их еще надо проверить.

По этим работам был написан весьма интересный критический разбор [32]. Обе работы критиковались в основном за очевидность. Так, критики считали, что работа сотрудников BenevolentAI — это скорее продвинутый научный поиск, доступный и человеку. Зачем здесь искусственный интеллект? Его триумфа здесь особо не просматривается. Но, на наш взгляд, сама по себе разработка, где искусственный интеллект собирает граф научных знаний с потенциальным медицинским применением, заслуживает внимания. Хотя бы с технической точки зрения. Такой подход может оказаться полезным в будущем — время покажет. Повторимся, что все данные пока предварительные.

InSilico критикуется за то, что их генератор создает молекулы, собирая «кусочки» известных лекарств. Например, одна из них содержит кусок противогельминтного препарата празиквантела (который в одной из упомянутых выше работ «выиграл» в докинге). Но основная претензия критиков заключается в том, что сотрудники InSilico не использовали перепрофилирование. Критики посчитали, что вряд ли кто-нибудь захочет вложиться в реальную разработку абсолютно новых лекарств. Но, в нашем понимании, это не проблема искусственного интеллекта и научного подхода коллектива InSilico.

Но не бизнесом единым движется область искусственного интеллекта в дизайне лекарств. Исследователи из Университета Мичигана использовали нейронную сеть-автокодировщик для генерации новых молекул, активных против Mpro [33]. Было сгенерировано несколько молекул, которые имеют неплохие физико-химические характеристики, а также доступны для синтеза (синтетическая доступность оценивалась с помощью SAScore [34]). Они сравнили созданные молекулы с рекомендованным в настоящее время для лечения коронавируса сочетанием лопинавира с ритонавиром и нашли, что в целом характеристики биодоступности и синтетической доступности сгенерированных молекул были лучше. Но даже беглый взгляд на эти молекулы позволяет заметить, что тут еще нужно поработать над медико-химической составляющей. Многие структуры содержат очень реакционноспособные фрагменты, и до вируса в таком виде молекулы точно не дойдут. Это исследование еще очень «сырое».

В другой работе [35] той же команды использовались сверточные нейронные сети. Они работают по принципу нейронных сетей в зрительных центрах коры головного мозга. Сети предсказывали энергии связывания молекул с Мpro-белком коронавируса. Сначала авторы собрали данные по молекулам, активным против SARS, потом «сдокировали» их в расшифрованную протеазу SARS-CoV-2 и на основе этого создали обучающую выборку. Отдельно собрали данные из базы BindingDB уже по отношению к разным белкам. С помощью полученной модели протестировали около 1400 известных лекарств для поиска возможности их перепрофилирования под лечение коронавируса. На их основе нашли группу молекул, которые можно перепрофилировать. По активности в этой группе «лидировали»: противоопухолевое таргетное средство, ингибитор протеасом бортезомиб, противотревожный и успокоительный препарат флуразепам и таргетный препарат для лечения лейкемии понатиниб.

Интересны данные исследователей по ингибиторам других протеаз как кандидатам в блокаторы протеазы коронавируса (табл.). «Лидером» оказался ингибитор протеазы вируса гепатита С боцепревир — только его авторы отмечали как имеющий высокую предсказанную аффинность к протеазе коронавируса. Его предсказанная аффинность составила −9,36 ккал/моль, что является высоким показателем. «Аутсайдером» оказался фосфорорганический яд изофлурофат — всего −4,94 ккал/моль, что почти ничто по меркам молекулярного моделирования.

Таблица. Кандидаты в блокаторы протеазы коронавируса (из [35]; с изменениями)

Кандидаты в блокаторы протеазы коронавируса («Природа» №3, 2020)

Коричневым цветом выделены ингибиторы вирусных протеаз; фиолетовым — ингибиторы факторов свертывания крови (антикоагулянты); синим — ингибиторы АПФ; желтым — ингибиторы DPP4; зеленым — ингибиторы других протеаз человеческого организма; белым — другие препараты / вещества.

Несмотря на то, что авторы выделили только боцепревир, ему «наступают на пятки» несколько ингибиторов вирусных протеаз, используемых для лечения вирусного гепатита и ВИЧ-инфекции, а также — немного неожиданно — ингибиторы факторов свертывания крови, которые также являются протеазами. В числе победителей также ингибиторы ангиотензинпревращающего фермента — того самого, к которому прикрепляется коронавирус. Это ведь тоже протеаза. Так что эти результаты также требуют проверки. Возможно, удастся создать препарат с двойным действием.

Исследователи группы Артема Черкасова, работающие в Университете Британской Колумбии (Ванкувер) [36], применили разработанный ими подход «глубокого докинга» [37] для поиска активных молекул с использованием кристаллической структуры Мpro уханьского коронавируса. «Глубокий докинг» представляет собой количественную модель «структура — свойство» на основе глубокого обучения, которая позволяет предсказывать результаты докинга. Методологически это исследование похоже на работу группы из Мичиганского университета.


Рис. 6. Предсказанное положение одного из веществ, «найденных» группой А. Черкасова, и взаимодействия этого соединения в связывающем участке протеазы SARS-CoV-2 по итогам докинга («Природа» №3, 2020)

Такой подход позволяет «просеять» гораздо больше соединений, чем при обычном докинге: ведь машина умеет предугадывать, какая энергия получится при докинге, и отбрасывать неподходящие молекулы. С использованием этого подхода авторы смогли провести виртуальный скрининг более 1,3 млрд (!) молекул из базы данных ZINC. В числе выявленных ими «лидеров» снова (уже в который раз!) оказался препарат для лечения ВИЧ — лопинавир (уже рекомендованный для лечения COVID-19). Также было отмечено «соединение 80» (имени у «новорожденного» вещества пока нет, только номер) — ингибитор протеазы SARS-CoV (из 2002 г.) (рис. 6). Однако 99% отмеченных соединений пока не синтезировано — это еще предстоит сделать.

Группа корейских ученых [38] обучила нейронную сеть предсказывать константу связывания молекулы с белком и провела поиск активных молекул среди коммерчески доступных. В результатах этого исследования оказалось сразу три препарата против ВИЧ — ритонавир, который уже был рекомендован для терапии коронавирусной инфекции (в сочетании с лопинавиром), а также атазанавир и эфавиренц. Немного разнообразия в эту подборку внесло противовирусное средство ганцикловир (но — от цитомегаловирусной инфекции).

Не протеазой единой…

Читатели могли обратить внимание (и мы сами неоднократно подчеркивали), что в компьютерных скринингах на блокирование Mpro часто «выигрывают» препараты для лечения ВИЧ-инфекции и гепатита C. Причем именно те, которые блокируют протеазы этих вирусов. Такое решение кажется очевидным — ведь протеазы могут быть похожи у разных вирусов. Кажется, что до этого можно догадаться и безо всякого моделирования! И исследователи уже догадались — об этом говорит применение комбинации лопинавира с ритонавиром против коронавирусных инфекций. А если так, то зачем вообще все эти высокопроизводительные вычисления и искусственный интеллект?

Но не все так просто. Протеазы могут различаться по структуре и механизму катализа. Например, протеаза ВИЧ — аспартильная, а протеаза вируса гепатита C — сериновая [39], т.е. они относятся к разным классам и имеют разный механизм действия. Каталитический домен протеазы коронавируса по укладке похож на химотрипсин, участвующий в пищеварении и также являющийся сериновой протеазой [40]. При таком разнообразии будет удачей, если ингибитор от одной протеазы подойдет к другой и будет эффективно ее блокировать. И искусственный интеллект здесь может послужить неплохим подспорьем, позволяя прикинуть шансы.

Кроме того, при недостатке экспериментальной информации самый очевидный путь может оказаться неверным. Например, мы уже знаем, что лопинавир с ритонавиром эффективны против коронавирусов, но связано ли это именно с протеазой?

Рассмотренные выше исследования давали положительный эффект, потому что в них протеаза была единственной мишенью. Этот момент может быть источником ошибки. А что, если сделать скрининг по всем возможным мишеням в составе коронавируса, которые изображены на рис. 4? Этот рисунок взят из статьи [14], авторы которой уже провели такую масштабную работу. Построив по гомологии модели всех белков коронавируса, они провели скрининг существующих лекарств и натуральных соединений методом докинга.

По каждой мишени был получен список из 40 «лидеров», что в сумме, пожалуй, ставит рекорд по производительности среди статей, затронутых в обзоре. Весь список приведен в оригинальной статье — здесь же мы коснемся самых интересных находок.

Для ритонавира было найдено две возможные мишени, для лопинавира — даже четыре, но главной протеазы среди них нет! Зато рибавирин — аналог нуклеозида, для которого ожидаемо действие на репликацию и синтез белка, оказался лидером по связыванию с папаин-подобной протеазой PLpro. Ему на пятки наступает валганцикловир — противогерпетическое средство, и тоже нуклеозидной природы! Правда, результаты скрининга против Mpro немного перекликаются с результатами команды из Университета Мичигана: там все же представлены препараты против ВИЧ — ампренавир и блокатор нейтральной эндопептидазы кандоксатрил. Этих данных достаточно, чтобы показать, что компьютерные технологии способны предложить нам много неожиданных решений в борьбе с коронавирусом. Будут ли они эффективны — покажет время, так как в любом случае необходима экспериментальная проверка.

А если «протеазная» гипотеза окажется истинной, то это будет подтверждением эффективности подходов хемоинформатики и молекулярного моделирования. И мы будем знать, что у нас есть вычислительное оружие против новых патогенов в будущем.

Ситуация с разработкой новых антикоронавирусных лекарств быстро меняется. За время подготовки нашей статьи к печати группа Diamond Light Source (Великобритания) провела экспериментальный поиск небольших молекул — ингибиторов протеазы. Планируется на их основе создать новую высокоактивную молекулу. Кроме того, в базе PDB уже появились новые структуры белков коронавируса.

Тем временем… (вместо послесловия)

Согласно последней статье в Nature Biotechnology [41], началось несколько клинических испытаний по перепрофилированию лекарств в целях лечения COVID-19. Один из подходов заключается в перепрофилировании известных противовирусных препаратов, в основном из арсенала антиВИЧ терапии. Имеются наблюдения, которые указывают на возможность перекрестного эффекта против коронавируса. Второй перспективный подход касается воздействия на организм человека, чтобы уменьшить «цитокиновый шторм», вызываемый иммунным ответом на вирус [42].

Идеи и разработка вакцин. Coalition for Epidemic Preparedness Innovations (CEPI), США, выделила трем компаниям 12,5 млн долларов для разработки вакцины от SARS-CoV: компаниям Moderna и Inovio, специализирующимся на создании вакцин, и Университету Квинсленда. Интересно, что подходы к вакцинам у всех трех получателей средств отличаются: первый делает вакцины на основе вирусной РНК, второй — на основе ДНК и третий специализируется на старой технологии с использованием вирусных протеинов. И уже есть первые успехи. Вакцина от коронавируса компании Moderna находится на первой стадии клинических испытаний в США. Испытания начались в марте 2020 г., их окончание планируется в июне 2021-го.

Несмотря на очевидные успехи поиска новых лекарств против COVID-19, клинические испытания вакцин и лекарственных препаратов займут значительное время. Так что профилактика заболевания в настоящий момент является единственным выходом.

Литература
1. Lu R., Zhao X., Li J. et al. Genomic characterisation and epidemiology of 2019 novel coronavirus: implications for virus origins and receptor binding // The Lancet. 23.01.2020. DOI: 10.1016/ S0140-6736(20)30251-8.
2. Wu F., Zhao S., Yu B. et al. Complete genome characterisation of a novel coronavirus associated with severe human respiratory disease in Wuhan, China // BioRxiv. 02.2020. DOI: 10.1101/2020.01.24.919183.
3. Gorbalenya A. E., Baker S. C., Baric R. S. et al. The species Severe acute respiratory syndrome-related coronavirus: classifying 2019-nCoV and naming it SARS-CoV-2 // Nat. Microbiol. 02.03.2020. DOI: 10.1038/s41564-020-0695-z.
4. McIntosh K., Perlmanin S. Coronaviruses, Including Severe Acute Respiratory Syndrome (SARS) and Middle East Respiratory Syndrome (MERS) // Mandell, Douglas, and Bennett’s Principles and Practice of Infectious Diseases. Eighth Edition. Bennett J. E., Dolin R., Blaser M. J. (eds.). Elsevier Inc. 2014; 1928–1936.
5. Carter J. B., Saunders V. A. Virology: Principles and Applications. Chichester, 2007.
6. Кулагина М. Г. Коронавирусная инфекция. Инфекционные болезни: национальное руководство. Ред. Н. Д. Ющук, Ю. Я. Венгеров. М., 2018; 759–768.
7. Order — Nidovirales. Virus Taxonomy: Ninth Report of the International Committee on Taxonomy of Viruses / King A. M. Q., Adams M. J., Carstens E. B., Lefkowitz E. J. (eds). 2012. 784–794. DOI: 10.1016/B978-0-12-384684-6.00066-5.
8. Menachery V., Yount B., Debbink K. et al. A SARS-like cluster of circulating bat coronaviruses shows potential for human emergence // Nat. Med. 2015; 21: 1508–1513. DOI: 10.1038/nm.3985.
9. Shi Z., Hu Z. A review of studies on animal reservoirs of the SARS coronavirus // Virus Res. 2008; 133(1): 74–87. DOI: 10.1016/j.virusres.2007.03.012.
10. Cyranoski D. Mystery deepens over animal source of coronavirus // Nature. 26.02.2020. DOI: 10.1038/d41586-020-00548-w.
11. Wu C., Liu Y., Yang Y. et al. Analysis of therapeutic targets for SARS-CoV-2 and discovery of potential drugs by computational methods // APSB. 27.02.2020. DOI: 10.1016/j.apsb.2020.02.008.
12. Fehr A. R., Perlman S. Coronaviruses: an overview of their replication and pathogenesis // Methods Mol. Biol. 2015; 1282: 1–23. DOI: 10.1007/978-1-4939-2438-7_1.
13. Hoffmann M., Kleine-Weber H., Schroeder S. et al. SARS-CoV-2 cell entry depends on ACE2 and TMPRSS2 and is blocked by a clinically proven protease inhibitor // Cell. 2020. pii: S0092-8674(20)30229-4. DOI: 10.1016/j.cell.2020.02.052.
14. Wu C., Liu Y., Yang Y. et al. Analysis of therapeutic targets for SARS-CoV-2 and discovery of potential drugsby computational methods // APSB. 18.02.2020. DOI: 10.1016/j.apsb.2020.02.008.
15. Chu C. M., Cheng V. C. C., Hung I. F. N. et al. Role of lopinavir / ritonavir in the treatment of SARS: initial virological and clinical findings // Thorax. 2004; 59: 252–256. DOI: 10.1136/thorax.2003.012658.
16. Jin Y., Cai L., Cheng Z. et al. A rapid advice guideline for the diagnosis and treatment of 2019 novel coronavirus (2019-nCoV) infected pneumonia (standard version) // Military Med. Res. 2020; 7: 4. DOI: 10.1186/s40779-020-0233-6.
17. Jin Z., Du X., Xu Y. et al. Structure of Mpro from COVID-19 virus and discovery of its inhibitors // BioRxiv. 10.03.2020. DOI: 10.1101/2020.02.26.964882.
18. Du L., He Y., Zhou Y. et al. The spike protein of SARS-CoV — a target for vaccine and therapeutic development // Nat. Rev. Microbiol. 2009; 7: 226–236. DOI: 10.1038/nrmicro2090
19. Lee T. W., Cherney M. M., Liu J. et al. Crystal structures reveal an induced-fit binding of a substrate-like Aza-peptide epoxide to SARS coronavirus main peptidase // J. Mol. Biol. 2007; 366(3): 916–932. DOI: 10.1016/j.jmb.2006.11.078J.
20. Xu Z., Peng C., Shi Y. et al. Nelfinavir was predicted to be a potential inhibitor of 2019-nCov main protease by an integrative approach combining homology modelling, molecular docking and binding free energy calculation // BioRxiv. 28.01.2020. DOI: 10.1101/2020.01.27.921627.
21. Touret F., Lamballerie X. de. Of chloroquine and COVID-19 // Antiviral Research. 2020; 177: 1047622. DOI: 10.1016/j.antiviral.2020.104762.
22. Liu X., Wang X. J. Potential inhibitors for 2019-nCoV coronavirus M protease from clinically approved medicines // BioRxiv. 29.01.2020. DOI: 10.1101/2020.01.29.924100.
23. Pettersen E. F., Goddard T. D., Huang C. C. et al. UCSF Chimera-A visualization system for exploratory research and analysis // J. Comput. Chem. 2004; 25(13): 1605–1612. DOI: 10.1002/jcc.20084.
24. Li Y., Zhang J., Wang N. et al. Therapeutic drugs targeting 2019-nCoV main protease by high-throughput screening // BioRxiv. 30.01.2020. DOI: 10.1101/2020.01.28.922922.
25. Jin Z., Du X., Xu Y. et al. Structure of Mpro from COVID-19 virus and discovery of its inhibitors // BioRxiv. 10.03.2020. DOI: 10.1101/2020.02.26.964882.
26. Chen L., Gui C., Luo X. et al. Cinanserin is an inhibitor of the 3C-like proteinase of severe acute respiratory syndrome coronavirus and strongly reduces virus replication in vitro // J. Virol. 2005; 79(11): 7095–7103. DOI: 10.1128/JVI.79.11.7095-7103.2005.
27. Kim E., Jensen Z., Grootel A. van et al. Inorganic materials synthesis planning with literature-trained neural networks // J. Chem. Inf. Model. 2020. 07.01.2020. DOI: 10.1021/acs.jcim.9b00995.
28. Senior A. W., Evans R., Jumper J. et al. Improved protein structure prediction using potentials from deep learning // Nature. 2020; 577: 706–710. DOI: 10.1038/s41586-019-1923-7.
29. Zhavoronkov A., Ivanenkov Y. A., Aliper A. et al. Deep learning enables rapid identification of potent DDR1 kinase inhibitors // Nat. Biotechnol. 2019; 37: 1038–1040. DOI: 10.1038/s41587-019-0224-x.
30. Zhavoronkov A., Aladinskiy V., Zhebrak A. et al. Potential COVID-2019 3C-like protease inhibitors designed using generative deep learning approaches // ChemRxiv. Preprint. 2020. DOI: 10.26434/chemrxiv.11829102.v2.
31. Richardson P., Griffin I., Tucker C. et al. Baricitinib as potential treatment for 2019-nCoV acute respiratory disease // Lancet. 2020; 395. DOI: 10.1016/ S0140-6736(20)30304-4.
32. Lemonick S. Two groups use artificial intelligence to find compounds that could fight the novel coronavirus // Сhemical and Engineering News. 2020; 98: 6.
33. Gao K., Nguyen D. D., Wang R., Wei G. W. Machine intelligence design of 2019-nCoV drugs // BioRxiv. 04.02.2020. DOI: 10.1101/2020.01.30.927889.
34. Ertl P., Schuffenhauer A. Estimation of synthetic accessibility score of drug-like molecules based on molecular complexity and fragment contributions // J. Cheminform. 2009; 1: 8. DOI: 10.1186/1758-2946-1-8
35. Nguyen D. D., Gao K., Chen J. Potentially highly potent drugs for 2019-nCoV // BioRxiv. 13.02.2020. DOI: 10.1101/2020.02.05.936013.
36. Ton A. T., Gentile F., Hsing M. et al. Rapid identification of potential inhibitors of SARS-CoV-2 main protease by deep docking of 1.3 billion compounds // ChemRxiv. Preprint. DOI: 10.26434/chemrxiv.11860077.v1.
37. Gentile F., Agrawal V., Hsing M. et al. Deep docking — a deep learning approach for virtual screening of big chemical datasets // BioRxiv. 17.12.2019. DOI: 10.1101/2019.12.15.877316.
38. Beck B. R., Shin B., Choi Y. et al. Predicting commercially available antiviral drugs that may act on the novel coronavirus (2019-nCoV), Wuhan, China through a drug-target interaction deep learning model // BioRxiv. 02.02.2020. DOI: 10.1101/2020.01.31.929547.
39. Raney K. D., Sharma S. D., Moustafa I. M. et al. Hepatitis C virus non-structural protein 3 (HCV NS3): a multifunctional antiviral target // JBC. 2010; 285: 22725–22731. DOI: 10.1074/jbc.R110.125294.
40. Xue X., Yu H., Yang H. et al. Structures of two coronavirus main proteases: implications for substrate binding and antiviral Drug design // Journal of Virology. 2008; 82(5): 2515–2527. DOI: 10.1128/JVI.02114-07.
41. Harrison C. Existing antivirals and knowledge gained from the SARS and MERS outbreaks gain traction as the fastest route to fight the current coronavirus epidemic // Nature Biotechnology. 02.02.2020. 10.1038/d41587-020-00003-1.
42. Mehta P., McAuley D. F., Brown M. et al. COVID-19: consider cytokine storm syndromes and immunosuppression // Lancet. 13.03.2020. DOI: 10.1016/S0140-6736(20)30628-0.


Эпидемиологическая обстановка в мире быстро меняется. За развитием текущей ситуации можно следить на сайте GitHub — хранилища данных, где собираются сведения для визуальной панели мониторинга SARS-CoV-2, управляемой Университетским центром системных исследований и инженерии имени Джонcа Хопкинса.