Связь структуры и функции нативно-развернутых белков

Связь фенотипа и генотипа – одна из ключевых проблем для многих областей биологии, от физики белка и эволюционной биологии до биотехнологии и медицинской генетики. В последние годы стало возможным проводить высокопроизводительные скрининги, позволяющие получать данные о функциональности сотен тысяч мутантных вариантов белков в одном эксперименте. Такие скрининги производят массивы данных, важные для понимания связи структуры и функции в разных группах белков. В фундаментальных исследованиях полученные данные используются для уточнения существующих теоретических моделей связи структуры и функции в белках, а также для моделирования молекулярной эволюции белков. В белковой инженерии определение функциональности мутантных вариантов позволяет применять структурные подходы и методы машинного обучения для улучшения существующих белков (Saito et al. 2018; Pethe, Rubenstein, and Khare 2019). В настоящем проекте мы планируем сфокусироваться на важной и наименее исследованной с точки зрения связи структуры и функции группе белков – так называемых нативно-развернутых белках. Нативно-развернутые белки, как правило, не формируют единой нативной структуры, а существуют во множестве альтернативных конформаций, заселенность которых определяется внешними условиями, такими как кислотность и солевой состав среды, наличие белка-партнера и посттрансляционных модификаций. Нативно-развернутые белки осуществляют множество функций, являясь, среди прочего, узлами белок-белковых взаимодействий, структурными молекулами, ферментами. Современные анализы свидетельствуют о том, что к группе нативно-развернутых белков может относиться до 15% всех белков — значительная часть протеома, — при этом данных о связи структуры и функции таких белков крайне мало. В рамках работ по настоящему проекту мы разработаем высокопроизводительный подход для определения функциональности нативно-развернутых белков, недавно обнаруженных в тихоходках и определяющих способность этих животных переживать полное высыхание. Мы создадим библиотеку мутантов генов таких нативно-развернутых белков и определим функциональность каждого варианта при экспрессии в клетках дрожжей. На основе полученных данных мы впервые систематически проанализируем связь последовательности и функции в нативно-развернутых белках и используем полученные данные для анализа применимости существующих моделей к эволюции этой группы белков, а также исследуем возможность применения машинного обучения для предсказания функциональных нативно-развернутых белков.

1 Июля 2019 года — 30 Июня 2022 года

ИБХ

Грант, РНФ

Список публикаций по проекту

  1. Sureda-Vives M, Sarkisyan KS (2020). Bioluminescence-Driven Optogenetics. Life (Basel) 10 (12), 1–11
  2. Gonzalez Somermeyer L, Fleiss A, Mishin AS, Bozhanova NG, Igolkina AA, Meiler J, Alaball Pujol ME, Putintseva EV, Sarkisyan KS, Kondrashov FA (2022). Heterogeneity of the GFP fitness landscape and data-driven protein design. Elife 11,
  3. Mitiouchkina T, Mishin AS, Somermeyer LG, Markina NM, Chepurnyh TV, Guglya EB, Karataeva TA, Palkina KA, Shakhova ES, Fakhranurova LI, Chekova SV, Tsarkova AS, Golubev YV, Negrebetsky VV, Dolgushin SA, Shalaev PV, Shlykov D, Melnik OA, Shipunova VO, Deyev SM, Bubyrev AI, Pushin AS, Choob VV, Dolgov SV, Kondrashov FA, Yampolsky IV, Sarkisyan KS (2020). Plants with genetically encoded autoluminescence. Nat Biotechnol 38 (8), 944–946