Связь структуры и функции нативно-развернутых белков
Связь фенотипа и генотипа – одна из ключевых проблем для многих областей биологии, от физики белка и эволюционной биологии до биотехнологии и медицинской генетики. В последние годы стало возможным проводить высокопроизводительные скрининги, позволяющие получать данные о функциональности сотен тысяч мутантных вариантов белков в одном эксперименте. Такие скрининги производят массивы данных, важные для понимания связи структуры и функции в разных группах белков. В фундаментальных исследованиях полученные данные используются для уточнения существующих теоретических моделей связи структуры и функции в белках, а также для моделирования молекулярной эволюции белков. В белковой инженерии определение функциональности мутантных вариантов позволяет применять структурные подходы и методы машинного обучения для улучшения существующих белков (Saito et al. 2018; Pethe, Rubenstein, and Khare 2019). В настоящем проекте мы планируем сфокусироваться на важной и наименее исследованной с точки зрения связи структуры и функции группе белков – так называемых нативно-развернутых белках. Нативно-развернутые белки, как правило, не формируют единой нативной структуры, а существуют во множестве альтернативных конформаций, заселенность которых определяется внешними условиями, такими как кислотность и солевой состав среды, наличие белка-партнера и посттрансляционных модификаций. Нативно-развернутые белки осуществляют множество функций, являясь, среди прочего, узлами белок-белковых взаимодействий, структурными молекулами, ферментами. Современные анализы свидетельствуют о том, что к группе нативно-развернутых белков может относиться до 15% всех белков — значительная часть протеома, — при этом данных о связи структуры и функции таких белков крайне мало. В рамках работ по настоящему проекту мы разработаем высокопроизводительный подход для определения функциональности нативно-развернутых белков, недавно обнаруженных в тихоходках и определяющих способность этих животных переживать полное высыхание. Мы создадим библиотеку мутантов генов таких нативно-развернутых белков и определим функциональность каждого варианта при экспрессии в клетках дрожжей. На основе полученных данных мы впервые систематически проанализируем связь последовательности и функции в нативно-развернутых белках и используем полученные данные для анализа применимости существующих моделей к эволюции этой группы белков, а также исследуем возможность применения машинного обучения для предсказания функциональных нативно-развернутых белков.
1 Июля 2019 года 30 Июня 2022 года
Список публикаций по проекту
- (2020). Bioluminescence-Driven Optogenetics. Life (Basel) 10 (12), 1–11
- (2022). Heterogeneity of the GFP fitness landscape and data-driven protein design. Elife 11,
- (2020). Plants with genetically encoded autoluminescence. Nat Biotechnol 38 (8), 944–946