Обнаружил новый класс мутаций у аутизма искусственный интеллект

Искусственный интеллект в медицине

Многие мутации в ДНК, которые способствуют заболеванию, заключаются не в реальных генах, а в 99% его генома, который когда-то считался «мусором». Несмотря на то, что ученые недавно поняли, что эти огромные участки ДНК действительно играют критическую роль, расшифровка этих эффектов в широком масштабе была невозможна до сих пор.

Используя искусственный интеллект, команда под руководством Принстонского университета расшифровала функциональные последствия таких мутаций у людей с аутизмом. Исследователи полагают, что этот мощный метод обычно применим для выявления такого генетического у любого заболевания.

Особые исследования

Публикуя в журнале Nature Genetics результаты, исследователи проанализировали геномы 1790 семей, в которых один ребенок имеет расстройство аутистического спектра, а другие - нет. Метод отсортирован среди 120 000 мутаций, чтобы найти те, которые влияют на поведение генов у людей с аутизмом. Хотя результаты не раскрывают точных причин возникновения аутизма, они показывают тысячи возможных факторов, способствующих этому.

Многие предыдущие исследования были сосредоточены на выявлении мутаций в самих генах. Гены, по сути, являются инструкциями для создания многих белков, которые строят и контролируют организм. Мутации в генах приводят к мутированным белкам, чьи функции нарушены. Так же нарушается их работоспособность в различных областях организма. Мутации в этих областях влияют не на сами функции, а на их эффективность.

До настоящего времени было невозможно просмотреть весь геном на предмет фрагментов ДНК, которые регулируют гены, и предсказать, как мутации в этой регуляторной ДНК могут способствовать развитию сложных заболеваний, утверждают исследователи. Это исследование является первым доказательством того, что мутации в регуляторной ДНК могут вызывать сложные заболевания.

«Эта технология обеспечивает основу для проведения такого анализа при любых заболеваниях», - сказала Ольга Троянская, профессор информатики и геномики и старший автор исследования. Этот подход может быть особенно полезен при неврологических расстройствах, раке, заболеваниях сердца и многих других заболеваниях, которые не позволяют предпринять усилия по выявлению генетических причин.

«Это меняет наше представление о возможных причинах этих заболеваний», - сказала Троянская, которая также является заместителем директора по геномике в Флатирон-институте Фонда Саймонса в Нью-Йорке, где она возглавляла группу исследователей.

Команда также включала группу во главе с нейробиологом Робертом Дарнеллом из Университета Рокфеллера. Первыми авторами статьи являются Цзянь Чжоу и Кристофер Парк, которые получили докторские степени в Принстоне и в настоящее время посещают сотрудников Института интегративной геномики им. Льюиса-Сиглера и исследователей из Института Флэтайрон, а также Чандру Тизфельд из Института Льюиса-Сиглера в Принстоне. для интегративной геномики.

Большинство предыдущих исследований генетической основы заболевания были сосредоточены на 20000 известных генов и окружающих участков ДНК, которые регулируют эти гены. Однако даже этот огромный объем генетической информации составляет лишь немногим более 1% из 3,2 миллиарда химических пар в геноме человека. Другие 99% традиционно считались «закрытыми» или «мусорными», хотя недавние исследования опровергают это.

Новый метод

В своем новом открытии исследовательская группа предлагает новый метод, чтобы разобраться в этом огромном разнообразии геномных данных. Система использует технику искусственного интеллекта, в которой алгоритм выполняет последовательные уровни анализа, чтобы узнать о схемах, которые иначе было бы невозможно различить. В этом случае алгоритм учит себя, как идентифицировать биологически релевантные участки ДНК и предсказывает, играют ли эти фрагменты какую-либо роль в любом из более чем 2000 белковых взаимодействий, которые, как известно, влияют на регуляцию генов.

Система также прогнозирует, окажет ли нарушение одной пары единиц ДНК существенное влияние на эти белковые взаимодействия. По словам Троянской, алгоритм «исследует геном», анализируя каждую химическую пару в контексте 1000 химических пар вокруг него, пока не просканирует все мутации. Таким образом, система может предсказать эффект мутации каждой химической единицы во всем геноме.

В конце концов, он раскрывает приоритетный список последовательностей ДНК, которые могут регулировать гены и мутации, которые могут вмешиваться в эту регуляцию. До этого вычислительного достижения общепринятым способом сбора такой информации были бы кропотливые лабораторные эксперименты на каждой последовательности и каждой возможной мутации в этой последовательности.

Это число возможных функций и мутаций слишком велико, чтобы их можно было рассмотреть - экспериментальный подход потребует проверки каждой мутации на наличие более 2000 типов взаимодействий белков и повторения этих экспериментов снова и снова для разных тканей и типов клеток, что составляет сотни миллионов экспериментов. Другие исследовательские группы пытались ускорить это открытие, применяя машинное обучение к целевым участкам ДНК, но не достигли способности смотреть на каждую единицу ДНК и каждую возможную мутацию и воздействие на каждое из более чем 2000 регуляторных взаимодействий по всему геному. «На самом деле наша статья позволяет вам использовать все эти возможности и оценить их», - сказал Пак.

«Эта расстановка приоритетов сама по себе очень полезна, потому что теперь вы также можете продолжать и проводить эксперименты только в случаях с наивысшим приоритетом». Наконец, система калибрует свои прогнозы, основываясь на известных мутациях, вызывающих заболевание, и разрабатывает «оценку воздействия болезни», оценку того, насколько вероятно, что данная мутация окажет влияние на заболевание.

В случае аутизма исследователи проанализировали геномы 1790 семей с «симплексным» расстройством аутистического спектра, то есть состояние очевидно у одного ребенка, но не у других членов семьи. (Эти данные были взяты из коллекции Simons Simplex из более чем 2000 семей аутистов.) Среди этой выборки менее 30% людей, затронутых расстройством аутистического спектра, имели ранее идентифицированную генетическую причину.

Исследователи считают, что вновь обнаруженные мутации могут значительно увеличить эту долю. Способность предсказать функциональный эффект каждой мутации была ключевым новшеством в этом новом исследовании.

Предыдущие исследования показали, что трудно выявить разницу в количестве регуляторных мутаций у людей с аутизмом по сравнению с незатронутыми людьми. Новый метод, однако, рассматривал мутации, которые, по прогнозам, будут оказывать сильное функциональное воздействие, и обнаружил значительно большее количество таких мутаций у пораженных людей. Когда исследователи посмотрели на то, какие гены были затронуты этими мутациями, они оказались генами, тесно связанными с функциями мозга.

Эти недавно обнаруженные мутации влияли на исходные гены и функции, как и ранее идентифицированные мутации. «Теперь мы все ближе и ближе подбираемся к тем факторам, которые могут быть связаны с аутизмом», - сказал Тисфельд.

Эта информация также важна для семей и их врачей, чтобы лучше диагностировать расстройство и избегать слишком общих предположений о том, как аутизм одного человека может быть классифицирован с другими. «Они говорят, что, когда вы встречаете одного человека с аутизмом, то подобного случая вы уже не встретите, поскольку каждый случай аутизма индивидуален», - сказал Тизфельд. «Генетически, похоже, так же». С помощью этого нового метода команда анализирует генетические причины различных форм рака, болезней сердца и других заболеваний.

Автор статьи: Виктор Булавин