В Московском центре исследований и разработок ЕМС по облачным вычислениям и большим данным разработали программный продукт – платформу, на основе которой можно решать самые сложные задачи в области персонализированной медицины, связанные с хранением, анализом и передачей огромных объемов данных.
Разработчики надеются, что платформа внесет значительный вклад в развитие медицины. С ее помощью можно будет искать новые биомаркеры заболеваний, связанных с поломками в геноме и транскриптоме, разрабатывать новые таргетные методы лечения онкологических заболеваний, искать новые препараты. Ряд пилотных проектов по тестированию платформы уже успешно прошел в России. Теперь в компании готовятся к внедрению технологии в одну из известных израильских клиник.
Медицина будущего
Персонализированная медицина или как ее еще называют медицина будущего – одно из самых современных направлений в медицине, которое стало развиваться совсем недавно. Это направление должно изменить принципы профилактики, диагностики и лечения многих заболеваний, в том числе и самых тяжелых, а также способы разработки и методики применения лекарственных препаратов, сделать этот процесс более успешным и эффективным.
Основная идея персонализированной медицины заключается в том, чтобы на основе генетических данных конкретного человека рассказать о рисках появления у него тех или иных болезней и составить план мониторинга его здоровья для предотвращения их развития. А, если заболевание уже диагностировано, то персонализированная медицина поможет выяснить, какое лечение будет эффективнее, и какие лекарственные препараты и в каких дозах окажут наилучший результат.
Генетика и биология….
Появление персонализированной медицины стало возможно благодаря знаменитому проекту по секвенированию генома человека – Human Genome Project (стоимость 2,7 млрд долл). Проект продолжался 20 лет с 1984 по 2003 год, и в нем участвовало множество научных коллективов со всего мира. В результате, ученые выяснили, что геном человека состоит из более 3 млрд пар нуклеотидов.
Но секвенирование генома человека — это лишь воспроизведение последовательности букв в тексте, который мы пока не можем прочитать. Расшифровать этот текст, понять, как работает геном – это, наверное, сейчас одна из самых важных задач в биологии, без решения которой невозможно развитие персонализированной медицины.
И в этой области сделано уже достаточно много. Например, ученые уже поняли, что в геноме существуют структурные различия. Оказалось, что множество участков ДНК у разных людей отличаются. Самое распространенное отличие – это замена одного нуклеотида (кирпичика, из которого построена ДНК) на другой. Изучение этих отличий очень важно для поиска генетических вариаций, связанных с какими-либо болезнями.
Также биологи пришли к пониманию, что существуют еще и функциональные различия в геноме разных людей, связанные с тем, как эти гены работают (транскрибируются). И особенности их работы также могут быть связаны с определенными заболеваниями.
В настоящее время стала активно развиваться системная биология, которая изучает работу клеточных систем в целом: то есть рассматривает взаимодействие ДНК (геномика), РНК (транскриптомика) и белков (протеомика).
Очевидно, что в любой этой области ученым приходится иметь дело с огромным объемом данных. Например, только данные генома одного человека, сошедшие с секвенатора, в цифровом виде занимают 0,5 терабайта, а эти данные уже в обработанном виде в три-четыре раза больше. Специалистам же нередко приходится иметь дело с геномами тысяч и десятков тысяч людей. Например, в Великобритании проводится проект Genomics England по секвенированию 100.000 геномов, характеризующих редкие и онкологические заболевания. В администрации США существуют планы по секвенированию миллиона геномов, у Китая есть план по секвенированию геномов миллиона граждан этой страны.
Если говорить о системной биологии, то объемы данных, с которыми приходится оперировать, еще больше. А для исследований в области персонализированной медицины к тому же часто приходится совмещать данные разного формата: генетические и клинические.
Очевидно, что обработка, хранение и передача всех этих огромных объемов информации или «больших данных» – задача очень непростая.
Новая платформа
В Московском центре ЕМС разработали платформу, которая позволяет решить эту проблему. Как говорит вице-президент корпорации ЕМС, генеральный директор Центра исследований и разработок EMC по облачным вычислениям и большим данным Камиль Исаев, основная цель, к которой они стремятся - использовать платформу на площадках клиник и научно-медицинских центров, которые занимаются разработками в области персонализированной медицины. Сейчас, например, готовится к старту проект по внедрению платформы в одну из ведущих израильских клиник.
Это крупнейший в мире центр, в котором занимаются не только лечением онкологических заболеваний, но и научными разработками в области персонализированной медицины, в том числе и с помощью биоинформатики.
«Известны сотни, если не тысячи мутаций, которые ведут к тем или иным онкологическим заболеваниям, но поиск протонкогенов, которые промутировав вызывают онкологию, продолжается. Эта основная задача, которая стоит перед биоинформатическими лабораториями ведущих клиник, и они ожидают нашей помощи именно в этом», - говорит Камиль Исаев.
По его словам, внедрение платформы на площадки клиник даст очень многое. Это и разработка таргетной терапии в онкологии (когда лекарство направлено на определенную мишень), это выбор и подбор лекарственных препаратов, в том числе, возможно, которые уже используются для лечения других заболеваний, это и диагностика и профилактика этих заболеваний.
Тем временем, несколько коллективов российских исследователей уже применили платформу, разработанную Московским центром ЕМС, для своих исследований в пилотных проектах.
«Транскриптомные данные – это горячие пирожки, которые сейчас быстро расхватывают»
«Основная догма молекулярной биологии – ДНК делает РНК, РНК делает белок. Важно анализировать все три компонента - ДНК, РНК, белки - для того, чтобы понять, как работает клетка. Этим и занимается системная биология. Мы научились хорошо восстанавливать из коротких фрагментов геномную ДНК, но транскриптом потребовал особого внимания. Для его сборки и анализа понадобился новый алгоритм. Тогда мы создали сборщик РНК данных и соединили его с большой протеомной программой, созданной коллегами из Калифорнии, на платформе ЕМС. В результате это позволяет собирать огромные данные транскриптома и анализировать их вместе с протеомными», - говорит Алла Лапидус, заместитель директора лаборатории алгоритмической биологии Академического Университета РАН.
По ее словам, эти данные очень важны для медицины, поскольку изменения транскриптома свидетельствуют о целом ряде заболеваний, в первую очередь, неврологических и онкологических. «Поняв, что сломалось в транскриптоме, мы можем понять, как лечить то или иное заболевание. Транскриптомные данные – это горячие пирожки, которые сейчас быстро расхватывают», - добавляет Алла Лапидус..
От науки в реальную медицину
Еще один проект, выполненный с помощью платформы ЕМС, уже успешно внедрен в клиническую практику. В лаборатории Parseq Lab (Санкт-Петербург) было создано решение для диагностики у новорожденных тяжелых наследственных заболеваний - муковисцидоза, фенилкетонурии и галактоземии при помощи технологии секвенирования генома. Такой неонатальный скрининг (кроме этих трех заболеваний он включает еще два) проводится в Санкт-Петербурге с конца 2014 года и является теперь обязательным. Причем, это первый в России случай внедрения высокопроизводительных геномных исследований в обычную медицинскую практику.
«От науки до реальной медицины - большое расстояние. Основная наша цель – внедрение диагностических инструментов, которые создаются упорным трудом в научных лабораториях, в клиническую практику. На три заболевания создан наш тест, на основе которого можно поставить генетический диагноз, а уже на его основе в некоторых случаях можно поставить клинический диагноз. Этот процесс называется трансляцией. Для некоторых заболеваний такая трансляция достаточно несложный процесс, для других – это искусство», - говорит генеральный директор Parseq Lab Александр Павлов.
По его словам, основные трудности, с которыми приходится сталкиваться в их работе с геномными данными – это хранение, управление и передача информации. «И эти вызовы успешно решает платформа ЕМС», - отмечает Александр Павлов.
Еще один проект, выполненный также на основе платформы ЕМС в Центре геномной биоинформатики им. Ф.Г. Добржанского (Санкт-Петербургский государственный университет), связан с изучением генетического разнообразия возбудителя туберкулеза. «В качестве пилотного эксперимента мы провели сборку генома Mycobacterium tuberculosis (возбудителя туберкулеза). Проблема с заболеваемостью туберкулезом в России серьезная. Цель наших проектов - связать генетическое разнообразие штаммов Mycobacterium tuberculosis с географическим положением. Это позволяет делать выводы о распространении штаммов, генетических факторах, которые влияют на их чувствительность или устойчивость к различным лекарствам», - рассказывает ведущий научный сотрудник Центра Антон Свитин.
Сохранить редких животных
Еще одна группа проектов на основе платформы ЕМС, выполненная в Центре геномной биоинформатики СПбГУ, связана уже с совсем другим направлением – сравнительной и эволюционной геномикой.
«Мы получаем данные по секвенированию генома редких млекопитающих, которые находятся на грани вымирания, аннотируем эти данные, выясняем, какие фрагменты за что отвечают, какова их роль. Так, мы провели сборку генома амурского леопарда (Panthera pardus orientalis). Этих животных осталось всего 50-70 особей, вид находится на грани уничтожения. Изучение генома амурского леопарда, который является исчезающим видом, может помочь сформулировать природоохранную стратегию, направленную на сохранение этого вида животных. Например, если окажется, что другой близкородственный подвид леопарда является генетически близким к амурскому, это родственный вид может стать ресурсом для восстановления популяции (так, например, было в случае амурского и закавказского тигров). Кроме того, анализ генома амурского леопарда может помочь оценить состояние популяции этого вида, что также важно для природоохранных усилий», - говорит Антон Свитин.
текст: Анна Говорова/Infox.ru