Moscow seminar on Bioinformatics 2012-2014

Московский семинар

по биоинформатике

Контакты

Схема проезда:

ФБиБи, МГУ

Статья о семинаре

Краткие резюме докладов

		2012-14 2009-11 2006-08 2003-05 2000-02 1997-99 1994-96

308. 30.05.2016		Magnus Fontes Институт Пастера, Париж, Франция Mathematical modelling for the Healthy Human Global project The Healthy Human Global project is a globalization of the unique Milieu Interieur (MI) project coordinated by the Institut Pasteur in Paris. In the ambitious MI project, comprehensive sets of different omics-variables have already been measured on 1000 healthy individuals and are currently being analyzed in order to obtain an understanding of the variability of human immune responses. The goal of the Healthy Human Global project is to delineate the boundaries of healthy human immune responses for the global human population. I will present the healthy Human Global project, discuss the modelling and computation currently being undertaken in the project, and elaborate on the new challenges in modelling and computation that arise for these massive global biomedical datasets. The Healthy Human Global Project

307. 16.03.2016		Константин Попадьин Центр Интегративной Геномики, Университет Лозанны, Швейцария Роль слабовредных мутаций в определении жизнеспособности эмбрионов Широко известно, что во время эмбриогенеза естественный отбор может эффективно элиминировать наименее приспособленные эмбрионы. Так, например, геномы нежизнеспособных (подвергшихся спонтанному абортированию) эмбрионов, намного чаще содержат крупные хромосомные аберрации, нежели геномы жизнеспособных эмбрионов. Однако, совсем ничего не известно о различиях между выжившими и невыжившими эмбрионами, содержащими одну и ту же хромосомную аберрацию. Рассматривая трисомию хромосомы 21 (синдром Дауна), которая характеризуется 80% вероятностью самопроизвольного аборта, я предлагаю гипотезу, согласно которой суммарный груз слабовредных мутаций может оказаться решающим в судьбе эмбриона. Анализируя генетические и транскриптомные данные когорты европейцев с синдромом Дауна, я представлю несколько свидетельств существования класса мутаций, которые увеличивают вероятность живорождения эмбрионов с трисомией. Причем механизм этой компенсации может базироваться как на увеличении частоты условно полезных вариантов (мутации, присутствие которых увеличивает вероятность выжить только при условии трисомии, но нейтральные в отсутствии трисомии) так и на уменьшении частоты безусловно-вредных мутаций (вредные всегда). Пониженная частота безусловно-вредных мутаций мне наиболее интересна и, используя простую математическую модель, я обсуждаю гипотезу генетического гандикапа, согласно которой носитель вредной мутации (генетического гандикапа) может обладать пониженным грузом слабовредных мутаций по сравнению с контрольной (здоровой) популяцией.

306. 16.02.2016		Сергей Козырев Математический институт им. Стеклова, Москва Модель фрагментов белков и статистические потенциалы Ссылка на публикацию Рассматривается модель конформаций белков, в которой конформации белков являются комбинациями конформаций коротких фрагментов белка. Для таких фрагментов мы рассматриваем распределение частоты встречаемости пар (последовательность аминокислот, конформация), усреднённое по некоторым шарам в пространствах последовательностей и конформаций. Далее, мы рассматриваем модель статистических потенциалов для конформаций фрагментов белка, в которой статистические потенциалы описывают рассмотренные усреднённые частоты встречаемости, и обсуждаем модель свободной энергии для белка, в которой свободная энергия равна сумме статистических потенциалов фрагментов. В данной модели также рассматриваем вклады в энергию конформации от контактов фрагментов, а также от статистических потенциалов иерархического набора фрагментов белка, строящегося по распределению частот встречаемости коротких фрагментов. Обсуждается применение такой модели к восстановлению нативной конформации белка по его первичной структуре. Обсуждается модификация структурного выравнивания, учитывающая статистические потенциалы для фрагментов.

305. 14.01.2016		Дмитрий Колобков Институт системной биологии, Москва Идентификация параметров математической модели по гетерогенному набору экспериментальных данных Идентификация параметров математической модели заключается в получении их точечной и доверительной оценки. Первая показывает значения параметра, при котором модель лучше всего (в том или ином смысле) описывает экспериментальные данные. Вторая показывает вариабельность точечной оценки при условии независимого повторения экспериментов. В работе рассматривается точечная оценка (ОМП), полученная методом максимального правдоподобия, и доверительные оценки, полученные разными асимптотическими методами, которые сравниваются между собой. В работе рассмотрены доверительные оценки трех видов: доверительные интервалы для одного параметра, доверительные области для вектора параметров и доверительные полосы для скалярной функции от вектора параметров. Точные методы построения доверительных оценок изучены слабо и сложны в реализации; приближения (например, численное интегрирование), неизбежные при реализации этих алгоритмов, приводят к значительному снижению точности. В связи с этим на практике применяются асимптотические методы, чья точность падает с уменьшением мощности набора экспериментальных данных. В работе рассматриваются и сравниваются четыре метода доверительного оценивания. Первый метод основан на линеаризации модели и предполагает, что стандартизованная ОМП (для вектора параметров) распределена по Стьюденту. Второй метод основан на обращении статистики F-теста и предполагает, что некоторая функция от ОМП распределена по Фишеру. Третий метод основан на обращении статистики теста отношения правдоподобий. Четвертый метод использует бутстреппинг для описания распределения ОМП. Гетерогенные экспериментальные данные – данные, полученные в результате различных экспериментов с различно распределенной экспериментальной ошибкой – усложняют поставленную задачу. В частности, широко известное решение задачи поиска оценки максимального правдоподобия методом наименьших квадратов перестает работать. Разработанная методология предполагает использование гетерогенных экспериментальных данных. Дизайн эксперимента используется для постановки эксперимента, который даст больше информации о модели при прежней затрате ресурсов. Новый подход к моделированию подразумевает не единовременную трату всех экспериментальных ресурсов, а цикличное выполнение последовательности этапов: эксперимента, оценки параметров и дизайна эксперимента. Ключевой вопрос дизайна эксперимента – выбор критерия оптимальности. Многие критерии оптимальности используют доверительные оценки. Так, популярный D-оптимальный критерий, предполагающий максимизацию определителя матрицы информации, сводится к задаче минимизации объема доверительного эллипсоида – доверительной области, построенной методом, основанным на линеаризации модели. В работе предлагаются альтернативные оптимальные критерии, использующие доверительные оценки, полученные методом, основанным на тесте отношения правдоподобий.

304. 24.12.2015		Илья Киселев Институт системной биологии, Новосибирск Модульное моделирование биологических систем на примере сердечно-сосудистой системы человека В работе разработан вариант модульного подхода к моделированию сложных биологических систем. Подход заключается в декомпозиции системы на подсистемы, каждая из которых может моделироваться отдельно с использованием своего собственного формализма и численного метода. Модульная модель всей системы строится как композиция таких подмоделей (модулей) с установленными связями между ними. В работе использовалась платформа формального описания биологических систем BioUML (www.biouml.org), которая была существенно доработана и дополнена автором. Особое внимание также уделено проблемам совместимости с существующим стандартом описания моделей биологических систем SBML – Systems Biology Markup Language (Hucka et al., 2003). Разработанные подходы использованы для создания новой модели сердечно-сосудистой системы человека. Модели, как и все созданные программные модули, доступны в составе BioUML по адресу www.biouml.org.

303. 08.10.2015		Olga V. Kalinina Department for Computational Biology and Applied Algorithmics, Max Planck Institute for Informatics, Saarbrucken, Germany A structural approach to functional characterization of a non-synonymous single nucleotide polymorphysms from the whole genome sequencing data Next-generation sequencing enabled simultaneous analysis of hundreds of genomes associated with a particular phenotype. These genomes naturally contain a lot neutral variation, thus one needs to distinguish functionally significant from passenger mutations. Experimental functional annotation of all mutations is not an option, so alternative computational tools are needed. One possibility to annotate mutations functionally is to consider their spatial location with respect to functionally relevant sites in the three-dimensional structures of the respective proteins. Unfortunately, an experimentally resolved three-dimensional structure is rarely available, so computational reconstruction of structure is an attractive alternative. We have computationally modeled the resistance-associated mutations from the whole genome sequences of S.aureus strains with artificially developed resistance towards a new compound with antibiotic activity, disciformycin. We have shown that the resistance-associated mutations map to conserved amino acid residues in the β and β’ subunits of RNA polymerase. Docking suggests that the resistance-associated mutations significantly decrease the affinity of disciformycin to these proteins. Based on our modeling, we proposed a mechanism of inhibition that states that the inhibitor binds to the protein-protein interaction interface, thus precluding RNA synthesis. In another project, we have analyzed several sets of proteins harboring mutations associated with cancer, other diseases and neutral variations. We were able to reconstruct up to 37% of cancer-associated proteins, and observe that cancer-associated mutations are enriched on protein-protein and protein-DNA interaction interfaces, and thus are potentially involved in disruption of signaling. In contrast, mutations associated with non-cancer diseases are enriched in protein core and active sites and potentially disrupt protein function as a whole.

302. 02.04.2015		Olga V. Kalinina Department for Computational Biology and Applied Algorithmics, Max Planck Institute for Informatics, Saarbrucken, Germany Combination of sequence and structure analysis with molecular dynamics simulations provides new insights into evolution and adaptation of HIV-1 proteins In 2013, over 35 million people were living with HIV around the world. As one of the major health hazards, HIV-1 has been a subject of intensive research. Antiretroviral drugs are efficient in controlling the virus over decades, but it cannot be cleared from the host organism completely. Currently, over 145,000 sequences of the HIV-1 Pol gene can be found in the Los Alamos HIV sequence database. Structurally, the viral particle can be reconstructed in great detail with three-dimensional structures of ten of its 19 proteins available in high resolution. In this talk, I will present how this information can be used for understanding the patterns of global HIV-1 evolution, as well as of adaptation to the host immune system or the antiretroviral treatment. First, we will explore the distribution of patches of extreme high and low conservation on the surface of HIV-1 proteins, and their correlation with binding sites with other viral and host proteins, particularly the broadly neutralizing and specific antibodies. In the second part, I will show how molecular dynamics can be used to rationalize the molecular mechanisms of resistance due to mutations that arise during antiretroviral treatment and eventually lead to the therapy failure.
301. 19.03.2015		Л.А.Урошлев (*), И.В.Кулаковский, Н.Г.Есипова, С.В.Рахманов, В.Ю.Макеев ИОГен РАН и ИМБ РАН Предсказание сайтов связывания катионов в белках, с учетом структурной воды Ионы являются неотъемлемыми кофакторами различных белков, таких как инсулин или кальмодулин. Обычно, за связывания иона ответственнен локальный участок белка, имеющий характерную трехмерную структуру, называемый мотивом связывания иона Обычно, для идентификации такого рода мотивов используют структурные шаблоны или структурные выравнивания. Однако, существует ряд случаев в которых такой подход не работает. К таким случаям относятся сайты связывания в апо-формах белков (закристаллизованных без иона), поскольку структура белка может меняться при связывании иона. Молекулы воды, жестко связанные в структуре белка, могут вносить существенный вклад в связывание иона-кофактора, и обычно также не учитываются при построении структурных шаблонов. Для определения сайтов связывания ионов, на основе метода статистических потенциалов, была разработана программа PIONCA. В докладе будут описаны взаимодействия, вносящие определяющий вклад в связывание двухвалентных катионов Ca2+, Mg2+ и Zn2+. Показано, что связывание различных ионов определяется взаимодействиями с атомами различных аминокислот, специфических для каждого типа иона. Также оказалось, что молекулы воды, жестко связанные со структурой белка, вносят определяющий вклад в связывание Ca2+, и Mg2+, но не Zn2+. В докладе будет также продемонстрирована эффективность программы PIONCA, и проведено ее сравнения с другими программами предсказания ионов, основанных на различных принципах.

© Seminar, 1993 - 2016