Moscow seminar on Bioinformatics 2006-2008

Московский семинар

по биоинформатике

Новости

Контакты

Схема проезда:

ИМБ

ФБиБи, МГУ

Статья о семинаре

Краткие резюме докладов

2012-14 2009-11 2006-08 2003-05 2000-02 1997-99 1994-96

187.

12.01.2006

A.M. Leontovich

Belozersky Institute of Physico-Chemical Biology, MSU

Avoiding artefact clusters of gene expression profile

A.M. Леонтович

Институт физико-химической биологии им. А.Н.Белозерского МГУ

Как определить, являются ли кластеры генов (профилей их экспрессии) артефактными

Общепринятой технологией для выяснения того, как влияют биологические условия (например, действие лекарств) на экспрессию генов и на их взаимодействие, является анализ результатов гибридизации на чипах. Каждой пробе (биологическому условию) соответствует свой чип, а каждому гену – свое место (ячейка) на чипе (одно и то же для чипов, соответствующих разным пробам). Для каждого гена и каждой пробы вычисляют значение экспрессии этого гена. Набор таких значений для фиксированного гена образует «профиль», такой профиль показывает, как зависит работа гена от проб (т.е. от биологических условий). Затем производят кластеризацию найденных профилей (т.е., по существу, генов). Обычно предполагается, что четко найденные кластеры указывают на биологическую взаимосвязь соответствующих генов, на их согласованное поведение при разных биологических условиях. Однако на самом деле часто «хорошие» кластеры могут появиться не из-за реальных биологических воздействий на гены, а являются артефактными (например, возникают из-за наличия грязи в некоторой области какого-либо чипа). В работе описана методика, позволяющая определить, какие из найденных кластеров биологически осмысленны, а какие из них на самом деле – артефактные. Она основана на том, что гены распределяются по ячейкам чипа случайным образом, и поэтому ячейки, соответствующие генам, входящим в биологически осмысленные кластеры, должны распределяться на чипе равномерно. Если же они распределены на чипе неравномерно (например, образуют на чипе четкий кластер), то это показывает, что соответствующий кластер профилей артефактный.
В докладе будет предварительно рассказано, как производится кластеризация профилей генов.

188.

19.01.2006

Pavel S. Novichkov

National Center for Biotechnology Information, NIH, Bethesda, USA and FBB MSU

Павел С. Новичков

Национальный центр биотехнологической информации, США и ФББ МГУ

Эволюция нуклеотидного состава синонимичных позиций в бактериальных геномах

Стационарность нуклеотидных частот, т.е. постоянство нуклеотидного состава во времени, является одним из наиболее общепринятых предположений при построении эволюционных моделей.
Именно этот класс моделей используется в таких популярных программах, как PAML, MrBayes (на самом деле требуется еще более сильное условие – обратимость эволюционного процесса во времени), которые широко применяются для оценки эволюционных расстояний и в решении целого ряда филогенетических задач.
Данная работа посвящена проверке гипотезы о стационарности нуклеотидных частот и выявлению закономерностей эволюции нуклеотидного состава. Анализ группы близкородственных геномов, находящихся на “правильных” расстояниях, позволяет выявить направление эволюционного процесса, и ответить на вопрос о стационарности нуклеотидного состава. В данном сообщении будут представлены предварительные результаты анализа таких групп геномов из разных бактериальных таксонов. По всей видимости, предположение о стационарности нуклеотидного состава в бактериальных геномах не отвечает действительности. Будут представлены выявленные закономерности эволюции нуклеотидного состава.

189.

2.02.2006

Konstantin Severinov

Rutgers University

Comparative analysis of molecular mechanisms ensuring stable propagation of bacterial restriction-modification systems

Константин Северинов

Университет Ратгерс и ИМГ

Type II R-M systems consist of i) a restriction endonuclease that recognizes a specific DNA sequence and introduces double-stranded breaks at or around the recognition site and ii) a methyltransferase (methylase) that recognizes the same DNA sequence and methylates it. Methylation prevents site recognition by the endonuclease and thus protects the target DNA from cleavage. Type II R-M genes are often plasmid-encoded and can spread from one bacterial host to another, crossing species boundaries and impacting genome evolution on a global scale. While some view R-M systems as purely selfish, i.e., concerned with their own propagation through bacterial populations, a plasmid containing R-M genes can confer selective advantage by, for example, protecting the host from bacteriophage infection, which the phage will have to overcome by acquiring specialized antirestriction genes.
During cell entry and establishment of a plasmid containing R-M genes, unmodified host DNA can be attacked by the endonuclease, causing host cell death. It is therefore intuitively clear that expression of R-M genes should be regulated to ensure that enough methylase is produced to methylate host DNA before endonuclease is synthesized. Since many R-M genes are found clustered on broad-range mobile genetic elements, coordinated expression of these genes should occur in different bacteria, i.e., should be independent of host regulators. Known mechanisms that ensure such coordinated expression will be discussed.

190.

14.02.2006

Юрий Магаршак

Yury Magarshak

MathTech, Inc. (New York)

Complementary Algebra and its Applications in Molecular Biology, Physiology, Physics and Computer Science

Комплементарная алгебра была разработана для объяснения экспериментов с цветным зрением человека. Комплементарность цветов и образование цветного круга из линейного электромагнитного спектра на уровне восприятия основано на жесткой структуре изоморфной комплексным числам с плотностью. Генератором математических структур этого типа является конечная группа и ее регулярное представление. Спиноры представляют собой частный случай комплементарных алгебр, генерируемых группой кватернионов. Генераторами структуры, соответствующей цветному зрению человека, являются группы вращений. Альернативным матричному является векторные представления комплементарных алгебр, в котором компоненты также генерируются конечными группами симметрии.
Показано, что между функциями комплексного переменного с плотностью и цветными изображениями имеется взаимно однозначное соответствие. Обсуждается принцип комплементарности в самых различных проявлениях и перспектива использования в системах, в которых имеется комплементарность, комплементарных алгебр. Гипотеза о том, что комплементарные алгебры являются основой не только зрения, но и одним из основных механизмов функционирования нервной системы, представляется интригующей и плодотворной.
Соавторы: Fedor Bogomolov (New York University и Институт им. Стеклова РАН, Москва), Louis Kauffman (City University of Chicago), Ove Franzen (University of Upplsala).

191.

9.03.2006

Mariya Yudkevich

Higher School of Economics

Networks in academic communities

Мария Юдкевич

Высшая школа экономики

Сети в академических сообществах: мы работаем, мы цитируем, и как это выглядит со стороны

Сети, образованные связями соавторства или цитирования, в различных дисциплинах имеют разную структуру. Можно ли по характеристикам соответствующих графов сделать какие-либо выводы о том, каковы особенности этой дисциплины?
В обзорном докладе представляются основные результаты, полученные исследователями этого вопроса, и разнообразные иллюстративные примеры.

192.

23.03.2006

Artyom Kopp

University of California, Davis

Molecular basis of phenotypic evolution: integrating developmental and evolutionary genetics

A key challenge in biology is to understand the genetic and molecular mechanisms of phenotypic evolution and speciation. To approach this problem, our lab combines developmental biology with quantitative genetics and phylogenetic analysis. Using different species of Drosophila as models, we seek to identify DNA sequence changes responsible for evolutionary innovations, to understand how these changes affect development and translate into phenotypic diversity, and to elucidate the evolutionary forces that promote these changes. I will describe our recent work on two rapidly evolving morphological traits - cuticular pigmentation and "sex combs" (male-specific structures involved in Drosophila courtship and mating).

193.

6.04.2006

Сергей Нуждин

Университет Калифорнии, Дэвис

Теория эволюции в пост-геномную эру

Sergei Nuzhdin

University of California, Davis

Deciphering evolution in post-genomic era

Quantitative genetics and molecular evolution have traditionally focused on genes. Recent technological (high throughput genotyping, RNA, and protein analyses) and conceptual (theoretical analyses of genetic network) advances are shifting the focus to systems of interacting genes. We have pioneered efforts to a) characterize genetic variation within species and divergence between them at the level of the whole genome transcript, b) estimate to what extent intraspecific variation is heritable, and c) elucidate what fraction of intraspecific expression variation and interspecific transcript level divergence is attributable to cis regulatory regions. For instance, by comparing genetic variation in transcription levels among D.simulans to the divergence between D.simulans and the closely related D.melanogaster, we have identified genes under strong directional selection. Further, we have shown that the proteins coded for by these genes are rapidly evolving.

194.

4.05.2006

Judith Plesset-Levens

National Science Foundation, USA

National Science Foundation, USA: How it Makes Funding Decisions

The National Science Foundation is one model for the peer review of competitive science research funding in the United States. Details of how the model operates will be presented. The importance of peer review and the involvement of working scientists in the decision makin process are keys to this model. A discussion of what are the rationales for the rules and preceedures under which it operates will also be presented.

195.

17.05.2006

Эрик Сиггиа

Университет Рокфеллера, Нью Йорк, США

Флюктуации и клеточный цикл дрожжей

Eric Siggia

Center for Studies in Physics and Biology, Rockefeller University, New York, USA

Fluctuations and the Cell Cycle in Yeast

Microcolonies of budding yeast have been imaged at 3 minute intervals as they expand from one to 50-100 cells. With the aid of several fluorescent markers that define cell cycle events the variability in timing has been measured as a function of ploidy (copies of the genome). The timing of certain events appears to be limited by molecular noise, and the genes responsible were traced by varying gene copy number. By imaging cells deleted for genes governing the transition from G1 to S phase, we have shown that there is a gene module that affects this transition and functions as a unit. The problem of how cells control their size will also be touched upon. These measurements illustrate the richer phenotypes obtained from single cell measurements for mutations that were originally defined at the population level.

196.

01.08.2006

V.S. Fridman

MSU, Dept. of Biology, Moscow

В.С. Фридман

Лаб. экологии и охраны природы, Биологический ф-т МГУ, Моск

Расшифровка "языка животных" и определение "значений" сигналов - проблема метода (на примере системы территориальных сигналов большого пестрого дятла Dendrocopos major L)

Безуспешность попыток расшифровки "языка животных" связана с нереш нностью этологами проблемы метода (Резникова, 2005; Панов, 2005). До сих пор не существует объективного, проверяемого и воспроизводимого метода, который позволял бы провести реконструкцию специализированных знаковых системы. Очевидно, соответствующий метод должен обеспечивать "прохождение" последовательных стадий анализа сигнальных систем в процессе коммуникации животных:
А) объективно выделить демонстрации как определ нные структуры действий, обладающие специфическим образом, устойчиво воспроизводимом при каждом отдельном акте демонстрирования;
Б) объективно (количественно или полуколичественно) оценить устойчивость этих "значащих структур", определить выделенность каждой из них на фоне континуума несигнальных (недемонстративных) действий, сопровождающих демонстрации во всех взаимодействиях;
В) oпределить тип восприятия демонстраций "компетентным читателем": что воспринимается? - cоответствующий образ сигнала или специфический эффект воздействия демонстраций как ключевых раздражителей;
Г) обладают ли демонстрации определ нным "значением", способны ли оба участника взаимодействия, и при мник, и сам демонстратор адекватно использовать информацию, переданную сигналами, и выигрывать взаимодействия именно за сч т этого даже в условиях, когда собственная мотивация птицы или "давление" стимуляции от партн ра "подсказывают" принципиально иное решение.
Если подобная ситуация появляется в норме во взаимодействиях определ нного типа, можно считать доказанным как факт при ма-передачи информации, так и факт функционирования определенных демонстраций как знаков специализированной знаковой системы ("языка"), выступающих специализированными посредниками в данном информационном обмене;
Д) Когда доказано, что определ нный ряд демонстраций представляет собой специализированную знаковую систему ("язык"), необходимы методы, позволяющие реконструировать "синтаксис", "семантику" и "прагматику" употребления знаков в соответствующем процессе общения.
На примере анализа системы территориальной коммуникации в осенне-зимних поселениях большого пестрого дятла (Dendrocopos major L: Picidae: Aves) разработана система методов, позволяющих последовательно решать проблемы А-Д и, соответственно, реконструировать специализированную знаковую систему, обслуживающую информационный обмен в агонистических взаимодействиях вида в контексте охраны территории. Доклад посвящен, во-первых, обоснованию метода реконструкции сигнальных систем, установления "знаковости" демонстрации и расшифровки "значений" отдельных сигналов ряда, во-вторых, описанию конкретной расшифровки "языка" территориальной коммуникации D. major.

197.

8.06.2006

А. Морозов

Университет Рокфеллера

Использование принципов механики ДНК для расшифровки нуклеосомного кода

A. Morozov

Center for Studies in Physics and Biology, The Rockefeller University

Using principles of DNA mechanics to decipher the nucleosome positioning code

Transcriptional regulation in eukaryotic genomes is believed to be strongly affected by the chromatin structure - DNA packaged into nucleosome particles is not as easily accessible to DNA binding factors as nucleosome-free DNA. Nucleosome formation in vivo is determined in part by histone-DNA interactions: DNA sequences tested in the lab exhibit more than a thousand-fold range of binding affinities. Understanding the mechanism of nucleosome formation is thus an important step towards deciphering how eukaryotic gene regulation is affected by chromatin structure.
We developed a model for predicting nucleosome binding affinities and specificities based on the physico-chemical rules of DNA mechanics. In this model, the total energy of a DNA molecule is described as a sum of the sequence dependent elastic energy and the constraint term constructed to penalize deviations of the DNA conformation from the nucleosomal superhelix. Because DNA is sharply bent in nucleosomes, the sequence dependence of the elastic energy allows us to identify high and low affinity sequences, and to predict nucleosome positions on the genomic scale. Our model successfully ranks sequences for which experimental binding affinity measurements are available. It provides simple mechanistic explanations for energetically preferred DNA sequence motifs. Genome-wide calculations of nucleosome occupancies demonstrate that the yeast genome encodes an intrinsic nucleosomal organization, which is likely to serve as an important mechanism for facilitating in vivo chromosomal functions. Experimental tests of computationally designed nucleosome positioning sequences are currently underway. Predictions of nucleosome binding specificities will be incorporated into future integrative models of eukaryotic gene regulation.

198.

15.6.2006

Елена Набиева

Принстонский Университет

Анализ сетей белок-белковых взаимодействий разложением на схемы путей

Elena Nabieva

Princeton University

Analyzing protein interaction networks via pathway schemas

High-throughput technologies have led to proteome-scale interaction maps for several organisms. Computational analysis of these networks can reveal important principles of cellular organization and help uncover protein function. Towards such analysis, we introduce pathway schemas to specify recurring means with which biological processes are carried out. In this talk, I will discuss our approach to uncover and query network schemas within interaction graphs. We show that network schemas can be used to uncover functionally cohesive subnetworks of interest.

199.

6.7.2006

Sergey Nechaev

LPTMS (Orsay, France) and Landau Institute of theoretical Physics (Russian Academy of Sciences)

On topological correlations in "dense" trivial knots, or what is common between the "crumpled" globule and random walks in non-Euclidean spaces

Сергей К. Нечаев

LPTMS (Orsay, France) и ИТФ им. Л.Д. Ландау РАН, Россия

О топологических корреляциях в "плотных" тривиальных узлах, или что общего между фрактальной ("crumpled") глобулой и случайными блужданиями в неевклидовых пространствах

В докладе речь пойдет о современных аналитических и численных достижениях в уже устоявшейся науке о статистике узлов (в свое время в статистической физике макромолекул это направление было инициировано работами Франк-Каменецкого, Вологодского, Лукашина и Аншелевича). Основное внимание будет уделено следующему вопрому. Какова типичная сложность квазиузла, который является произвольной "дочерней" частью замкнутого незаузленного "материнского" полимера в глобулярном состоянии? Данный вопрос проанализирован полуаналитически/получисленно на примере модели плотных решеточных узлов и показано, что любая "дочерняя" часть "материнского" узла является слабо заузленной.
Данный вывод может рассматриваться в качестве серьезной аргументации в пользу необычной фрактальной структуры полимерной глобулы, образованной кольцевым незаузленным гомополимером, т.наз. "crumpled globule" предложенной лет 15 назад в совместной работе с Гросбергом и Шахновичем.
Полученные результаты о топологических корреляциях в тривиальных узлах имеют под собой основу, связанную со статистикой замкнутых случайных блужданий (т.наз. "броуновских мостов") в пространстве постоянной отрицательной кривизны (Лобачевского), дискретным аналогом которого является обычное дерево Кэли.
Все необходимые понятия (топологический инвариант, сложность узла, случайное блуждание в пространстве Лобачевского) будут определены в процессе изложения.

200.

31.09.2006

Ekaterina Panina

University of California, Los Angeles

On the trail of the murderous protein

Although multiple in vitro and in vivo phenotypes have been associated with the Bordetella type III secretion system (TTSS), the effector proteins responsible had not been previously identified. We developed a computational screen for TTSS effectors in the genomes of Gram-negative bacteria based on biophysical and functional characteristics of class I chaperones and their frequent co-localization with TTSS effectors. When applied to B. bronchiseptica, this method identified a single candidate locus, btcA-bteA. The function of BtcA and BteA as a chaperone-effector pair was further experimentally validated. We next decided to determine BteA function inside the eukaryotic cells. Recent data on BteA activity and its intracellular localization will be discussed.

201.

14.09.2006

G. Bazykin

Princeton University

Bursts of non-synonymous substitutions in HIV-1 evolution reveal instances of positive selection at conservative protein sites

The fixation of a new allele can be driven by Darwinian positive selection or can be due to random genetic drift. Identifying instances of positive selection is a difficult task, because its impact is routinely masked by the action of negative selection. The nature of the genetic code dictates that positive selection in favor of an amino acid replacement should often cause a burst of two or three nucleotide substitutions at a single codon site because a large fraction of amino acid replacements cannot be achieved after just one nucleotide substitution (Gillespie JH Evolution 38, 1116-1129, 1984). Here, we study pairs of successive non-synonymous substitutions within a codon in the course of evolution of HIV-1 genes. Such pairs are more numerous and more clumped than what is expected if different substitutions were independent and than what is observed for pairs of successive synonymous substitutions. Bursts of non-synonymous substitutions in HIV-1 evolution cannot be explained by mutational biases, and must, therefore, be due to positive selection. Clumping is the strongest at codon sites with low overall rate of non-synonymous evolution, implying that a substantial fraction of replacements of conservative amino acids are driven by positive selection. We identified many conservative sites of HIV-1 proteins that occasionally experience positive selection.

202.

09.11.2006

Мария Самсонова

Санкт-Петербургский политехнический университет

Системная биология детерминации сегментов

Методами системной биологии исследованы механизмы развития в морфогенетическом поле, контролирующем сегментацию у плодовой мушки дрозофилы. Разработан методы получения количественных данных об экспрессии генов из конфокальных изображений, а также методы удаления экспериментального шума, возникающего при получении и обработке данных. Высокая точность полученных данных позволяет оценить точность формирования паттерна сегментации. Разработана математическая модель, объясняющая динамику экспрессии генов сегментации и позволяющая высказать предположения, нашедшие подтверждение в эксперименте.

Maria Samsonova

St. Petersburg State Polytechnical University

We investigate the systems biology of development in the morphogenetic field controlling Drosophila segmentation. We have developed the data processing pipeline to extract quantitative data on segmentation gene expression from the confocal images and to get rid of noise which arises in the course of data acquisition and processing. Our data have cellular resolution in space and 6.5 minutes resolution in time. This precision is sufficient to study the accuracy of pattern formation. The data are interpreted with mathematical models which provide a precise and predictive understanding of the dynamics of segment determination.

203.

13.11.2006

Pavel Pevzner

Bioinformatics Program, University of California San Diego, La Jolla, USA.

Whole proteome analysis of post-translational modifications: applications of mass-spectrometry for proteogenomic annotation

While bacterial genome annotations have significantly improved in recent years, techniques for bacterial proteome annotation (including post-translational chemical modifications, signal peptides, proteolytic events, etc.) are still in their infancy. At the same time, the number of sequenced bacterial genomes is rising sharply, far outpacing our ability to validate the predicted genes, let alone annotate bacterial proteomes. In this study, we use tandem mass spectrometry (MS/MS) to annotate the proteome of Shewanella oneidensis MR-1, an important microbe for bioremediation. In particular, we provide the first comprehensive map of post-translational modifications in a bacterial genome, including a large number of chemical modifications, signal peptide cleavages and cleavage of N-terminal methionine residues. We also detect multiple genes that were missed or assigned incorrect start positions by gene prediction programs and suggest corrections to improve the gene annotation.
This study demonstrates that complementing every genome sequencing project by an MS/MS project would significantly improve both genome and proteome annotations for a reasonable cost.

204.

7.12.2006

О. Калинина (& М.С. Гельфанд, А.А. Миронов, А.Б. Рахманинова, R. Russell)

ФББ МГУ

Компьютерное предсказание детерминант специфичности и их использование для определения функционально важных сайтов в структуре белка

В настоящее время объем расшифрованных белковых последовательностей во много раз превышает экспериментальные возможности по их функциональной аннотации. Поэтому все большую роль начинает играть аннотация in silico - методами биоинформатики. Такая аннотация носит характер предсказания, но может служить важной отправной точкой для дальнейших лабораторных исследований. В настоящей работе представлен новый метод для предсказания функционально важных сайтов белка, SDPsite, основанный на предсказании детерминант специфичности. Используя выравнивание белкового семейства и филогенетическое дерево, алгоритм предсказывает консервативные позиции и детерминанты специфичности, картирует их на структуру белка и ищет области кластеризации предсказанных позиций. Сравнение полученных предсказаний с экспериментальными данными и с опубликованными результатами других методов предсказания функционального сайта показывает, что результаты SDPsite хорошо согласуются с экспериментальными данными и превосходят результаты большинства ранее опубликованных методов. SDPsite свободно доступен через Интернет по адресу http://bioinf.fbb.msu.ru/SDPsite.

205.

14.12.2006

S.G. Georgieva, V.E. Ramensky

Engelhardt Institute of Molecular Biology RAS

A retrocopy of a gene can functionally displace the source gene in evolution

The e(y)2 gene of Drosophila melanogaster encodes the ubiquitous evolutionarily conserved co-activator of RNA polymerase II that is involved in transcription regulation of a high number of genes. The Drosophila e(y)2b gene, paralogue of the e(y)2 has been found. The analysis of structure of the e(y)2, e(y)2b and its orthologues from other species reveals that the e(y)2 gene derived as a result of retroposition of the e(y)2b during Drosophila evolution. The mRNA-derived retrogenes lack introns or regulatory regions; most of them become pseudogenes whereas some acquire tissue-specific functions. Here we describe the different situation: the e(y)2 retrogene performs the general function and is ubiquitously expressed, while the source gene is functional only in a small group of male germ cells. This must have resulted from retroposition into a transcriptionally favorable region of the genome.

С.Г. Георгиева, В.Е. Раменский

ИМБ РАН

Ретрокопия гена вытесняет исходный ген

Ген e(y)2 Д. меланогастер кодирует консервативный и повсеместно экспрессирующийся коактиватор РНК-полимеразы II и участвует в регуляции транскрипции большого числа генов. Был обнаружен паралог e(y)2, ген e(y)2b, и в результате анализа структуры этих генов и их ортологов выяснилось, что e(y)2 возник в ходе эволюции дрозофилы в результате ретропозиции e(y)2b. Получающиеся таким образом гены не имеют интронов и регуляторных участков и как правило превращаются в псевдогены, лишь некоторые из них приобретают тканеспецифичные функции. Мы наблюдаем другую ситуацию: ретроген e(y)2 выполняет универсальную функцию и экспрессируется во всех тканях, в то время как исходный ген функционален только в небольшой группе мужских зародышевых клеток.

206.

15.02.2006

A.F. Litvina, F.B. Uspensky

Institute of Slavic Studies, RAS

А.Ф. Литвина, Ф.Б. Успенский

Институт славяноведения РАН

Выбор имени в династии Рюриковичей. Привычка княжеского обихода или система?

Выбор имени в Средние века предельно тесно связан с проблематикой наследственных прав, стратегией власти, политической борьбой. Имена, которые даются наследникам княжеской власти, могут служить тончайшим индикатором для определения актуальности тех или иных внутридинастических и международных связей на разных этапах жизни правящего рода. В то же время принципы выбора имен, сохраняющиеся из поколения в поколение, обеспечивают единство разросшейся династии и стабильность ее властных привилегий. Имянаречение воплощает в себе, таким образом, концентрированную историю княжеского рода, а отчасти и концентрированную историю страны, где этот род правил.
Сосуществование исконного и христианского имени, появление и эволюция многоименности, варьирование основ двусоставных именований, выбор патрональных княжеских святых и культ общеродовых покровителей, наречение в честь родичей живых и умерших, - все эти и многие другие процессы рассматриваются как части единой системы имянаречения у Рюриковичей.

207.

1.03.2007

Р. М. Фрумкина

Еще раз о "честном слове дворянина"

Лингвистика считается гуманитарной наукой; в западной терминологии ее относят к social sciences. Тем самым лингвистика оказывается рядом с историей, социологией, культурной антропологией, филологией и философией.
Этот комплекс дисциплин нередко рассматривают как единое целое, о чем говорит множество его самоназваний: в разные времена social sciences именовались "моральными науками", "науками о духе", о культуре, науками о человеке, социальными науками.
Объединяет эти науки их предмет, хотя и формулируемый несколько расплывчато: прежде всего это науки о человеке как социальном существе и о его опыте социального. Как и комплексы прочих наук, социальные науки периодически переживают периоды активной ревизии своих построений, то есть подвергаются процедурам, которые в кантианской традиции назывались критикой, или анализом оснований.
Критика оснований становится особо актуальной в периоды смены парадигм - не обязательно в узкой области знаний, но непременно в области, важной для культуры в целом. В гуманитарных науках "сотрясение основ" происходило за последние 100 лет дважды: в те времена, когда появилось противопоставление наук объясняющих и наук понимающих (т.е. в конце 19 века), и в середине прошлого века, когда появилась кибернетика, а вместе с ней попытки "устроить" лингвистику как математику, а психологию - как естественную науку (условно говоря, как "физику"). К третьему "сотрясению основ" надо было бы отнести начавшиеся несколько раньше изменения в исторической науке, связанные ярче всего со школой "Анналов", и новый взгляд на историю науки, ассоциированный с именем Томаса Куна и понятием "парадигмы".
Такое упрощение осмысленно скорее в дидактических целях. Но оно позволяет поставить некоторые проблемы более заостренно. А именно:
Что позволяет нам считать "науки о духе" - науками, а не "свободными искусствами"?
Насколько в пределах отдельных наук о духе / о человеке разработана эпистемология, то есть зафиксированы допустимые способы конструирования предмета исследования и общепринятые методы работы с ним (наблюдение, эксперимент, убеждение, доказательство)?
Насколько отошла в область преданий известная история о "честном слове дворянина"?

208.

19.04.2007

Anna Vlasova

Kaspersky Lab

On many ways to write "Viagra", or Spam against e-mail

Анна Власова

Лаборатория Касперского

Сколькими способами можно написать слово "виагра" или спам против электронной почты

1. Спам: этапы развития и современное состояние.
Спам - массовая анонимная незапрошенная рассылка средствами электронных коммуникаций. Эволюция спама от незатейливого рекламного инструмента до мощного средства кибер-мошенничества (фишинг, "нигерийские письма" и т.п.). Технические способы организации спам-рассылки.
2. Кто такие спамеры и почему спам вреден.
Спам-индустрия в действии: инфраструктура спамерского рынка и производители спамерского ПО. Кто платит деньги спамерам? Заказчики спама, покупатели спам-баз и другие.
Ущерб от спама: время, деньги, настроение.
3. Содержание спама.
Тематическая классификация спама. Региональная и языковая специфика спама.
Автоматическая генерация содержимого спамерского сообщения и ее эффекты. Спамерские "трюки" и методы внесения текстового "шума". Эволюция "трюков" от текстовых к графическим. Мимикрия спама под личную переписку.
Криминализация спама.
4. Войны спамеров и антиспамеров.
Противостояние спам-антиспам: есть ли выход? Влияние борьбы со спамом на электронную почту. Снижение функционала электронной почты (потеря почты в результате работы антиспам-фильтро и т.п.). Предложения по аутентификации пользователя, оплате исходящих сообщений и т.п.
5. Простые советы по защите от спама.

О докладчике: Анна Власова, закончила отделение Структурной и прикладной лингвистики Филологического факультета МГУ в 1990-м году. Кандидат филологических наук. В течение многих лет занимается вопросами автоматизированной обработки текста на естественном языке (сначала в аспирантуре МГУ, потом на кафедре Теоретической и прикладной лингвистики МГЛУ, дальше в коммерческих организациях, работающих в сфере IT-технологий - "МедиаЛингва", "Рамблер" и др). Сейчас работает в "Лаборатории Касперского" главным антиспамером (начальником группы спам-аналитиков).

209.

10.05.2007

Евгений Лысенко

Институт физиологии растений РАН

Сигма-факторы растений

"У бабочек примерно так же"

Сигма-факторы регулируют взаимодействие бактериальных РНК-полимераз с промоторами, однако, гены сигма-факторов обнаружены и у эукариотических организмов: у растений и водорослей сигма-факторы управляют промоторной специфичностью основной пластидной РНК-полимеразы. Система, сложившаяся у растений, во многом напоминает бактериальную.
В докладе будет коротко дано представление о пластидной "машине" экспрессии генов и, несколько подробнее, о транскрипционном аппарате пластид. Затем будет изложена основная информация о сигма-факторах растений. Поскольку о сигма-факторах растений известно не так уж много (опубликовано около 50 работ), то большая часть доклада будет посвящена выводам и предположениям, а также анализу их обоснованности.
Доклад основан на обзоре (Lysenko EA Plant sigma factors and their role in plastid transcription. Plant Cell Rep. Preview), который может быть найден по адресу: http://dx.doi.org/10.1007/s00299-007-0318-7

210.

17.05.2007

Константин Попадьин

ИППИ РАН

Деградация митохондриального генома у млекопитающих: Чем крупнее зверь, тем хуже гены

Согласно эффективно-нейтральной теории молекулярной эволюции, случайный генетический дрейф приводит к фиксации слабо-вредных (эффективно-нейтральных) мутаций, и чем ниже эффективная численность популяции, тем сильнее эффект случайного дрейфа и тем большая доля слабо-вредных мутаций фиксируется в ходе эволюции. Мы используем широко известный экологический факт, согласно которому масса тела млекопитающих обратно коррелирует с их популяционной плотностью и численностью. Таким образом, наша гипотеза заключается в том, что у крупных млекопитающих (имеющих более низкую эффективную численность) вероятность фиксации слабо-вредных мутаций выше, чем у мелких млекопитающих (обладающих более высокой эффективной численностью). Для проверки данной гипотезы мы анализируем 110 видов млекопитающих, с известной массой тела взрослого организма и с полностью отсеквенированным митохондриальным геномом. Вероятность фиксации слабо-вредных мутаций мы оцениваем как значения Kn/Ks а так же Kr/Kc на внешних веточках филогенетического дерева млекопитающих, построенного по 13 митохондриальным протеин-кодирующим генам. Основным результатом работы являются значимые положительные регрессии между массой тела и вероятностью фиксации слабо-вредных мутаций, что подтверждает эффективно-нейтральную теорию. Однако ряд вопросов остается нерешенным:
1. В нашей работе мы анализируем внешние веточки древа, на Kn/Ks и Kr/Kc значения которых влияют не только зафиксированные мутации, но и те, что находятся пока в полиморфном состоянии. Насколько силен эффект полиморфных мутаций и правдивы ли окажутся полученные нами результаты на глубокой филогении?
2. Можно ли по нашим регрессиям аппроксимировать значения эффективной численности млекопитающих?
3. Известно, что крупные млекопитающие быстрее вымирают. Связано ли это с накоплением слабо-вредных мутаций (mutational meltdown)? И, вообще, могут ли слабо-вредные мутации, накопленные в митохондриях, значимо влиять на приспособленность млекопитающих? Какие механизмы в жизни митохондрий могут предотвращать накопление слабо-вредных мутаций?
На семинаре предстоит найти ответы на данные вопросы.

211.

31.05.2007

Валентина В. Василевская

ИНЭОС РАН

Особенности конформационных состояний амфифильных макромолекул

Известно, что причиной растворимости белковых глобул является их особая организация, при которой ядро глобулы составляют гидрофобные звенья, а оболочку - гидрофильные. При этом плотность гидрофильной оболочки достаточна, чтобы защитить гидрофобные ядра белков от взаимодействия между собой.
Глобулы обычных синтетических полимеров, как правило, не имеют защитной гидрофильной оболочки и агрегируют в растворе даже при очень низких концентрациях. В серии недавних работ нами было показано, что для того, чтобы глобулы синтетических макромолекул не агрегировали, необходимо, чтобы макромолекула отвечала трем основным требованиям. Во-первых, это должен быть сополимер из гидрофобных Н и гидрофильных P звеньев. Во-вторых, распределение звеньев Н и P в макромолекуле должно отвечать особой так называемой белковоподобной статистике. В-третьих, необходимо, чтобы гидрофильные мономерные звенья содержали как собственно гидрофильные, так и гидрофобные группы, т.е. были амфифильными на уровне отдельного мономерного звена.
Особенностью нести в одном звене одновременно гидрофильные и гидрофобные группы обладают многие синтетические полимеры, а также молекулы белков. Будучи помещенными в непрерывную фазу эмульсии, мономерные звенья амфифильных макромолекул зачастую предпочитают размещаться не в объемах фаз, а на межфазных поверхностях, экспонируя соответствующие части звеньев в фазы с предпочтительными для них взаимодействиями. Такой взгляд на строение мономерных звеньев позволил ввести новую, двумерную классификацию синтетических полимеров и аминокислот.
В докладе будет рассказано об этой классификации, об особенностях конформационного поведения макромолекул с амфифильными звеньями, а также о наших поисках белковоподобной статистики распределения звеньев в реальных белковых макромолекулах.

212.

14.06.2007

В.С.Фридман, С.А.Бурлак

Биологический ф-т МГУ, Ин-т востоковедения РАН

Происхождение человеческого языка: взгляд этолога и лингвиста

Чтобы получить искомую траекторию эволюционного развития человеческого языка от сигнального поведения животных, следует "опереться" не на факты человеческой же психики, но на предшествующую ей траекторию филогенетического развития сигнальных систем позвоночных, естественным продолжением которой становится глоттогенез.
Эта траектория малоизучена (часто оспаривается сам факт совершенствования организации коммуникативных систем в филогенетическом ряду позвоночных). ЕT надо выделить в явном виде: описать основные стадии развития сигналов и механизмов коммуникации от рыб до высших млекопитающих, показать факторы направленности эволюции, "приводящие" сигнальную систему и формы социальности животных в состояние, характерное для антропоидов и других высших обезьян, откуда может быть дан старт развитию уже собственно языка.
Тогда накопленный этологами богатейший сравнительный материал по сигналам и механизмам коммуникации разных групп позвоночных будет организован конкретной филогенетической гипотезой, определяющей возможность и необходимость появления человеческого языка, исходя из известных векторов эволюции сигнальности у позвоночных. Затем его можно использовать в качестве отправной точки для исследования уже собственно происхождения языка. Первое делается в докладе В.С.Фридмана, второе - С.А.Бурлак.
В докладе В.С.Фридмана даTтся обзор систем сигнализации позвоночных, выделены основные этапы филогенетического развития сигналов и механизмов коммуникации "от рыб до приматов", выделены факторы направленности эволюционного совершенствования сигналов и форм социальности. Будет обоснована раздельность исторического развития "мышления" и "речи" в животном мире и показаны биологические предпосылки соединения первого и второго "в точке старта" глоттогенеза.
В докладе С.А.Бурлак будет показано, что такие свойства человеческого языка, как членораздельная звучащая речь, возможность образовывать слова путем аффиксации, маркирование синтаксических отношений специальными словами или частями слов, наличие иерархических связей в синтаксической структуре предложения, а также богатство лексического запаса человеческих языков, с необходимостью возникают при переходе к звуковой коммуникации и увеличении количества используемых знаков.

213.

9.07.2007

Shamil Sunyaev

Brigham and Women's Hospital, Harvard Medical School

Low frequency missense variation in humans and perspectives of unbiased discovery of genes underlying human phenotypes by massive re-sequencing

The ability to sequence cost effectively all of the coding regions of a given individual genome is rapidly approaching, with the potential for whole-genome re-sequencing not far behind. Initiatives are currently under way to phenotype hundreds of thousands of individuals for major human traits. The confluence of these powerful trends will soon make sequencing of large numbers of phenotypically characterized human individuals a reality. Very deep re-sequencing has the potential to reveal vast trove of low frequency alleles. While success with highly targeted candidate gene re-sequencing has been reported, the potential for unbiased discovery of new gene-phenotype associations by re-sequencing large numbers of genes in large numbers of individuals has not been considered. Here we test the hypothesis that genes related to specific human phenotypes may be systematically discovered de novo by pan-genic re-sequencing of clinical populations. Using computational simulations we show that genes with meaningful effects on a given human quantitative trait can be identified in an unbiased fashion and with substantial power by re-sequencing all genes in approximately 10,000 individuals selected from the top- and bottom-five percentiles of the trait distribution. The pending ability to implement this discovery paradigm systematically holds the potential to revolutionize discovery of the genetic basis of human disease.

214.

12.07.2007

Shamil Sunyaev

Brigham and Women's Hospital, Harvard Medical School

Searching in the junkyard: evidence for function and selection in non-coding regions of the human genome

215.

16.07.2007

Dmitry G. Vassylyev

University of Alabama at Birmingham

Structural studies of prokaryotic transcription intermediates

RNA polymerase elongation complex (EC) is both highly stable and processive, rapidly extending RNA chains for thousands of nucleotides. Understanding the mechanisms of elongation and its regulation requires detailed information concerning the structural organization of the EC. The 2.5A resolution structure of the Thermus thermophilus EC revealed the post-translocated intermediate with the DNA template in the active site available for pairing with the substrate and shed significant light on the basic principles of transcription elongation.
We have also determined the 3.0A resolution structures of the EC with a non-hydrolyzable substrate analog, AMPcPP, and with AMPcPP plus the inhibitor streptolydigin. In the EC/AMPcPP structure, the substrate binds to the active ("insertion") site closed through re-folding of the trigger loop (TL) into two ?-helices. In contrast, the EC/AMPcPP/streptolydigin structure reveals an inactive ("pre-insertion") substrate configuration stabilized by streptolydigin-induced displacement of the TL. Our structural and biochemical data suggest that TL re-folding is vital for catalysis and have three major implications. First, despite differences in the details, the two-step, pre-insertion/insertion mechanism of substrate loading may be universal for all RNAPs. Second, freezing of the pre-insertion state is an attractive target for design of novel antibiotics. Finally, the TL emerges as a prominent target whose re-folding can be modulated by regulatory factors.

216.

21.09.2007

Sergey Nuzhdin

University of Southern California

Super-dense marker-based genetic analyses

Much of evolutionary and ecological genetics has focused on population subdivision and local adaptation that takes place in spite of homogenizing gene flow. Different types of markers have been used (allozyme, AFLP, SSR, SSCPs) with 100s of them assayed in each genotype from multiple populations. While these studies have been tremendously helpful in painting the picture of overall gene flow, the marker density has not been high enough for the gene-level conclusions. This is because the density of recombination breakpoints (linkage-disequilibrium, LD blocks) has been much higher than the marker number. Accordingly, the waste majority of among population differences are missed in such surveys. Recent revolutionary technologies - tiling oligonucleotide microarrays, and complete resequencing - enable assaying markers at a density of several markers within each LD block. For instance, Arabidopsis tiling arrays might recover up to 3M markers with the average distance of 35b covering complete genome. These tools enable us to identify every selective sweep contributing to local adaptation, and a large fraction of polymorphisms involved in balancing selection. I will show three case studies illustrating the use of these tools in local adaptations of Drosophila and Arabidopsis populations.

217.

25.09.2007

Павел Певзнер

Университет Калифорнии, Сан Диего

Сравнительная протеомика: комбинирование масс-спектрометрии и сравнительной геномики для анализа многих геномов

Pavel Pevzner

University of California, San Diego

Comparative Proteogenomics: Combining Mass Spectrometry and Comparative Genomics to Analyze Multiple Genomes

Mass spectrometry recently emerged as a valuable technique for proteogenomic annotations that improve on the state-of-the art in predicting genes and other features in both prokaryotes (Gupta et al., 2007, Genome Research) and eukaryotes (Tanner et al., 2007, Genome Research). However, previous proteogenomic approaches were limited to a single genome and did not take advantage of analyzing mass spectrometry data from multiple genomes at once. We show that such comparative proteogenomics approach (similarly to comparative genomics approaches) allows one to address the problems that remained beyond the reach of the traditional "single proteome" approach in mass-spectrometry. In particular, we show how comparative proteogenomics addresses the notoriously difficult problem of "one-hit-wonders" in proteomics and improves on the existing gene prediction tools in genomics.

218.

11.10.2007

В.В. Алешин

НИИ физико-химической биологии им. А.Н. Белозерского
Московского государственного университета им. М.В. Ломоносова

Одноклеточные родственники многоклеточных животных

В предстоящем сообщении планируется сделать краткий обзор строения, образа жизни и систематического положения одноклеточных эвкариотов родов Ichthyophonus, Amoebidium, Sphaeroforma, Capsaspora и некоторых других. Интерес к этим невзрачным амебоидным или грибоподобным микроорганизмам зародился лет десять назад, после того, как случайно выяснилось, что нуклеотидные последовательности рибосомной РНК некоторых видов, относимых прежде к низшим грибам, примерно в равной степени похожи на последовательности дрожжей и воротничковых жгутиконосцев. Обсуждается, насколько данные об этих существах могут повлиять на представления зоологов об общем разнообразии и эволюции заднежгутиковых, в частности, трансформациях в линии, ведущей к предку многоклеточных.

219

25.10.2007

I.B. Zhulin

Joint Institute for Computational Sciences, University of Tennessee - Oak Ridge National Laboratory

Molecular Evolution of a Complex Signal Transduction System in Prokaryotes

Molecular machinery that governs bacterial motility (chemotaxis) is one of the best studied signal transduction systems in Nature [1]. Sophisticated behavior of Earth’s smallest organisms fascinated naturalists of the last century and modern biochemists, who hoped that the properties of the underlying molecular navigation system would resemble those of higher organisms. However, the latest structural and functional studies revealed no such similarity in the molecular design. Using the wealth of information encoded in hundreds of bacterial genomes we reconstructed the evolutionary history of this system. Here we show that the chemotaxis system is the evolutionary youngest and most sophisticated signal transduction pathway in prokaryotes. It appeared in Bacteria after the separation of the three domains of Life and has been later irradiated into Archaea, but not into Eucarya. It developed from classical bacterial two-component regulatory systems that, in turn, originated from simple one-component systems comprised of a single protein with sensory and regulatory capabilities that were likely present in the Last Universal Common Ancestor [2]. Through a series of domain innovations the chemotaxis system differentiated into several functional classes that evolved to control not only motility, but also other cellular functions. Detailed evolutionary analysis of individual system components allowed us to reveal novel structural and functional insights that have not been identified by previous experimental studies [3].
1. Wadhams GH & Armitage JP (2004) Nat Rev Mol Cell Biol 5:1024-1037
2. Ulrich LE, Koonin EV & Zhulin IB (2005) Trends Microbiol 13: 52-56
3. Alexander RP & Zhulin IB (2007) Proc Natl Acad Sci USA 104: 2885-2890

220.

15.11.2007

А. Ефимов

Институт белка РАН, Пущино

Моделирование структуры белков и путей их сворачивания

В докладе будет рассмотрен стереохимический подход к моделированию структуры и путей сворачивания белков, основанный на построении и анализе структурных деревьев белков. При моделировании структур каждого семейства белков в качестве стартовой структуры берется соответствующий структурный мотив с уникальной укладкой цепи. Такие структурные мотивы состоят из двух и более альфа-спиралей и/или бета-тяжей, имеют уникальную укладку цепи и хиральность и "указывают" место пристраивания остальной части цепи. Пристраивание других элементов к стартовому структурному мотиву происходит в соответствии с набором правил, выведенных из известных принципов структурной организации белков. Число возможных путей роста каждой промежуточной структуры ограничено правилами. Эти пути показываются линиями, которые объединяют все структуры в единое древо. К настоящему времени построено девять структурных деревьев для самых больших белковых суперсемейств, которые охватывают несколько сотен негомологичных белков.

221.

29.11.2007

А. Алексеевский

Институт физико-химической биологии им. А.А. Белозерского и факультет биоинженерии и биоинформатики МГУ

Классификация супервторичной структуры доменов типа "бета-сэндвич"

(По работе Y.-S.Сhiang, T.I.Gelfand, A.E.Kister, I.M.Gelfand, New classification of supersecondary structures of sandwich-like proteins uncovers strict patterns of strand assemblage. Proteins, 2007).
Удовлетворительная универсальная классификация укладок белковых доменов в настоящее время не разработана. Об этом свидетельствуют, например, многочисленные расхождения в двух популярных структурных классификациях - SCOP и CATH. Одна из причин этого - в отсутствии воспроизводимых формализованных описаний укладки белка: взаимного расположения в пространстве и вдоль полипептидной цепи элементов вторичной структуры - альфа-спиралей и бета-тяжей. Отработка адекватного языка описания укладки для отдельных классов белков представляет интерес с разных точек зрения.
В работе, по которой будет доклад, предложено формализованной описание укладки доменов типа "бета-сэндвич", основанное на понятии "стрендон". Стрендон - это один тяж или несколько последовательных по цепи бета-тяжей из одного бета-листа таких, что каждая пара соседей образует бета-шпильку. Авторы формулируют правило, по которому топология бета-сэндвича однозначно, с точностью до циклической перестановки стрендонов, определяется а) числом стрендонов; б) числами тяжей в каждом стрендоне. Части а) правила - "правилу супермотивов", - удовлетворяют 95% от 749 доменов - представителей всех аннотированных в БД SCOP как "сэндвич" доменов белков. Полному правилу ("правилу мотивов") удовлетворяет 82% от 749 доменов.

222.

13.12.2007

А.Н. Некрасов

ИБХ им. М.М.Шемякина и Ю.А.Овчинникова РАН

Иерархические элементы из белковых последовательностей. Как? и Зачем?

Рассматривается метод, позволяющий строить иерархически организованные "деревья" на основе нативных белковых последовательностей. Рассматривается взаимосвязь выявляемых "деревьев" с известными структурными элементами. Продемонстрирована возможность объяснения с их помощью механизмов функционирования некоторых белков и особенностей формирования белок-белковых комплексов.

223.

20.12.2007

С. Кряжимский

Принстонский университет

Исследование ландшафта приспособленности гемагглютинина вируса гриппа типа А

Гемагглютинин вируса гриппа типа А - классический пример белка, эволюционирующего под положительным отбором. Эволюцию гемагглютинина обычно описывают с помощью моделей типа Голдмана-Янга. Поскольку такие модели приписывают одинаковую приспособленность всем аминокислотным заменам в каждом сайте, они значительно недооценивают количество гомоплазийных аминокислотных замен. В данной работе мы обнаруживаем в некоторых сайтах гемагглютинина статистически значимые гомоплазийные замены. Большинство гомоплазий приходится на эпитопные части белка. Кроме того, модели типа Голдмана-Янга значительно переоценивают разницу в стереохимических свойствах аминокислот, заменяющих друг друга в типичном сайте, а также переоценивают количество аминокислот, появлявшихся в типичном сайте гемагглютинина на протяжении 30 лет его эволюции. Наши результаты показывают, что в белках, эволюционирующих в том числе под положительным отбором, в каждом сайте допускаются лишь небольшое количество аминокислот, причем близких по своим стереохимическим свойствам. Для некоторых сайтов удается явно указать такие аминокислоты.

224.

6.03.2008

М.Д.Логачева

Факультет биоинженерии и биоинформатики МГУ

Хлоропластные геномы высших растений, их структура и филогенетический анализ

Информация о структуре хлоропластных геномов используется во многих областях биологии растений. В докладе будет дан обзор современных данных о строении хлоропластных геномов высших растений, особенностях эволюции отдельных генов и геномов в целом. Особое внимание планируется уделить использованию последовательностей хлоропластных генов для реконструкции филогении растений. Насколько согласуются результаты изучения отдельных генов? Многие исследователи считают, что надежные результаты можно получить лишь при использовании большого (50-80) числа генов, а другие считают, что достаточно одного-двух генов, а гораздо важнее представить максимальное число видов. Возможно ли найти компромисс между этими двумя мнениями?

225.

20.03.2008

И.Б.Левонтина

Институт русского языка РАН

Русская графика и орфография:
принципы, проблемы, перспективы

Как устроена русская графика? Каковы принципы русской орфографии? Как менялись орфографические правила и стоит ли проводить орфографическую реформу? Нужно ли спасать букву ё (йо)? Что происходит с орфографией в Интернете? Действительно ли снижается уровень грамотности и очень ли это плохо?

226.

28.03.2008

Mark Borodovsky

Georgia Tech (Atlanta, Georgia)

A new ab initio gene finder for fungi genomes:
iterative unsupervised parameter estimation

We describe a new ab initio algorithm for identification of protein-coding genes in fungi genomes. A prominent feature of this approach is elimination of a pre-determined training set for hidden Markov model (HMM) parameter estimation; instead, we delineate trusted genes in anonymous input sequence in iterative unsupervised fashion similarly to the algorithm implemented earlier in eukaryotic gene finder GeneMark.hmm-ES. In contrast, the new algorithm uses more complex HMM; particularly, the new intron model which architecture is changing upon iterations makes provisions for introns with and without branch point sites. We use both the Viterbi training and the MCMC sequence alignments to estimate parameters of the new intron model. We utilize EST validated test sets built for 16 fungi genomes to show that the new algorithm achieves a high accuracy in single exon and whole gene prediction and is favorably compared to the gene finders employing traditional supervised training. The new method provides means of accurate gene calling for sequencing projects accumulated a large amount of sequence ready for interpretation, while a large enough set of experimentally validated genes for supervised estimation of parameters of conventional gene finders is not available yet. Many out of more than 300 current fungi genome sequencing projects could benefit from using this new method for gene annotation.

227.

3.04.2008

К. Северинов, А. Казаков

Институт биологии гена РАН и ИППИ РАН, Москва

Низкомолекулярные пост-трансляционно модифицируемые микроцины

Microcins are a class of ribosomally synthesized antibacterial peptides produced by Enterobacteriaceae and active against closely related bacterial species. While some microcins are active as unmodified peptides, others are heavily modified by dedicated maturation enzymes. Low-molecular-weight microcins from the post-translationally modified group target essential molecular machines inside the cells. Available structural and functional data about two such microcins - microcin J and microcin C- will be discussed. While those two low-molecular-weight post-translationally modified microcins are produced by Escherichia coli, inferences based on sequence and structural similarities with peptides encoded or produced by phylogenetically diverse bacteria are made whenever possible to put these compounds into a larger perspective.

228.

23.04.2008

А.Б.Рахманинова и Ю.Коростелев, О.Н.Лайкова, А.А.Миронов, М.С.Гельфанд

ФББ МГУ

Корреляции между последовательностями факторов транскрипции и сайтов их связывания на ДНК

Огромное количество последовательностей ДНК-связывающих белков и последовательностей сайтов их связывания на ДНК позволяет искать статистически значимо скоррелированные замены в них. Вопрос в том, что найдем.
Написана программа DPCorr, на вход получающая белковое и нуклеотидное выравнивание и правило соответствия между ними. На выходе получаем список статистически значимо скоррелированных пар колонок и для каждой пары – таблицу сопряженности частот аминокислотных остатков и нуклеотидов. Метод протестирован на большом и хорошо изученном семействе LACI-регуляторов. Значимо скоррелированных пар оказалось мало, сопоставление с литературными данными говорит о том, что корреляции имеют физический (биологический) смысл. С другой стороны, характер корреляций позволяет предположить новые паттерны контактов между белком данного семейства и ДНК.
Исследованы перепредставленные пары белковых и соответствующих нуклеотидных слов (слово – набор символов в заданных позициях). Пары коротких слов – простейшее распознающее правило. Обнаружены статистически значимые кооперативные эффекты, например, тип нуклеотида в колонке зависит сразу от 2-х колонок белкового выравнивания.
Отдельно проверено, что все основные обнаруженные закономерности не являются филогенетическим следом.
Применение метода к малоизученному семейству NrtR (в некотором смысле контрпример по отношению к LacI) позволило найти разумного кандидата на роль распознающей спирали.

229.

3.04.2008

Philipp Khaitovich

Max Planck - CAS Partner Institute for Computational Biology (Shanghai, China)

Gene expression patterns in primate brain development

Gene expression patterns in primate brain development. In contrast to other primates, human brain development continues long into postnatal development. During this period, both the brain itself and its cognitive abilities develop in parallel. Here we present the first systematic study of messenger RNA and micro RNA expression changes, as well as changes in mRNA splicing occurring in brain during postnatal development in humans, chimpanzees and rhesus macaques.
Our results indicate that the brain transcriptome undergoes immense remodeling during development, as well as in aging.

230.

30.05.2008

Кирилл Еськов и Михаил Гельфанд

Институт палеонтологии РАН, ИППИ РАН, Москва

Макроэволюция и микроэволюция

Семинар будет продолжением обсуждения, происходившего в ходе и после организованных полит.ру и посвященных современному состоянию теории эволюции лекций в клубе "Билингва"
(К.Еськов, "Палеонтология и макроэволюция": http://www.polit.ru/lectures/2008/04/10/paleontolog.html,
М.Гельфанд "Геномы и эволюция": http://www.polit.ru/lectures/2008/04/24/gelfand.html,
С.Боринская "Молекулярно-генетическая эволюция человека" http://www.polit.ru/lectures/2008/05/23/geny.html).
Формат семинара предполагает более или менее свободную дискуссию в отсутствие заранее подготовленных сообщений.

231.

3.06.2008

Константин Попадьин, Георгий Базыкин

ИППИ РАН, Москва

Нуклеотидные повторы в митохондриальном геноме определяют предрасположенность к появлению соматических вредных мутаций в пострепродуктивном периоде жизни

Прямые совершенные нуклеотидные повторы в митохондриальном геноме являются горячими местами происхождения крупных делеций. Далее, из-за более быстрой репликации, эти митохондриальные геномы с делецией получают внутриклеточное преимущество, что приводит к быстрому увеличению их концентрации внутри клетки. Достигнув некоторой пороговой концентрации, данные мутантные геномы становятся фенотипически заметными и приводят к ряду нейродегенеративных заболеваний и старению в целом. В работе проверяется гипотеза, согласно которой обилие повторов связано с максимальной продолжительностью жизни организмов. Проанализированы все отсеквенированные к данному моменту митохондриальные геномы человека и всех позвоночных животных.

232.

30.07.2008

Васильев Дмитрий Глебович

Университет Алабамы, Бирмингем

Регуляция транскрипции: от структуры к функции

233.

7.08.2008

Владимир Лукашов

Институт вирусологии им. Д.И. Ивановского, Москва и Университет Амстердама, Нидерланды

Эволюция ВИЧ-1: прошлое, настоящее и будущее

Вирус иммунодефицита человека первого типа, ВИЧ-1, является одним из наиболее опасных и распространенных патогенов человека. Значительная генетическая изменчивость этого вируса представляет значительную проблему при его диагностике и разработке антивирусных препаратов, включая вакцины - но и делает этот вирус интересным объектом эволюционных исследований.
В ходе семинара мы планируем обсудить широкий спектр вопросов, связанных с молекулярной эволюцией ВИЧ-1 на различных уровнях: начиная от закономерностей эволюции ВИЧ-1 внутри хозяина и использования генетических маркеров ВИЧ-1 для изучения глобальной эпидемиологии этого вируса - и заканчивая происхождением ВИЧ-1 и его будущим.

234.

14.08.2008

Вадим Гладышев

University of Nebraska, Lincoln

How selenium has altered our understanding of the genetic code and redox regulation

Selenium is a trace element that occurs in proteins in the form of selenocysteine (Sec), known as the 21st amino acid in the genetic code. Sec-containing proteins are present in all three domains of life and are essential in mammals. Selenium is best known for its cancer prevention activity and also has roles in immune response, male reproduction and other processes. We identified full sets of selenoproteins in a variety of organisms, including humans, which have 25 selenoprotein genes. These studies allowed explanation of some of the roles of selenium in biology and medicine. The seminar will further focus on the studies that utilized Sec to better understand the genetic code and redox regulation of cellular processes. First, we took advantage of the observation that Sec is located in catalytic sites of selenoproteins where it serves redox function. This property was used to develop a method for genome-wide identification of proteins containing catalytic redox-active cysteine residues. Thiol-based redox regulation is used by all organisms and conserved during evolution. Second, analyses of Sec utilization as well as mechanisms of Sec biosynthesis and insertion in various organisms yielded new information about the genetic code, including a possibility of its further extension.
Fomenko et al. (2007) High-throughput identification of catalytic redox-active cysteine residues. Science 135, 387-389.
Kryukov et al (2003) Characterization of mammalian selenoproteomes. Science 300, 1439-4313.

235.

25.08.2008

Pavel Pevzner

University of California, San Diego

EULER: From assembling short DNA reads to shotgun protein sequencing by assembling mass spectra

Current sequencing technologies attempt to maximize read length without sacrificing basecalling accuracy. Since fragment assembly with inaccurate reads is difficult, the common practice is to trim the inaccurate tails of the reads. We present a new computational technique EULER-USR for assembling short reads that bypasses the problem of limited accuracy in the tails of reads. An important and counterintuitive implication of this result is that one may extend sequencing reactions ``past their prime'' to where the error rate grows above what is normally acceptable for fragment assembly. We compare EULER-USR with other short read assemblers and illustrate its applications for assembling mate-paired Illumina reads from bacterial genomes.
We further address the problem of sequencing molecules that are not directly inscribed in the genomes (e.g., antibodies or antibiotics-like non-ribosomal peptides) and propose to assemble them from tandem mass spectra. We show that our Eulerian approach to DNA sequencing can be generalized to Shotgun Protein Sequencing (SPS).
We illustrate applications of SPS to de novo sequencing of snake venoms (collaborations with Karl Clauser at Broad) and antibodies (collaboration with Jennie Lill at Genentech).
We further show how multistage mass-spectrometry enables high-throughput de novo sequencing of peptide-like natural products.

236.

22.09.2008

Denis Kaznadzey

Encyclopaedia Genomica, Inc. (USA-Austria)

High-throughput similarity search (algorithm and tool)

By systematic redesign of BLAST-like comparison algorithm for DNA and protein sequences we have created portable similarity search tools that perform 10 to 1000 times faster then standard NCBI blast, while keeping reasonable sensitivity. The QSIMSCAN (Quick SIMilarity SCANner) algorithm is designed as a pipeline of filters of increasing computational complexity through which the initial dictionary–based hits are passed. The major factors in performance gain are massive aggregation of queries, direct addressing of the lookup tables, accumulation of primary hits in similarity zones and careful optimization of performance-critical code. The sensitivity is mantained by using diversification of tuples, cumulative scoring on adjacent diagonals, computing true Smith-Waterman alignments on detected similarity zones and several other techniques.
The QSIMSCAN algorithm gives most advantage when used on large collections of query sequences, for example, when comparing entire proteome of the organism to non-redundant protein database, or when searching for near-identity zones in EST dataset for subsequent clustering. Thus, the task of comparing of entire proteome of E.coli (4,132 proteins) to the NCBI non-redundant protein database of 6,441,864 records takes 1 hour 34 minutes on moderately powerful laptop computer. With standard NCBI BLAST same job on same system takes 76 hours 12 minutes. The performance of nucleic acid QSIMSCAN is sufficient to cross-compare 1,000,000 EST sequences on single PC in 4 hours, making possible clustering and annotation of large EST projects semi-interactively without use of any special hardware, or even faster on multi-CPU setups with help of QSIMSCAN parallel extensions.
We believe that fast, portable, reliable and simple QSIMSCAN-based tools for massive similarity search would be useful in the rising era of mass sequencing.

237.

27.10.2008

Михаил Гальперин

NCBI, NLM (США)

Эволюция биологических мембран и мембранного потенциала

Структурная организация мембранных липидов в клетках бактерий и архебактерий (архей) имеет несколько принципиальных отличий, что ставит под вопрос природу исходных (предковых) мембран. Мы подошли к этому вопросу с несколько необычной стороны, изучая эволюцию мембранной АТФ синтетазы. Трехмерная структура растворимого фактора F1 мембранной АТФазы очень близка к структурам ДНК- и РНК-хеликаз, работа которых сопряжена с их вращением вокруг субстрата (ДНК или РНК). Это означало что "изобретение колеса" произошло задолго до появления мембранной АТФазы. Сравнение структур мембранных субъединиц c фактора Fо из H+- и Na+-зависимых АТФ синтетаз показало что Nа+-АТФазы являются более древней формой. Это означало, что натриевый градиент (sodium-motive force) является эволюционнно более древним, а протонный градиент (proton-motive force) возник позже и, благодаря своей более высокой эффективности, заместил натриевый градиент у большинства организмов, включая бактериальных предков митохондрий и хлоропластов. Это, в свою очередь, позволило заключить, что древнейшие мембраны были пористыми, проницаемыми для ионов и, возможно, даже для небольших молекул и могли поддерживать только Доннановский потенциал. Мы предполагаем что эволюция биологических мембран протекала в направлении снижения их проницаемости, что и привело к возникновению сначала натриевого, а затем и протонного градиента.

238.

6.11.2008

Alexey Stukalov (Moscow)

PK & OMA - web-tools for protein families and mutations analysis

ProteinKeys (PK) & Online Mutation Assessor (OMA) are Web 2.0 applications, targeted for molecular biologists, that study the role of specific amino acid residues and their mutations for protein function. These tools were used to analyze cancer mutations in The Cancer Genome Atlas (TCGA) project.
The algorithmic part includes Contrast Entropy Optimization (CEO) method [Reva 2007] for prediction of functional protein subfamilies and residues specificity, pairwise and HMM-based alignment of protein sequences (HMMER and BLAST), detection of binding sites and ligands, cross-homologs features search. The sum of these methods provides for tight integration of key bioinformatics databases: UniProt, wwPDB, Pfam etc. In the end, there's a biologist, who could examine his protein or mutation of interest in the context of protein family, homologous 3D structure or mutation assessment report.
In future, PK&OMA may evolve into flexible large-scale data analysis tool, that could be used in various aspects of bioinformatics, from comparative genomics to drug design.
ProteinKeys (PK) http://awabi.cbio.mskcc.org/proteinkeys/
Online Mutation Assessor (OMA) http://awabi.cbio.mskcc.org/oma/

239.

24.11.2008

Olga Troyanskaya

Princeton University

Using functional genomics data to study protein function, interaction networks, and evolution

With the explosion of functional genomic data (including microarrays, protein-protein interaction data, knockout/knockdown experiments etc), we should be poised to answer systems-level biological questions about functions and interactions of proteins and their evolution. However, these data are challenging to analyze and addressing such challenging problems requires targeted context-specific approaches, probabilistic methods, and tight integration with experiments. I will discuss some of my laboratory's work in this area, including on analyzing large collections of diverse functional genomic data in yeast for prediction of function and on using such computational methods to drive experiments. I ill also present some of our results in higher eukaryotes and how these approaches enable us start addressing evolutionary questions.
More information about our work is available at function.princeton.edu.