Informations

Pourquoi la faible diversité de séquences cause-t-elle des problèmes de séquençage

Pourquoi la faible diversité de séquences cause-t-elle des problèmes de séquençage


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Lorsque les séquenceurs traitent des fragments de séquence, s'il y a peu de diversité à un locus pb particulier, cela peut poser des problèmes au séquenceur. J'ai la compréhension superficielle que lorsqu'une Flow Cell contient un pourcentage important d'une seule base sur un cycle donné, elle a du mal à décider quelle base est présente dans chaque séquence. Pourquoi est-ce?


Je pense que le problème est plus que le logiciel a du mal à identifier les clusters individuels si bien plus d'un quart d'entre eux s'allument pour une base donnée. Si vous avez plus de diversité dans les premiers cycles, lorsque les coordonnées du cluster sont identifiées, je pense que c'est moins un problème.


Pourquoi la faible diversité de séquences cause-t-elle des problèmes de séquençage - Biologie

Le changement climatique entraîne une perte de diversité génétique
avril 2012

Où est l'évolution ?
La variation génétique fait référence à l'idée que différents individus d'une population sont susceptibles de porter différentes séquences génétiques pour les régions correspondantes du génome. Par exemple, chez l'homme, un individu peut porter des séquences génétiques qui codent pour le sang de type A, et quelqu'un d'autre peut porter des séquences qui codent pour le sang de type O. De même, les gens peuvent porter différentes séquences dans des régions du génome qui ne codent pour rien du tout. Les deux sont des exemples de variation génétique. Les populations qui ont moins de différences génétiques d'un individu à l'autre ont des niveaux de variation génétique plus faibles.

Dans le cas des tamias, les scientifiques ont pu étudier l'ADN de spécimens de musée collectés au début des années 1900 et les comparer à des échantillons de tamias collectés au cours des 10 dernières années. Les tamias modernes étaient beaucoup plus homogènes sur le plan génétique, c'est-à-dire qu'ils avaient moins de séquences génétiques différentes dans les sept régions d'ADN étudiées que leurs homologues historiques. Bien que l'étude n'ait porté que sur quelques régions non codantes, il est très probable que tous certaines parties du génome des tamias - celles qui aident à produire des traits importants, ainsi que celles qui ne codent pour rien - ont perdu leur variation génétique.

Le changement climatique est le coupable évident. Comme le montrent les cartes ci-dessous, l'aire de répartition du tamia alpin (et presque certainement la taille de sa population) a considérablement diminué au cours des 90 dernières années à mesure que le climat s'est réchauffé. Et bien sûr, à mesure que la population perdait des individus, elle perdait également les variantes génétiques qu'ils portaient, réduisant ainsi son niveau de variation génétique. À titre de comparaison, le tamia tordu, T. speciosus, n'est pas aussi capricieux et a maintenu son autonomie historique malgré la chaleur. Lorsque les scientifiques ont étudié le tamia tordu, ils ont trouvé des niveaux similaires de variation génétique dans des échantillons historiques et modernes. Étant donné que la principale différence entre les deux espèces semble être leur réponse à la hausse des températures, le changement climatique est la cause la plus probable de la diminution de la variation génétique chez le tamia alpin.

    Premièrement, cela corrobore l'idée que la population diminue et se fragmente, c'est-à-dire que de petites sous-populations sont coupées les unes des autres. Ces deux facteurs augmentent les chances d'extinction de l'espèce.

Ces trois facteurs ont le potentiel d'augmenter le risque d'extinction des tamias.

Bien sûr, pour le moment, les tamias semblent bien se porter et ne sont pas répertoriés comme espèce menacée. Mais la nouvelle recherche met en évidence les risques auxquels ils sont susceptibles d'être confrontés dans un proche avenir, ainsi que les risques auxquels sont confrontées de nombreuses autres espèces dont les aires de répartition se contractent en raison du réchauffement climatique. Les tamias alpins sont l'une des rares espèces pour lesquelles nous pouvons facilement examiner les changements dans les niveaux de variation génétique au cours du siècle dernier, car nous avons les bons spécimens de musée. De nombreuses autres espèces de haute altitude se sont également déplacées vers le haut et sont probablement confrontées au même double coup dur que les tamias sont une diminution de la taille de la population et les effets secondaires cachés de la variation génétique réduite.

    Moritz, C., Patton, J.L., Conroy, C.J., Parra, J.L., White, G.C. et Beissinger, S.R. (2008). Impact d'un siècle de changement climatique sur les communautés de petits mammifères dans le parc national de Yosemite, aux États-Unis. Science. 322: 261-264.

du centre de nouvelles de l'UC Berkeley

de Le Quotidien Californien

Comprendre les ressources d'Evolution :

Discussion et questions d'extension

    Pourquoi la variation génétique est-elle si importante pour l'évolution ?

une. Quel pourcentage de la population a le génotype Aa ?

b. Quel pourcentage de la population a une mauvaise vision causée par le génotype aa ?

c. Si la population s'accouple au hasard, dans quel pourcentage d'accouplements un individu Aa s'accouplera-t-il avec un autre individu Aa ?

ré. Dans quel pourcentage des accouplements un individu AA s'accouplera-t-il avec un individu Aa ?

Imaginez maintenant que deux individus non apparentés (un avec le génotype AA et un avec le génotype Aa) s'accouplent et produisent 20 petits au cours de leur vie.

e. Quel pourcentage de chiots vous attendriez-vous à être porteurs de l'allèle a ?

F. Combien de chiots devraient-ils être porteurs de l'allèle a ?

g. À quel pourcentage de chiots vous attendriez-vous pour avoir une mauvaise vision ?

Imaginez maintenant que cet ensemble de chiots est isolé des autres tamias et que les chiots finissent par s'accoupler les uns avec les autres, c'est-à-dire avec des frères et sœurs.

h. Si les frères et sœurs s'accouplent au hasard, dans quel pourcentage d'accouplements un individu Aa s'accouplera-t-il avec un autre individu Aa ?

je. Dans ces cas (quand un clan Aa s'accouple avec un autre clan Aa), quel pourcentage de la progéniture aura une mauvaise vision ?


Leçons et ressources pédagogiques associées

    : Dans cette leçon pour les niveaux 9-12, les élèves effectuent un inventaire des traits humains à l'échelle de la classe, construisent des histogrammes des données qu'ils collectent et jouent à un bref jeu qui présente aux élèves les principaux concepts liés à la variation génétique humaine et la notion de l'unicité de chaque individu .

: Cette leçon pour les élèves de la 9e à la 12e année utilise la chromatographie sur papier pour simuler l'électrophorèse de l'ADN. Le problème posé est d'identifier les similitudes génétiques entre plusieurs sous-espèces de loup afin de fournir des informations pour un programme de conservation/élevage.

: Ce bulletin d'information pour les niveaux 9-16 décrit un plan de conservation pour sauver la panthère de Floride en insufflant une variation génétique dans la population. Cet article comprend un ensemble de questions de discussion à utiliser en classe, ainsi que des liens vers des leçons connexes.

    Moritz, C., Patton, J.L., Conroy, C.J., Parra, J.L., White, G.C. et Beissinger, S.R. (2008). Impact d'un siècle de changement climatique sur les communautés de petits mammifères dans le parc national de Yosemite, aux États-Unis. Science. 322: 261-264.


Gènes et maladies héréditaires

Les gènes sont des segments spéciaux de lettres d'ADN qui, lorsqu'ils sont lus correctement par les protéines du corps, peuvent fournir une instruction spécifique et importante pour que le corps fonctionne correctement. Les chercheurs estiment qu'il y a environ 22 000 gènes contenus dans le génome. Bien que les gènes soient très importants, ils ne représentent qu'un faible pourcentage de tout l'ADN du génome. Chaque gène a un emplacement spécifique sur l'un de nos 23 chromosomes et est hérité ou transmis de génération en génération en tant qu'unité. Nous avons deux copies de chaque chromosome et donc deux copies de chaque gène.

Nous héritons d'un exemplaire de chacun de nos parents et, à notre tour, transmettons un de nos deux exemplaires à chacun de nos enfants.

Chaque gène contient un ensemble spécifique d'instructions pour le corps. Certains gènes contiennent plusieurs ensembles d'instructions. Habituellement, ces instructions font une protéine. Il existe de nombreux types de protéines dans notre corps qui peuvent effectuer plusieurs tâches importantes. Par exemple, les protéines forment la base de nos tissus organiques, de nos os et de notre système nerveux. Ils guident également la façon dont nous digérons les aliments et les médicaments.

Qu'est-ce qu'une maladie héréditaire ?

Bien que les facteurs génétiques jouent un rôle dans presque toutes les conditions et caractéristiques de santé, il existe certaines conditions dans lesquelles les modifications génétiques sont presque exclusivement responsables de la cause de la maladie. On les appelle troubles génétiques ou maladies héréditaires.

Étant donné que les gènes sont transmis du parent à l'enfant, toute modification de l'ADN au sein d'un gène est également transmise. Les modifications de l'ADN peuvent également se produire spontanément, apparaissant pour la première fois chez l'enfant de parents non affectés. C'est ce qu'on appelle une nouvelle mutation, où le mot mutation signifie changement.

Parfois, ce changement peut entraîner des erreurs dans les instructions relatives aux protéines, entraînant la production d'une protéine qui ne fonctionne pas correctement ou qui ne peut pas être fabriquée du tout. Lorsqu'une protéine est manquante ou ne fonctionne pas comme elle le devrait, cela peut provoquer une maladie génétique.

La génétique de chaque trouble est unique. Dans certains cas, toutes les erreurs dans un gène particulier provoquent un trouble génétique spécifique. Dans d'autres cas, des changements différents au sein d'un même gène peuvent entraîner des problèmes de santé ou de développement différents ou même des troubles génétiques différents. Parfois, des changements dans plusieurs gènes similaires peuvent tous conduire à la même maladie génétique.

Quand apparaissent les maladies héréditaires ?

Les troubles génétiques sont généralement hérités (transmis) de manière dominante ou récessive. Nous avons chacun deux copies de chaque gène sur nos 22 chromosomes numérotés. De plus, les femmes ont deux copies de tous les gènes du chromosome X, tandis que les hommes ont une copie des gènes du chromosome X et une copie des gènes du chromosome Y.

Lorsqu'un trouble est dominant, la maladie peut survenir lorsqu'il y a des erreurs d'ADN dans une seule des deux copies du gène. Cela signifie que si un parent a le changement d'ADN, il y a 50-50 chances qu'il soit transmis à chaque enfant.

Lorsqu'un trouble est récessif, il doit y avoir des erreurs dans les deux copies du gène pour que le trouble se produise. Cela signifie que les deux parents doivent porter au moins une copie du changement génétique spécifique afin de produire un enfant affecté.

Si les deux parents ont une copie modifiée, il y a 1 chance sur 4, ou 25 %, qu'un enfant hérite des deux copies modifiées en même temps, provoquant le trouble chez l'enfant. Les parents qui n'ont qu'une seule copie génétique modifiée ne présentent généralement aucun symptôme de la maladie et peuvent même ne pas savoir qu'ils portent une modification génétique. Les chercheurs estiment que nous avons chacun (« porter ») 6 à 10 modifications génétiques récessives. Certaines modifications génétiques récessives peuvent être plus fréquentes dans différents groupes de population. Par exemple, les modifications génétiques de la drépanocytose sont plus fréquentes chez les personnes d'ascendance ouest-africaine et les modifications génétiques de la mucoviscidose sont plus fréquentes chez les personnes d'ascendance nord-européenne.

En plus du modèle héréditaire, certains troubles génétiques peuvent être incohérents lorsqu'il s'agit de savoir si une personne développe des symptômes et leur gravité. La pénétrance fait référence au fait que la personne qui a les modifications génétiques en cause développe réellement des symptômes du trouble. L'expressivité fait référence aux symptômes qui peuvent se développer et à leur gravité.


[D] Pourquoi ne pas utiliser l'optimiseur basé sur la dynamique avec WGAN ?

Je continue de lire que je ne devrais pas utiliser d'élan lors de l'optimisation d'un WGAN. Rien de ce que j'ai lu n'explique pourquoi. Alors pourquoi ne devrais-je pas utiliser un optimiseur basé sur la dynamique ? Quelqu'un connaît la raison ?

Cela est probablement dû à la dynamique de formation contradictoire. Vous voulez que le générateur/critique soit capable de répondre à toute nouvelle fonctionnalité identifiée par l'autre, donc l'élan nuirait à cette réactivité et pourrait conduire à des instabilités et à un effondrement de mode.

Enfin, comme résultat négatif, nous rapportons que l'entraînement WGAN devient instable lorsque l'on utilise un optimiseur basé sur la dynamique tel qu'Adam [8] (avec β1 > 0) sur le critique, ou lorsque l'on utilise des taux d'apprentissage élevés. Étant donné que la perte pour le critique n'est pas stationnaire, les méthodes basées sur la quantité de mouvement semblent avoir de moins bonnes performances. Nous avons identifié la quantité de mouvement comme une cause potentielle car, à mesure que la perte explosait et que les échantillons empiraient, le cosinus entre le pas d'Adam et le gradient devenait généralement négatif. Les seuls endroits où ce cosinus était négatif étaient dans ces situations d'instabilité. Nous sommes donc passés à RMSProp [21] qui est connu pour bien fonctionner même sur des problèmes très non stationnaires [13].


Cliquez ici pour commander notre dernier livre, A Handy Guide to Ancestry and Relationship DNA Tests

Je n'ai jamais vraiment compris ce qui se passe si vous êtes consanguin. Je sais que cela signifie que vos parents sont étroitement liés, mais est-ce que le fait d'avoir des parents étroitement liés perturbe votre ADN ?

-Un lycéen du Michigan

C'est une question intéressante avec une réponse tout aussi intéressante! Le fait d'avoir des parents proches ne « gâche pas exactement votre ADN », comme vous le dites. Mais cela signifie que vous avez moins la diversité, ou variété, dans votre ADN. Et la diversité peut être très importante pour votre santé.

Moins de variété dans votre ADN peut augmenter vos chances de contracter des maladies génétiques rares. Vous avez peut-être entendu parler de certaines de ces maladies : albinisme, fibrose kystique, hémophilie, etc.

Moins de variété dans votre ADN peut également vous rendre malsain d’une autre manière – cela peut affaiblir votre système immunitaire et vous empêcher de combattre les maladies également. Vous pouvez devenir une personne très malade !

Maintenant, bien sûr, la consanguinité ne signifie pas que vous contracterez certainement une maladie génétique ou que vous vous retrouverez maladif. Vous êtes simplement plus susceptible d'avoir des problèmes de santé. Et plus il y a de consanguinité, plus le risque est grand.

Ainsi, la consanguinité ne modifie en rien votre ADN. Au lieu de cela, la consanguinité est risquée car cela signifie que l'ADN de votre mère et de votre père est similaire. Et comme vous le verrez ci-dessous, lorsque ces parties similaires se réunissent chez leur enfant, cet enfant peut se retrouver avec des problèmes.

Même ADN, mêmes maladies

Chaque personne a 46 chromosomes et chaque chromosome contient un tas de gènes. Chaque gène a les directions pour une petite partie de vous. Il y a donc un gène qui détermine si vous aurez les cheveux roux, un qui donne de la couleur à votre peau en fabriquant de la mélanine, un autre qui aide le sang à transporter l'oxygène, etc.

Vous avez en fait deux ensembles de 23 chromosomes. Un ensemble de 23 vient de maman et les 23 autres viennent de papa. Étant donné que chaque ensemble de chromosomes possède le même ensemble de gènes*, cela signifie que vous avez deux copies de presque tous les gènes. Ce qui est important pour nous rendre chacun unique, c'est que la copie que vous recevez de votre mère peut être très différente de celle que vous recevez de votre père.

Ainsi, par exemple, le gène à l'origine des cheveux roux se présente sous la forme d'une version rouge et d'une version non rouge (ces différentes versions sont appelées « allèles »). Et le gène qui produit un pigment appelé mélanine existe dans une version normale qui produit de la mélanine et une version brisée qui ne le fait pas. Si vous n'avez que le cassé, vous vous retrouverez avec l'albinisme.

Avoir deux copies de tout est en fait un très bon système. C'est parce que si une copie est cassée, vous avez toujours une deuxième copie à utiliser comme sauvegarde.

C'est le cas du gène qui fabrique la mélanine. Les personnes avec une seule copie cassée n'ont pas d'albinisme, car leur bonne copie en fait assez pour éloigner l'albinisme.

Mais les personnes avec une mauvaise copie de gène peuvent toujours la transmettre à leurs enfants. Nous appelons ces personnes des « porteurs », car elles portent un seul exemplaire, mais n’ont pas la maladie réelle. Et c'est là que les ennuis peuvent commencer avec la consanguinité.

Mais avec la consanguinité, il est plus probable que votre conjoint soit porteur du même gène brisé. Ainsi, dans l'exemple de l'albinisme, cela signifierait que maman et papa sont tous deux porteurs du gène cassé pour fabriquer la mélanine. Ensuite, maman et papa ont 50% de chances de transmettre un gène brisé à leur enfant. Cela signifie que chaque enfant a 25 % de chances de contracter la maladie (0,5 x 0,5 = 0,25). C'est un risque assez élevé !

Maintenant, je ne dis pas que les personnes atteintes d'albinisme (ou de toute autre maladie rare d'ailleurs), sont toujours le résultat de la consanguinité. Tout le monde a cinq ou dix de ces gènes brisés cachés dans son ADN. Cela signifie que c'est toujours un coup de dés lorsque vous choisissez un conjoint pour savoir s'il portera les mêmes gènes brisés que vous.

Mais avec la consanguinité, le risque que vous soyez tous les deux porteurs des mêmes mauvais gènes est beaucoup plus élevé. Chaque famille est susceptible d'avoir son propre type de gènes de maladie, et la consanguinité est une opportunité pour deux porteurs du même gène brisé d'en transmettre deux copies à leurs enfants. Et puis leur enfant peut se retrouver avec cette maladie.

Comme vous pouvez le voir, c'est bien d'avoir des bébés avec quelqu'un qui a un ADN différent du vôtre. Ensuite, vous pouvez donner à vos bébés une collection diversifiée d'ADN, et ils auront toujours un allèle de sauvegarde pour tous ceux qui sont cassés.

Mais ce n'est pas la seule raison pour laquelle vous voulez que les parents soient génétiquement assez différents. La deuxième raison pour laquelle vous avez besoin de beaucoup de variété de la part de chaque parent est de pouvoir combattre autant de maladies que possible.

Mêmes gènes, système immunitaire faible

Avoir un ADN diversifié est important pour avoir un système immunitaire fort. C'est pourquoi la consanguinité peut rendre certains enfants maladifs. Et c'est pourquoi les souris de laboratoire et certains animaux de ferme tombent malades si facilement.

Le système immunitaire dépend d'une partie très importante de l'ADN appelée région du CMH ou du complexe majeur d'histocompatibilité. C'est beaucoup de gros mots, mais fondamentalement, la région du CMH est composée d'un tas de gènes qui vous aident à combattre la maladie.

Le secret de la région du CMH pour lutter contre la maladie est d'avoir autant de types différents d'allèles (ou de versions de gènes) que possible. Plus vous avez de variété, mieux vous combattez la maladie.

La diversité est importante car chaque gène du CMH est efficace pour lutter contre un ensemble différent de maladies. Vous pouvez le voir comme un système de verrouillage et de clé. Chaque maladie est une serrure de forme différente et chaque gène du CMH est une clé. Plus vous avez de clés, plus vous pouvez déverrouiller et détruire de maladies.

Bien que cela puisse sembler très simplifié, cela ressemble beaucoup à la façon dont notre corps fonctionne réellement. Notre corps essaie constamment de détecter des matières étrangères dans le corps. Les scientifiques pensent que chaque gène du CMH nous permet de détecter un type différent de matière étrangère.

Et plus important encore, chaque allèle d'un gène du CMH peut aider à détecter un type différent de matière étrangère. Nous ne comprenons pas encore complètement quels types de matières étrangères chaque allèle peut aider à détecter, mais nous savons que chaque allèle unique aide à détecter un type différent.

Maintenant, je pense que vous pouvez voir pourquoi la consanguinité peut causer des problèmes ici. Lorsque la consanguinité se produit et que deux personnes étroitement liées ont des enfants, ces enfants sont susceptibles d'avoir moins de diversité dans leur ADN. Ce qui signifie que ces enfants consanguins auraient moins de types d'allèles MHC (ou moins de clés).

Avec moins de types d'allèles MHC, ils peuvent détecter moins de types de matières étrangères (ou verrous). Ils seront plus susceptibles de tomber malades car ils ne peuvent pas combattre avec succès autant de maladies. Le résultat final est une personne plus malade.

Comme vous pouvez le voir, la diversité est la chose la plus importante perdue avec la consanguinité. Que ce soit pour vous assurer que vous n'obtenez pas deux mauvais allèles et que vous vous retrouviez avec une maladie génétique rare, ou si c'est pour vous assurer que vous obtenez de nombreux allèles différents du CMH, vous avez besoin de diversité pour vous protéger.


Exemples d'espèces à faible diversité génétique et conséquences

Les grandes populations ont tendance à avoir des niveaux élevés de diversité génétique. Cependant, à mesure que les populations diminuent, elles perdent une grande partie de leur diversité. Le résultat est que les individus restants sont plus similaires génétiquement les uns aux autres.

Cela devient un problème si les traits de survie ont été perdus et si des combinaisons génétiques causant des maladies sont exprimées avec une fréquence marquée.

La famine de la pomme de terre

L'absence de diversité génétique était la raison de l'une des plus grandes famines de l'histoire. Les causes de la famine de la pomme de terre en Irlande qui a eu lieu au 19ème siècle peuvent être attribuées à la sensibilité de la nouvelle plante de pomme de terre à une maladie spécifique.

Parce que les nouvelles plantes de pomme de terre ne sont pas le résultat de la reproduction - elles sont plutôt créées à partir d'une plante mère - elles présentent une très faible diversité génétique.

La faible diversité génétique de la pomme de terre signifie que le virus s'est propagé à la grande majorité de la culture de la pomme de terre qui était un aliment de base pour la population irlandaise, laissant un million de personnes mourir de faim. L'absence ou la faible diversité génétique est aussi en partie ce qui rend les monocultures agricoles plus sensibles aux maladies.

Le saumon sauvage de l'Atlantique menacé par les écloseries de saumon

Le saumon sauvage de l'Atlantique perd peut-être les caractéristiques nécessaires pour survivre dans les eaux océaniques.

L'élevage de poissons pour le repeuplement comme solution à la diminution des populations, soit à cause de la surpêche, soit dans le cas de la Suède pour atténuer l'impact des centrales hydroélectriques, semble créer un problème différent : une plus faible diversité génétique.

Les rivières suédoises se jettent dans la mer Baltique, lui fournissant 90 pour cent de ses saumons sauvages juvéniles. Une étude récente des populations de saumon atlantique dans treize rivières en Suède, dont cinq abritent des saumons élevés en écloserie, montre que contrairement à il y a cent ans, avant le début des mesures d'ensemencement, les poissons sont génétiquement plus similaires.

On pourrait s'attendre à ce que ceux élevés dans les écloseries le soient, car ils sont sélectionnés pour une croissance rapide plutôt que pour la vitesse et les prouesses dans la nature et se reproduisent au sein d'une population définie. Cependant, il semble que lorsqu'ils se reproduisent avec le saumon sauvage, les poissons transmettent leurs gènes inférieurs. Cela met en péril les capacités de survie de l'ensemble de la population de saumons [11] .

Population d'ornithorynques de l'île King

Une étude de la population d'ornithorynques sur l'île King dans le détroit de Bass au large de la côte nord-ouest de la Tasmanie, en Australie, a révélé que de faibles niveaux de diversité génétique affectent le succès de reproduction, la survie et la résistance aux parasites de ces animaux.

La faible diversité génétique dans un système de réponse immunitaire important est particulièrement préoccupante. Les scientifiques craignent que cela puisse avoir des conséquences dévastatrices pour l'espèce si la mucormycose fongique du continent tasmanien atteignait la population insulaire. La mucormycose fongique est une maladie causée par le champignon Mucor amphibiorum, qui provoque des lésions cutanées sujettes aux infections et peut être mortelle pour les ornithorynques.

Sans variation génétique, une population n'a pas l'arsenal pour l'aider à réagir aux variables environnementales changeantes.

En 1492, lorsque les explorateurs ont introduit une multitude de nouvelles maladies dans les Amériques, notamment la variole, la rougeole et la grippe, la population amérindienne a connu un « effondrement démographique massif » [12] .

On estime que les nouvelles maladies ont tué 90 % de la population amérindienne [13] . Si une population n'a pas les gènes pour résister à une maladie et que la maladie est si virulente qu'elle menace d'anéantir toute la population avant que l'espèce n'ait la possibilité de développer une résistance, la population peut alors être menacée d'extinction.


FAQ sur le génome de Néandertal

Avec la publication des deux premiers articles décrivant les séquences d'ADN chromosomique d'un Néandertal, j'ai pensé rassembler quelques questions fréquemment posées et leurs réponses. En fait, la plupart de ces questions m'ont été fréquemment posées cette semaine - principalement par des journalistes - donc je pense que c'est une bonne liste.

Je ferai un suivi au cours des prochaines semaines avec des détails supplémentaires, en particulier au fur et à mesure que certains de nos propres travaux avancent. J'ai délibérément laissé quelques détails en suspens ici – parfois par souci de concision, dans d'autres cas parce qu'ils attendent de nouveaux développements.

MISE À JOUR (17/11/2006): J'édite à travers cela, apportant des modifications ici et là pour rendre les choses plus claires. Ainsi, au fur et à mesure que cela progresse, il ne sera pas identique à la version initiale, bien que les modifications soient mineures.

Il y a deux articles dans deux revues, par deux équipes différentes de personnes. Quelle est la différence?

Les deux équipes ont utilisé des échantillons du même spécimen, Vindija (Vi) 80 - donc en principe, elles séquencent le même génome. La différence entre les deux vient de leurs méthodes de séquençage de l'ADN.

Le groupe Rubin (Noonan et al. 2006) utilise un métagénomique méthode basée sur la création d'un bibliothèque de clones de l'ADN ancien. Pour créer une bibliothèque de clones, l'ADN d'un échantillon est coupé avec une enzyme de restriction, qui coupe l'ADN à chaque endroit où il affiche la même séquence courte (généralement des séquences de 4 ou 6 pb, telles que "ATTA"). Les courts fragments d'ADN sont mélangés et liés à des vecteurs qui peuvent être maintenus et répliqués dans les cellules. C'est le processus de "clonage", et la "bibliothèque" se compose de tous les fragments courts, qui (espérons-le) se chevauchent afin qu'ils puissent être reconstruits.

Les gens ont fait des bibliothèques depuis longtemps. Par exemple, le complément d'ARNm entier dans un type de tissu donné peut être transformé en une bibliothèque d'ADN complémentaire (ADNc). Une fois la bibliothèque constituée, elle peut être sondée avec de courtes séquences d'ADN marquées pour évaluer si un gène donné est exprimé dans ce type de tissu. Ou au contraire, après le séquençage de l'ADNc de la bibliothèque, il peut être utilisé pour concevoir des sondes pour trouver d'où il provient dans le génome.

L'aspect unique de l'approche métagénomique est que tous Les séquences d'ADN d'un échantillon seront incluses dans la bibliothèque, potentiellement séquencées et finalement reconstruites avec des ordinateurs en génomes séparés. Habituellement, le clonage est précédé d'une étape d'amplification (généralement par PCR), qui sélectionne et amplifie l'ADN particulièrement intéressant pour le clonage. Mais les méthodes métagénomiques ignorent cette amplification, car elles ne peuvent pas prédire à l'avance ce qu'elles recherchent. L'une des premières applications les plus importantes de la métagénomique a été de reconstruire les génomes de microbes qui ne peuvent pas être cultivés. Même si ces organismes ne se prêtent pas à être conservés dans des colonies de laboratoire, leurs génomes peuvent être reconstruits en échantillonnant leurs environnements - par exemple, le sol ou l'eau d'un étang.

Ou des fossiles. Pour le fossile de Vindija 80, l'extrait ne comprend qu'environ 6% de séquences d'ADN identifiables de « primates ». Sur les quelque 20 pour cent qui sont identifiables, plus de la moitié sont microbiennes.

Je suppose que si vous vous intéressiez à la décomposition microbienne à long terme des os fossiles, vous pourriez faire votre dissertation sur ceux-ci. Pour le reste d'entre nous, la dernière étape consiste à laisser l'ordinateur cracher les séquences humaines, qui sont supposées être l'ADN de Néandertal plus une certaine proportion de contamination humaine.

En revanche, le groupe 454 (Green et al. 2006) a utilisé une méthode appelée PCR en émulsion à base de billes. C'est une bouchée, donc ça porte une explication (pour laquelle je paraphrase du matériel de Margulies 2005 et Ronaghi 2001).

La « réaction en chaîne par polymérase », ou PCR, est une méthode de réplication de nombreuses copies d'une séquence d'ADN à partir d'une seule matrice. Habituellement, pour effectuer une PCR, vous concevez une "amorce", qui est une courte séquence d'ADN qui provoque la réplication préférentielle de la séquence cible par l'ADN polymérase. Avec un certain nombre de cycles thermiques et une amorce suffisante, vous vous retrouvez avec un grand nombre de copies du morceau d'ADN que vous voulez.

C'est, bien sûr, exactement pourquoi la PCR standard est si problématique pour les séquences anciennes. Là, tu ne peut pas obtenez exactement ce que vous voulez, car il est cassé en petits morceaux et endommagé. Vous seriez heureux d'obtenir n'importe quoi. Mais si vous amplifiez tout ensemble dans une cuve géante, alors le moins endommagé les séquences seront celles qui s'amplifieront préférentiellement, et celles-ci vont être sans valeur à vous parce qu'ils représentent tous des contaminants de diverses sortes, comme l'ADN microbien ou les séquences humaines modernes.

La méthode 454 attache tous les petits morceaux de séquence à de minuscules billes et sépare ces billes en gouttelettes d'huile dans une suspension d'eau. Les gouttelettes d'huile sont la partie "émulsion", et en les séparant de cette manière, le processus peut utiliser la PCR tout en gardant toutes les minuscules séquences séparées les unes des autres. Parce qu'elles sont séparées, une bonne séquence ne peut pas submerger toutes les autres dans la solution. Les produits PCR adhèrent tous à la bille de sorte qu'après leur sortie de l'émulsion, les copies des différentes séquences soient toujours séparées.

Après PCR, l'ADN est décomposé en brins simples, toujours attachés à leurs billes, et les billes sont déposées sur un assemblage de lame à fibre optique. La lame a de minuscules puits qui sont optiquement connectés à un CCD photosensible, ce qui est essentiel pour l'étape de « pyroséquençage ». Les nucléotides traversent la lame et pénètrent dans ces puits les uns après les autres (T, A, C, puis G). Lorsque l'ADN polymérase relie l'un de ces nucléotides à l'ADN simple brin dans un puits, elle libère une molécule de pyrophosphate (PPi).

C'est alors que la magie opère. La solution contient également de la luciférase, l'enzyme qui fait briller les lucioles. Avec un peu de chimie supplémentaire, le PPi donne un sursaut d'énergie à la luciférase, qui émet alors une étincelle de lumière. Le CCD capte la lumière, ce qui est un signal que le nucléotide a été incorporé dans la séquence.

Étant donné que les nucléotides ne sont ajoutés que toutes les quelques secondes, une personne intelligente avec un cahier pourrait reconstruire la séquence du fragment d'ADN dans chaque puits. Le vrai truc, c'est que la lame de fibre optique contient bien plus d'un million de puits, tous séquencés simultanément. Au fur et à mesure que le CCD capte la série de flashs de chaque cellule, le système suit de nombreuses mégabases d'ADN à chaque exécution.

À l'heure actuelle, il s'agit de la méthode de séquençage de l'ADN la plus rapide de la planète. Il peut construire le génome complet d'un microbe en quelques heures.

Si la méthode de séquençage 454 est tellement plus rapide, alors pourquoi quelqu'un voudrait-il jamais créer des bibliothèques de clones ?

L'affirmation est que l'approche de la bibliothèque est supérieure en tant que moyen de sonder des loci génétiques spécifiques. Par exemple, voici un passage de la p. 1071 de l'article de Pennisi :

Cela ressemble à l'étude réalisée plus tôt cette année qui a révélé Mc1r variantes dans différents mammouths, mais en fait, cette étude a utilisé la PCR directe plutôt que le clonage (je suppose parce qu'ils ont beaucoup plus de tissu de mammouth avec lequel travailler !).

Ce n'est pas évident pour moi que ce soit vraiment un avantage. Je veux dire, il est certainement vrai que nous voulons vraiment échantillonner certains gènes (comme MCPH1) de plusieurs fossiles néandertaliens différents. Mais je ne vois aucun intérêt à forer des fossiles à cette fin sans aussi séquencer leurs génomes complets.

Maintenant, quelqu'un dira : « Eh bien, le séquençage du génome complet de chaque fossile est tout simplement trop cher. On peut se limiter à travailler sur quelques gènes beaucoup moins cher, et nous pouvons utiliser les mêmes échantillons plus tard pour séquencer d'autres gènes, ou des génomes entiers."

Personnellement, je ne vois pas l'urgence. Ces fossiles étaient dans le sol depuis 40 000 ans, et ils ne vont nulle part. Si nous pouvons séquencer des génomes entiers à moindre coût en 10 ou 20 ans, et en plus avoir de meilleurs moyens de faire face à la contamination, je ne vois pas pourquoi nous ne devrions tout simplement pas attendre. Former des étudiants diplômés en métagénomique n'est pas une raison suffisante pour travailler sur ces fossiles rares.

On peut dire que le mêmes échantillons sera suffisant pour le séquençage ultérieur de génomes entiers, ou d'autres gènes, ou du champignon du pied d'athlète de Néandertal, ou autre, mais d'après mon expérience, cela ne fonctionne jamais de cette façon. Quelqu'un revient toujours pour broyer, dissoudre ou enlever au laser plus d'os.

En fait, si je cherchais à faire la prochaine avancée en métagénomique, je prendrais une partie de cette chair de mammouth, j'y mélangerais du sang d'éléphant et je trouverais des moyens de résoudre les parties du mélange résultant. Cette serait quelque chose.

Êtes-vous en train de dire que vous êtes contre l'échantillonnage destructeur de ces fossiles ?

Pas du tout. En fait, je pense que la génomique donne la raison la plus convaincante déjà pour broyer plus d'os.

There is just a huge quantity of information from DNA sequences far more than from the morphology -- especially for samples like bone fragments or isolated teeth.

Heck, if the devil came to me and said I could have the full genome sequence of every fossil if I would agree to their destruction, I think that would be a good bargain!

But it's pretty clear that we're ne pas in that situation. We can have our cake and eat it too -- and the longer we wait, the cheaper and less destructive this is likely to be. And frankly, just une Neandertal genome is going to give us plenty to work on for a long time.

But then, I was trained as a fossil guy, and I'm used to working with a few bits and pieces. It gives me a natural advantage!

They say there's no significant evidence of interbreeding. Yet you told us last week that there est significant evidence of interbreeding. What gives?

A few years ago I gave a talk where I laid out what I saw as the problems interpreting nuclear DNA sequences from Neandertals. Now, this was long before we had any reasonable prospect of getting such sequences, so it was purely based on knowledge about human genetic variation. As I saw it then, there were two problems:

  1. Human mtDNA is really variable, with greater than 1 percent sequence divergence between people, and much higher in some places. In contrast, human nuclear DNA has less than one base pair in a thousand different between copies. To get a reasonable picture of variation among people, you need long nuclear sequences so that you will find polymorphisms. But ancient DNA is broken into short little sequences that are very difficult to reconstruct. With mtDNA, this is less of a problem because it is clonal and a person basically has one sequence in many copies. But most nuclear DNA (all autosomal DNA) exists in two, possibly different copies. So reconstructing long enough sequences to study polymorphisms is very difficult.
  2. The coalescence age of human mtDNA is only a couple hundred thousand years, so sampling ancient humans is sort of likely to result in sequences that lie outside this range of variation -- and with Neandertals, that is precisely what happened. But nuclear loci have coalescence ages on the order of 600,000 to 2 million years or older. With these dates, the diversity among living people must significantly predate any divergence of archaic humans for most nuclear genetic loci. Cela signifie que Neandertals ought to have shared a high proportion of polymorphisms that are toujours variable in humans. Since we can expect that Neandertals will not be very genetically divergent for these nuclear genes, compared to the genetic differences among living people, we can conclude that no gene is likely to tell us very much about the phylogenetic relationships of an ancient Neandertal with living people.

These two problems are still stumbling blocks for interpreting Neandertal sequences. But the research teams found a very clever way to circumvent them, by using génomique approaches instead of génétique approches.

If you've been scratching your head wondering exactly why "genomics" has a buzz, then this is a good example.

Because of projects like the HapMap and the chimpanzee genome project, we know a lot (not everything, but a lot) about human genetic polymorphisms and our genetic differences from chimpanzees. In fact, we have databases of human single nucleotide polymorphisms (SNPs), and human-chimpanzee comparisons. For each SNP, some humans have an ancestral nucleotide -- generally the one that chimpanzees have. Other humans have a dérivé nucleotide -- the one that appeared in some ancient human, and different from chimpanzees.

For the most part, derived SNP alleles are récent. A few of them are very old, and these tend to be found at high frequencies (because the person who originated them had lots of descendants in that time). But many more of them are recent, found in a relatively small number of people today, who descend from a common ancestor during the past couple hundred thousand years.

If Neandertals diverged from humans over 200,000 years ago, and they n'a pas interbreed after that time, then the Neandertal genome should have relatively few derived human SNPs. In contrast, if the two populations continued to interbreed after 200,000 years ago, they might share fairly many of these derived SNPs.

Hence, we have a potential test for Neandertal-human genetic interactions.

Noonan et al. (2006) looked for these derived SNPs and found very few of them. They concluded that there was no significant evidence of Neandertal-human interbreeding, although their statistical test couldn't rule out as much as 25 percent admixture (for reference, Plagnol and Wall 2006 estimated only 5 percent ancestry from tous archaic humans, not only Neandertals).

Green et al. (2006) also looked for derived SNPs. They had a much bigger sample of DNA to work with, so they ought to have a stronger test. Here's what they wrote (p. 334):

If this observation holds (i.e., if it is not influenced by contamination, and the ascertainment function does indeed show this to be an excess of derived SNPs), then it is one of the strongest pieces of evidence for genetic intermixture of Neandertals and modern humans. Note that there are two avenues for this gene flow -- either from the ancient ancestors of modern humans dans Neandertals, or hors de Neandertals into early modern humans. I'm sure we will hear more about this when they have more sequence.

In the meantime, the other source of evidence about Neandertal-human genetic interaction is the genomic variation of living people. Last week's paper on MCPH1 (discussed here) is a good example of what that evidence looks like. The key feature is that if you troll through the genome, you begin to notice some loci with interesting genealogies. The interestingness is a combined signature of recent selection and ancient population structure.

Looking for genes like MCPH1 in the Neandertal genome is a no-brainer. We probably won't find a lot of them, because the Neandertals were a small subset of the ancient human population.

There is one further problem. We can recognize these interesting loci in living people because they lie on relatively long haplotypes with little recombination. The inference is that such an allele must have begun from a very low copy number around 30,000 years ago, presumably because it was introduced from some archaic population. But the SNPs that are presently linked to the selected site were probably polymorphic within the archaic population, not fixed on a long haplotype. Unless we know exactly which SNP is the selected site on a human allelic variant, we may have some trouble telling whether an archaic genome has the allele. And as I note below, a large proportion of SNPs are going to be missing from the draft Neandertal genome even when it reaches an average 1x coverage.

This just means that evidence from the genomics of living people and from the Neandertal genome won't mesh together seamlessly. There remains some complexity interpreting these relationships.

The divergence date of Neandertal and human sequences is estimated at around 520,000 years ago. Qu'est-ce que ça veut dire?

First, what it ne fait pas moyenne. It doesn't mean that the human and Neandertal populations diverged 520,000 years ago. I noted above that the estimate of the genetic divergence time comes from the proportion of chimpanzee-human differences for which the Neandertal shares the human allele. But of course, some living humans have the ancestral, chimpanzee-like allele for many polymorphisms, so this comparison of polymorphisms is ne pas saying that Neandertals were like chimps. Instead, we are just disregarding the Neandertal-specific evolutionary events.

I'm sticking with the 520,000 year genetic divergence estimate from Green et al. (2006), instead of the older estimate from Noonan et al. (2006), because of the vastly larger sample in the Green paper. Still, most of the discussion does not hang too critically on the precise date although the date changes the interpretation by degrees.

The real interesting observation is the Neanderal-human genome draft difference compared to the human-human difference. Here's a passage from p. 354 of Green et al. (2006):

They don't specify where this "contemporary human" was from. The draft human genome is a chimera made up of anonymous people from different populations. That means that wherever the "contemporary human" is from, it will be the same region as represented by some part of the draft genome, but not all. So the divergence between these two mystery sequences is likely to be greater than average within a single population, and less than average between different populations.

Keeping that in mind, the human-Neandertal difference is startlingly close to this human-human difference measurement. The Neandertal is only 10 percent more different from the draft human genome than these two human sequences are from each other.

It seems very likely that we will find pairs of living human populations where the moyenne genetic divergence is older -- maybe much older -- than this human-Neandertal divergence. For instance, it seems almost certain that the great genetic variability among living African groups will exceed this human-Neandertal difference.

Some geneticists have noted that European and Asian populations seem to be a genetic "subset" of African populations, at least for many genetic loci. With these kinds of numbers, it looks like Neandertals may be a subset of living human diversity in the same sense. I've never much liked that formulation, because "subset" is never really an accurate description of the genetic relationships. But if the seat of living human diversity is Africa, adding Neandertals to the mix may not change that pattern at all.

As Green and colleagues note, most of the genetic divergence between humans and Neandertals, and between humans and other living humans, is actually much older than the divergence of these populations from each other.

At one limit (that is, assuming complete isolation of humans and Neandertals after some date), the population divergence time depends on the effective size of the population that was ancestral to living humans and Neandertals. It is basically not possible to obtain a good estimate of this ancestral effective population size from the current Neandertal data -- mainly because good estimates depend on heterogeneity in divergence times among loci, which we can't infer for the short Neandertal sequences.

Both papers assume that this ancestral effective population size was small -- even smaller than the long-term human effective population size of around 10,000 individuals. A smaller effective size for the human-Neandertal ancestral population is fairly unlikely, though, since it must have been distributed across large parts of Europe and Africa at a minimum. More likely, the effective size was close to 10,000, just as in humans, since the human effective size is inferred to have been that small over at least the past million years.

If you're reading the term "effective population size" for the first time, don't worry. It doesn't mean "population size", and it has mainly a technical genetic meaning. It is sort of important that the Neandertal sequence supports this particular effective size over the long term, but it will take another post to explain why.

As noted above, the populations may never have been isolated. The derived SNP evidence might suggest that there was never tout population divergence, or at least no long period of complete isolation, between humans and Neandertals. We'll have to wait and see.

Why does this bone have such a low level of contamination compared to other Neandertals?

I should start by pointing out that "contamination" here means "modern human sequence". All fossil bones are loaded with exogenous DNA, like bacterial and fungal genomes that invaded after the animal died. From a certain point of view, those exogenous genes are contaminants -- we are generally not interested in leur sequences, and sorting them out from the endogenous Neandertal DNA is a real nuisance. But because we have a référence genome from humans to compare with the sequences from the ancient bone, we pouvez sort out these bacterial and other exogenous sequences. So although they do "contaminate" the bone, they don't distort our picture of the sequence.

The real problem is that there are contaminating sequences from recent humains in the ancient bones. These sequences come from excavators, anthropologists who studied the bones, museum personnel, graduate students who cleaned and prepared the bones for sequencing, other samples from the labs doing the work, and who knows where else.

I have been asked many times why they can't eliminate this contamination. For example, why can't they just clean the bone, or take samples from deep inside the bone, or take samples from deep inside of teeth, or use a clean room, yada yada yada.

The answer is that they faire wash the bones, and they faire eliminate the outer surface, and they faire take samples from deep inside of bones, and they faire work in a clean room, with ultraviolet lights and positive air pressure so that DNA can't get sucked into the room, and rubber gloves and bunny suits, and the whole nine yards. Et the bones are still contaminated, deep inside them.

Now, you may imagine anthropologists picking their noses with the bones, and using them as chopsticks, and putting them up to their ears to hear them breathing, and all manner of other things. The truth is, I have no idea how the contamination gets in there, and neither does anybody else. It's just there, and apparently we can't avoid it.

The extraction team looked at lots of Neandertal specimens, with one question in mind: How much human contamination does this bone have? To answer this question, they amplified mtDNA sequences, and assessed what proportion of transcripts were Neandertal-like and what proportion were human-like. Vindija 80 stood out as having a very low proportion of human-like transcripts -- less than 2 percent. So they inferred that there was little contamination of the sample by recent human DNA, and are working under the assumption that the nuclear genome is contaminated in a similar low proportion.

As for why this particular bone has such low contamination, well, nobody really knows that either. Svante Pääbo speculates that it is because Vi 80 was originally identified as fauna and hasn't been handled much. He might well be right. Which would bring us back to the nose-picking chopstick bone theory, I suppose.

If Vindija 80 was put in a box with fauna, it can't be very diagnostic. This high preservation seems very unusual. How do they know it was a Neandertal?

The radiocarbon date is 38,310 +/- 2130, and they found very high preservation of a Neandertal-like mtDNA sequence. If you think that fails to answer the question, well.

How can they deal with the damage to ancient DNA sequences?

One of the things that has become clear about ancient DNA research is that DNA from ancient fossils undergoes various kinds of damage. The most obvious is the fragmentation of the DNA into very small pieces, a problem that both the sequencing approaches have been designed to circumvent.

But a more serious problem is that some bases become degraded over time in ways that cause the sequencing methods to misidentify them. For example, cytosine (the "C" base) can be chemically modified over time into a base called uracil, which sequencing methods misidentify as a thymine (the "T" base).

There seems to be no way to tell which base pair changes are diagenetic (i.e. DNA damage-induced) and which are genuine Neandertal changes.

So, the teams took a radical approach: just ignore all the changes that are possibly damage. Instead of analyzing Neandertal-specific changes, they decided to assess the status of human polymorphisms and human-chimpanzee differences in the Neandertal seqeunce. This method is how they estimated the Neandertal-human genetic divergence time, for example -- because the Neandertals have approximately 96 percent similarity with humans for human-chimpanzee genetic differences, it is possible to infer that their genes diverged from the average human gene only 4 percent of the evolutionary time separating humans and chimpanzees. The research teams assumed that humans and chimpanzees are separated by 13 million years of evolution -- this includes the time on les deux the human and chimpanzee lineages since their common ancestor, assumed to be 6.5 million years ago. These dates and genetic differences produce an estimate of around 520,000 years ago for human-Neandertal genetic divergences.

In the long run, it should be possible to sequence the genome with multiple coverage, which would allow damage to be resolved. With many copies, the damage to any individual DNA sequence will be unique, while changes that are evident in multiple copies must probably be real.

But we are quite a ways from the long run, so for the time being we have to deal with DNA damage. For individual genes, it may be possible to reason exactly what effects changes would have and thereby arrive at a conclusion about which changes are diagenetic. For instance, only a minority of such changes will affect coding regions, and some of those will be synonymous changes, so only a small proportion will make amino acid changes, and if there are only a couple of these per gene the resulting protein structure may be able to be analyzed. So from a functional perspective, it should be possible to work with damaged sequence.

The main problem is from the statistical perspective (i.e., assuming neutrality), and here I think the teams have taken a very reasonable approach by just throwing the changes out.

Will they really be able to sequence the full Neandertal genome in two years?

I got a lot of questions from journalists on this point. I really see no reason to doubt it -- they know their average sequence yield from a given amount of extract, and the proportion of that yield that is actually Neandertal DNA.

The main caveat is a statistical one: 3 billion base pairs of sequence is -- on average -- one full coverage of the genome, but in practice some loci will be sequenced many times, while a fairly large proportion (a bit over 30 percent) won't be sequenced at all.

A billion missing bases may not seem like a big deal, but there is a catch: the short average fragment size means that the missing patches will be distributed throughout every gene. Since the average gene covers a region of a few kilobases, complete gene sequences will be pretty rare -- most will have gaps in them amounting to around 30 percent of their length.

Or to put it another way, a bit more than 30 percent of informative SNPs in humans will not be represented in the first Neandertal genome draft.

A second issue is that the genome of Vindija 80 is not haploid -- there are two copies of most everything in that bone. Some of these copies were polymorphisms in Neandertals, and if these are reconstructed into a single sequence, there will be mixed-up haplotypes. This means that it will be difficult, if not impossible, to assess whether there were functional multi-SNP differences between the human and Neandertal sequences of particular genes.

Anyway, that's probably getting beyond ourselves. No doubt somebody will think of some way to improve these problems and it will eventually become cheap enough to do 10x coverage instead of 1x coverage.

They're already making plans to clone Neandertal super-soldiers, aren't they?

Maybe unsurprisingly, this question about Neandertal cloning is the one most journalists so far have wanted to ask me. I'm sure they're asking everybody, hoping that somebody will slip a really pithy quote for them.

Since I have clones here at home, I can't bring myself to get to worked up about it. A Neandertal clone army would definitely be an improvement over a Neandertal Jar-Jar.

Personally, I have another problematic scenario in mind, which I am developing elsewhere.

Les références:

Green RE, Krause J, Ptak SE, Briggs AW, Ronan MT, Simons JF, Du L, Egholm M, Rothberg JM, Paunovic M, Pääbo S. 2006. Analysis of one million base pairs of Neanderthal DNA. Nature 444:330-336. DOI link

Lambert DM, Millar CD. 2006. Evolutionary biology: Ancient genomics is born. Nature 444:275-276. DOI link

Margulies M and 55 others. 2005. Genomie sequencing in microfabricated high-density picolitre containers. Nature 437:376-380. DOI link

Noonan JP, Coop G, Kudaravalli S, Smith D, Krause J, Alessi J, Chen F, Platt D, Pääbo S, Pritchard JK, Rubin EM. 2006. Sequencing and analysis of Neanderthal genomic DNA. Science 314:1113-1118. DOI link

Pennisi E. 2006. The dawn of stone age genomics. Science 314:1068-1071.

Römpler H and 8 others. 2006. Nuclear gene indicates coat-color polymorphism in mammoths. DOI link

Ronaghi M. 2001. Pyrosequencing sheds light on DNA sequencing. Genome Res 11:3-11. Résumé

Schloss PD, Handelsman J. 2003. Biotechnological prospects from metagenomics. Current Opinion in Biotechnology 14:303-310.

Updated: November 17, 2006

You May Also Enjoy


Set 3: Question 4

Note to 7.014 students who are Biology majors: Use these problems for practice some may go further than you are used to. But try them anyway, because they are interesting. Use the Hypertext for help, or the textbook, if you want to.

Enzyme Biochemistry Practice Problems

1) Which of the following assumptions are made in Michaelis-Menten kinetics? For Review material on Michaelis-Menten kinetics, consult the Hypertextbook

2) An enzyme (E) in a certain flower converts a colorless substance (S) into a pink colored compound (P). The enzyme follows Michaelis-Menten kinetics.
E + S <--> ES --> E + P

a) Which of the following are valid definitions of the specific activity of enzyme E?

b) What is Vmax? For Review material on Km and Vmax, consult the Hypertextbook

3) You are a research scientist studying a novel enzyme X, and you want to characterize this new enzyme. You measure the velocity of the reaction with different substrate concentrations and get the following data:

[substrate] (mM) Initial Velocity (mmol/min)
3.0 10.4
5.0 14.5
10.0 22.5
30.0 33.8
90.0 40.5

a) Given these data, choose the correct graph. To review material on enzyme kinetics, consult the Hypertextbook.

b). What would be the effect on the initial reaction velocities if the concentration of enzyme was reduced to 10% of the amount used in part i)? To review material on Michaelis-Menten kinetics, consult the Hypertextbook.

c). How would the ten-fold decrease in enzyme concentration affect the observed Km? To review material on enzyme kinetics examples, consult the Hypertextbook.

4) You have isolated the enzyme milleniase from the rare Y2K bug. This enzyme cleaves the first two numbers off of four digit dates. You flex your skills as an enzymologist and come up with the following graph of initial velocity as a function of substrate concentration:

a) From the graph, estimate Km. To review material on measuring Km and Vmax, consult the Hyptertextbook.

b) What is the approximate value of Vmax? To review material on measuring Km and Vmax, consult the Hyptertextbook.

c) Is milleniase an allosteric enzyme? Expliquer.

5) You wish to find the amino acid sequence of an enzyme from the baker's yeast, Saccharomyces cerevisiae. Which of the following methods might you use to determine this?

a) Purify the protein and subject it to N-terminal sequencing.

b) Treat the purified enzyme with protease and then sequence the proteolytic fragments by Edman degradation.

c) Clone the gene and sequence the DNA of the coding sequence, then generate a deduced protein sequence.

d). Query GenBank (through the National Center for Biotechnology Information) and look up the sequence in the database.

8) Your biology professor states in his lecture that all enzymes are proteins, but you see your TA raising her eyebrows. The reason for her expression is:

9) Lactose is a disaccharide found in milk. Many adults throughout the world get sick from drinking milk because they cannot digest lactose. Lactose intolerance varies markedly among various human populations. For example, only about 3% of people of Danish descent are lactose intolerant, compared with 97% of people of Thai descent. When someone who is lactose intolerant ingests milk, the lactose accumulates in the lumen of the small intestine because there is no mechanism for uptake of the disaccharide. This causes abdominal distension, cramping, and watery diarrhea. Adults who can drink milk can do so because of the enzyme lactase which is located on the outer surface of epithelial cells lining the small intestine. Lactase hydrolyzes lactose into its two component monosaccharides, glucose and galactose. Both glucose and galactose can cross the epithelial cells, and therefore do not cause illness.

a) Why can't lactose diffuse across the membranes of the intestinal epithelial cells in the absence of a carrier-mediated uptake system?

b) Why does the accumulation of sugar (or any solute) in the intestinal lumen cause an influx of water that leads to watery diarrhea?

c) You decide to study lactase further, and see whether it can also cleave other common disaccharides, such as maltose. (Maltose = glucose + glucose.) You find that maltose is NOT cleaved by lactase, and furthermore, maltose appears to have some kind of inhibitory effect on lactase's ability to cleave lactose. Is maltose a more likely candidate for competitive or noncompetitive inhibition of lactase?

d) In order to confirm your hypothesis in part (c), you quantitatively study the kinetics of lactase with lactose alone, and in the presence of both lactose and maltose. You measure the initial velocity of the reaction (rate at which lactose is cleaved) at varying concentrations of substrate. The data are given below.

[Lactose] moles/L Velocity (mol/min)
lactose only with maltose
0.3 x 10-5 10.4 4.1
0.5 x 10-5 14.5 6.4
1.0 x 10-5 22.5 11.3
3.0 x 10-5 33.8 22.6
9.0 x 10-5 40.5 33

Do these data support the model that maltose is a competitive or noncompetitive inhibitor? (You may need to graph 1/V vs. 1/[S] for lactase in the presence and absence of maltose).


Human papillomaviruses (HPV)

HPV are important viral pathogens that cause a variety of mucosal infections of the anogenital and oral mucosa. These infections can lead to epithelial cancers at these mucosal sites. Papillomaviruses (PVs) are species-restricted such that HPVs cannot be directly studied in pre-clinical laboratory animal models. Two rabbit papillomavirus models have been used extensively to study various aspects of papillomavirus biology, including vaccine testing 96 , anti-viral treatments 97 , papillomavirus biology 98 , and latent viral infections 99 . The viruses include cottontail rabbit papillomavirus (CRPV), which is a cutaneous-tropic virus whose lesions spontaneously progress to cancer, and rabbit oral papillomavirus (ROPV), which is a mucosa-tropic virus that induces oral infections. Numerous viral mutant genomes 98 and a unique HLA.A2.1 transgenic rabbit line 100 have been developed to study host immune responses to viral infection, therapeutic T-cell-based vaccines and host anti-CD8 immunity to viral proteins.


Gene Transfer Between Species Is Surprisingly Common

Bacteria are known to share genes, spreading drug resistance, for example. But how common is it in other organisms, including mammals like us? Two new studies show that most bacteria have genes or large groups of genes shared by other bacteria.

Even among higher organisms, shared genes are the rule rather than the exception, UC Berkeley and LBNL researchers say.

Two new studies by University of California, Berkeley, scientists highlight the amazing promiscuity of genes, which appear to shuttle frequently between organisms, especially more primitive organisms, and often in packs.

Such gene flow, dubbed horizontal gene transfer, has been seen frequently in bacteria, allowing pathogenic bacteria, for example, to share genes conferring resistance to a drug. Recently, two different species of plants were shown to share genes as well. The questions have been: How common is it, and how does it occur?

In a report appearing this week in the Proceedings of the National Academy of Sciences (PNAS), UC Berkeley and Lawrence Berkeley National Laboratory (LBNL) researchers analyzed more than 8,000 different families of genes coding for proteins - families that represent the millions of proteins in all living creatures - to assess the prevalence of horizontal gene transfer.

They found that more than half of all the most primitive organisms, Archaea, have one or more protein genes acquired by horizontal gene transfer, as compared to 30 to 50 percent of bacteria that have acquired genes this way. Fewer than 10 percent of eukaryotes - plants and animals - have genes acquired via horizontal gene transfer.

In a second report published by Nature, two species of bacteria living together in the pink slime of an acidic California mine were found to share large groups of genes. These genes code for proteins that work together, so by acquiring the entire block from another organism, bacteria can gain a new function that helps them adapt more quickly to the same type of environment - in this case, a hot, highly acidic, metal-rich broth.

This is the first observation of exchange of very large genomic blocks between organisms in a natural microbial community, according to UC Berkeley's Jill Banfield, who led the team of researchers from LBNL, Oak Ridge National Laboratory (ORNL), Lawrence Livermore National Laboratory and the U. S. Department of Energy's Joint Genome Institute (JGI).

"One of the key questions being debated was, 'Is horizontal gene transfer extensive and rampant, or is it a relatively rare event?'" said Sung-Hou Kim, professor of chemistry at UC Berkeley and coauthor of the PNAS paper. "This becomes important in classifying organisms and comparing whole genomes to find their relationships.

"Our study shows that gene transfer is fairly common, but the extent in a given organism is fairly low - that is, most organisms have received one or more genes from a closely related organism. And while it's very likely that genes are transferred in chunks that are linked metabolically, I bet it's not always true. If a group of genes doesn't have value in a new environment for a new organism, it's not going to stick around."

"This provides important information about the conservation of genetic resources to enable life to survive and thrive," said ORNL's Bob Hettich, a co-author of the Nature paper. "Ultimately, the basic knowledge gained from this research will lead to a greater understanding of genetic diversity in related organisms and should lead to developments in human health and bioremediation."

Though the Nature findings about mine slime bear on the issue of horizontal gene transfer, the study's main goal was to detect, with high resolution, which organism is able to carry out what function within a natural, uncultivated microbial community, according to Banfield.

"In addition to revealing a history of genetic exchange between two dominant organism types in the mine, we show that it is possible to identify a large fraction of the proteins from coexisting organisms and determine which organism most of the proteins comes from, even if the organisms are quite closely related," said Banfield, a professor of earth and planetary science and of environmental science, policy and management at UC Berkeley and also an LBNL researcher.

Banfield leads a long-term study of the community of organisms in mine slime obtained from the Richmond Mine near Redding, Calif. This microbial biofilm has turned out to be an ideal research subject, Banfield said, because the simple community contains few enough organisms that they can be used as a model system to uncover aspects of how microbes interact with each other and their surroundings in ways that are difficult or impossible in other environments.

Banfield contrasts her strategy of ever more detailed studies of a single site to that of Craig Venter, who has been sailing the world's oceans aboard his boat, Sorcerer II, sampling large communities of organisms to survey global diversity. After four years collecting vast amounts of genomic information, he plans to publish some of his analyses next week in the Public Library of Science, or PLoS.

In 2002, the mine was the source of samples for the first fairly comprehensive community genomic, or metagenomic, characterization of a natural microbial consortium. In 2005, Banfield and colleagues presented the first relatively large-scale analysis of the proteins that consortia members make to carry out the various metabolic tasks needed for life underground - work that revealed information about the machinery used to adapt to the extreme conditions in which they live. More recently, in 2006, research scientist Brett Baker, Banfield and colleagues reported that the biofilms harbor novel archaeal organisms that appear to be extremely small compared to other life forms.

"Analysis of how microorganisms respond to their environments and the role of exchange of genetic material in adaptation and evolution is important if we are to understand important environmental processes such as acid mine drainage, or even degradation of cellulose for ethanol production by microbial communities," added Banfield.

In their new paper, the researchers combine metagenomics with strain-resolved shotgun proteomics to show that different organisms are exchanging large blocks of their genes.

"Who's there and what are they doing are key questions in microbial ecology," said Banfield's colleague Vincent Denef, a post-doctoral researcher in UC Berkeley's Department of Earth and Planetary Science. "Our high-resolution, mass spectrometry-based community proteomics approach answers both at the same time. We can now tell apart closely related organisms, which we previously would have grouped as one species, and we can monitor and discriminate their behavior within the same natural community. These abilities will allow us to understand the implications of small differences in genome sequence and content on ecological performance, one of the key goals of the current microbial genomic sequencing efforts."


Voir la vidéo: Sanger sequencing (Novembre 2022).