Informations

Séquençage de deux brins d'adn

Séquençage de deux brins d'adn


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ma formation n'est pas génétique. 2.Je ne suis pas intéressé à savoir comment le séquençage ou le génotypage de l'ADN est effectué. 3. Je m'intéresse uniquement à la nature des résultats décrits ici.

Venons-en maintenant à la question : les humains ont deux ensembles de chromosomes dans chaque cellule. Donc, si je dis séquençage du chromosome 1, qu'est-ce que cela signifie réellement ? Lequel des deux chromosomes est séquencé ? De génotypage-faire la comparaison entre deux + deux = quatre chromosomes1 ? Ou toute ma compréhension est-elle erronée ?


Je m'intéresse uniquement à la nature des résultats décrits ici.

En alignant cette séquence sur tous les nucléotides de tous les organismes, nous réaliserions que la séquence (courte) donnée se produit dans divers organismes en plus des humains. Par conséquent, il pourrait provenir d'une espèce avec un seul chromosome voir NCBI Blast !

Pour l'exemple, supposons que l'espèce ait plusieurs instances de chaque chromosome (par exemple, une par la mère humaine et une par le père humain), et regardons « les résultats tels que décrits ici ». Comme aucun détail n'est donné sur le protocole, supposons en outre le scénario le plus courant - à savoir qu'il n'y avait pas de distinction ou de séparation expérimentale des instances individuelles de chromosomes.

En regardant les résultats, nous nous rendrions compte qu'il ne s'agit pas de "séquençage de nouvelle génération", mais de séquençage de Sanger.

Maintenant, nous regardons à nouveau le schéma fourni (remarque : ce ne sont pas de vraies données expérimentales) : il est clair que les bandes sur le côté gauche ne se produisent que pour une lettre/base, et à une position donnée de la séquence, il n'y a qu'un seul pic très clair sur le côté droit (par opposition à la possibilité d'avoir plusieurs pics correspondant à différentes bases).

Il faudrait conclure que chaque instance du chromosome a une séquence absolument identique. Ainsi, nous conclurions qu'il ne serait pas important de distinguer les instances individuelles.

Mais attendez, les chromosomes maternels et paternels ne sont-ils pas différents ? Absolument, l'exemple donné ne regarde cependant que 25 bases plutôt que le chromosome complet - et il serait fort possible qu'elles soient absolument identiques. (remarque : il existe diverses techniques expérimentales pour sélectionner uniquement des régions spécifiques d'ADN ou d'ARN pour l'analyse).


Je dirais que votre compréhension ici n'est pas nécessairement imparfaite - plutôt, il y a un petit tour qui vous est joué.

La figure illustre les résultats typiques du séquençage de Sanger. Ce type de séquençage nécessite toujours une amorce, une courte séquence d'environ 20 bases qui sont connues. Le code suivant ces 20 bases sera séquencé. En utilisant cette technique seule, vous ne pouvez pratiquement pas séquencer un chromosome entier - il n'est généralement bon que pour environ 700 à 1200 bases après l'amorce.

Les bandes dans le graphique à gauche et les pics à droite correspondent à la base à la position "primer + n" (n étant le nombre de bandes/pics commençant à compter au bas du graphique).

Considérons maintenant qu'en pratique, cette technique est réalisée sur un échantillon liquide contenant bien sûr un nombre énorme de molécules d'ADN. Dans un scénario idéal, chaque molécule est identique. Dans ce cas, la séquence derrière les 20 bases d'amorces est identique et vous obtiendrez des bandes ou des pics clairs comme indiqué dans le graphique.

Lorsque vous prélevez un échantillon d'un organisme comme un humain, il y aura une variété de molécules d'ADN dans le mélange.

Qu'est-ce qui est séquencé ? Simple, tout ce qui se trouve derrière l'amorce que vous utilisez pour séquencer. Si différentes molécules ont des séquences différentes là-bas, le résultat sera des bandes dans différentes colonnes à la même position sur le gel (côté gauche du graphique) ou deux pics de couleurs différentes au même endroit dans la chromatographie (côté droit du graphique) .

Exemple : génotypage

Nous considérons le gène XYZ. Il existe deux variantes de ce gène chez l'homme, et la seule différence est à la position 167 du gène, où une variante a un A et l'autre un G. Grâce au projet du génome humain, je connais la séquence complète du gène XYZ , je conçois donc mon amorce pour couvrir les positions 50-70 de XYZ. Par conséquent, mon résultat de séquençage devrait donner le gène XYZ, commençant quelque part autour de la position 100 (même les réactions de séquençage de la plus haute qualité manquent quelques bases après l'amorce). Si je prélève un échantillon sur un humain qui a le même variant XYZ sur les deux chromosomes sœurs, je n'obtiendrai qu'un seul résultat de séquençage - avec A ou G à la position ~67 de mon séquençage. Si mon échantillon provient d'un humain qui a une variante sur un chromosome et l'autre variante sur l'autre, mon séquençage sera ambigu à la position ~67, et en y regardant de plus près, j'ai séquencé deux variantes de cet échantillon : une avec un A et une avec un G à cette position ambiguë. De cette façon, je peux déterminer le génotype d'un humain pour ce gène : homozygote XYZA/A, XYZB/B ou hétérozygote XYZUN B.

PS : Ne laissez pas la nature double brin de l'ADN vous embrouiller dans votre réflexion ici, le séquençage de Sanger ne séquence toujours qu'un seul brin (celui pour lequel vous avez conçu l'amorce) ! Donc deux chromosomes frères = deux doubles brins = quatre simples brins, dont deux seront séquencés car les deux autres contiennent les séquences complémentaires.

PPS : La façon dont cela fonctionne peut causer d'énormes problèmes si l'apprêt n'est pas conçu correctement. Avec 20 bases, il est possible que les mêmes 20 bases apparaissent ailleurs dans le génome, et du coup les séquences suivant l'amorce ne sont pas seulement différentes dans une ou deux positions, mais partout.


C'est une image du séquençage de Sanger. Si ce séquençage avait été effectué dans une région où un organisme diploïde était hétérozygote pour un simple SNP, le fichier de trace aurait, au lieu d'avoir des pics uniques et propres, aurait au point du SNP deux demi-pics de deux couleurs pour les deux lettres présent sur ce site. Si la différence entre les deux allèles était plus complexe qu'un seul polymorphisme nucléotidique, le fichier de trace pourrait sembler très différent.

Donc, si je dis séquençage du chromosome 1, qu'est-ce que cela signifie réellement ?

Les gens ne se contentent pas souvent de séquencer un chromosome entier comme ça, et à peu près plus personne ne le ferait avec la technologie Sanger. Mais si vous séquencez un organisme diploïde non consanguin, vous vous attendriez à ce que les points d'hétérozygotie obtiennent un mélange de signaux.

De génotypage-faire la comparaison entre deux + deux = quatre chromosomes1 ?

Les organismes diploïdes ont 2 copies d'un chromosome donné, pas 4. Chaque chromosome a deux brins, mais les informations sur les brins complémentaires sont identiques.


METTRE À JOUR


Avant de passer au séquençage, vous devez considérer que vous ne séquencez pas un seul chromosome d'une seule cellule. Vous séquencez un échantillon d'ADN correspondant à une population de cellules, contenant tous les chromosomes. Je ne connais pas de procédure pour cibler un seul chromosome, des procédures ciblées pour des régions spécifiques sur les gènes entourant le génome existent.

Ou toute ma compréhension est-elle erronée ?

Oui, je dirais qu'il manque pas de défaut.

Cela dit,

Donc, si je dis séquençage du chromosome 1, qu'est-ce que cela signifie réellement ?

Hypothétiquement, cela signifierait que vous séquencez l'ADN du chromosome 1 correspondant à une population de cellules. Cela signifie que vous récupérez la séquence du chromosome 1 pour une utilisation dans une analyse en aval en polymérisant sa séquence d'ADN complémentaire en tirant parti de la procédure de réplication de l'ADN.

Lequel des deux chromosomes est séquencé ?

Il n'y a aucun moyen de différencier deux chromosomes dans les expériences de séquençage grand public. La cellule n'a aucune idée de quel chromosome est lequel et vous non plus, donc les deux chromosomes sont séquencés en même temps. Attention, j'ai dit aucun moyen de différencier deux chromosomes dans les expériences de séquençage grand public

la comparaison a-t-elle lieu entre deux+deux=quatre chromosomes 1 ?

Celui-ci comporte deux parties. Qu'entends-tu par quatre ? Si vous sous-entendez que le chromosome 1 a deux brins et que cela équivaut à 4, alors non, les deux brins forment ensemble un chromosome. Votre cellule a 2n ou deux chromosomes 1. Si vous séquencez une population de cellules (disons 1000), vous avez deux mille chromosomes 1 qui sont séquencés, tous présents par paires sur 1000 cellules.

Des comparaisons ont-elles lieu ?

Dans les expériences traditionnelles, nous ne comparons pas. Cela dit, des méthodes de différenciation entre les deux chromosomes 1 existent. Le plus ancien que j'ai pu trouver est un article de M Nagano sur le séquençage spécifique des allèles. Dans ce cas, puisque vos parents contribuent à parts égales à votre ADN, chacun d'eux porte des mutations spécifiques à son ADN. En utilisant cette caractéristique, nous pouvons différencier le chromosome paternel et maternel 1.

Il existe également un séquençage monocellulaire, dans ce cas, vous séquenceriez les deux chromosomes 1 à partir d'une seule cellule, théoriquement, vous pouvez également effectuer un séquençage spécifique d'allèles sur une seule cellule, ce qui vous permet de différencier les deux chromosomes 1 présents dans la cellule.

Enfin, il n'y a aucun moyen de différencier les deux brins, après le séquençage lorsque vous alignez vos données sur le génome de référence, vous apprendrez à connaître l'échouage des données.

Réponse à l'ancienne question


De nos jours, le mot séquençage est synonyme de séquençage à haut débit, et l'article auquel vous avez lié dans le commentaire concerne également les techniques de séquençage à haut débit (je l'ai compris d'un coup d'œil rapide).

Lors du séquençage de l'ADN, lequel des deux brins est séquencé ?

Les deux sont séquencés.

Dans quel ordre les résultats sont-ils fournis

Aléatoire

lors du séquençage, comment ces deux brins sont-ils séquencés ?

S'il s'agit d'un séquençage à une seule extrémité, nous ne savons pas quel brin a été séquencé en premier. (Il y a des moyens, mais par souci de simplicité n'y allons pas)

S'il s'agit d'un séquençage d'extrémités appariées, une lecture provient du brin sens et l'autre lecture provient du brin opposé.

Vous pouvez regarder une vidéo youtube ici pour savoir quelle est la différence

Est-ce que le résultat d'un brin est fourni en premier suivi de l'autre ou est-ce qu'un seul des deux brins est séquencé?

Les deux sont signalés.

La question que vous avez posée est très large, je peux continuer sur une poignée de pages A4 et ne pas finir. Pour en venir à votre première question, j'ai dit que les deux sont séquencés, car nous n'avons aucun moyen de savoir pendant le séquençage quel brin est séquencé (il existe des techniques de séquençage échoué, mais vous devriez digérer ce qui est mentionné/lié ici en premier et plus tard avec un peu plus la recherche revient avec une question sur le séquençage échoué).

Après le séquençage, vous obtenez votre résultat dans un ordre aléatoire, car ce que vous obtenez n'est pas vraiment un résultat mais des fichiers de données plus bruts appelés fichiers FASTQ. Renseignez-vous un peu sur FASTQ. Après le séquençage, vous n'obtenez pas vraiment de FASTQ mais vous obtenez un fichier BCL ou base call, qui doit être converti en FASTQ. Ces FASTQ doivent ensuite être soit filtrés ou non sur la base de la qualité puis alignés sur un génome de référence. C'est là que vous apprenez quelle lecture vient de quel brin.

Vous devriez en savoir plus sur le séquençage à extrémité unique et le séquençage à extrémité appariée pour mieux comprendre comment l'ADN est séquencé. Regardez aussi cette vidéo. C'est la version la plus simplifiée que j'ai pu trouver. Cela devrait vous rendre curieux sans vous bombarder de trop d'informations.

Enfin, dans un séquençage à une seule extrémité, vous n'avez aucun moyen de savoir sans alignement quel brin a été séquencé, mais en extrémité appariée (où un fragment d'ADN est séquencé à partir des deux extrémités, générant deux lectures appariées) généralement, un partenaire s'aligne au sens brin tandis que l'autre s'aligne sur le brin antisens.


Biologie MCAT : Séquençage d'ADN et d'ARN

Une partie importante de la création d'amorces d'ADN lors de la réalisation d'une PCR ou d'une autre analyse quantitative est le point de fusion de l'amorce. Quel jeu d'amorces fonctionnerait très probablement bien ensemble en tant qu'amorces directe et inverse d'une PCR ?

CGGACATGGTGG et GTTACCGCAGGC

ATCGCTTTGTAC et GTTACCGCAGGC

ATCGCTTTGTAC et CGGACATGCTGG

CACACTATAAAAA et ATCGCTTTGTAC

GTGTGATACCCC et CACACTATAAAA

CGGACATGGTGG et GTTACCGCAGGC

Le point de fusion d'un brin d'ADN peut être prédit par les bases qui le composent. La cytosine et la guanine ont trois liaisons hydrogène l'une à l'autre, elles se lient donc plus fortement que les deux liaisons hydrogène de l'adénine et de la thymine. Cela signifie que les brins contenant la même quantité de C et de G fonctionneraient mieux ensemble. Il n'y a qu'un seul choix de réponse dans lequel les deux brins ont la même quantité de Cs et Gs (ou Ts et As).

Exemple Question #1391 : Biologie

Quel morceau d'ADN a le point de fusion le plus bas ?

Remarque : un seul brin est affiché

La cytosine et la guanine se lient plus fortement que l'adénine et la guanine car elles ont trois liaisons hydrogène au lieu de deux. Par conséquent, un morceau d'ADN avec une concentration élevée de Ts et d'As aura un point de fusion bas. Le bon choix a 8 Ts et As, tandis que les autres ont moins que cela.

Exemple Question #1391 : Biologie

Les chromosomes humains sont divisés en deux bras, un bras q long et un bras p court. UNE caryotype est l'organisation du complément génétique total d'une cellule humaine. Un caryotype typique est généré en ordonnant le chromosome 1 au chromosome 23 par ordre de taille décroissante.

Lors de la visualisation d'un caryotype, il peut souvent devenir évident que des changements dans le nombre, l'arrangement ou la structure des chromosomes sont présents. Parmi les changements génétiques les plus courants figurent les translocations robertsoniennes, impliquant la transposition de matériel chromosomique entre les bras longs de certains chromosomes pour former un seul chromosome dérivé. Les chromosomes 14 et 21, par exemple, subissent souvent une translocation Robertsonienne, comme ci-dessous.

Un caryotype de cet individu pour les chromosomes 14 et 21 apparaîtrait ainsi comme suit :

Bien qu'un individu présentant des aberrations telles qu'une translocation Robertsonienne puisse être phénotypiquement normal, il peut générer des gamètes par méiose qui ont des organisations atypiques de chromosomes, entraînant des anomalies fœtales récurrentes ou des fausses couches.

Le principal composant chimique des chromosomes est l'acide nucléique, bien que les protéines soient également des éléments importants. Lequel des énoncés suivants est vrai pour les acides nucléiques ?

L'ADN contient des résidus d'uracile, tandis que l'ARN contient de la thymine

L'ADN est traduit directement par l'ARNt lié aux acides aminés

Les régions riches en guanine-cytosine ont des points de fusion plus élevés que les régions riches en adénine-thymine

L'ARN fournit la principale forme de stockage de l'information génétique

Les ribosomes sont importants dans la synthèse des molécules d'ARN

Les régions riches en guanine-cytosine ont des points de fusion plus élevés que les régions riches en adénine-thymine

L'appariement guanine-cytosine forme trois liaisons hydrogène, au lieu des deux liaisons formées par l'adénine et la thymine. Les autres choix sont tous tentants, mais subtilement faux. L'ARN contient de l'uracile, l'ADN est la principale forme de stockage de l'information, l'ARNm est directement traduit par l'ARNt et les ribosomes sont importants dans la synthèse des protéines. Il convient de noter que le groupe hydroxyle 2' du squelette du sucre pentose de l'ARN est perdu dans l'ADN, ce qui augmente la stabilité et permet à l'ADN de servir de support de stockage stable.

Exemple de question n° 1 : Comprendre les acides nucléiques

Choisissez la raison la moins susceptible d'expliquer pourquoi deux purines ne seront jamais vues attachées l'une à l'autre dans une hélice d'ADN.

Les groupes fonctionnels à la fin d'une purine ne correspondraient pas correctement avec l'autre purine.

Deux purines pourraient provoquer une bosse dans l'ADN, causant des problèmes de transcription et de réplication.

Les bases puriques ne seront jamais trouvées sur les brins d'ADN opposés, elles n'ont donc pas la capacité de s'apparier les unes aux autres.

La structure volumineuse à deux anneaux des purines causerait trop de gêne à l'intérieur de l'hélice.

Les bases puriques ne seront jamais trouvées sur les brins d'ADN opposés, elles n'ont donc pas la capacité de s'apparier les unes aux autres.

Les brins d'ADN sont composés de millions de nucléotides. En conséquence, il serait pratiquement impossible de trouver un seul brin qui n'aurait pas les quatre nucléotides.

Les nucléotides se combinent en paires purine-pyrimidine en raison de l'ajustement stériquement approprié des bases, ainsi que de la combinaison préférée de liaisons hydrogène entre les deux nucléotides. En conséquence, deux purines ne seraient pas vues combinées. Cela est dû à la fois au fait qu'ils sont trop gros lorsqu'ils sont ensemble et à la liaison hydrique incorrecte entre leurs groupes fonctionnels.

Exemple Question #1391 : Biologie

Quel segment d'ADN aurait le point de fusion le plus élevé lorsqu'il est associé à son brin complémentaire ?

Les paires de bases de nucléotides d'ADN sont maintenues ensemble par une liaison hydrogène. La cytosine et la guanine sont maintenues ensemble par trois liaisons hydrogène, tandis que l'adénine et la thymine ne sont maintenues ensemble que par deux. Une liaison hydrogène accrue dans un brin d'ADN augmentera le point de fusion. Le segment d'ADN avec le plus de paires de bases guanine-cytosine aura le point de fusion le plus élevé.

Exemple Question #1391 : Biologie

Laquelle des options suivantes inclut des codons dégénérés ?

Le terme « codons dégénérés » fait référence à des codons avec différentes séquences de bases nucléotidiques qui spécifient le même acide aminé. Dans les exemples fournis, deux codons (UCU et UCA) spécifient tous deux la sérine, indiquant qu'il s'agit de la bonne réponse.

Exemple Question #1396 : Biologie

En 2013, les scientifiques ont lié une réponse cellulaire appelée réponse protéique dépliée (UPR) à une série de maladies neurodégénératives, y compris des problèmes de santé majeurs comme la maladie de Parkinson et la maladie d'Alzheimer. Selon leurs travaux, la réponse protéique dépliée est une réduction de la traduction résultant d'une série d'enzymes qui modifient un facteur d'initiation de la traduction, eIF2, comme ci-dessous :

Dans la séquence ci-dessus, le capteur de protéine dépliée se lie à une protéine dépliée, telle que la bêta-amyloïde pathogène trouvée dans le cerveau des patients atteints de la maladie d'Alzheimer. Ce capteur phosphoryle ensuite PERK, ou protéine kinase kinase du réticulum endoplasmique de type ARN. Cela conduit à des effets en aval sur eIF2, dont l'inhibition réprime la traduction. On pense que les symptômes de la maladie neurodégénérative peuvent être le résultat de cette traduction réduite.

Pendant la traduction, le code génétique est utilisé pour convertir une séquence de bases azotées dans l'ARNm en une séquence d'acides aminés. Lequel des énoncés suivants est vrai du code génétique ?

I. Plus d'une séquence de codons code pour un seul acide aminé

II. La position la plus 5' du codon sur l'ARNm est la position d'oscillation

III. Chaque séquence de codons ne code que pour un acide aminé

Le code génétique est sans ambiguïté, car chaque codon ne code que pour un acide aminé. Il est également dégénéré, de sorte que chaque acide aminé peut être codé par plusieurs codons. Le choix 2 est incorrect, car la position la plus en 3' sur l'ARNm est la position d'oscillation.

Exemple Question #1397 : Biologie

Un court brin polynucléotidique avec la séquence de bases de AUCCCUGG doit être __________ .

Les séquences polynucléotidiques sont des acides nucléiques, elles doivent donc être de l'ADN ou de l'ARN. Toute séquence contenant U (uracile) doit être de l'ARN, mais il n'y a aucun moyen de déterminer le type d'ARN simplement en regardant la séquence. Cette séquence pourrait coder pour l'ARNm, l'ARNr ou l'ARNt.

L'ARNm est utilisé pour traduire les protéines. L'ARNr joue un rôle structurel et fonctionnel dans la composition des ribosomes. L'ARNt transporte les acides aminés vers le ribosome lors de la traduction.

Exemple de question n° 1 : Séquençage de l'ADN et de l'ARN

Lequel des éléments suivants organise correctement les bases sur la boucle anti-codon d'un ARNt transportant du tryptophane ?

Le tryptophane, qui est codé sur l'ARNm en tant que 3'-UGG-5', va être transporté vers le ribosome via l'ARN-t du tryptophane. La boucle anti-codon doit être complémentaire du brin d'ARNm. Puisque le code du tryptophane est 3'-UGG-'5, la boucle anti-codon de l'ARNt doit lire 3'-CCA-5' pour s'aligner.

Exemple Question #1392 : Biologie

Les codons GGU, GGA, GGC et GGG codent tous pour le même acide aminé, la glycine. Quel terme biologique est utilisé pour décrire ce phénomène ?

La dégénérescence fait référence au fait que plus d'un codon peut coder pour le même acide aminé. Ces codons diffèrent généralement par leur troisième base ou "wobble" base. La dégénérescence explique comment il peut y avoir un total de soixante-quatre codons possibles correspondant à seulement vingt acides aminés.

Toutes les ressources de biologie MCAT

Signaler un problème avec cette question

Si vous rencontrez un problème avec cette question, veuillez nous en informer. Avec l'aide de la communauté, nous pouvons continuer à améliorer nos ressources éducatives.


Séquençage de Sanger

La méthode de séquençage de l'ADN développée par Fred Sanger constitue aujourd'hui la base des réactions automatisées de séquençage en "cycle". Mise à l'échelle jusqu'à la séquence. Dans les années 1980, deux développements clés ont permis aux chercheurs de croire que le séquençage de l'ensemble du génome était possible. La première était une technique appelée réaction en chaîne par polymérase (PCR) qui permettait de produire rapidement et avec précision de nombreuses copies de la séquence d'ADN. La seconde, une méthode automatisée de séquençage de l'ADN, basée sur la chimie de la PCR et le processus de séquençage développé par Frederick Sanger en 1977.
(Emplacement ADNi : Génome > Le projet > Assemblage > Animations > Séquençage de Sanger)

La première méthode de séquençage du code génétique a été conçue par Fred Sanger. Pour séquencer l'ADN, il doit d'abord être séparé en deux brins. Le brin à séquencer est copié à l'aide de bases altérées chimiquement. Ces bases altérées provoquent l'arrêt du processus de copie chaque fois qu'une lettre particulière est incorporée dans la chaîne d'ADN en croissance. Ce processus est effectué pour les quatre bases, puis les fragments sont assemblés comme un puzzle pour révéler la séquence du morceau d'ADN d'origine.

Séquençage Sanger, Fred Sanger, Frederick Sanger, amplification en chaîne par polymérase, amplification en chaîne par polymérase PCR, ADN de Sanger, ADN


Les scientifiques disent : le séquençage de l'ADN

Ces lettres et couleurs représentent un code ADN et les produits chimiques qui composent un brin de notre empreinte génétique. Les scientifiques peuvent prélever des échantillons à l'aide de l'écouvillon d'organismes et « lire » leur ADN grâce à un processus appelé séquençage de l'ADN.

Partagez ceci :

Séquençage ADN (nom, "D. N. A. SEE-kwen-sing")

Chacun de nous a son propre ADN unique - de longues molécules qui contiennent des instructions sur la façon de fabriquer et de faire fonctionner notre corps. L'ADN est composé de quatre substances chimiques appelées nucléotides. Ils s'associent pour former une séquence. Ces nucléotides sont l'adénine, la cytosine, la guanine et la thymine (ou A, C, G et T). L'adénine s'associe à la thymine. La cytosine s'apparie à la guanine. Nos cellules décodent des séquences extrêmement longues de ces appariements pour obtenir des instructions sur les protéines à fabriquer.

Éducateurs et parents, inscrivez-vous à la feuille de triche

Mises à jour hebdomadaires pour vous aider à utiliser Actualités scientifiques pour les étudiants dans l'environnement d'apprentissage

Désormais, les scientifiques peuvent prélever des cellules sur n'importe quel organisme vivant et effectuer séquençage ADN — faire correspondre chaque nucléotide avec sa paire. Ce processus permet aux scientifiques de déterminer exactement ce que chaque brin d'ADN « dit ». La détermination de la séquence d'ADN aide les scientifiques à répondre à des questions importantes - de l'espèce d'où provient l'échantillon aux instructions que le brin d'ADN pourrait contenir.

Dans une phrase

Un adolescent a utilisé le séquençage de l'ADN pour découvrir quelles bactéries présentes dans l'intestin d'un ver pouvaient digérer le plastique.

Mots de pouvoir

(pour en savoir plus sur Power Words, cliquez ici)

cellule La plus petite unité structurelle et fonctionnelle d'un organisme. Généralement trop petit pour être vu à l'œil nu, il se compose d'un liquide aqueux entouré d'une membrane ou d'une paroi. Les animaux sont constitués de milliers à des milliards de cellules, selon leur taille. Certains organismes, comme les levures, les moisissures, les bactéries et certaines algues, sont composés d'une seule cellule.

chimique Substance formée de deux atomes ou plus qui s'unissent (se lient ensemble) dans une proportion et une structure fixes. Par exemple, l'eau est un produit chimique composé de deux atomes d'hydrogène liés à un atome d'oxygène. Son symbole chimique est H 2 O. Chimique peut également être un adjectif qui décrit les propriétés des matériaux qui sont le résultat de diverses réactions entre différents composés.

décoder Convertir un message caché ou secret en un langage compréhensible.

digérer (nom : digestion) Pour décomposer les aliments en composés simples que le corps peut absorber et utiliser pour la croissance. Certaines usines de traitement des eaux usées exploitent les microbes pour digérer ou dégrader les déchets afin que les produits de dégradation puissent être recyclés pour être utilisés ailleurs dans l'environnement.

séquençage ADN Le processus de détermination de l'ordre exact des blocs de construction appariés &mdash appelés nucléotides &mdash qui forment chaque barreau d'un brin d'ADN en forme d'échelle. Il n'y a que quatre nucléotides : adénine, cytosine, guanine et thymine (qui sont abrégés A, C, G et T). Et l'adénine s'apparie toujours avec la thymine, la cytosine s'apparie toujours avec la guanine.

gène (adj. génétique) Un segment d'ADN qui code, ou contient des instructions, pour produire une protéine. Les descendants héritent des gènes de leurs parents. Les gènes influencent l'apparence et le comportement d'un organisme.

guanine L'une des quatre substances dont les organismes ont besoin pour produire de l'ADN.

molécule Groupe d'atomes électriquement neutre qui représente la plus petite quantité possible d'un composé chimique. Les molécules peuvent être constituées d'un seul type d'atomes ou de différents types. Par exemple, l'oxygène de l'air est composé de deux atomes d'oxygène (O2 ), mais l'eau est composée de deux atomes d'hydrogène et d'un atome d'oxygène (H2O).

nucléotides Les quatre produits chimiques qui, comme les barreaux d'une échelle, relient les deux brins qui composent l'ADN. Ce sont : A (adénine), T (thymine), C (cytosine) et G (guanine). A se lie à T et C se lie à G pour former de l'ADN. Dans l'ARN, l'uracile remplace la thymine.

organisme Tout être vivant, des éléphants et des plantes aux bactéries et autres types de vie unicellulaire.

Plastique N'importe lequel d'une série de matériaux facilement déformables ou de matériaux synthétiques fabriqués à partir de polymères (longues chaînes d'une molécule de base) qui ont tendance à être légers, peu coûteux et résistants à la dégradation.

protéines Composés constitués d'une ou plusieurs longues chaînes d'acides aminés. Les protéines sont une partie essentielle de tous les organismes vivants. Ils forment la base des cellules vivantes, des muscles et des tissus, ils font également le travail à l'intérieur des cellules. L'hémoglobine dans le sang et les anticorps qui tentent de combattre les infections font partie des protéines autonomes les plus connues. Les médicaments agissent souvent en s'accrochant aux protéines.

séquençage Technologies qui déterminent l'ordre des nucléotides ou des lettres dans une molécule d'ADN qui définissent les traits d'un organisme.

espèce Groupe d'organismes similaires capables de produire une progéniture capable de survivre et de se reproduire.

unique Quelque chose qui ne ressemble à rien d'autre, le seul de son genre.

À propos de Bethany Brookshire

Bethany Brookshire était une rédactrice de longue date à Actualités scientifiques pour les étudiants. Elle a un doctorat. en physiologie et pharmacologie et aime écrire sur les neurosciences, la biologie, le climat et plus encore. Elle pense que les Porgs sont une espèce envahissante.

Ressources pédagogiques pour cet article En savoir plus

Des ressources pédagogiques gratuites sont disponibles pour cet article. Inscrivez-vous pour accéder :


Méthodes bioinformatiques et biostatistiques pour l'analyse du méthylome de l'ADN de l'obésité

Sarah Amandine Caroline Voisin , in Computational Epigenetics and Diseases , 2019

Quels logiciels et ensembles de données dois-je utiliser pour analyser les données de méthylation de l'ADN dans le contexte de l'obésité ?

Quelle que soit la technique de méthylation de l'ADN choisie (RRBS, puces Illumina, MeDIP-seq, puce Me-DIP, etc.), les récents efforts coordonnés de la communauté bio-informatique ont permis de prétraiter, filtrer, normaliser et effectuer toutes sortes d'analyses statistiques. analyses sur les données de méthylation de l'ADN avec le logiciel statistique R. En 2003, le projet Bioconductor open source et open-développement a été lancé dans le but de fournir des outils pour l'analyse et la compréhension de données génomiques à haut débit, en utilisant le langage de programmation R. Elle s'est avérée extrêmement fructueuse et est aujourd'hui la plateforme leader pour l'analyse des données de méthylation de l'ADN, que ce soit dans le contexte de l'obésité ou dans d'autres contextes pathologiques [15] . Parmi les 1473 packages qui sont maintenant sur le site Web [16] , 68 incluent des algorithmes pour prétraiter et analyser les données de méthylation de l'ADN. L'excellente revue de Teschendorff et Relton a décrit en détail ces algorithmes et progiciels pour les analyses en aval des données de méthylation de l'ADN, y compris les algorithmes de déconvolution du type cellulaire, la sélection des caractéristiques, ainsi que l'analyse des voies, intégrative et au niveau du système [17] .

Il est juste de dire qu'il n'y a pas d'étalon-or pour le prétraitement des données de méthylation de l'ADN à partir des puces à billes Illumina, mais il y a quelques étapes importantes qui devraient être mises en œuvre pour augmenter la validité des résultats. Tout d'abord, il est important d'effectuer une transformation logit des valeurs , qui représentent le pourcentage de méthylation à un CpG donné, en valeurs M. Les valeurs de β vont de 0 (aucun allèle n'est méthylé) à 1 (tous les allèles sont méthylés) et sont notoirement hétéroscédastiques lorsqu'elles sont proches de 0 et 1. C'est un problème pour la plupart des tests statistiques qui supposent l'homoscédasticité, mais cela peut être évité en en utilisant des valeurs M, définies comme M = log 2 ( β 1 − β ) , puisque les valeurs M sont approximativement homoscédastiques [18] . La plupart des études effectuent leurs analyses avec des valeurs M et rapportent leurs résultats avec ?? valeurs, puisque ?? les valeurs ont une interprétation biologique plus directe. Deuxièmement, il est primordial de prendre en compte les deux conceptions de sonde différentes sur les puces Illumina HumanMethylation 450k et EPIC, appelées conceptions de type I et de type II. Spécifiquement, ?? les valeurs des sondes de type II sont moins précises et reproductibles que celles des sondes de type I et présentent des distributions différentes [19] . Il est possible de tenir compte de cette différence dans la conception des sondes soit en analysant les deux types de sondes séparément, soit en normalisant les valeurs de méthylation directement avec la correction basée sur les pics (PBC) [19] , la normalisation Beta-Mixture Quantile (BMIQ) [20 ] , ou Régression sur sondes corrélées (RCP) [21] . Il n'y a que des différences de performances mineures entre ces méthodes, mais RCP semble les surpasser toutes et être efficace sur le plan informatique [21] . Enfin, les échantillons sont souvent analysés sur différentes plaques et à différents emplacements sur les plaques, introduisant des effets de lots connus qui pourraient avoir des conséquences dramatiques sur l'analyse en aval si la distribution des échantillons sur les plaques est inégale entre les groupes. Il est possible d'ajuster cet effet de lot, soit en ajoutant à la fois le numéro et l'emplacement de la plaque sur la plaque comme covariables dans l'analyse statistique, soit en normalisant les données de méthylation à l'aide des méthodes empiriques de Bayes (ComBat) [22] , analyse des variables de substitution ( SVA) [23] , la normalisation fonctionnelle [24] , Remove Unwanted Variation (RUVm) [25] , et BEclear [26] . ComBat est une méthode très populaire et facile à mettre en œuvre, mais RUVm est particulièrement utile pour l'analyse d'ensembles de données très « désordonnés » tels que ceux qui cherchent à combiner des échantillons de plusieurs laboratoires/études [25] .

Les scientifiques doivent s'efforcer de combiner plusieurs ensembles de données provenant de différentes études, ou de reproduire leurs résultats dans différentes cohortes pour renforcer leurs conclusions. Les données de méthylation de l'ADN ne sont pas aussi sensibles que les données génétiques et sont plus facilement partagées dans la communauté scientifique. De plus en plus de revues demandent maintenant aux auteurs de déposer leurs données brutes et traitées sur la méthylation de l'ADN dans des référentiels en libre accès avant que la publication ne soit acceptée. Les plateformes Gene Expression Omnibus (GEO) [27] et ArrayExpress [28] contiennent plusieurs milliers de jeux de données de méthylation de l'ADN chez l'homme, qui constituent un trésor précieux et sous-exploité pour les groupes de recherche travaillant sur les données de méthylation de l'ADN. Par exemple, une grande étude d'association à l'échelle de l'épigénome (EWAS) de l'indice de masse corporelle [14] a utilisé un ensemble de données de la base de données GEO pour effectuer des analyses de corrélation entre tissus, ce qui a conduit à la découverte que les loci de méthylation sont enrichis pour les caractéristiques génomiques fonctionnelles dans plusieurs tissus. Il peut cependant être difficile d'obtenir des données phénotypiques sur des échantillons déposés sur de telles plateformes en libre accès, car les auteurs ont tendance à partager la quantité minimale d'informations phénotypiques lors du téléchargement des ensembles de données. Il devient alors une tâche ardue de contacter chaque auteur de chaque ensemble de données, et des efforts doivent être faits pour rendre ces informations phénotypiques plus accessibles.


Séquençage de l'ADN, sans prise de tête

La technologie de séquençage de l'ADN s'est améliorée à pas de géant ces dernières années, plusieurs techniques rivalisant pour la suprématie. Désormais, une nouvelle technologie, appelée séquençage nanopore, semble prête à passer en tête du peloton. Des chercheurs ont démontré pour la première fois qu'ils peuvent lire en continu les lettres chimiques de l'ADN lorsqu'il traverse un minuscule pore, ouvrant la voie à un nouveau type de machine de séquençage qui décode l'ADN un peu comme un annonceur lisant un téléscripteur. Cette avancée pourrait faire baisser le coût du séquençage d'un génome humain complet en dessous de 1 000 dollars, ce qui devrait révolutionner la médecine personnalisée et contribuer à inaugurer une nouvelle ère de diagnostics et de médicaments génétiques.

La plupart des techniques de séquençage nécessitent des jours de travail. Les machines copient les brins d'ADN et les modifient avec des marqueurs fluorescents et d'autres composés pour leur permettre de lire les lettres de séquence d'ADN, ou bases. Le séquençage Nanopore promet de supprimer ces étapes supplémentaires en séquençant des brins d'ADN uniques non modifiés, et devenant ainsi peut-être la méthode de séquençage la plus rapide et la moins chère du marché.

L'idée de faire passer un brin d'ADN à travers un petit pore, puis de lire ses lettres chimiques a été suggérée pour la première fois par des chercheurs du Massachusetts et de Californie en 1996. Depuis lors, les scientifiques ont découvert comment faire passer l'ADN à travers des protéines avec de minuscules pores intégrés dans un film en utilisant une charge électrique. Lorsque les bases de l'ADN traversent le pore, elles modifient la charge électrique. L'électronique sensible détecte ces changements et identifie les bases.

Un problème majeur, cependant, a été que lorsqu'une tension électrique est appliquée à travers le film, l'ADN a tendance à se déplacer trop rapidement à travers le nanopore pour lire toutes les bases en séquence. Il y a deux ans, Mark Akeson et ses collègues de l'Université de Californie à Santa Cruz ont trouvé une solution possible. Ils ont ajouté une protéine appelée phi29 à une configuration de nanopores. La protéine s'est vaguement accrochée à un brin d'ADN alors qu'elle se déplaçait à travers le nanopore, ralentissant sa progression.

Maintenant, une équipe dirigée par Jens Gundlach, physicien à l'Université de Washington, Seattle, rapporte aujourd'hui dans Biotechnologie naturelle qu'il a incorporé la protéine phi29 d'Akeson dans sa configuration de nanopores, qui utilise une protéine de pore différente qui est plus apte à identifier rapidement les quatre bases chimiques. La protéine phi29 ralentit l'ADN de sorte que seulement 20 à 30 bases nucléotidiques traversent le pore chaque seconde, ce qui permet de les identifier électriquement lors de leur passage. "C'est vraiment le Saint Graal du séquençage des nanopores", déclare Gundlach.

L'avancée promet de renforcer la concurrence avec une société de séquençage de nanopores appelée Oxford Nanopore Technologies. En février, des responsables de cette société ont déclaré aux participants lors d'une réunion sur la technologie de séquençage en Floride qu'ils avaient déjà attrapé ce graal. La société a déclaré qu'elle pouvait non seulement lire électriquement la séquence complète de nucléotides dans l'ADN lorsqu'ils traversaient un pore individuel, mais qu'au début de 2013, elle vendrait des machines avec des milliers de nanopores fonctionnant en parallèle, permettant de séquencer un génome en aussi peu que 15 minutes, pour environ 1000 $.

La plupart des chercheurs en génome s'accordent à dire que ce serait un exploit impressionnant s'il était vrai. Mais ils attendent toujours des preuves. "Oxford Nanopore était la première annonce, mais ils ont été vivement critiqués pour ne pas avoir montré beaucoup de données", a déclaré le chimiste Geoffrey Barrall, président d'Electronic BioSciences à San Diego, en Californie, qui développe également le séquençage des nanopores. En revanche, dit Barrall, les résultats de Gundlach et de ses collègues semblent convaincants. "C'est le premier article où quelqu'un a réellement séquencé l'ADN."


L'expérience Meselson - Stahl

La structure de l'ADN a suggéré à Watson et Crick le mécanisme par lequel l'ADN &mdash donc les gènes &mdash pouvaient être copiés fidèlement. Ils ont proposé qu'au moment de la réplication de l'ADN, les deux brins de la molécule

  • séparés les uns des autres mais
  • sont restés intacts car chacun a servi de modèle pour la synthèse de
  • un brin complémentaire.

Lorsque le processus de réplication est terminé, deux molécules d'ADN &mdash identiques l'une à l'autre et identiques à l'original &mdash ont été produites.

Ce mode de réplication est décrit comme semi-conservateur : la moitié de chaque nouvelle molécule d'ADN est ancienne et la moitié nouvelle.

Alors que Watson et Crick avaient suggéré que c'était la façon dont l'ADN se révélerait être répliqué, la preuve du modèle est venue des expériences de M. S. Meselson et F. W. Stahl.

ils ont grandi E. coli est un milieu utilisant des ions ammonium (NH4 + ) comme source d'azote pour la synthèse de l'ADN (ainsi que des protéines). 14 N est l'isotope commun de l'azote, mais ils pourraient également utiliser des ions ammonium enrichis en un isotope lourd rare de l'azote, 15 N.

Après avoir grandi E. coli pendant plusieurs générations dans un milieu contenant 15 NH4 + , ils ont constaté que l'ADN des cellules était plus lourd que la normale en raison de la 15 N atomes dedans.

La différence peut être détectée en extrayant l'ADN du E. coli cellules et le faire tourner dans une ultracentrifugeuse. La densité de l'ADN détermine où il s'accumule dans le tube.

Ensuite, ils ont transféré plus de cellules vivantes qui avaient poussé dans 15 NH4 + à un milieu contenant des ions ammonium ordinaires ( 14 NH4 + ) et leur a permis de diviser juste une fois que.

L'ADN de cette nouvelle génération de cellules était exactement de densité intermédiaire entre celle de la génération précédente et la normale.

Ceci, en soi, n'est pas surprenant. Cela ne nous dit pas plus que la moitié des atomes d'azote dans le nouvel ADN sont 14 N et demi sont 15 N. Cela ne nous dit rien sur leur disposition dans les molécules.

Cependant, lorsque les bactéries ont pu se diviser de nouveau en ions ammonium normaux ( 14 NH4 + ), deux densités distinctes d'ADN se sont formées :

Comme l'indique cette figure interprétative, leurs résultats montrent que les molécules d'ADN ne sont pas dégradées et reformées à partir de nucléotides libres entre les divisions cellulaires, mais à la place, chaque brin original reste intact car il construit un brin complémentaire à partir des nucléotides disponibles.

C'est ce qu'on appelle la réplication semi-conservative parce que chaque molécule d'ADN fille est à moitié "ancienne" et à moitié "nouvelle".

Des brins immortels. Notez que le "vieux" brin (le rouge dans la moitié supérieure de la figure) est immortel car &mdash sauf mutations ou recombinaison génétique &mdash il continuera à servir de modèle immuable à travers les générations.

E. coli est une bactérie, mais la réplication semi-conservatrice de l'ADN se produit également chez les eucaryotes. Et parce que chaque molécule d'ADN chez un eucaryote est incorporée dans un chromosome, la réplication de chromosomes entiers est également semi-conservatrice. Cela signifie également que le chromosome eucaryote contient un "brin immortel" d'ADN.

  • Vous êtes ici :  
  • Accueil
  • Manuels du département de biologie d'Andover
  • Biologie de Kimball (manuel supplémentaire pour la séquence Biol-58x)
  • ADN : la substance des gènes
  • L'expérience de Meselson-Stahl

Une séquence d'ADN est une chaîne de désoxyribonucléotides tandis qu'une séquence protéique est une chaîne d'acides aminés. C'est donc la principale différence entre l'ADN et la séquence protéique. Des liaisons phosphodiester existent entre les désoxyribonucléotides d'une séquence d'ADN, tandis que des liaisons peptidiques existent entre les acides aminés d'une séquence protéique. Par conséquent, il s'agit également d'une différence entre l'ADN et la séquence protéique.

L'infographie ci-dessous montre plus de détails sur la différence entre l'ADN et la séquence protéique.


Séquençage de l'ADN : la science-fiction devient-elle une réalité médicale ?

Dans deux articles publiés dans de grandes revues scientifiques, les chercheurs ont suggéré aujourd'hui de pousser le séquençage de l'ADN à une utilisation plus routinière en clinique, et pas seulement comme outil de recherche.

Des chercheurs néerlandais proposent que le séquençage de l'ADN remplace les anciennes formes de tests génétiques pour diagnostiquer la cause d'une déficience intellectuelle sévère, la deuxième fois en une journée que les chercheurs ont poussé la technologie émergente comme test de diagnostic de premier choix pour une maladie grave. Ces résultats ont été publiés ce soir dans le New England Journal of Medicine.

"C'est le nouveau test pour la déficience intellectuelle. Il n'y a aucun doute là-dessus", déclare Han Brunner du centre médical de l'Université Radboud de Nijmegen, l'un des auteurs de l'étude néerlandaise. "Il s'agit d'un changement de paradigme vers la médecine axée sur le génome pour les patients qui ont des problèmes complexes qui ne seront pas faciles à diagnostiquer par les stratégies conventionnelles."

Plus tôt dans la journée, une étude de Science Translational Medicine a proposé que le séquençage de l'ADN pourrait devenir un test standard de premier choix pour les nourrissons dans les unités de soins intensifs néonatals, car une combinaison de nouveaux logiciels et matériels pourrait permettre aux médecins d'obtenir des résultats en seulement 50 heures, en répondant aux questions sur ce qui rend un bébé malade beaucoup plus rapidement quand le temps presse.

« L'essentiel de notre recherche est qu'il est désormais possible de décoder un génome entier et de fournir des résultats intermédiaires au médecin en deux jours », Stephen Kingsmore, directeur du Center for Pediatric Genomic Medicine des Children's Mercy Hospitals and Clinics et un auteur principal du document, a déclaré aux journalistes lors d'une conférence téléphonique hier. "Nous pensons que cela va transformer le monde de la néonatologie, en permettant aux néonatologistes de pratiquer une médecine influencée par les génomes."

Brunner et ses collègues ont utilisé une technique appelée séquençage de l'exome, qui extrait uniquement les gènes connus de la vaste étendue d'ADN du génome humain afin de réduire les coûts de séquençage. Les chercheurs néerlandais ont séquencé 100 patients avec un QI inférieur à 50 et leurs parents non affectés. La technique a trouvé des mutations génétiques connues pour causer une déficience intellectuelle chez 16 patients, et des gènes de fonction inconnue qui semblent en être la cause chez 22 autres patients. C'est au moins aussi bon que la technologie génétique actuelle disponible pour identifier les mutations chez les patients présentant une déficience intellectuelle sévère.

Chez seulement deux patients, le diagnostic a changé la façon dont les médecins les traitaient. D'une part, un changement de régime peut s'avérer utile, d'autre part, le diagnostic génétique déterminera les types de médicaments contre l'épilepsie que le patient recevra.

Mais il y a plusieurs autres avantages au diagnostic. Les parents en recherchent souvent désespérément un, simplement parce qu'ils veulent savoir ce qui s'est mal passé. Ils sont également souvent terrifiés par ce qui se passera s'ils décident d'avoir un autre enfant, et le test peut leur dire s'ils sont porteurs d'un gène qui a causé le défaut.

Dans la plupart des cas dans cette étude, une mauvaise copie d'un gène d'un parent n'était pas à blâmer. Une surprise est que la plupart des mutations qui ont causé ces cas sont toutes nouvelles – elles n'existaient pas dans les génomes des parents. Dans trois cas, le gène a été hérité de la mère via le chromosome X car les garçons n'ont qu'un chromosome X mais les femmes en ont deux, une si mauvaise copie est délétère chez les garçons.

En moyenne, chaque enfant naît avec une toute nouvelle mutation génétique. La plupart d'entre eux n'ont pas d'importance. Mais il se peut, selon Brunner, qu'il existe 1 000 gènes dans lesquels une telle mutation peut provoquer un handicap mental. Ainsi, certains enfants malchanceux souffrent simplement à cause du taux de mutation de fond.

Brunner dit que le coût du séquençage de l'exome était d'environ 2 400 $ par patient séquencé, ce qui n'inclut pas le coût de l'analyse. Mais cette partie du coût est susceptible de baisser. Le séquençage dans cette étude a été fait avec le système SOLID fabriqué par Life Technologies. L'utilisation du prochain système Proton de Life ou du HiSeq plus largement utilisé d'Illumina, l'acteur dominant du séquençage de l'ADN, devrait encore réduire les coûts.

"Le séquençage de l'exome est déjà entré dans le domaine du diagnostic clinique", déclare Heather Memford, pédiatre et généticienne à l'Université de Washington qui a écrit un éditorial dans le NEJM sur le résultat. "La question pour nous en tant que cliniciens est pour quels patients l'utilisons-nous maintenant par rapport à plus tard."

Les chercheurs de l'article de Science Translational Medicine, travaillant directement avec Illumina, ont d'abord développé un test de diagnostic qui a capturé 600 gènes susceptibles d'être la raison pour laquelle les bébés se sont retrouvés à l'USIN. Ce panneau est vendu sous forme de kit par Illumina et sera probablement utilisé par certains laboratoires commerciaux qui ont des certifications gouvernementales pour effectuer des tests de diagnostic. Mais ensuite, ils ont séquencé les génomes entiers de deux enfants qui étaient déjà morts et de cinq autres qui étaient vivants mais non diagnosticables. Dans tous les cas sauf un, ils ont pu trouver un gène qui est ou est susceptible d'être à l'origine de la maladie de l'enfant. Le coût par test, y compris le coût de l'analyse des données, était de 13 500 $. That might sound like a lot, but the cost of a day in the NICU is $8,000.

The biggest question remains how quickly tests such as this will move from being essentially research tools to being real clinical tests that are conducted in commercial laboratories and are paid for by insurers. There are some accounts that this is starting to happen, but Memford says she still does all her DNA sequencing using research, not insurance, funding. Kingsmore says that he's not sure how the test will reach patients, but he thinks that Children's Mercy may eventually be able to offer it as a service to other hospitals.


DNA Sequencing

After the finding that DNA's information was encoded in its sequence of nucleotides (A, C, T, and G), it was believed that one could find this sequence through a method of analyzing a large number of identical strands of DNA and identifying each nucleotide in order of it's appearance in the DNA sequence. This technique was ultimately discovered in 1977 by Fredrick Sanger. His method, known as Sanger Sequencing, relied on two main principles.

DNA can be separated by size. This was briefly discussed in the section on Laboratory Techniques with regards to gel electrophoresis. Keeping in mind that DNA is negatively charged, it will migrate towards the positive electrode when an electric current is applied. When placed in a gel composed of polyacrylamide beads, larger strands of DNA will migrate through the gel slower. Incidentally, the use of polyacrylamide gels instead of agarose gels allow for much greater resolution in separating strands of DNA by size. It allows one to actually distinguish a strand of DNA 400 base pairs long from a strand of DNA 401 base pairs long. As a result, polyacrylamide gels would be capable of resolving even 1 base pair differences in DNA, making this very useful for sequencing.

In addition, the chemical structure of DNA allows geneticists to manipulate its normal function and use it to identify the sequence of a strand of DNA. As was discussed in the section about DNA replication, cells have a protein called DNA Polymerase II that adds nucleotides complementary to the original strand, allowing it to form two identical strands of DNA from a template strand. To do this, it adds one nucleotide complementary to the template strand at a time. In order to do this, Polymerase requires a DNA Primer, a short strand of DNA complementary to the end of the template strand for a 3' OH group. The following diagram shows the structure of a normal nucleotide (dNTP):

DNA Polymerase II normally will connect the 3' OH to the next nucleotide at the 5' Phosphate group, labeled alpha, and kick off Phosphates beta and gamma. DNA primers provide the 3' OH for DNA Polymerase to build onto. It was realized that without that 3' OH group, the strand could no longer be elongated, which provided the basis for the Sanger Sequencing technique. Sanger proposed the synthesis of a modified form of a nucleotide, a dideoxyribonucleotide triphosphate (ddNTP), which share the same structure as a normal dNTP, with the exception of the 3' OH group, which is replaced by an H:

DNA Polymerase would be able to integrate this modified nucleotide if added in vitro (in a test tube outside the cell) and would immediately terminate the chain being synthesized, as the lack of a 3' OH group would prevent any further addition of nucleotides to the synthesizing strand. This resulted in the discovery of the first technique of DNA sequencing.

Four separate reaction tubes would be required, each one containing radioactively labeled DNA primers, DNA Polymerase II, and an ample amount of all 4 dNTP (dATP, dTTP, dGTP, dCTP), each to be integrated into the DNA strand being synthesized as a nucleotide. In addition, each reaction tubes would contain a different ddNTP, allowing each tube to identify a different nucleotide along the strand. For example, one tube would contain a ddATP, enabling that reaction tube to identify all the A's being integrated into the synthesizing strand, and thus all the T's in the complementary template strand (recall that T nucleotides are complementary and base pair with A nucleotides). All 4 dNTPs and a different ddNTP are added to each reaction tube in a ratio of around 300:1, and Polymerase will randomly integrate either a dNTP or a ddNTP into the synthesizing strand if the ddNTP complements with the nucleotide on the template strand. As a result, a reacting that has ddATP would integrate a dGTP, dCTP, and dTTP if the template strand's nucleotide was C, G, or A, respectively. If the template strand's nucleotide was T, however, Polymerase will randomly integrate either dATP or ddATP. If it integrates dATP, the strand will continue to synthesize, which is what generally happens 97% of the time. If it integrates a ddATP, however, the reaction for that strand of DNA is terminated immediately, and will be of that size for good. This process is repeated with three other tubes with ddGTP, ddCTP, and ddTTP.

Once this reaction is ran to completion, it is then put onto a flat slab of polyacrylamide gel and an electric current is applied in a process called PolyAcrylamide Gel Electrophoresis. This allows for the separation of strands of DNA one base-pair apart, allowing one to resolve the sequence of the template strand by viewing the gel in a process called Autoradiography. Because the primers added were radioactive, an image of it can be taken, where every time strands of DNA are encountered on the gel, a band appears. The end product is a gel with a banding pattern that looks similar to this:

This technique of sequencing, however, has two major shortcomings. The length of the DNA being sequenced cannot be longer than 1000 base pairs long, or it will be completely inaccurate. Typically, sequencing is done on strands of DNA no longer than 850 base pairs long for the best accuracy. This has severe implications for the sequencing of large genomes such as humans, which have a genome of almost 3 billion base pairs!. In addition, this technique of sequencing has another major flaw that one can see from the image above: it requires that the sequences be read by a person. The amount of time it would take for people to manually read and record genomes billions of base pairs long would be impractical for realistic research.

The invention of automated sequencers in 1987 by Applied Biosystems was a breakthrough in the ability of geneticists to sequence large genomes. While the limitation of 1000 base pairs for sequencing is still unavoidable, it solves the problem of needing people to read and record the sequence. In an automated sequencing process, instead of labelling the primers with radioactive labels, the ddNTP is labeled with a fluorescent label, where each ddNTP would fluoresce a different color when a laser is fired through it. Unlike the autoradiography, which will show a band of the same color regardless of the ddNTP, this method will fluoresce a different color for each of the four different nucleotides. Thus, this allows for the sequencing reaction to occur in one tube, as each ddNTP would fluoresce a different color and identify the nucleotide in the sequence. Once the reaction was ran to completion, it was placed into a gel tray where an electric current would be applied from the tray into 96 microcapillaries, all of which will gather at a laser. The idea is that the DNA will migrate towards the positive electrode at the laser end, where it would fluoresce a specific wavelength of light once the DNA passes through, and get recorded by a computer detector. The wavelength of light detected would be automatically associated with the corresponding nucleotide, allowing computers to automatically print out a chromatogram as well as the sequence, similar to this image:

Thus, using computers, the amount of time it takes to sequence strands of DNA is significantly shortened. Without this computing technology, large scale sequencing projects would be impossible to even initiate, much less complete. This paved the way for projects such as the Human Genome Project, which was initiated by the NIH in 1991.


Voir la vidéo: vidéo 3 séquençage dADN (Janvier 2023).