DNA and Forensic Science

ADN et Police Scientifique

Prof. Dr. Lhoëst G.J.J.

1. Introduction

La découverte de l'acide déoxyribonucléique (ADN), l'établissement de sa structure et la mise en évidence de l'information génétique véhiculée peuvent être considérés comme des étapes importantes ayant conduit à jeter les bases conceptuelles de l'hérédité.  Actuellement la structure de base des gènes peut être dévoilée avec une incroyable rapidité par des biologistes moléculaires, de nouveaux produits peuvent être crées en utilisant les techniques de la génétique de même que des outils diagnostiques peuvent être mis en évidence ou suggérer des traitements en rapports avec des désordres génétiques.  De nombreuses maladies génétiques sont provoquées par des mutations de l'ADN dans des régions du génome codant pour la synthèse protéique et des scientifiques examinent ces régions afin de repérer des mutations à la source de maladie génétique. 

Pendant un certain nombre d'années, ces avancées technologiques n'ont eu qu'un intérêt restreint dans le domaine des sciences médico-légales en raison du fait qu'à le différence de la génétiques clinique moléculaire, l'établissement d'un profil ADN dans les sciences médico-légales tire profit de loci dans le génome humain qui ne code pas pour des protéines.  Ces loci font intervenir des séquences d'ADN répétitives qui sont polymorphes ou qui ont un nombre variable de grandeurs répétitives.  En raison du fait que des régions non-codantes pour des protéines sont utilisées, les banques de données ADN qui contiennent des informations de profils ADN typiques ne révèlent aucunes informations liées à la santé d'un individu ou à la présence d'une maladie génétique éventuelle.

En fait ce qui changea dans les années 1985 ce fut la découverte de ces parties de la structure de l'ADN dont certains gènes sont si uniques qu'ils peuvent être considérés comme des empreintes D'ADN spécifiques liées à chaque individu. A l'intérieur des 60 trillions de cellules du corps humain il y a des rubans de matériel génétique appelés des chromosomes.  Répartis le long des chromosomes comme des grains le long d'un fil il y a environ 25000 gènes.  Le gène est l'unité fondamentale de l'hérédité donnant instruction aux cellules du corps de fabriquer des protéines déterminant aussi bien la couleur des cheveux que notre susceptibilité à certaine maladie.  Ce n'est qu'en 1950 que deux chercheurs Watson et Crick déduisirent la structure de l'ADN.

2.1 Structure de l'ADN

L'ADN est un polymère formé d'unités répétitives de nucléotides renfermant une molécule de sucre, un groupe contenant du phosphore et une molécule contenant de l'azote appelée une base.  Les nucléotides sont reliés pour former un brin.  Le squelette est construit à partir d'unités ose-phosphate répétitive.  les oses sont des molécules de désoxyribose dont l'ADN tire son nom.  Chaque désoxyribose est uni à l'une des quatre bases possibles à savoir l'adénine (A), la cytosine (C), la guanine (G) et la thymine (T)

Le long d'un brin d'ADN l'ordre des bases importe peu et les bases émergent du squelette ose-phosphate. En fait un brin d'ADN est composé d'une longue chaîne comprenant des millions de bases.  Les efforts de Watson et Crick conduisirent à la découverte qu'une molécule d'ADN est véritablement composée de deux brins d'ADN enroulés sous forme d'hélice.  Lorsque ces chercheurs manipulèrent des modèles constitués de brins d'ADN, ils réalisèrent que les bases sur chaque brin ne pouvant être convenablement alignés l'un avec l'autre dans une configuration double hélice que si A était apparié avec T et G avec C.  Cette disposition fut appelée appariement des bases complémentaires.

clip_image002Les quatre bases s'insèrent très facilement dans la partie centrale de la structure en double hélice et la séquence des bases le long d'un brin détermine complètement la séquence le long de l'autre brin.  Cet appariement spécifique suggère presque instantanément u mécanisme de copiage du matériel génétique puisque lors de la séparation des deux brins l'un d'eux peut constituer une matrice pour la création de l'autre brin par appariement spécifique des bases. 

  DSC00421

 

 

2.2 Rôle de l'ADN

Certaines propriétés héréditaires qui sont contrôlée par l'ADN sont issues de sa capacité d'orienter la production de molécules complexes que sont les protéines. Les protéines sont en fait synthétisées en unissant un série d'acides aminés et bien qu'il y aie des milliers de protéines, elles dérivent toutes de par la combinaison de 20 acides aminés.  La séquence des acides aminés dans une protéine détermine sa forme et sa fonction.  Par exemple l'hémoglobine présente dans nos globules rouges transporte l'oxygène vers les cellules de notre corps et en élimine le CO2 .  L'une des quatre chaînes d'amino acides d'une hémoglobine normale et anormale est représentée dans la figure ci-jointe:

 

 Il esr à remarquer que la seule différence entre cette hémoglobine normale et anormale est la substitution d'un seul acide aminé dans la chaîne protéique.  L'information génétique déterminant la séquence d'acides aminés pour chaque protéine dans le corps humain est stocké dans dans l'ADN sous la forme d'un code génétique faisant appel à la séquence des bases le long du brin d'ADN et cet alphabet est simple A T et G_C.  En fait chaque acide aminé est généré en faisant appel à un code regroupant trois bases.  Si nous reprenons l'exemple de l'hémoglobine et des trois derniers acides aminés ou une substitution s'opère, on peut observer que la séquence des acides aminés est CCT-GAG-GAG pour la proline, glutamate, glutamate et CCT, GTG,GAG pour l'hémoglobine falciforme.  On peut ainsi se rendre compte que la simple substitution d'une lettre à savoir T pour A au niveau de la valine peut être la cause de l'anémie falciforme et que la maladie peut être due à des modifications chimiques très subtiles.  Actuellement l'ordre des bases sur les 23 paires de chromosomes humain connus également sous le nom de génome humain a été déchiffré.  Il est clair que savoir si sur chromosome spécifique l'ADN code pour la production d'une protéine particulière est utile pour diagnostiquer et traiter des maladies génétiques.  Egalement comparer le génome humain avec celui d'autres organismes peut aider à comprendre le rôle et les implications de l'évolution.

 2.3 Le processus de Réplication de l'ADN

La synthèse d'ADN nouveau à partir d'ADN exixtant commence par le déroulement de brins d'ADN en une double hélice.

Chaque brin est alors exposé à une collection de nucleotides libres.  La double hélice est recrée lettre par lettre au fur et à mesure que les nucleotides sont assemblés dans l'ordre adéquat en respectant le principe d'appariement des bases c'est à dire A avec T et G avec C.  Le résultat est l'émergence de deux copies identiques de l'ADN.  De nombreuses enzymes et protéines sont engagés dans le déroulement des brins d'ADN, dans le maintien de la séparation des deux brins d'ADN et permettant ainsi l'assemblage de deux nouveaux brins déADN. Les ADN polymérases sont des enzymes qui sont capables d'assembler un nouveau brin d'ADN dans l'ordre approprié des bases déterminé par le brin d'ADN originel ou parent.  Le phénomène de réplication de l'ADN n'avait que peu d'intérêt au niveau de la police scientifique mais ceci changea au moment ou des chercheurs perfectionnèrent la technologie de l'ADN polymérase afin de copier des brins d'ADN en dehors de la cellule vivante.  Cette technique de laboratpire est connue sous le nom de "polymerase chain reaction " (PCR) qui est une technique utilisée pour multiplier des brinsv d'ADN dans un tube de laboratoire.  De petites quantités d'ADN ou des morceaux d'ADN trouvés sur la scène du crime peuvent être copiés à l'aide de l'ADN polymérase.

 

Le processus de copie est fort dépendant de la température et peut être réalisé de façon automatique à l'aide d'un "DNA thermal cycler" .  Chaque cycle assure un dédoublement de l'ADN et en quelque heures 30 cycle peuvent multiplier l'ADN un billion de fois.  Lorsque copié l'ADN peut être analysé par des méthodes modernes de la biologie moléculaire.  La possibilité de multiplier de petites quantités d'ADN a ouvert de nouveaux boulevards à la police scientifique en ce que la grandeur de l'échantillon d'ADN trouvé sur la scène du crime ne peut plus être considéré comme une limitation en soi.

 

2.4 Courte répétition en tandem - Short Tandem Repeats (STRs)

L'analyse STR est la méthode qui rencontre le plus de succès et est la plus utilisée comme technique de profilage de l'ADN.  Les STRs sont des loci sur les chromosomes contenant de courtes séquences d'éléments qui se répètent le long de la molécule d'ADN.  Ce sont des marqueurs d'identification important parce qu'ils sont présents abondamment sur le génome humain.  Les séquences répétitives de STRs consistent en 3 à 7 bases et l'entièreté du brin d'un STR est aussi très court et représente moins de 450 bases.  Les STRs sont donc moins susceptible à la dégradation et peuvent être récupérés sur des souillures qui ont été soumises à de fortes décompositions.  En raison de leur faible longueur les STRs peuvent être considérés comme des candidats idéaux pour la multiplication PCR circonvenant ainsi les problèmes d'échantillonnage limité rencontrés sur la scène du crime.  Un équivalent de 18 cellules contenant de l'ADN est nécessaire afin d'obtenir un profil ADN et par exemple des profils STR ont été utilisés pour identifier des résidus de salive sur des enveloppe, des timbres, des cannettes ou des bouts de cigarettes.  Afin de comprendre l'utilité des STRs au niveau de la police scientifique penchons nous sur un STR connu sous le nom de TH01.  ce segment d'ADN contient des séquences répétitives A-A-T-G et sept variants ont été identifiés dans le génome humain.  Ces variants contiennent de 5 à 11 unités répétitives A-A-T-G.   TH01 est extrait du matériel biologique, amplifié par PCR et le fait qu'un STR puisse être copié veut dire que des quantités extrêmement  petites de la molécule peuvent être détectées et analysées.  Une fois les STRs copiés ou amplifiés, ils sont séparés par électrophorèse et les STRs sont alors forcés de se mouvoir au travers d'un gel apposé sur une plaque soumise à un potentiel électrique.  Les petits fragments d'ADN migrent plus rapidement que les fragments d'ADN plus important et en examinant la distance à laquelle les STR ont migré sur la plaque électrophorétique, le nombre de répétition AATG dans le STR peut être déterminé.

  Chaque être humain possède deux types de STR pour TH01 hérité de chaque parent.  Ainsi il est possible de trouver dans le liquide séminal TH01 correspondant respectivement à 6 et 8 unités répétitives.  Cette combinaison de TH01 est trouvée dans approximativement 3,5 % de la population.  Tous les êtres humains présentent ce type d'unités répétitives mais avec une très grande variation d'unités répétitives chez chacun d'entre nous.  L'ADN extrait de traces récoltées sur la scène du crime est compatible avec celui de l'un des suspects.  Mais en comparant seulement un STR un nombre limité de personnes de la population auront le même fragment STR que celui du suspect.  Ce n'est qu'en examinant d'autres STRs qu'un haut degré de discrimination pourra être obtenu conduisant à une individualisation.

Examen de STRs Multiples

Ce qui rend lesv STRs si attractif au niveau de la police scientifique c'est qu'il est possible de trouver des centaines de types de STRs dans les gènes humains.  Au plus des STRs sont caractérisés, au plus petit sera le pourcentage de la population à partir duquel ces STRs peuvent émaner et ceci introduit le pricipe de l'examen multiple de STRs.  En utilisant la technologie PCR, il est possible d'extraire et d'amplifier simultanément une combinaison de différents STRs.  Un sustèle STR est le kit bleu STR disponible commercialement sur le marché fournissant le matériel nécessaire pour amplifiet et détecter trois STR:  D3S1358, vWA et le FGA.  Ce système assure un non chevauchement des bandes si bien que chaque marqueur peut être observé clairement sur un gel d'électrophorèse.  Dans les pays Anglo-Saxons 13 STRs ont été standardisés afin de pouvoir les faire entrer dans une base de données appelée "Combined DNA Index System" ou CODIS.  En 2017 sept nouveaux loci additionnels ont été ajoutés à la base des données CODIS et cette extension permettra encore plus d'améliorer les investigations par exemple dans le domaine du contre-terrorisme.  Lorsqu'un STR est choisi pour l'analyse non seulement l'identité et le nombre d'unité répétée doivent être définis mais ausse la séquence des bases encadrant les unités répétées doivent être connues.  Ceci permet aux entreprises proposant des kit STR de pouvoir préparer les primers adéquats permettant de délinéer le segment STR à amplifier par PCR.  Un mélange de primers visant différent STRs pourront être utilisés afin d'amplifier simultanément une multitude de STRs.  Un kit STR commercial peut réaliser des copies de 15 STRs différents. 

Il faut comprendre qu'un ADN similaire ne correspond pas à une similitude complète de tout le génome humain d'ADN et les différents longs brins d'ADN dans nos cellules sont propres à chaque personne.  Les longs brins d'ADN sont enveloppés dans un faisceau appelé chromosomes.  Nous possédons 23 pairs de chromosomes (voir figure) et les deux chromosomes de chaque pair présentent la même séquence de gène, l'une provenant de la, mère l'autre du père.  Ces séquences sont similaires en ce qu'elles correspondent à une même séquence de gènes mais qui n'est pas forcément identique, la mère et le père pouvant avoir différentes versions d'un gène appelé allèle (variante d'un gène), la mère pouvant par exemple avoir des checeux blonds et le père noirs.  A certaines places sur les chromosomes des motifs répétés peuvent être trouvés dans le code génétique qui sont appelés "Short Tandem Repeats ou STR" . Par exemple à la position D7S280 trouvée sur le chromosome 7 le mot GATA est répété de 6 à 15 fois dans notre ADN, le nombre exact de répétition variant de personnes à personnes. Un profil ADN représente simplement le comptage de STR à une position particulière (loci) du génome.  La base de données CODIS développée par le FBI utilise des STR à 13 places et la base de données du Royaume Uni utilise des STR à 10 places. Pour un échantillon d'ADN particulier, le nombre de répétitions pour chaque marqueur STR (défini comme le génotype de ce marqueur) est compté.

        

  Le premier marqueur FGA STR a un brin d'ADN avec 20 répétitions du mot code et l'autre brin avec 24 (un brin de l'ADN de la mère et l'autre du père) et le génotype est 20/24.  Le marqueur STR D3S1358 à 15 répétitions sur les deux brins et le génotype est 15.  Parfois il y a des problèmes se posant lors de la répétition du mot code, ceci de traduit par des génotypes comportant une virgule par exemple 33,2 pour l'un des allèles du gène à D21S11.  Dans les affaires criminelles, deux profils peuvent être rencontrés, l'un provenant de la scène du crime et l'autre d'un suspect pouvant paraître identique.  En raison du fait qu'on se réfère à 13 places différentes sur le génome, il n'est pas impossible que deux personnes n'ayant aucun rapport l'une avec l'autre répondent aux critères de la chance.  Il est donc souhaitable statistiquement de connaître le niveau de probabilité.  Il est nécessaire de calculer la portion de la population qui présente un nombre différent de répétition aux 13 places.  Ces fréquences allèliques sont estimées à partir de données collectées dans des laboratoires de chimie médico-légales.

 

Allèle de TH01 Fréquence
4 0,001
5 0,001
6 0,266
7 0,160
8 0,135
9 0,199
9,3 0,200
10 0,038
11 0,001
   

Par exemple différents allèles du gène au niveau TH01 sont répertoriés dans le tableau ci-dessus.  Certains allèles sont très rares ( 1 sur 1000 personnes ont le mot code répété 4 fois) d'autres sont plus courant (1 sur 4 personnes présente le mot code répété 6 fois).  Des données de fréquence similaire existent pour tous les marqueurs STR utilisés dans les profils d'ADN.  Ces estimations de fréquence varient suivant la race si bien que des bases de données fréquentielles existent pour différent groupes raciaux.   Afin de pouvoir utiliser ces fréquences allèliques et de pouvoir calculer la rareté d'un profil certaines hypothèses génétiques doivent être faites:

a) Les marqueurs STR utilisés dans des profils d'ADN se trouvent sur des chromosomes différents et l'hypothèse est faite qu'ils sont indépendants si bien que le génotype d'un marqueur sur un chromosome n'a pas d'effet sur le génotype d'un autre marqueur sur un autre chromosome.

b) Les deux brins dans chaque pair de chromosomes (un brin de chacun de nos parents) peuvent être supposés indépendants.

c) Les marqueurs STR choisis pour des profils d'ADN n'ont pas de fonctions génétiques.

Cette indépendance des marqueurs utilisés dans les profils d(ADN signifie que pour calculer la rareté d'un profil il est simplement nécessaire de multiplier dans leur ensemble les fréquences des marqueurs indépendants afin d'obtenir une probabilité de concordance, c'est-à-dire la probabilité pour qu'une personne prise au hasard dans la population présente ce profil d'ADN.  La probabilité de concordance calculée pour des profils d'ADN de nos jours est habituellement de 1 sur un billion.

 

Identification du Sexe en utilisant des STRs

Portons notre attention sur le gène amelogenin (un locus utile pour déterminer le sexe) situé à la fois sur les chromosomes X et Y.  Ce gène a une caractéristique intéressante en ce qu'il est plus plus court de six bases au niveau du chromosome X et non point dans le chromosome Y.  En conséquence lors d'une amplification PCR et après séparation par électrophorèse les mâles qui possèdent le chromosome X et Y exhibent deux bandes tandis que les femelles qui ont deux chomosomes X n'affichent qu'une bande. Il est possible de localiser des types de STRs sur le cgromosome Y qui est spécifique pour le sexe mâle et qui est toujours apparié au chromosome X.  Un kit commercial permet l'identification de STRs du chromosome 17 Y.  Les STRs Y sont utiles pour analyser le sang, la salive ou un prélèvement vaginal s'avérant être un mélange en provenance de plusieurs mâles.  Les STRs dérivés du chromosome Y n'ont comme origine que ce seul chromosome Y.

 

 

 2.5  La réaction en chaîne PCR (Polymerase Chain Reaction)

Une enzyme appelée ADN polymerase peut être utilisée afin de synthétiser des régions spécifiques de l'ADN.  La PCR peut être utilisée pour dupliquer de façon répétitive ou amplifier un brin d'ADN des millions de fois.  Supposons par exemple qu'un segment d'ADN doive être dupliqué par PCR et dont la séquence des bases est la suivante:

      C--T--G--A--C--T--T--C--G--G--A--C--A

      G--A--C--T--G--A--A--G--C--C--T--G--T 

Afin de pouvoir réaliser la PCR sur ce segment d'ADN, de petites séquences présentement colorée d'ADN à chaque extrémité de la région doivent être identifiées.  Ces courts segments colorés doivent être disponible sous une forme pure qualifiée de "primer" afin de permettre le bon fonctionnement de la technique PCR

 La première étape pour la PCR est de chauffer les brins d'ADN à environ 94°C.  A cette température les brins d'ADN se séparent complètement.  La seconde étape est d'ajouter les primers aux brins séparés et de permettre l'hybridation..   

       C--T--G--A--C--T--T--C--G--G--A--C--A                     

                                                --C--T--G--T

        G-A--C--T--G--A--A--G--C--C--T--G--T 

         C-T- G- A--

 La troisième étape consiste à ajouter l'ADN polymerase et un mélange de nucleotides (A,T,G,C) aux brins séparés.  Lorsque le tube à essai est chauffé à 72°C l' ADN polymerase assume la reconstruction du brin dans son entièreté en assurant l'extension des primers en ajoutant une par une les bases requises.

             C--T--G--A--C--T--T--C--G--G--A--C--A                     

             G- A -C -T- G - A- A -G--C--C--T--G--T

            G--A--C--T--G--A--A--G--C--C--T--G--T 

               C--T--G--A-- C--T--T-- C--G-G--A--C--A

Ceci constitue le premier cycle de la technique PCR résultant du doublement du nombre de molécules d'ADN.  En reproduisant le cycle de chauffage, de refoidissement et un nouveau dédoublement des molécules d' ADN, on arrive à la fin du second cycle à créer quatre brins d'ADN.  Après trente cycles prenant environ deux minutes, approximativement un billion de copies de la molécule d'ADN originelle ont ainsi été crées.

Mini STRs

Il était apparu que le fait de travailler avec des segments d'ADN court pouvait permettre d'ectraire des informations utiles à partir d'ADN fragmenté.  Ceci n'est pas vrai dans tous les cas.  De l'ADN dégradé est rencontré occasionnellement si bien que l'analyse STR traditionnelle n'est pas possible.  L'expostion prolongée de l'ADN à des environnements extrêmes tels des températures extrêmes, l'humidité ou l'activité microbienne peut conduire à de telles dégradations.  une solution à ce problème est de travailler avec des brins encore plus courts qui émergent du processus PCR.  Ceci a été accompli en créant de nouveaux "primers" qui sont positionnés plus près des régions répétées de STR.  Les produits STR plus courts appelés "amplicons" qui émergent de la PCR augmentent les chances de pouvoir caractériser des brins d'ADN forts fragmentés.  Ces petits "amplicons" sont appelés " mini STRs".  Des kits mini-STR ont été mis sur le marché afin de pouvoir amplifier fuit mini STRs dont 7 sont complètement compatible avec la base de données CODIS.  Ces mini STRs comportent de 71 à 250 bases et un analyste ADN pouvant suspecter un échantillon d'ADN dégradé a actuellement la possibilité d'appliquer la technologie des STRs ou des mini STRs.

ADN Mitochondrial

La cellule humaine renferme deux types d'ADN, le nucléaire et le mitochondrial.  l'ADN nucléaire est constitué par les 23 paires de chromosome renfermé dans les noyaux de nos cellules.  Chaque parent contribue au contenu génétique de ces chromosomes.  L'ADN mitochondrial (mtADN) est situé en dehors du noyau de la cellule et est seulement un héritage de la mère. 

Les mitochondries sont des structures cellulaires présentent dans toutes les cellules humaines.  Elles fournissent environ 90 % de l'énergie dont le corps a besoin pour fonctionner.  A la différence de l'ADN nucléaire qui est composé de brins linéaires continus de nucléotides (A,T,G et C), l'ADN mitochondrial (mtADN) à une configuration en anneau.  Chaque anneau contient assez de A,T,G et C soit environ 16549 unités nécessaires pour former les 37 gènes intervenant dans la génération de l'énergie mitochondriale.  Parmi ces 37 gènes, 13 codent pour des polypeptides, 2 pour des ARNr et 22 pour des ARNt.  Ce génome ne comporte pas d'introns c'est-à-dire de régions non codantes.  Nous rappelons que chez les eucaryotes l'ADN est en grande partie non codant et de plus la séquence codante d'un gène est souvent interrompue par des séquences non codantes.  Les gènes des eucaryotes sont nommés gènes mosaîques ou morcelés.  Les séquences codantes sont appelées exons et non codantes introns.

 

 

Deux régions de l'ADN mitochondrial (mtADN) ont été trouvées comme hautement variable dans la population humaine. Ces deux régions ont été désignées comme des régions hypervariables respectivement HV1 et HV2 comme illustré dans la figure ci-contre.  L' analyse des régions HV1 et HV2 est fastidieuse et oblige de générer par PCR de nombreuses copies de ces régions hypervariables de l'ADN et d'en déterminer l'ordre des bases.  Ce procédé est appelé séquençage.  Le laboratoire du FBI parmi d'autres ont collaboré afin de mettre en place une banque de données mtADN de la population contenant les séquences de bases en provenance des régions HV1 et HV2.  Lorsque les séquences des régions hypervariables sont obtenues, la plupart des laboratoires simplement font état du nombre de fois que ces séquences apparaissent dans la base de données de l'ADN mitochondrial du FBI.  Cette base de données contient environ 5000 séquences et cette approche permet de comptabiliser la rareté ou la non rareté d'une séquence particulière d'ADN mitochondrial dans cette base de données.  Il est particulièrement intéressant de noter que de nombreuses séquences qui ont été déterminées sont singulières dans la base de données existantes et que de nombreuses types existent à une fréquence qui n'excède pas 1 %.  Il faut cependant noter que même dans les conditions les plus favorables l'utilisation de l'ADN mitochondrial ne soutient pas la comparaison avec l'analyse STR en ce qui concerne le pouvoir de discrimination.  Ainsi l'analyse de l'ADN mitochondrial doit être réservé pour des échantillons pour lesquels l'analyse de l'ADN nucléaire n'est pas possible. 

 

 2.6  L' Electrophorèse

2.6.1 Visualisation d'un fragment d'ADN

Chaque enzyme de restriction (enzyme bactérienne rconnaissant une séquence d'ADN spécifique, le site de restriction) reconnaît  une séquence d'ADN qui lui est spécifique le site de restriction qui est une séquence d'ADN reconnue spécifiquement par une enzyme de restriction.  Les fragments d'ADN obtenus sont appelés fragments de restriction.  Ils sont plus facilement utilisables et identifiables qu'une molécile d'ADN entière.  Ces enzymes sont utilisés comme des ciseaux biologiques pour réaliser des constructions d ADN recombiné ainsi que pour l'analyse de la variabilité de l'ADN.

2.6.2  L'électrophorèse (gel)

L'action d'une enzyme de restriction génère des fragments de restriction de tailles différentes.  Ces fragments peuvent être séparés suivant leur taille sur un gel d'éléctrophorèse.  L'ADN est déposé dans des encoches appelés puits situés à l'extrémité du gel. Un champ électrique est apposé et les molécules d'ADN chargées négativement migrent.  Elles se séparent suivant leur taille et les molécules les plus grandes sont retardées par rapport aux petites.  La visualisation des fragments d'ADN après électrophorèse sev fait par trempage du gel dans une solution de bromure d'éthidium.  Cette molécule s'intercale entre les bases de l'ADN et a la propriété d'être fluorescente sous la lumière ultraviolette.  Dans le cas d'ADN génomique une population de fragments est généré tandis que dans le cas d'ADN mitochondrial ou chloroplastique quelques fragments de taille déterminée sont seulement observés.  Après la migration la taille des fragments est estimée par comparaison des distances de migration avec celle de fragments de tailles connues servant d'étalon.  Par comparaison des profils obtenus dans chaque puits correspondant chacun à un individu, des différence entre individu peuvent être mises en évidence permettant de visualiser le polymorphisme de leur ADN c'est à dire pouvant être relié à des différences de séquences d'ADN entre individus.

 

Hybridation

L'hybridation moléculaire permet de repérer ou de rechercher un fragment d'ADN dans un mélange de fragments. Cette méthode d'étude repose sur deux propriétés de la molécule d'ADN

a) L'ADN a la faculté de passer de façon réversible de l'état de double brin à l'état simple brin.  C'est la dénaturation ou inversément la renaturation.  Sous l'action de la température et/ou d'agents chimiques il y a rupture des liaisons entre les bases et séparation des bases.  l'abaissement de la température provoque la renaturation des bases et on parle d'hybridation.

b) Cet appariement se fait uniquement entre les paires A-T et G-C.

L'objectif de l'hybridation est de révéler si une molécule d'ADN contient une séquence ou un gène pariculier, le gène étant une unité d'information génétique occupant une position spécifique (locus) dans le chromosome et comprenant un segment d'ADN renfermant une séquence de bases codant pour des protéines.  Pour assurer l'hybridation, on utilise une sonde qui est un fragment d' ADN correspondant à une séquence connue.  Cette sonde est marquée radioactivement ou chimiquement.  Les molécules cibles d'ADN à caractériser sont au préalable rendues simple brin et fixées sur une membrane d'hybridation en nylon.  La sonde simple marquée et les molécules cibles sont mises en contact dans des conditions permettant la renaturation.  Lorsque la sonde reconnaît son homologue il y a hybridation et l'excédent de sonde est éliminé par lavage.

2.6.3  Electrophorèse Capillaire

La séparation des STRs peut être faite sur une plaque d'électrophorèse sur laquelle est apposé un gel mais dans le but de réduire les temps d'analyse et de faciliter la collection des données l'électrophorèse capillaire s'est imposée comme la technologie préférée pour la caractérisation des STRs. 

Un système typique d'électrophorèse capillaire consiste en une source de courant haute tension, un système d'introduction de l'échantillon, un tube capillaire, un détecteur et un système d'acquisition de données.  Certains instruments incluent une unité de contrôle de la température afin d'assurer des résultats reproductibles en raison du fait que la séparation de l'échantillon dépend à la fois de la mobilité électrophorétique et de la viscosité des solutions qui diminue lorsque la température de la colonne augmente.  Chaque extrémité de la source à haute tension est connectée à une électrode permettant d'induire un champs électrique assurant la migration de l'échantillon de l'anode vers la cathode au travers du tube capillaire.  Le capillaire est constitué de silice fondue et est parfois recouvert d'une couche de polyimide.  Chaque extrémité du capillaire est trempé dans un récipient contenant l'électrode et une solution électrostatique ou solution tampon.  Avant l'introduction de l'échantillon sur la colonne, la solution tampon désirée doit être passée au travers du capillaire.  Un détecteur à proximité de la sortie cathodique est présent permettant par exemple une mesure d'une lumière UV-visible passant au travers de l'analyte.

Mobilité Electrophorétique

L'électrophorèse est le processus dans lequel un échantillon ionique migre sous l'influence d'un voltage appliqué.  L'ion subit une force qui est égale au produit de la charge nette et de la force du champ électrique.  Il est aussi influencé par une force d'entraînement égale au produit d'un coefficient de friction translationnel (f) et de la vitesse.  La mobilité électrophorétique s'exprime comme suit:

                            

     ou f pour une particule spérique est donnée par la loi de Stokes ou n représente la viscosité du solvant et r le rayon de Stokes.  Le rayon de Stokes est donné par la formule suivante:

                            

kb  est la constante de Boltzman, T la température absolue en degré Kelvin, Dm le coefficient de diffusion de l'analyte

La vitesse réelle des ions est directement proportionnelle  à la grandeur du champ électrique E

                                        

Ecoulement Electroosmotique 

L'écoulement électroosmotique est provoqué en appliquant un haut voltage à un capillaire rempli d'un électrolyte.

Cet écoulement se fait lorsque le tampon passant au travers du capillaire a un pH plus grand que 3 si bien que les groupes silanols SiOH perdent un proton et deviennet des ions SiO- .  La paroi du capillaire porte une charge négative ce qui a pour conséquence d'attirer une double couche de cations.  La couche cationique intérieure est stationnaire tandis que la couche cationique extérieure peut se mouvoir librement.  Le champ électrique appliqué provoque un déplacement de cations libres vers la cathode créant un écoulement massif.  La vitesse de l'écoulement électroosmotique est régi par l'équation suivante:

                                                            ou e  = la constante diélectrique

                                                                                  n = la viscosité de la solution

                                                                                 E = le champ électrique

                                                                                 z = le potentiel z

En raison du fait que la mobilité éléctrophorétique est plus grande que l'écoulement électroosmotique les particules cragées négativement attitrées par l'anode seront séparées. L'écoulement électroosmotique travaille au mieux lorsque le potentiel zeta entre les couches cationiques est grand, une couche diffuse importante de cations afin d'entraîner plus de molecules vers la cathode, une faible viscosité et un pH = 9 afin d'ioniser tous les groupes silanols.

Méthodes d'Electroséparation capillaire

Electrophorèse capillaire de zone (CZE)

L'éléctrophorèse capillaire de zone ou éléctrophorèse capillaire en solution libre est la technique la plus communément utilisée.  Un mélange dans une solution peut être séparé en ses composés individuels rapidement et facilement.  La séparation est basée sur les différences de mobilité électrophorétique proportionnelle à la charge de la molécule, inversément proportionnelle à la viscosité et au rayon de Stokes.  La vitesse de déplacement ionique est directement proportionnelle à la mobilité électrophorétique et à la grandeur du champ électrique.  Les cations avec le plus grand rapport charge-masse se séparent d'abord suivant par les cations avec un rapport réduit, les espèce neutres, les anions avec un petit rapport charge-masse et finalement les anions avec un grand rapport.  La vitesse électroosmotique peut être ajustée en changeant le pH, la viscosité de la solution , la force ionique, le voltage et la constante diélectrique du tampon.

Electrophorèse Capillaire sur Gel (CGE)

L'électrophorèse capillaire sur gel est basée sur une différenne de grandeur de paricules migrant au travers du gel.  Les gels minimisent la diffusion du soluté provoquant un élargissement de bandes, empêchent des absorption de soluté par les parois du capillaire et limitent le transfert de chaleur ralentissant les molécules.  Un appareillage communément utilisé pour la séparation des protéine est le SDS-PAGE qui est un système très sensible requérant peu d'échantillon.

2.6.4  Analyse STR par Spectrométrie de masse à temps de vol

2.6.4.1  Méthode off-line

La spectrométrie de masse est une méthode versatile faisant intervenir la détection d'ions et la mesure de leur rapport m/z.  Ces dernières années des avancées spectaculaires ont été réalisées dans le domaine de l'analyse des biomolécules comme l'ADN, les protéines et les carbohydrates.  Ces avancées ont pu se faire d'une part grâce à l'introduction de nouvelles techniques d'ionisation connue sous le nom de " matrix-assisted-laser desorption-ionization (MALDI) " et d'autre part grâce à la découverte de nouvelles matrices qui permettent d'ioniser l'ADN sans fragmentation ectensive. Cette méthode lorsque couplée à la spectrométrie de masse à temps de vol est appelée MALDI-TOF-MS.

Dans le procédé MALDI-TOF l'échantillon d'ADN est mélangé avec une matrice organique permettant au mélange de co-cristallisé sur une plaque pouvant contenir différents échantillons en provenance d'une seule injection analytique.  Chaque échantillon cristallin est alors analysé en déplaçant la plaque d'échantillon située en dessous d'un faisceau laser pulsé.  Cette impulsion d'énergie laser libère et ionise une petite partie de l'échantillon d'ADN.  La matrice protège les molécules d'ADN de la fragmentation et intervient dans le processus d'ionisation.  Les ions d'ADN générés se déplacent au travers de la zone de temps de vol vers le détecteur dans des temps de l'ordre de la microseconde.  Les petits ions ont une plus grande vitesse que les plus grans et atteignent le détecteur en premier lieu.  Afin d'améliorer le traitement du signal, la moyenne de multiples impulsions laser est prise en compte ce qui a pour résultat de porter le temps de mesure à quelques secondes pour chaque échantillon.  Les données qui sont collectées dans différent canaux spectraux en des valeurs de temps doivent être converties en des valeurs de masse.  La calibration en masse est habituellement réalisée avec deux oligonucléotides encadrant le domaine de masse examiné.  Cette calibration reste normalement bonne pour des centaines d'échantillon et est réalisée une fois par jour.  L'exactitude et la précision dans la mesure de la masse sont telles qu'il n'est pas nécessaire de recourir à une échelel allèlique afin de déterminer la grandeur de l'échantillon ou le génotype.  Des mesures électrophorétiques soit sur des gels apposés sur une plaque soit dans un tube capillaire nécessitent l'utilisation de marqueurs et des échelles allèliques afin d'ajuster les variations dans les mobilités de l'ADN sous des conditions d'environnement un peu différente.  Non seulement les mesrures d'ADN obtenue avec un spectromètre de masse sont plus rapidement obtenue mais elles sont aussi plus exactes. 

2.6.4.2  Méthode on-line

La figure ci-dessous illustre la combinaison de deux circuits électriques à l'interface electrospray (ESI).

Les circuits haut voltage de l'électrophorèse capillaire (CE) et de l'interface électrospray (ESI) ont en commun la pointe de l'interface ESI.  Pour le mode d'ions positit (négatif) ceci nécessite d'appliquer un haut voltage ESI negatif (positif) à l'orifice d'entrée des ions plutôt qu'un haut voltage positif (négatif) à l'interface électrospray lui même.

 

 

 

 

Combined ion trap and TOF mass spectrometer with the possibility of a capillary ESI coupling.

 

 

 

 

 

 

 

 

La société Bruker en Allemagne a développé des techniques de séparation et de spectrométrie de masse permettant de réaliser des avancées sérieuses dans le domaine de l'analyse du protéome.  Les techniques TIMS (trapped ion mobility spectrometry ) et PASEF ( Parallel Accumulation- Serial Fragmentation) sont largement utilisées dans le domaine de l'analyse protéomique.  En résumé des protéines sont extraites d'échantillons biologiques sous examen et enzymatiquement clivées afin de permettre l'analyse en spectrométrie de masse.  Le mélange protéique est séparé par nano-HPLC, ionisé par électrospray (ESI) et analysé par spectrométrie de masse.  Le spectromètre de masse détecte des ions précurseurs peptidiques appropriés dans les scans complets (MS) qui sont alors fragmentés dans des scans consécutifs MS/MS.  Les instruments à temps de vol (time-of-flight : TOF) présentent des propriétés recherchées pour l'analyse de mélanges complexes peptidiques.  La haute vitesse d'acquisition des instruments à temps de vol (TOF) permet de les coupler avec des techniques de séparation rapide comme la spectrométrie à mobilité ionique (ion mobility spectrometry : IMS).  L'IMS sépare des ions dans la phase gazeuse en tenant compte de leurs grandeurs, de leurs formes et leurs sections collisionnelles (collisional cross section: CCS)  et ceci dans des temps de la milliseconde permettant encore d'acquérir un grand nombre de scan.  La technologie IMS pouvant être classée entre la LC et la MS apporte une dimension additionnelle à la séparation pouvant accroître la vitesse et la sélectivité de l'analyse en particulier pour des échantillons protéiniques complexes.

 

La spectrométrie à mobilité d'ions piégés (trapped ion mobility spectrometry : TIMS) accumule des ions à certaines positions dans un tunnel à ions grâce d'une part à un champ électrique et d'autre part grâce à la présence d'un courant gazeux constant.  Lorsqu'un nombre suffisant d'ions ont été piégés et séparés, le champ électrique est diminué permettant de libérer des ions de l'entité TIMS afin de les envoyer vers l'analyseur de masse.  De cette façon la dimension de l'analyseur IMS est réduite à environ dix centimètres permettant même d'en mettre deux en série.  Récemment une accumulation parallèle jointe à une fragmentation sérielle (Parallel Accumulation-Serial Fragmentation: PASEF) a permis de synchroniser la sélection de précurseur MS/MS avec la séparation TIMS.