World Families Forums - Genetic Genealogy for French Dummies

Welcome, Guest. Please login or register.
December 20, 2014, 08:35:22 AM
Home Help Search Login Register

+  World Families Forums
|-+  General Forums - Note: You must Be Logged In to post. Anyone can browse.
| |-+  General Discussion
| | |-+  Genetic Genealogy for French Dummies
« previous next »
Pages: [1] Go Down Print
Author Topic: Genetic Genealogy for French Dummies  (Read 7708 times)
palamede
Senior Member
***
Offline Offline

Posts: 64


« on: April 15, 2012, 10:06:34 AM »

Partie 1: Dernière mise à jour : Le 03 mars 2012 10hCET
Dans Dna-Forums, french forum

Ce sujet sur la Généalogie Génétique est exclusivement réservé aux nuls et paresseux.


A/  Pourquoi s'y intéresser ?

La GG est répandue par ordre décroissant approximatif chez les Juifs, les Irlandais, les Ecossais, Les Gallois, les Anglais, les Américains du nord, Australiens et Néo-Zélandais, les Scandinaves et Finlandais, les Germaniques, en dernier chez les Latins. L'intérêt est nouveau mais croissant dans l'est de l'Europe, en Asie et Afrique du nord .    Il y a un lien entre l'intérêt pour la GG et les régions et ethnies qui ont toujours montré un grand intérêt pour leur origine familiale : clans celtes, tribus arabes, castes indiennes, ...  
Dans les pays latins, la recherche universitaire est active en Italie et Espagne, même en dehors de leur pays respectif, les Italiens sont au premier plan en Afrique avec de grandes réussites, les Espagnols se sont attaqués à une terre plus ingrate et dangereuse au nord des Pyrénées où ils doivent lutter contre les chausse-trappes et le sabotage des institutions locales.
Mais la recherche universitaire a des moyens limités quoique quadrillant mieux l'espace géographique terrestre et pour une vue plus détaillée dans les zones plus riches, elle ne peut lutter contre les résultats trouvés par les compagnies de tests chez des centaines de milliers de clients.

Vous êtes orphelin, enfant abandonné (http://dna-forums.org/index.php?/forum/104-adoptions/)
ou individu  isolé, vous souhaitez vous reconstituer une famille biologique. Ce n'est pas le souhait de tout le monde,  mais c'est fort chez certains.
Vous avez un fort sentiment d'appartenance et vous souhaitez vous rattacher à un ensemble important.
Vous pensez qu'il n'y a pas que les familles royales et princières d'importantes et que la votre les vaut bien.  Ceci est en complément de la recherche généalogie traditionnelle. Malheureusement son succès est fonction de la chance et du nombre de personnes qui se sont faites tester dans votre région ou ethnie d'origine.
Vos parents sont des migrants, le contact familial a été perdu et même la mémoire du lieu d'origine.
Vous avez des origines multiples et mal connues, l'analyse du génome peut vous donner les proportions pour de grande régions géographiques, pour l'Europe limitée à 5 régions Nord, Sud, Ouest, Est et Centre. Pour plus précis, seule la chance  de trouver des marqueurs rares très spécifiques à une petite région ou ethnie.
Vous vous intéressez à l'histoire du peuplement humain et vous cherchez des références plus objectives, complémentaires et critiques de l'Histoire et de la Préhistoire et vous voulez apporter votre contribution à la science, surtout dans des 'Terra Incognita' comme la France, presque une tache blanche dans un monde de mieux en mieux connu. Ce sujet s'appelle aussi génétique des populations .

http://fr.wikipedia.org/wiki/G%C3%A9n%C3%A9tique_des_populations

Articles hostile à la GG des médias francophones en général, est-elle contraire à l'idéologie républicaine française ?.
http://www.lefigaro.fr/sciences/2006/10/05/01008-20061005ARTWWW90283-questions_ethiques_sur_les_tests_genetiques.php
http://www.lefigaro.fr/sciences/2007/10/20/01008-20071020ARTFIG90775-la_genealogie_genetique_epinglee.php
http://www.lefigaro.fr/sciences/2006/05/10/01008-20060510ARTFIG90124-la_genealogie_est_elle_atteinte_d_une_fievre_genetique_.php
http://www.lemonde.fr/planete/article/2010/03/19/tests-genetiques-attention-aux-derives_1321569_3244.html
Il y a eu plusieurs sujets sur le forum français sur la légalité, les risques légaux, les craintes sue les tests génétiques. Je ne vous imposerai mon opinion, surtout qu'elle n'est pas fermement et rationnellement fixée. Il est à noter que je ne l'ai rarement vu discuter sur les forums en anglais. Cela semble plus une préoccupation en France qu'ailleurs.

http://dna-forums.org/index.php?/topic/2631-la-genealogie-genetique-en-france/
http://dna-forums.org/index.php?/topic/15220-genealogie-genetique-et-loi-francaise/
http://dna-forums.org/index.php?/topic/8276-irons-nous-en-prison/

Comment intéresser le public français ? ce fut  un sujet de discussion sur ce forum.
http://dna-forums.org/index.php?/topic/14406-campagne-de-sensibilisation-des-genealogistes/
http://dna-forums.org/index.php?/topic/14235-vulgarisation-pour-les-debutants-et-conseils/
J'ai fait un topo dans http://dna-forums.org/index.php?/topic/15202-rencontre-physique/  

B/ Un article simple expliquant la GG à lire absolument
http://fr.geneawiki.com/index.php/G%C3%A9n%C3%A9alogie_G%C3%A9n%C3%A9tique
Geneawiki est une encyclopédie spécialisée généalogie de la forme de wikipedia qui fonctionne avec les outils wikipedia.

http://fr.wikipedia.org/wiki/G%C3%A9n%C3%A9alogie_G%C3%A9n%C3%A9tique

En anglais http://www.isogg.org/wiki/Genetic_genealogy
http://en.wikipedia.org/wiki/Genetic_genealogy
et http://en.wikipedia.org/wiki/Genealogical_DNA_test

C/ Quelques connaissances biologiques indispensables

Le génome humain est composé de 46 chromosomes dans le noyau (appelé ADN nucléaire) dans les cellules non sexuelles (23 pour les sexuelles, spermatozoïde et ovule)) , en fait 2 jeux de 23 chromosomes venant chacun du père et de la mère et composée de 22 chromosomes autosomaux (Noté de 1 à 22 par ordre de taille décroissant)  et de chromosomes dits sexuels, le X (ovule, donc transmis par la mère ) et le Y (spermatozoïde transmis par le père ).Sur les
Sur les chromosomes de l'ADN nucléaire des cellules sexuelles , l'information génétique est codée sur 3 milliards de paires de bases (50 millions sur le chromosome Y), les bases sont de 4 substances chimiques (nucléotides) qu'on reconnait par leur première lettre A, C, G, T; A et T s'apparient ainsi que G et C (Voir wiki pour nucléotides, si vous êtes courageux). Ceux  sont elles qui font l'objet des mutations de différents types. La GG utilise 2 types de mutations :   Les marqueurs génétiques SNP et STR.
La discussion sur l'ADN utile dans la constitution de l'individu et une grande partie (dite "junkie")  pensée inutile ne concerne pas la GG. Sauf que la GG amène parfois à penser que de l'ADN dit inutile a peut-être plus de fonction qu'on le croyait parce qu'il ne s'avère pas réellement neutre pour la conservation de ses mutations.
 
Les mutations STR Short Tandem Repeats

http://fr.wikipedia.org/wiki/G%C3%A9nome_mitochondrial_humain
http://www.geneattic.com/geneticalogie/mito.htm
http://fr.wikipedia.org/wiki/%C3%88ve_mitochondriale
http://fr.wikipedia.org/wiki/ADN_nucl%C3%A9aire

Les STR sont la répétition d'un motif de 3 ou 4 bases. Dans la GG, c'est le nombre de répétitions qui nous importe. Il y a des STR sur tout le génome nucléaire, mais jusqu'ici, la GG ne s'intéresse qu'à une partie des centaines de STR du chromosome Y et aux nombres de répétitions de leur motif.

Ainsi  la compagnie FTDNA, suivant le prix, vous testera 12, 25, 37, 67 et depuis récemment 111 STrs. Plus il y a de STRs testés, meilleures les conclusions à en tirer.
Les STRs ont différentes vitesses de mutations à travers le passage de génération à génération. Suivant le type d'intérêt qu'on a dans la GG, Ce ne seront pas les mêmes STRs les plus intéressants.
Les valeurs (de répétition du motif)pour chaque STR sur un individu définissent l'haplotype de l'individu. C'est une signature génétique. La somme des différences sur les valeurs STR donne la distance génétique (GD) entre 2 individus. On peut évaluer un degré de cousinage en comparant la distance génétique.

Table  de mutation des STRs
http://freepages.genealogy.rootsweb.ancestry.com/~geneticgenealogy/ratestuff.htm

Liste des STRs testés par compagnie :
http://www.gendna.net/ydnacomp.htm


Les mutations SNP Single Nucleotid Polymorphism
Type de mutation la plus simple à comprendre, sur un emplacement donné d'un chromosome, le remplacement d'une lettre par une autre (Substitution d'un nucléotide A,C, G, T par un autre).  
http://fr.wikipedia.org/wiki/Polymorphisme_nucl%C3%A9otidique
http://dna-forums.org/index.php?/forum/15-y-dna-discussions/

Tests fait sur les mâles, bien entendu. Mais il n'est pas interdit pour une femme de faire un prélèvement ADN avec le kit fourni sur leur père, ou frère avec leur accord et de personnellement considérer que cela est son haplogroupe agnatique.

En dehors de l'ADN nucléaire, il y a dans la cellule en dehors du noyau des milliers d'organites  les mitochondries importantes dans le métabolisme énergétique des cellules ayant chacune un ADN d'environ 16000 paires de bases l'ADN mitochondrial qui se transmet par l'ovule (donc de mère à fille), son nombre le rend plus facile à extraire et à tester, donc les recherches ont commencé par l'ADN mitochondrial pour les humains vivants, mais aussi morts depuis longtemps par l'extraction de l'ADN mitochondrial.
Mais les mutations sont plus rares dans l'ADN-mt car petit, donc moins de possibilité de rapprocher des parentés et plus d'éparpillement géographique qui rend moins aisé d'y distinguer des migrations.  
http://dna-forums.org/index.php?/forum/19-mtdna-discussions/

Les tests sur le génome entier : Plus cher, plus difficile à analyser mais ne se limite pas aux lignées agnatives (ADN-Y) et cognatives (ADN-mt). Voir le forum
http://dna-forums.org/index.php?/forum/26-autosomal-dna/

Pourquoi l'ADN-Y et l'ADN-mt sont privilégiées dans la GG ?

Ce n'est pas par favoritisme pour les lignées par les agnats (père-fils) et les cognats (mère-fille), mais pour un obstacle scientifique sur les autres parties du génome.
C'est le brassage intra-chromosomique (par des enjambements ou recombinaisons) durant la méiose qui crée les cellules sexuels à un jeu de 23 chromosomes. Voici des références, inutiles de lire en détail.
http://fr.wikipedia.org/wiki/M%C3%A9iose
http://fr.wikipedia.org/wiki/Enjambement_%28g%C3%A9n%C3%A9tique%29


Donc sur les 22 autosomes, le chromosome X et une petite fraction du chromosome Y, il y a recombinaison d'un nouveau chromosome formé de tranches des 2 chromosomes homologues. Sauf accident génétique, chaque locus d'un chromosome a un gène de l'un ou de l'autre des 2 homologues.
Ces recombinaisons entrainent que les marqueurs d'un parent ne se retrouvent pas tous dans la cellule fille, donc il devient impossible d'avoir un ensemble de marqueurs venant d'un seul parent qui permettrait d'avoir la  généalogique d'une lignée ancestrale.

La taille des tranches d'ADN issu d'un ancêtre est variable et l'enjambement se fait souvent aux mêmes endroits (locus) du chromosome, donc des tranches de plusieurs milliers de paires de bases peuvent subsister pendant plusieurs générations avant d'être découpé par une recombinaison
on parle parfois dans le sous-forum sur les 22 autosomes pour ces tranches en milliers ou centaines de paires de bases, mais il existe aussi une unité de mesure le centimorgan  :
"Morgan est l'inventeur d'une unité de mesure (le centimorgan, symbole cM) de la distance entre deux gènes sur un même chromosome. Cette distance est calculée en fonction de la fréquence des enjambements (ou crossovers) ayant lieu entre ces deux gènes : 1 centimorgan correspond à 1 % de descendants au génotype recombiné (résultant d'un enjambement)."

Le centimorgan correspond environ à un million de paires de bases, sa valeur est différente suivant les chromosomes, plus petite pour les petits, plus grande pour les plus grands. Les chromosomes sont classés du considéré le plus grand 1 (en réalité, on a déterminé depuis c'est le chromosome 2 le plus grand) au plus petit 22. Je rappelle que le mongolisme est la trisomie (3 chromosomes au lieu de 2 dans le noyau des cellules normales ou somatiques) du chromosome 21. La trisomie des autres 21 chromosomes somatiques  dans l'ovule fécondée est trop délétère pour permettre de mener l'embryon jusqu'à terme.


Notions de génétique des populations

Effet fondateur
http://fr.wikipedia.org/wiki/Effet_fondateur
Dans les discussions sur les forums, on pensera à une ou plusieurs familles d'un ancêtre commun qui entame une migration ou participe au peuplement d'une région. Le développement des haplogroupes et de leurs subclades n'est qu'une suite d'effets fondateurs qui ont eu un succès démographiques, alors que d'autres mutations ne se sont pas développés et ont disparus. Une preuve de ceci, sur les arbres des haplogroupes, vous remarquerez que de de nombreux haplogroupes sont définis par plusieurs mutations, parfois jusqu'à 30 comme le Hg-Y I1. I1 est un groupe important, nombreux et répandu dont la fréquence maximale (plus de 40%) est dans le centre de la Scandinavie d'où il s'est répandu dans certainement plusieurs migrations, dont la plus importante est la migration viking (vers un tiers des Vikings).
Le premier porteur de la première mutation I1 vivait il y a quelques dizaines de milliers d'années, ses descendants connurent d'autres mutations durant les milliers d'années suivants, mais il y a peut-être 10.000 ans, il n'est resté de ses descendants que le porteur de 30 mutations I1 (ou du moins ses quelques descendants) et tous ceux qui n'avaient eu qu'une partie de ses 30 mutations ou d'autres mutations avaient disparu par une effet "bottleneck", en français embouteillage. Pourquoi, famine ? épidémie ? massacres ? et certainement aussi dérive génétique.  

Dérive génétique
http://fr.wikipedia.org/wiki/D%C3%A9rive_g%C3%A9n%C3%A9tique
La dérive génétique est considérée comme un effet du hasard et on la mathématise avec les lois de probabilité, mais la diminution de certains haplogroupes sont trop importantes pour s'expliquer par une dérive génétique naturelle  comme celle du Hg_mt U5 en Europe quand on compare la fréquence actuelle aux fréquences préhistoriques des squelettes anciens qui montrent une diminution constante. On essaye d'expliquer par des problèmes d'adaptabilité aux conditions climatiques et économiques récentes. Si l'évolution de la fréquence sort du cadre des lois de la dérive génétique basée sur la neutralité génétique et on essaye de déterminer  un facteur d'adaptabilité du marqueur à l'environnement.

Je ne vous parlerai plus de la neutralité génétique (pas d'influence externe sur une partie d'ADN dite neutre)importante pour la validité des mesures de diversité génétique et des facteurs environnementaux ou autres qui influent sur la conservation des mutations (aléatoire) comme postulée par le darwinisme.

Fréquence des haplogroupes contre leur diversité génétique
Définition haplotype:Le haplotype est une suite des sites polymorphes d'un fragment d'ADN qui contient la signature d'un lignage génétique particulier. La comparaison des haplotypes est une des mesures de la diversité génétique.
Pour le chromosome Y, le haplotype utilisé est un ensemble de valeurs des STRs sur ce chromosome. Le nombre et la qualité des STRs utilisés dépend du prix mis dans les tests, et des équipes universitaires et des compagnies,

Il y a une école qui a eu beaucoup de succès sur les forums et blogs qui ne jure que par les mesures de diversité génétique (faites au moyen d'outils de mathématique statistique sur les haplotypes)pour dater l'age des haplogroupes global (date du MRCA) et suivant chaque région et de là en déduire des chemins de migrations.
http://dna-forums.org/index.php?/topic/8343-de-quand-date-r-m269-et-ou-est-il-apparu/

MRCA : Most Recent Common Ancestor, l'ancêtre commun le plus récent, qui n'est pas forcément l'ancêtre qui a subi la mutation qui sert de marqueur à l'haplogroupe, mais le descendant (parfois lointain) à qui se rattachent tous ses descendants actuels membres de l'haplogroupe. Si vous voulez paraitre savant, vous parlerez de "coalescence" et vous pourrez lire http://thierrywirth-lab.com/lectures/Coal.pdf

Je fais partie des "archaïques" qui croient que la fréquence d'un haplogroupe dans la population d'une région peut contenir une signification historique et que les mesures de diversité génétique ne sont pas sans piège. En plus je ne vous parlerez pas des querelles sur les taux de mutation qu'il faut prendre pour obtenir un age absolu et ne pas se contenter d'ages relatifs des haplogroupes les uns par rapport aux autres.

Logged

Y=G2a3b1a2-L497 Wallony-Charleroi; Mt=H2a2a1 Normandy-Bray
Dodecad-DiY: E Eur 9,25% W Eur 48,48% Med 28,46% W Asia 11,70%
World9: Atl-Balt 67,61% Southern 13,23% Cauc-Gedr 12,73%
K12a: North-E 39,71% Med 37,9% Cauc 12,55% Gedr 5,78% SW Asia 2,13%
palamede
Senior Member
***
Offline Offline

Posts: 64


« Reply #1 on: April 15, 2012, 10:12:41 AM »

Partie 2: Dernière mise à jour : Le 03 mars 2012 10hCET

D/ Branches de la GG

La véritable GG ou l'apport à la généalogie familiale
http://dna-forums.org/index.php?/forum/3-general-genealogy/
http://dna-forums.org/index.php?/topic/15184-family-myths-why-paperwork-is-crucial/

Les Hg dans les régions ou ethnies ou l'apport à l'Histoire Humaine

Qu'est-ce que le modal d'un haplogroupe ? C'est l'haplotype des valeurs les plus courantes pour chaque STR. On suppose que c'est l'haplotype de l'ancêtre qui a connu la mutation servant de marqueur définissant l'haplogroupe. La dispersion des haplotypes d'un haplogroupe autour du modal est indicatif de l'ancienneté, mais aussi du succès de l'haplogroupe.
 
Fréquence des allèles STR-Y par haplogroupe
http://freepages.genealogy.rootsweb.ancestry.com/~geneticgenealogy/yfreq.htm

Taux des mutations des SNPs : environ 10-8 par paire de bases par génération, encore discuté.
http://dna-forums.org/index.php?/topic/15515-levolution-humaine-plus-lente/

Chromosome X et les haploblocks
http://dna-forums.org/index.php?/forum/99-x-chromosome/
Lors de la recombinaison pour former un nouveau X à partir des 2 X parents chez une femme, la recombinaison donnerait plus de grandes tranches qui subsistent intact plus longtemps à travers les générations, on les appelle "haploblocks".

Etude sur le génome entier et ses millions de marqueurs  

Généralement, on commence par les tests sur les ADN Y et Mt moins cher et plus facile à comprendre.Pour ce qui est de l'apport aux importants mouvements de population, c'est suffisant d'un point de vue statistique.
Si les haplogroupes Y et Mt ne décrivent pas l'originalité de votre génome, sur une population assez importante, c'est suffisant pour reconstituer ses composants d'origine.

Si vous voulez aller plus loin et approfondir ce que la génétique peut dire de vos origines personnelles et de votre parenté, le test sur le génome entier vous intéressera. Comme autre motivation importante chez certains, le sentiment de participer à une grande aventure scientifique et aux techniques les plus pointues  
http://dna-forums.org/index.php?/forum/26-autosomal-dna/

Malgré le hachage des autosomes et du X, les tranches permettent parfois de se retrouver des cousinages autre que les dans la branche agnatique chez les populations les plus testés par concordance des marqueurs d'une ou plusieurs tranches qui indiquent un ancêtre commun.
Suivant la taille des tranches et leur total en centimorgan (ou milliers de paires de base) et les quelques rares divergences sur ces tranches, on peut faire une estimation du degré de cousinage.
 
Une compagnie comme 23ANDme fournit des cartes des chromosomes, vous en verrez sur le sous-forum haplogroupes et ailleurs. Ces cartes sont formées de tranches de couleurs différentes pour les 22 autosomes et le X déterminées par la compagnie pour représenter l'origine géographique de la tranche suivant la couleur. La compagnie y arrive avec la valeur de millions de marqueurs étalés sur le génome et elle pense connaitre la région géographique (5 régions pour l'Europe Nord, Sud, Ouest, Est, Centre) de chaque marqueur et elle peut trouver des tranches d'ADN qui peuvent encore dire après les recombinaisons de plusieurs générations l'origine de l'ancêtre qui a donné cette tranche d'ADN. On ne peut pas remonter au-delà de quelques générations (7 ou 8) car l'ADN des ancêtres  est devenu trop mélangé et les tranches de taille insuffisante.
D'un point de vue théorique, au delà de nombreuse générations, il se peut qu'on a plus aucun ADN de certains ancêtres. Même s'il n'y a eu aucun NPE (No Parental Event) comme adultère ou adoption dans l'unique lignée qui vous fait descendant de Charlemagne, il n'est pas certain qu'il en reste la moindre trace dans votre ADN, les recombinaisons des générations depuis ce temps peut l'avoir complètement éliminer, effet du hasard mais tout dans votre allure permet de ressentir votre noble origine.

23ANDme propose un relevé complet de votre exome (ensemble des exons des gènes):  https://www.23andme.com/exome/ mais ceci relève plus de la génétique médicale que des marqueurs généalogiques.
"Votre exome consiste des 50 millions de bases ADN de votre génome contenant l'information nécessaire à encoder toutes vos protéines. Informellement, vous pouvez voir l'exome comme la séquence de vos gènes. Votre génome entier est composé de votre exome plus le reste de l'ADN, consistant de trois milliards de bases avec des séquences répétitives, des séquences de fonction inconnue, et d'ADN qui ne code pour des protéines."



En dehors des compagnies, certains se font inscrire au projet 1000 génomes ou participent à des projets qui analysent informatiquement leur génome en partant des données brutes sur les génomes données  par des compagnies comme 23AndMe, FTDNA,deCODEme, ...  et leur donnent une répartition de leurs origines  : projet DODECAD (2 outils DIY et Oracle) animé par Dieneskes, projet Harrapa par des Indiens, projet ARTEMIS, projet Eurogenes Biogeographic Ancestry (BGA)animé par "Polako" sur forum Eurogenes utilisant des matériaux de 23andMe , deCODEme, HGDP-CEPH et Hapmap, Gedcom , Dr McDonald BGA calculator.  
Résultats sous forme de MDS plots qui sont des diagrammes, de prooprtion par zones géographiques pour le génome , par chromosome et mème par portions de chromosome.
 
Les scientifiques ont déterminé aussi des haplogroupes pour des gènes sur les autosomes et surtout le chromosome X plus stable), mais cela reste inconnu das amateurs de GG.
Pour certains gènes particuliers, suivant la composition génétique, Les compagnies peuvent faire des prédictions sur les phénotypes : couleur de la peau, des cheveux, des yeux, tolérance des adultes au lactose (LP), et quelques autres à détermination génétique relativement unique mais beaucoup de caractères phénotypiques comme la taille, l'intelligence ont une origine polygénétique sans compter de possibles interférences environnementales.      
 
Pour ce qui est de la susceptibilité génétique aux maladies et des tests, je n'y connais rien en dehors du conflit qui a opposé la Food  Administration américaine à certaines compagnies dont 23ANDme, je ne sais pas où cela en est. Pour les amateurs de GG, les opinions sur la question sont aussi diverses que dans le public, sans compter ceux qui comme moi pensent que chaque maladie est un cas spécifique qui demande un accord international sur un protocole de tests, si tests admissibles.
 

E/ Répartition géographique et ethnique
Hg-Y par groupe ethnique, faire attention au nombre de personnes testées dans l'échantillon, important pour la crédibilité.
http://uk.ask.com/wiki/Y-DNA_haplogroups_by_ethnic_groups?qsrc=3044

Qu'est qu'un haplogroupe ?

Les études ont commencé par l'étude de l'ADN mitochondrial, le repérage des marqueurs utiles en génétique des populations, leur classement les uns par rapport aux autres. Un marqueur x se retrouve toujours avec un autre y mais l'inverse n'est pas vrai et on en conclut que le groupe défini par x est inclus dans un plus grand groupe défini par y, ce qui voudra dire que la mutation x s'est fait dans le groupe y et est postérieure à y.
Les premiers classement furent fait chez les Amérindiens ce qui explique que les haplogroupes A,B,C,D sont présents  chez les Amérindiens mais pas exclusivement, fréquents Asie de l'Est aussi.
On a d'intéressantes statistiques sur les Hg-Mt dans les populations latinos et créoles des Amériques et des Antilles qui permettent de comparer la part de métissage Européens/Amérindiens par les femmes et sur les HG-Y pour les hommes (Q1a3a(SNP M3) est l'haplogroupe Y  de 90% des Améridiens (et Inuits) au Nord-est du Canada à 99% en Amérique du Sud.

Aprés groupement en haplogroupes de la population mondiale, il fut déterminé que l'haplogroupe initial, celui qui part de l"éve mitochondrial" était l'haplogroupe L présent en Afrique. Plus tard cet haplogroupe fut lui mème divisé en sous_haplogroupes avec L0 > L1 > L2 > L3 . L0 étant le plus vieux qui se retrouve chez les Boschimans du désert de Namibie. L3 étant le plus récent et a lui-mème donné naissance aux deux haplogroupes M et N qui se sont répandus hors d'Afrique et ont essaimé de nouveau haplogroupes.  

Ne vous étonnez-pas, on désigne fréquemment  les sous-haplogroupes(ou sub-clades) "haplogroupes" tout court, car les subdivisions peuvent continuer en groupes plus fins.

Une chose malheureusement à savoir sur l'ADN-mt : Les compagnies ne vous donneront pas vos mutations par rapport à un ADN origine, mais par rapport à un ADN référence appelé CRS Cambridge Reference Standard. Il y a les tables Philotree pour déterminer son haplogroupe à partir de là, mais ce n'est pas toujours facile car cela fait toile d'araignée, mais ne vous inquiétez pas, il y a des bonnes âmes sur les forums qui vous aideront.
Liste des mutations  Hg_mt R dans Phylotree. Pour un autre haplogroupe, changer la lettre R par la lettre le désignant:
http://phylotree.org/tree/subtree_R.htm
James Lick's very nice mthap utility (http://vps1.jameslick.com/dna/mthap/) . James Lick intervient fréquemment sur les forums des haplogroupes mitochondriaux.
Le faq (réponses aux questions) de FTDNA http://www.familytreedna.com/faq/answers.aspx?id=10

J'ai fait partie des quelques dizaines de chanceux, dont les 16000 paires de base étaient rigoureusement égales au CRS sur les dizaines de milliers qui avaient fait le FGS "Full Genome Sequence".

Wikipedia en français peu intéressant et peu à jour , Faire recherche sur "Haplogroupe A wiki" pour les haplogroupes A (ADN-Y et ADN-mt), Changer la lettre pour autres haplogroupes

Wikipedia en anglais plus intéressant et plus à jour , Faire recherche sur "Haplogroup A wiki" pour les haplogroupes A (ADN-Y et ADN-mt), Changer la lettre pour autres haplogroupes

Il y a aussi le wiki anglais particulier de ISOGG dédié à la Généalogie génétique :
http://www.isogg.org/wiki/Wiki_Welcome_Page

Quand furent déterminés les haplogroupes-Y, on partit de l'haplogroupe des Boschimans qu'on nota A et qu'on pensait l'haplogroupe premier (probablement avec raison), puis on classa par ordre d'apparition des haplogroupes tel qu'il apparaissait par l'étude des mutations, d'abord B lui aussi seulement présent en Afrique (cela  s'entend hors migrations modernes), puis ensuite hors d'Afrique, hors E dont on ne sait s'il est né en Afrique ou y est revenu d'Asie, grosses discussions.

Si un haplogroupe peut être dit "primitif", il ne faut pas étendre le qualificatif "primitif" à ces porteurs. Si ceux-ci n'ont pas connu les mutations des haplogroupes dérivés, raison qu'on les classent dans l'haplogroupe primitif, mais ils ont connu d'aures mutations qui les classent dans les sub-clades de celui-ci. Ensuite ils sont dans un haplogroupe primitif pour, par exemple, le chromosome Y, mais rien ne prouve qu'ils soient primitifs pour les gènes portés par les autres chromosomes.

Deux moyens pour connaitre son haplogroupe :
 Un moins précis et plus anciennement utilisé par un prédicteur d'haplogroupe à partir de votre haplotype. Plus il y a de STRs sur votre haplotype, plus précis sera le résultat du prédicteur. Il y a plusieurs prédicteurs, un des plus réputés est celui de Athey (http://www.hprg.com/hapest5/hapest5b/hapest5.htm).

L'autre est directement le test des SNPs plus sur, rarement des erreurs par les compagnies réputés. Mais pendant longtemps, il y a eu peu de SNPs connus et testés et des spécialistes amateurs faisaient des regroupements des haplotypes suivant les valeurs en clusters. Les tests des SNPs ont souvent confirmés ses regroupements mais pas toujours. Un manque de concordance entre les SNPs et les résultats des prédicteurs doit amener à se poser des questions.
Certains SNPs et certains clusters donnent parfois une origine assez précise. Par exemple, Il est parfois frappant que certains clusters contiennent essentiellement des noms juifs ou des noms gallois et/ou irlandais et autres cas.

Pour l'haplogroupe I, le regroupement en clusters et l'analyse des sub-clades a été fait par Ken Nordtstedt, un physicien réputé à l'aise dans les calculs mathématiques.
http://en.wikipedia.org/wiki/Kenneth_Nordtvedt  

Pour l'haplogroupe R1b1a2 (anciennement R1b1b2) et ses sub-clades qui constituent plus de la moitié de la population mâle d'Europe Occidentale et Amérique du Nord, surtout dans les zones les plus testées, de nombreux analystes amateurs on fait des regroupements en clusters, maintenant ils se consacrent surtout à la recherche de nouveaux SNPs et a tenter de déterminer les porteurs de ces SNPs avec l'aide des clusters d'haplotypes.

Remarque sur les codifications d'haplogroupes : Il y a plusieurs codifications apparemment rationelle, la plus officielle étant celle d'ISOGG qui évolue périodiquement en fonctions des nombreuses nouvelles découvertes. Les compagnies ont des codifications semblables mais qui n'évoluent pas sur le même rythme : 1ere ennui.

Dernière Codification norme  ISOGG Hg_Y R.  autre haplogroupe, changer la lettre R
http://www.isogg.org/tree/ISOGG_HapgrpR.html

Codification compagnie FTDNA Hg_Y
http://ytree.ftdna.com/index.php?name=Draft&parent=root


2eme ennui la codification n'est rationnelle qu'à instant t, elle peut être complétement remanié et les sous-haplogroupes changent fréquemment de nom : ainsi R1b1b2 devenu R1b1a2 et bien d'autres et tout le monde s'y perd. Ce qui fait que les haplogroupes sont souvent nommés d'après la mutation qui les définit le mieux. Ainsi pour R1b1a2, on écrira R-M269 ou R1-M269 ou souvent R1b-M269.

3e ennui, pour un haplogroupe, tout le monde n'emploie pas toujours la même mutation, le mieux est de consulter souvent la codification ISOGG internet (à mettre dans ses favoris) pour s'en sortir et savoir de quoi on parle.

4e ennui : une même mutation a parfois 2 ou 3 noms car elle a été découverte par 2 ou 3 laboratoires différents qui se dispute l'antériorité et tout le monde n'emploie pas le mème nom. Même remède : consulter ISOGG exemple  L51/M412/S167
La première est le code du laboratoire découvreur.

Par contre, cette mise en cluster n'a pas été faite ou sommairement pour les haplogroupes plus rares ou plus exotiques. L'année dernière, peut satisfait des clusters de mon haplogroupe G2a3b1 ou G-P303 et de ses sub-clades, j'ai voulu faire une nouvelle clusterisation sur un tableur excel. Soit qu'elle était insatisfaisante, soit manque de curiosité des personnes qui aurait du être intéressé, cela n'a soulevé aucun écho. Depuis j'envisage périodiquement de la reprendre, mais manque de temps et diverses occupations m'ont distrait jusqu'ici.  
 
Logged

Y=G2a3b1a2-L497 Wallony-Charleroi; Mt=H2a2a1 Normandy-Bray
Dodecad-DiY: E Eur 9,25% W Eur 48,48% Med 28,46% W Asia 11,70%
World9: Atl-Balt 67,61% Southern 13,23% Cauc-Gedr 12,73%
K12a: North-E 39,71% Med 37,9% Cauc 12,55% Gedr 5,78% SW Asia 2,13%
palamede
Senior Member
***
Offline Offline

Posts: 64


« Reply #2 on: April 15, 2012, 10:19:54 AM »

partie 3:

F/ L'amateurisme utile

Comme les amateurs sont utiles en astronomie,(Recherche des comètes, des supernovas, ...), certains amateurs doués font avancer la généalogie génétique, voila un sous-forum où ils découvrent des nouveaux marqueurs sur les chromosome Y
http://dna-forums.org/index.php?/forum/143-1k-genomes/

A partir de la publication de cartes des bases (A, C, G, T) faite par la recherche génétique avancée et un matériel très sophistiqué sur le projet 1000 Génomes (humains) http://fr.wikipedia.org/wiki/Projet_1000_Genomes , mais qui sont une donnée brute sous forme de suites de lettres (A ou C ou G ou T). Donc ces amateurs (en anglais "amateurs" ou "hobbyists") par des outils informatiques découvrent des marqueurs génétiques et complètent l'arbre des marqueurs du chromosome Y qui retracent une partie de l'histoire humaine depuis un supposé "Adam" génétique pour le chromosome Y.
Dernière évaluation de l'age de ce supposé Adam : 145.000 ans
 
Les marqueurs déterminés par des amateurs dans les derniers mois 2011 commencent par les lettres Z ou DN (Comme DNA Forums), voici les haplogroupes avec l'apport le plus important dans les dernières versions proposées non définitives
Commençant par L Marqueurs trouvés par l'Université d'Arizona (Thomas Krahn) associée avec la compagnie FTDNA
Les codes avec 2 lettres et 5 chiffres sont des personnes volontaires  dont le génome est déchiffré dans le cadre du projet 1000 génomes

Candidats SNP sous I1-M253 rev3 8 juillet 2011 (Maximum au centre de la Scandinavie- marqueur d'une présence viking)
http://www.box.net/shared/1eq1zhbdmzhvb88yr1z4
Ceci entre dans l'arbre de l'haplogroupe I défini par Ken Nordtvedt le 1er novembre2011
http://knordtvedt.home.bresnan.net/Tree%20and%20Map%20for%20Hg%20I.pdf
sub-cladeI1 défini par Ken Nordtvedt le 1er décembre2011
https://fbcdn-sphotos-a.akamaihd.net/hphotos-ak-ash4/308229_10150407517163515_545248514_8505932_1418229405_n.jpg

Candidats SNP sous I2-L460 rev7 aout 2011
http://www.box.net/shared/duuvh3epioblh59finur

Candidats SNP sous R1a-M417 rev5 11 juin 2011
http://www.box.net/shared/tgtnvajp4rzx05o4st7n
Un arbre de L.Lapinski du 1 décembre2011
http://dna-forums.org/index.php?/topic/16981-r1a-snps-chart/
R1a1a1 M417 est juste sous R1a1a M17 - Fréquent chez les Slaves (En Inde ?)

Candidats SNP sous R1b-U106 GregMagoon rev11 27 octobre 2011 - Fréquent en Europe du Nord-Ouest, maximum aux Pays Bas
http://www.box.net/shared/v7lra868or7sooa7qg1s
Dans ce schéma, haplogroupe de Jim Watson (James D. Watson Prix Nobel médecine 1962) et Craig Venters (Venters est actuellement président du "Center for the Advancement of Genomics") qui sont des personnalités  parmi les premières à avoir leur génome déchiffré sous forme de paires de bases. 
http://fr.wikipedia.org/wiki/Craig_Venter

Candidats SNP sous R1b-L21 rev6 22 juin 2011 (Maximum Iles Britanniques et France du Nord-Ouest)
http://www.box.net/shared/66415pac2c5gmrc8z5re
Arbre phylogénétique de R1b-L21 par "Dubhthach" sept2011
http://compsoc.nuigalway.ie/~dubhthach/l21-draft6.png septembre2011

Candidats SNP sous R1b-U152 rev4
http://www.u152.org/images/stories/Proposed_Phylogeny_U152_Candidate_SNPs_v004.png
01/09/2011: https://docs.google.com/leaf?id=0Bwo12PDVxPwwNTM3NDg0MzktZjBkZC00ZWVhLWExYzktMDc2YTZkMjY3ODdl&hl=en_GB
20/12/2011: https://docs.google.com/leaf?id=0Bwo12PDVxPwwNTM3NDg0MzktZjBkZC00ZWVhLWExYzktMDc2YTZkMjY3ODdl&hl=en_GB&pli=1

Arbre phylogénétique de J1 par "Victar" 15dec2011
http://pixelcraftco.com/images/j1-phylogenic-tree.jpg

Est importante aussi la critique des articles scientifiques, de leur intérêt, pertinence et fiabilité.Si vous êtes béotien, ce genre de critiques vous paraitrons du lèse-majesté par des autodidactes prétentieux. Mais, malheureusement, une partie de papiers et thèses scientifiques ne méritent pas votre respect de simple citoyen et même quand sérieusement fait, beaucoup souffrent d'une vue assez exclusive sans contact avec d'autres disciplines pour la cohérence des résultats.Importance de la multi-disciplinarité pour la GG.
De même, les médias publient des conclusions d'études dites scientifiques et il est malaisé pour un profane de distinguer ce qui est sérieux de ce qui ne l'est pas et les médias sont friands de conclusions qui peuvent attirer l'intérêt du lecteur profane.


G/ Les compagnies :

http://www.isogg.org/wiki/List_of_DNA_testing_companies
Sur DNA forums,  il y a un sous-forum (anglais)  par compagnie o. Quelque soit la qualité de leurs dirigeants, beaucoup ont manqué de moyens financiers pour pouvoir  atteindre une taille critique qui leur permettent de rester à jour en moyens scientifiques et techniques

Le résultat, les deux compagnies dominantes sont américaines

- FTDNA FamilyTreeDNA à Houston-Texas (Filiale IGENEA à Zurich-Suisse) fait les tests de ses clients dans les universités américaines, principalement à l'université du Colorado.
Sauf peut-etre pour un premier test avec création de votre kit où c'est plus facile en Europe et Euros par IGENEA , préférable de continuer directement avec FTDNA, j'ai pas eu de problème de paiement. Plus recommandé pour les tests SNP et STR sur chr-Y et partiel ou total test ADN mitochondrial.
http://en.wikipedia.org/wiki/FamilyTreeDNA et http://www.familytreedna.com/faq/default.aspx

-23andMe (23 like 23 chromosomes) dans la Silicon Valley en Californie. Plus recommandé pour des tests globaux sur les millions de marqueurs repérés sur le  génome humain.
http://en.wikipedia.org/wiki/23andMe


Les deux compagnies font des campagnes de promotion, souvent signalées par Didier Vernade ("Didier") modérateur et animateur du sous-forum français.
Les fanatiques aisés  sont clients dans les deux compagnies.

Autres compagnies réputées : DeCODme surtout pour les origines par les  test des marqueurs  autosomaux, Genetree, Ancestry.com, SGMF (Sorenson).
SGMF n'est pas une compagnie commerciale, elle peut faire des tests gratuits si elle considère que c'est intéressant scientifiquement, sinon cela risque d'être mis de coté ou trés long (Voir sur son sous-forum comme pour les autres compagnies).
 
Un récapitulatif au 06sept2011
http://dna-forums.org/index.php?/topic/16166-overviewreview-genealogy-dna-test-providers-and-experiences/

H Blogs et forums

DNA forums : http://dna-forums.org/ Certains sous-forums (comme cet unique  sous-forum en français) sont accessibles en lecture sans s'inscrire comme utilisateur (avec mot de passe), mais les forums plus spécialisés ne nécessitent. vous pouvez aisément vous inscrire. Si vous êtes nuls, mais simples et sans prétention, il vous sera beaucoup pardonné. Sans cela, les modérateurs font une chasse sans pitié et sans appel aux trolls et autres indésirables. Par contre, beaucoup de membres de ce forum, dont moi fortement, souhaite que les participants se fassent tester, même si cela leur demande un petit effort financier. Ce sera votre manière de participer au développement de la GG dans les pays francophones et de combattre la pensée unique.


Forum worldfamilies
http://www.worldfamilies.net/forum/

Forum anthrocivitas "The gate of all nations"
http://anthrocivitas.net/forum/index.php

Forum Eupedia
http://www.eupedia.com/forum/forumdisplay.php?201-Genetics-amp-Anthropology

Forum GENEALOGY-DNA de Rootsweb ici un post dans les archives de Juillet 2011
http://archiver.rootsweb.ancestry.com/th/read/GENEALOGY-DNA/2011-07/1310697006
"RootsWeb is funded and supported by Ancestry.com and our loyal RootsWeb community."


Blogs actifs

Blog Eupedia sur préhistoire, anthropologie et génétique, beaucoup de documentation intéressante mais aussi quelques hypothèses douteuses
http://www.eupedia.com/genetics/

Blog de l'haplogroupe-Y G par un américain Ray Banks administrateur de l'haplogroupe
http://www.members.cox.net/morebanks/G2Ideas.html

Blog de R1b-U152 tenu par un sicilien Robert Rocca pseudo "RRocca"
http://www.u152.org/
R1b-U152 fils de R1b-P312 a la  plus grande fréquence sur  une écharpe qui va du Nord de la Corse et l'Italie du Nord au Rhin Moyen par l'Est de la France, l'Ouest des Alpes, Suisse, Allemagne du Sud-ouest.

Plus généraux, il y a :
Dieneskes Pontiko un anthropologue grec pseudo  "dieneskes"
http://dienekes.blogspot.com/

Maju, un basque très savant avec un point de vue différent,  adversaire des méthodes de datation par la diversité génétique
http://forwhattheywereweare.blogspot.com/

Jean Manco, une anglaise de Bristol souvent sur les forums pseudo "Jean M" . Il y a une liste d'haplogroupes qu'on a réussi à déterminer sur des squelettes anciens.
http://www.buildinghistory.org/distantpast/peoplingeurope.shtml

Bernard Secher, intervenant du forum français, Je ne suis pas toujours d'accord avec ses hypothèses migrationnistes
http://pagesperso-orange.fr/bsecher

Blog de Didier Vernade
http://chezdidier.over-blog.com/categorie-0.html

http://eurogenes.blogspot.com/

Un blog de conseil sur les tests ADN, semble t-il bien fait et bien organisé:
http://www.dna-testing-adviser.com/index.html

Cartes des cultures archéologiques, faites par un amateur ATIL, mais de qualité:
http://atil.pagesperso-orange.fr/atil/index.htm

I/ Papiers scientifiques

Une liste d'articles scientifiques:
http://community.haplozone.net/index.php?topic=473.0
Sur R1a:
http://www.draganprimorac.com/wp-content/uploads/2010/05
Article Cruciani-2011 sur la révision de la racine vers l'Adam-Y chromosomique
http://www.cell.com/AJHG/retrieve/pii/S0002929711001649
Sur les ages de divergence des branches d'homo sapiens :
http://www.nature.com/nature/journal/v468/n7327/extref/nature09710-s1.pdf

Where  did European come from-2008  version peuplement d'origine paléolithique
http://www.jogg.info/41/Wiik.pdf
Beaucoup de chiffres et pourcentages de fréquence intéressants à prendre avec la prudence habituelle pour le détail, mais le gros est exact.
Pour les chiffres de Paris venant de l'Institut médico-légale de Paris comme ceux de l'Ile de France d'une étude espagnole [de E. Ramos-Luis et al faite à l'Institut Nationale de la Transfusion Sanguine, ils sont faux et n'ont même pas de valeur indicative pour les fréquences de l'Ile de France il y a une dizaine de générations.

Table de Phylogeography of French male lineagesde Eva Ramos-Luis et al dans 
http://dna-forums.org/index.php?/topic/13650-y-dna-in-france-ramos-luis-et-al-numbers/
Les chiffres de province sont plus vraisemblables mais ont porté sur les porteurs de noms français (et je suppose des provinces périphériques) sans contrôle généalogique.

Il y a une étude des hgs mitochondriaux  sur la France datant de vers 2003, mais il y a moins de variations dans les fréquences et elles sont à la limite de l'incertitude statistique, seul le total France peut être considéré comme précis:
n=1385, H=45,56%;HV6=4,77;HV*=1,73; I=2,02; J=7,65; K=8,74;N1b=0,25;R0=0,36;T1=1,66;T*=6,86;U1=0,07; U2=1,44;U3=0,94;U4=2,31;U5=8,30;U7=0,07;W=1,88;X=0,79;KV*=0,14. 

Gottex  signale l' ouvrage intéressant pour la généalogie génétique de Bertrand Jordan : L’humanité au pluriel ,édition du seuil(2008).
"Dans les chapitres 5,6 et 7, il explique clairement comment sont utilisés les SNPs par les généticiens des populations avec les paramètres statistiques Fst (fixation index statistics) et AIM(Ancestry informative marker) par exemple."
 
J/ Autres

Genographic project de National Geographic (et IBM) : Chercher l'histoire génétique des peuples,un indicateur fiable afin de pouvoir retracer les migrations de l'homme sur terre.
Le Genographic Project a été lancé en 2005, au départ pour une durée de cinq ans. Mais les centres de recherches continueront leur travail de terrain et leurs analyses jusqu’en 2011.  700.000 personnes testées suivant E=MC6 de mai 2011.
http://fr.wikipedia.org/wiki/Projet_g%C3%A9nographique
https://genographic.nationalgeographic.com/genographic/lan/fr/faqs_about.html#Q1


Heteroplasmie : phénomène qui entraine parfois, peu fréquent des différences dans l'ADN mitochondrial
 http://fr.wikipedia.org/wiki/H%C3%A9t%C3%A9roplasmie
Il y a un code qui permet d'indiquer un marqueur qui entre dans une  hétéroplasmie.
Exemple marqueur 16519C indiqué par 16519Y.

ASD Average Square Distance Distance moyenne des carrés des distances génétiques  (GD) des individus d'un groupe (sous-haplogroupes ou clusters d'haplotypes) pour obtenir aprovimativement l'age du MRCA (TMRCA Time to Most Recent Common Ancestor)

Intraclade variance : variance des marqueurs STRs dans un clade (Sous-Hg ou clusters)

Interclade variancee : Variance entre des clades d'un même haplogroupe

Zhiv factor rates (ou ZUL, vient des généticiens russe Zhivotovsky et américain Underhill) est le rapport entre le "mutation germline rate" (taux de mutation réel entre père-fils appelé aussi "pedigree rate") et le "evolutionary effective rate" qui donne le taux de mutation qui reste effectivement dans le génome après une période marquée par des pertes de mutations dans des "bottlenecks" (chute importante de populations par famine,épidémie,guerre, ..)  et la dérive génétique qui fait disparaitre des mutations surtout quand elles sont encore peu répandues.
2 études de Zhivotovsky et al sur les Maoris et les Roms donnent la valeur 3,6 sur ce facteur, ce qui veut dire que les dates de mutation seraient 3,6 fois plus anciennes que les dates données par le "germline rate" seul. Il y a beaucoup de contestations et discussions.
article ZUL: http://mbe.oxfordjournals.org/content/23/12/2268.abstract
contradiction par Dieneskes Pontiko:
http://dienekes.blogspot.com/2008/07/how-y-str-variance-accumulates-comment.html

La dernière estimation donne qu'il y a environ 30 mutations pour tout le génome entre les parents et les enfants, donc 3 fois moins que la précédente 100-200.
Il y a encore des études pour plus de précision sur le taux de mutation germline (père-fils.)

Une nouvelle méthode (dec2011) qui prétend pouvoir régler la discussion entre "pedigree mutation" et "evolutionary mutation" par une nouvelles table donnant des dates par rapport aux "Genetic distances" en palliant le problème des mutations devenues invisibles mathématiqhement
http://www.tropie.ta...l/Table-FTM.pdf

Genbank : Banque mondiale contenant les descriptions de tous les morceaux d'ADN scientifiquement trouvés de toutes les espèces animales et végétales testées.
Il y a aussi comme banque importante pour l'humain : Hapmap,  HGDP-CEPH et PROPRES.


Locus, Allèles, Homozygote, Hétérozygote

Le locus est la position du départ d'un gène ou d'un motif répétitif ou simplement d'une paire de bases :
http://fr.wikipedia.org/wiki/Locus

En biologie, le sens orthodoxe des mots sont
http://fr.wikipedia.org/wiki/All%C3%A8le
http://fr.wikipedia.org/wiki/Homozygote
http://fr.wikipedia.org/wiki/H%C3%A9t%C3%A9rozygote

Donc le sens orthodoxe et le plus employé en biologie est au niveau des gènes.
En GG, de façon quelque peu abusive, ce sens est étendu au niveau des motifs de répétition et au niveau de la base pour une position donnée dans le chromosome.
Il y aura homozygotie si similitude dans la répétition des motifs et surtout si c'est la même base dans le même locus des deux chromosomes autosomaux de mème numéro (Ceux-ci sont classés de 1 à 22 par ordre de taille décroissant. Je rappelle que la maladie du mongolisme est lié à la trisomie (alors que la diploidie est le stade normal des cellules non sexuelles) du chromosome 21, un des deux plus petits. Les autes trisomies peuvent arriver, mais l'embryon n'y survit pas.

Il y a des mesures de l'importance relative de l'homozygotie/hétérozygotie  chez les humains. On mesure ainsi l'isolement génétique d'une petite population qui amène par dérive génétique et/ou effet fondateur à une plus forte homozygotie que dans une population plus brassée. On a ainsi mesuré que le Nord de la Suède a un assez net plus fort taux d'homogyzotie que la Suède Centrale. Il y a de nombreuses études génétiques régionales scientifiquement précises en Suède (comme en Italie, Espagne, UK, Irlande, Belgique, ... contrairement à des pays à mentalité arriérée, suivez mon regard !!

Outils de mesure d'homozygotie:
David Pike 's Homozygosity tool
Family Finder de FTDNA


Génotype, Phénotype

Le génotype est l'ensemble de l'information gènétyque du génome.
http://fr.wikipedia.org/wiki/G%C3%A9notype
Le résultat qu'on observe dans la nature est le phénotype.
http://fr.wikipedia.org/wiki/Ph%C3%A9notype

Certaines compagnies vous proposent de donner votre phénotype prévisionnel pour certains traits à partir du génotype dans la mesure des connaissances actuels. Ce phénotype peut varier de son caractère génétique plus ou moins multifactorielle, du taux de codominance d'un allèle sur l'autre du même gène  et de la complexité des influences d'autres parties du génome et bien entendu de l'interaction gènétique/environnement : l'expression des gènes étant plus ou moins sur l'action de facteurs environnementaux intra-utérins et après la naissance.
Parmi les traits testés, la couleur de la peau, des cheveux, des yeux, la capacité de digérer le lait adulte, les groupes sanguins, certaines allergies,....  ensuite nous entrons dans le domaine de la génétique médicale qui n'a qu'un rapport très indirect avec notre GG.

Vous pourrez comparer phénotype prédit (dans l'état actuel de la science) et phénotype réel. Si j'en crois certains posts d'utilisateurs, il peut y avoir de sérieuses différences.


LP Lactase persistence allele : Originellement, la production de lactase se perd au cours du passage de l'enfance à l'age adulte, elle permet de digérer le lactose et donc de boire du lait. La consommation du fromage serait elle toujours permise. Cet allèle était très peu répandu jusqu'au néolithique, mais le développement de l'élevage a favoriser les porteurs de cet allèle jusqu'à devenir majoritaire dans certaines régions comme l'Europe du Nord Ouest. Ce n'est pas toujours le même allèle LP dans des régions géographiques très séparées. La valeur de l'allèle sur un site donné (ou locus) peut être donné par les compagnies et il a été testé dans des squelettes anciens.
On peut etre homozygote ou hétérozygote pour LP et avec des variations phénotypiques.
Si on admet que les gènes LP étaient rares dans toutes les populations du monde avant le développement de l'élevage, pourquoi les gènes LP ont été plus sélectionnés et se sont plus répandus dans certaines régions du monde que dans d'autres, par exemple dans l'Europe du Nord-Ouest qui a pourtant connu l'élevage plus tard que des régions où LP est moins bien fréquent. Il y a des études géographiques donnant sa répartition géographique phénotypiques et haplotypiques avec les taux d'homozygotie par zones.

[
Logged

Y=G2a3b1a2-L497 Wallony-Charleroi; Mt=H2a2a1 Normandy-Bray
Dodecad-DiY: E Eur 9,25% W Eur 48,48% Med 28,46% W Asia 11,70%
World9: Atl-Balt 67,61% Southern 13,23% Cauc-Gedr 12,73%
K12a: North-E 39,71% Med 37,9% Cauc 12,55% Gedr 5,78% SW Asia 2,13%
palamede
Senior Member
***
Offline Offline

Posts: 64


« Reply #3 on: April 15, 2012, 10:22:11 AM »

partie 4

K/ FAQ

* Commandes de tests

** FTDNA
http://dna-forums.org/index.php?/topic/15798-les-habituelles-soldes-ftdna/page__pid__266685#entry266685

Des tests approfondis
Haplotype avec 12,24,37,67 ou 111 marqueurs : Dernièrement les valeurs des marqueurs 68 à 111 a été mis en questions par certains forumeurs "thetick" et "22ruth". Suivant "thetick": "The 68-111 markers have been pretty unpredictable and I suspect there may be some quality issues FTDNA is not willing to admit much like the validity of the Affymetrix matches that disappeared with the new Illumina Family Finder."

Large choix  de tests SNP, le meilleur et souvent la référence certainement actuellement.
Deep clade : Recherche pour tous les SNP connues dans l'haplogroupe du client
WTY (Walk Throug ADN-Y : Analyse du chromosome y du client pour trouver tous les SNPs connus ou inconnus  (communs ou privés).

Analyse des chromosomes autosomaux avec Family Finder de FTDNA accompagné d'une répartition  géographique avec Population Finder.


** 22ANDme

500K illumina chip: système 23andme  qui permet de repérer 500.000 mutations sur des sites mutants connus de tout le génome. Il y a des versions plus récentes qui repèrent des millions de mutations dans un génome.

Opinion du forumeur "thetick" sur 23andMe qui est partagée par d'autres forumeurs:
"Ancestry Finder is fine for clues about distant ancestry. Relative Finder can be useful, but far too many people are anonymous or just ignore contact requests. Your raw data is the real gold mine. Lots of 3rd party tools. See http://www.23andyou.com/3rdparty. McDonald's analysis, Interpretome, DIYDodecad, Promethease and Enlis are all great tools!

Be vary care about 23andme since you will loose all your data except your raw data when you stop your subscription. 23andme just changed this and NEVER bothered to tell anyone except a change in their FAQ. This directly contradicts what 23andme used to email customers about ending subscriptions.
See http://dna-forums.or...new-23andme-tos

I no longer recommend 23andme because of their very sleazy and but probably legal change. Besides this and their terrible customer service it's a very good product for the price which is why 23andme is forcing everyone to have subscription.
"


**  Autres compagnies

* Exploitation des résultats

Projets familiaux, régionaux, d'haplogroupes qui peuvent aider.

Base de données


** ADN-Mt
MitoSearch.org
http://phylotree.org

[quote name='zänder' timestamp='1328258623' post='301559']
this nice little tool, describing all SNP's of the rCRS, even the amount of mutations, has been updated recently:

http://mitowheel.org/mitowheel.html
about: MitoWheel 1.2, updated on October 3rd, 2011
Human mtDNA sequence list updated on May 21st, 2008

Developed by Gábor Zsurka  (concept, programming, graphics) and Attila Csordás  (ideas, testing)
[/quote]

** ADN-Y
YHRD database
ySearch.org : Pour mettre à jour, votre entrée dans la base Ysearch, suivre le processus expliqué dans http://irishtype3dna.org/convertmarkers.php#genebase
SMGF (Sorenson)tables http://www.smgf.org/pages/ydatabase.jspx
TMRCA tables d'Ancestry.com
Adrian Squecco's database
Mc Gee Y-DNA comparizon utility http://www.mymcgee.com/tools/yutility.html
Prédicteurs d'haplogroupes à partir d'haplotypes: Athey le plus utilsé, Cullen, Vadim, ...
Produit de construction d'arbres génétiques : MEGA, PHYLIP, FLUXUS, ....

** ADN-X
Dans les tests autosomaux.
Pour les comparaisons de de segments au-dessus de 5 centimorgans, de nombreux 'matchs' artificiels avec des femmes, explication de "R1a1a" :
"Because women have two Xs, it is quite easy to have a short match with women on the X by artificial alignment of a mix of her two (maternal and paternal) Xs. It sounds quite possible you have no real X matches in the database, and all your "matches" are in fact a random mix of paternal and maternal values."
Ils disparaissent généralement si on prend des segments > 7,5cM, pour moins voir
http://dna-forums.org/index.php?/topic/17301-why-are-my-matches-all-female/page__pid__298006#entry298006
 
** Autosomes
Relative Finder 23ANDme https://www.23andme.com/ancestry/relfinder/
Ancestry Finder 23ANDme http://www.isogg.org/wiki/File:BasicViewAF.jpg
Family Finder FTDNA
http://dna-forums.org/index.php?/topic/15225-italian-relationship-to-middle-east/page__pid__254696#entry254696
Spécialistes BGA (biogeographical) :Dr MacDonald reconnu et apprécié.Adrian Squecco.
Produits d'analyse :
- ADMIXTURE, STRUCTURE
- Paintmychromosomes http://dna-forums.org/index.php?/topic/17023-paintmychromosomescom/
SnpNPMap aide à explorer les données du génome autosomal venant de 23andMe ou FamilyTreeDNA. //snpmap.blogspot.com  Voir version 1.0.2 introduction.

Signalé par "thetick sur le forum 'adn autosomales", des cartes tirées des analyses DODECAD-V3 le produit de Dieneskes Pontikos. Intéressant pour voir la moyenne attribuée sur chaque pays d'Europe, Asie de l'ouest et Afrique du Nord des répartitions de part origine  de chaque zone géographique (BGA BioGeograohical Ancestry)'.
http://bergep.clanteam.com/DOD_Maps/dod_map.html
C'est surtout par rapport à ces moyennes qu'il faut voir chaque cas individuel.

"How is BioGeographical Ancestry estimated? ... uses an especially selected panel of Ancestry Informative Markers (AIMs) that have been characterized in a large number of well-defined population samples. These markers are selected on the bases of showing substantial differences in frequency between population groups and, as such, can tell us about the origins of a particular person whose ancestry is unknown. For example, the Duffy Null allele (FY*0) is very common (approaching fixation or an allele frequency of 100%) in all sub-Saharan African populations. Thus, a person with this allele is very likely to have some level of African ancestry. After the analysis of these AIMs, in a sample of a person's DNA, the likelihood (or probability) that a person is derived from any of the parental populations and any of the possible mixes of parental populations is calculated. The population (or combination of populations) where the likelihood is the highest is then taken to be the best estimate of the ancestral proportions of the person. Confidence intervals on these point estimates of ancestral proportions are also being calculated."


* Moyens, contacts et expériences des recherches en parenté
Jusqu'ici concernent surtout les pays qui atteignent une certaine taille critique dans la clientèle des compagnies.


* Qu'est- ce que les SNP privés, intérêt

http://dna-forums.org/index.php?/topic/15842-private-snps-for-genealogical-research/


* Racisme et antiracisme

La crainte de propos racistes ou de préter flanc à des accusations de racisme est vive sur les forums GG et entrainent rapidement des réponses de forumeurs très sensibles à ce sujet   et des  réactions des modérateurs qui demandent la suppression des textes contestables.
Certains peuvent avoir leur accès interdit où pour d'autres motifs tels que propos trop violents, trollisme trop voyant. Je ne connais pas les critères exactes d'interdiction pour "DNA Forums", il y a un ou deux modérateurs par sous-forum, je ne sais pas les limitres de leur pouvoir et une administration centrale qui procède peut-etre à un nouveau jugement et supprime textes et/ou accès. Certains 'threads' qui tournent trop en rond avec des conflits permanents peuvent être fermés par les modérateurs mais restent présents.

Plus délicat les accusations de racisme qui n'obtiennent pas un accord unanime et sont sujets de vive critique de la part d'autres forumeurs/ Cela reste à l(appréciation des modérateurs qui ont de l'expérience sur les matières en question et peut-être aussi déjà une appréciation sur les personnes en conflit . Il est certain qu(on ne peut bannir des sujets, parfois trés interessant, à la première accusation de racisme.

* Ethnocentrisme

- Europeanocentrisme
Les Européens sont souvent accusés d'Europeanocentrisme. J'ai souvent tendance a penser à tort mais je suis européen.

- Indocentrisme : Il y a des Indiens (et Pakistanais et Bengalis) qui ont l'esprit scientifique et objectf et d'autres moins.
En plus il faut reconnaitre que l'histoire de l'haplogroupe R1a est complexe et peut prêter à une grosse controverse. La forte fréquence de R1a en Inde (autre fortes fréquences en Pologne et Russie Centrale) aurait pu à la rigueur s'expliquer par l'immigration des Indo-aryens, des Scythes, Kouchans  et d'autres envahisseurs dans la période historique, mais les fréquence presque aussi importantes des R1a dans les basses castes et beaucoup de tribus n'était pas attendue alors que la distribution d'autres haplogroupes marquent une grande différence entre hautes castes d'un coté, basses castes et tribus de l'autre. Cela entraine de nombreuses interrogations avec des thèses diverses et contradictoires.
Puis l'Inde est un sous-continent par elle-même qui a joué un grans rôle dans la diffusion de l'homme moderne avec une grande richesse en haplogroupes.

-Turcocentrisme (Turquie et pays turcophones : même remarque sur l'esprit scientifique et objectif. et puis l'histoire des tribus  turcophones est compliqué et de plus, quel est l'apport des anciennes tribus turcs dans la population de l'actuelle Turquie et d'autres régions turcophones ?

- Afrocentrisme
Peu présent sur "DNA Forums" jusqu'ici.

- Autres ethnocentrismes : Il y en a d'autres et plus limités géographiquement. Certaines propositions sont un peu étranges et on ne sait comment les cataloguer.


* Tropismes

- Out of Africa, possibilité hybridation avec Neanderthal et autres anciennes sous-espèces

- Repeuplement épiglaciaire

- Expansion du Néolithique et Campaniforme

- Indo-européens et Aryens

- Invasions celtiques , germaniques, slaves,  vikings, les Sarmates ...

Les marqueurs, éléments d'identification génétique ? vrais et faux dangers

Article sur l'identification génétique :
http://fr.wikipedia.org/wiki/Empreinte_g%C3%A9n%C3%A9tique

Les marqueurs génétiques actuels de la GG ne sont pas ceux de l'identification judiciaire ou de la recherche parentale .
En théorie, les bases des marqueurs GG pourraient servir à circonscrire une recherche mais est-ce réaliste, vu le cout que cela représenterait, les systèmes de recherche de la police n'étant pas compatibles. Il faudrait que vous soyez l'ennemi public numéro un pour qu'on l'envisage, en faisant l'hypothèse que celui-ci s'est fait testé, peu réaliste.
Si un régime totalitaire voulait créer un fichier de la population, cela ne lui serait pas un problème d'obtenir votre ADN sans que vous le sachez et s'en tenir aux marqueurs de la police qui n'utilisent pas les ADN Y et mt.

Les marqueurs participent-ils de la sélection naturelle de Darwin ?
Normalement non, car il y aurait sur eux un effet de sélection dont on ne saurait mesurer l'effet et le marqueur ne serait plus utile pour utilser les divergences mesurées pour  faire une datation du MRCA (le plus souvent égale ou un peu inférieure à l'ancienneté d'une mutation).
Donc on devrait utiliser un marqueur qui est neutre génétiquement (c'est à dire qui n'a pas d'effets phénotypiques marqués donnant un avantage ou désavantage sélectif.
A une époque beaucoup considéraient que seulement les 5% de l'ADN (Les exons des 20.000 gènes) étaient utiles, car seuls traduits en ARN messager (directement utiles à la fabrication des protéines et donc à la fabrication de l'individu homme, animal, végétal, bactérie. Les introns (partie inutile) sont éliminées par l'épissage et les exons réunis pour la transcription en ARN). Seule la partie utile (exons)pouvait subir l'action de la sélection qui était ainsi  bien délimitée dans son champ  et encore dans les exons  la théorie neutraliste émise par un japonais Motoo Kimura a la fin des années 1960, considérait que beaucoup de mutations ne procuraient pas d'avantage compétitif.    
http://fr.wikipedia.org/wiki/Th%C3%A9orie_neutraliste_de_l%E2%80%99%C3%A9volution

Les introns furent découvert ensuite en 1976, et aussi qu'une grande partie de l'ADN était externe aux gènes (Sequence ALU, STRs, ....)
http://fr.wikipedia.org/wiki/%C3%89pissage

Comme l'attendaient de nombreux autres biologistes plus imaginatifs qui jugeaient  improbable que l'évolution est laissé subsister dans l'ADN plus de 95% inutiles, rien que d'un point de vue cout énergétique (Gould), l'étude du fonctionnement de la machinerie génétique se complexifie de plus en plus.

* La GG dans 20 ans

S'il est difficile de prévoir les nouveautés scientifiques et techniques, de prévoir l'évolution de la législation et des jurisprudences, on peut tenter de prolonger les tendances actuelles
Je laisse de coté l'aspect médical et ses problèmes, mais qui sera le plus important politiquement.

- Très grande sophistication des arbres des haplogroupes Mt, Y et peut-être des développements sur le chromosome X et autosomales qui permettront de donner une origine à des tranches d'ADN, il y en aura que cela intéressera beaucoup.

- Des tests de plus en plus sophistiqués, fins sur des grandes parties du génome deviendront accessibles.

- une amélioration de connaissance des répartitions passées

- une meilleure vision de l'évolution humaine

- des reproductions informatiques des mouvements, expansions et rétractions de populations

- Des recherches plus locales, sur telle ou telle particularité de petites régions.

- Si un grand intérèt public se développe pour les tests génétiques, je ne suis pas convaincu que cela aura un rapport avec la GG. Je vois plus de la curiosité pour ce que la génétique de l'époque pourra dire de chacun, de son potentiel, mème encore à l'état d'embryon à l. Ce qui pourra susciter les problèmes afférents sur le recrutement, les assurances. Peut-etre la création de groupes se distinguant sur des caractères génétiques plus affriolants que les marqueurs génétiques utilisés par la GG qui généralement neutres ou d'influence phénotypique  très limitée.


Projet Human Genome   http://en.wikipedia.org/wiki/Human_Genome_Project
Projet HGDP http://en.wikipedia.org/wiki/Human_Genome_Diversity_Project
BGA Behavior Genetics association http://www.bga.org/
Fondation Jean Dausset pour l'étude du polymorphisme humain http://www.cephb.fr/en/cephdb/

Par contre, je ne pense pas que dans 20 ans, on en soit déjà à fabriquer des individus avec des caractères pré-établis contrôlant l'action du choix des chromosomes et des recombinaisons intra-chromosomiques. Peut-être il y aura déjà quelques tentatives sur les animaux domestiques.

C'est certain, cela risque de nous rapprocher du "Meilleur des Mondes", mais cela par des  recherches et découvertes sortant du cadre  de la GG. Il sera nécessaire de s'entendre sur certaines limites, mais peu envisageable de tout interdire. De toute manière, sauf problèmes trop flagrants, les pays ont le plus souvent des approches et une vision des choses complètement différentes   et le public peut adopter des choses qu'il avait refusé longtemps , parfois pour un supplément de plat de lentilles.

Logged

Y=G2a3b1a2-L497 Wallony-Charleroi; Mt=H2a2a1 Normandy-Bray
Dodecad-DiY: E Eur 9,25% W Eur 48,48% Med 28,46% W Asia 11,70%
World9: Atl-Balt 67,61% Southern 13,23% Cauc-Gedr 12,73%
K12a: North-E 39,71% Med 37,9% Cauc 12,55% Gedr 5,78% SW Asia 2,13%
palamede
Senior Member
***
Offline Offline

Posts: 64


« Reply #4 on: April 15, 2012, 10:25:23 AM »

partie 5

*  Pour en savoir plus sur la génétique

L'élève dépasse le maitre, vous vous étiez méjugès au départ malgré mon avertissement.Cela commence à dépasser les connaissances et l'entendement d'un modeste amateur de GG.Je ne peux que vous donner quelques références wikipedia


En français
http://fr.wikipedia.org/wiki/G%C3%A8ne
http://fr.wikipedia.org/wiki/M%C3%A9iose
http://fr.wikipedia.org/wiki/Liaison_g%C3%A9n%C3%A9tique
http://fr.wikipedia.org/wiki/D%C3%A9s%C3%A9quilibre_de_liaison
http://fr.wikipedia.org/wiki/%C3%89pig%C3%A9n%C3%A9tique
http://fr.wikipedia.org/wiki/Corpuscule_de_Barr
http://fr.wikipedia.org/wiki/Puce_%C3%A0_ADN
http://www.edu.upmc.fr/sdv/masselot_05001/biodiversite/transposons.html

En anglais
http://en.wikipedia.org/wiki/Genetic_linkage
http://en.wikipedia.org/wiki/Linkage_disequilibrium
http://en.wikipedia.org/wiki/Genome-wide_association_study
http://en.wikipedia.org/wiki/Microsatellite_%28genetics%29
http://en.wikipedia.org/wiki/Noncoding_DNA
http://en.wikipedia.org/wiki/Transposon
http://en.wikipedia.org/wiki/Epistasis
http://en.wikipedia.org/wiki/Quantitative_trait_locus
http://en.wikipedia.org/wiki/Full_genome_sequencing
http://en.wikipedia.org/wiki/DNA_microarray
http://en.wikipedia.org/wiki/Affymetrix
http://en.wikipedia.org/wiki/Illumina_%28company%29
Dans BioPortFolio , le 25 juillet 2011  "Illumina, Inc. today announced that it has begun shipping the HumanOmni5-Quad DNA Analysis BeadChip (Omni5), the new flagship array of the Omni family of microarrays."



Des termes de technologie des marqueurs génétiques que vous rencontrerez sur ce forum
recLOH : recombinant Loss Of Heterozygotis
http://dna-fingerprint.de/modules.php?op=modload&name=Sections&file=index&req=viewarticle&artid=9
http://en.wikipedia.org/wiki/RecLOH
http://en.wikipedia.org/wiki/Palindromic_sequence
La définition de "primers" d'un marqueur est nécessaire pour pour le test. on dit aussi en français une "amorce".
http://en.wikipedia.org/wiki/Primer_%28molecular_biology%29
http://en.wikipedia.org/wiki/Polymerase_chain_reaction

En génétique des populations (statistique) on parle souvent de "star-like structure",
"star-like structure because of repeated founder effects". dans wikipedia (E-M78)
"a simple star-like structure indicative of expansion from one source [...]. This pattern seems incompatible with recolonization from differentiated refugial populations" par Rokus, un hollandais savant dont l'esprit polémiste,paradoxal, l'intransigeance, les thèses, le "Dutchocentrisme" ne sont pas toujours beaucoup goutés sur les forums , si vous n'avez pas peur d'affronter son texte trés savant dont  je serais bien incapable d'apprécier la vraie valeur.
http://rokus01.wordpress.com/2010/09/14/the-neolithic-advance/
L'avance néolithique des R1b s'oppose aux rares archaiques survivants (dont votre chenu et cacochyme serviteur qui voit l'arrivée des R1b avec le Gravettien (calibré 32-30K BC)de Sibérie du sud , l'haplogroupe I venant à l'Aurignacien (calibré 45-30K BC) d'Iran), ils   sont bien déchus et il affronte surtout la virulente et dynamique nouvelle école des partisans d'une vague de peuplement et remplacement de vieilles populations mâles (quelques survivants du paléolithique et surtout plus nombreux de la première vague de l'arrivée des techniques néolithiques) à partir de la fin du 4e millénaire et ensuite).
On vous parlera de "surf effect" à partir de R-L23 déjà indoeuropéanisés ou non, partants   ou du sud de l'Ukraine, ou du Caucase ou du Moyen-Orient suivant les penchants des promoteurs,) et sur la vague ("surfing") de peuplement apparaissent  de nouveaux marqueurs s'étendant dans l'élargissement de la vague et ainsi de suite jusqu'à buter sur les côtes atlantiques où ils s'y seraient accumulés jusqu'à etre presque exclusif du Pays Basque à l'ouest de l'Ecosse. Ceci pour les lignées mâles, elles se seraient accouplées avec les lignées femelles indigènes. Certains plus extrèmes pensent que l' haplogroupe mitochondrial H (entre 35-55% suivant les régions) est venu avec R1b.
En dehors qu'on ne peut manqué d'évoquer le terme génocide pour ces Ages du cuivre et du bronze, de beaucoup discussions sur une réelle supériorité technologique, on peut remarquer que  dans l'antiquité il y a avait encore plusieurs langues non-indoeuropéennes en Europe de l'ouest dans des zones à fort peuplement actuel  R1b (et H) : Aquitain/Vascon/Basque, Ancien Sarde, Ibère, Etrusque, Rhète. Le Ligure est maintenant considéré comme un ancien indoeuropéen intermédiaire entre proto-celte et proto-italique. On peut penser que la question sera résolue dans quelques années avec les études de plus en plus nombreuses des prélèvements d'ADN sur les anciens squelettes.


Pour gens intéressés par les outils d'analyse informatique, ce n'est pas mon cas, 38 ans d'informatique ont ruiné mon peu de courage. Les intervenants du post sont parmi les plus actifs dans la recherche de nouveaux marqueurs SNP à partir des fichiers de données bruts (raw data) du projet "1000genomes"
http://dna-forums.org/index.php?/topic/14552-calling-strs-using-samtools/

"Finch2 server" pour accéder aux infos WTY (Walk Thru the Y-chromosome) de FTDNA.
http://tech.groups.yahoo.com/group/RL21Project/message/3548

Archaeopteryx de phylosoft semble apprécié.
http://www.phylosoft.org/

Liste de programmes dont le fameux "STRUCTURE" sur un site de l'université de Chicago
http://pritch.bsd.uchicago.edu/software.html

Outils d'exploration des génomes autosomales de 23andMe et FTDNA
http://dna-forums.org/index.php?/topic/15555-snp-map-application/page__pid__261639#entry261639

Une  spécification de format de fichiers pour échanger des données de généalogies entre différents logiciels de généalogie:
http://en.wikipedia.org/wiki/GEDCOM
Plus un outil pour faire des comparaisons  entre les données  intra-compagnie et inter-compagnie (23andme, Family Tree Family Finder, Illumina version, ..) parmi des personnes de possible origine proche ayant des segments presque identiques et des utilitaires GEDMATCH http://www.gedmatch.com/ et GEDCOM/TREE pour comparer les fichiers GEDCOM.

Outils d'analyse phylogénétique
- TNT phylogenetic software    http://www.zmuc.dk/p.../phylogeny/tnt/
- Phylomurka                   http://sourceforge.n...cts/phylomurka/

Vu dans https://sites.google.com/site/haplogroupil38/home/l533

"Made with Fluxus Free Phylogenetic Software: http://www.fluxus-engineering.com/sharenet.htm
To create the Median Joining network with the haplogroup I-L38 samples with known SNP L533 status; 33 loci were taken into account (the first three FTDNA panels except DYS464)
For most of the STRs a standard weight of 10 was used. Only for DYS385a,b and DYS454 a weight of 40 was inserted to get a clear distinction between the positive and negative L533 samples.

Green nodes represent samples that tested L533+, red nodes L533-. Somewhere on the orange coloured branch mutation L533 originated. The orange line represents 9 mutations  between the hypothetical L533- node and the hypothetical L533+ node.

Cfr. Fluxus Time Estimates and calculated with an average of 1 mutation every 150 years (cfr Hertogdom Brabant project), the MCRA of samples SCO1 and ENG2/3 lived 800 years ago (with a standard deviation of 200 year +/-)
"

Selon Ray Banks, pour obtenir les haplotypes Y à partir des données bruts de  1000 genomes ou autres analyses:
"Dienekes is reporting in his blog
Phased Omni haplotypes with ShapeIT
The working directory of the 1000 Genomes ftp site contains phased haplotypes for 2,123 individuals from the 1000 Genomes Project (US/Europe). The data were phased with ShapeIT, which I've recently played with, and could recommend as a fairly user-friendly and high quality phasing software.

You can use vcftools to convert the data into PLINK format, which appears to be quite efficient (but use --plink-tped) compared to doing it on the single file I previously linked to. So, it's also a way to get 1000Genomes data into the more useful PLINK format, and it's pre-phased as a bonus.

Not being familiar with ShapeIT and PLINK, more simply it is possible to get the Y haplotypes into a spreadsheet to include as an addendum to Greg's spreadsheet? Or am I misreading the info
Logged

Y=G2a3b1a2-L497 Wallony-Charleroi; Mt=H2a2a1 Normandy-Bray
Dodecad-DiY: E Eur 9,25% W Eur 48,48% Med 28,46% W Asia 11,70%
World9: Atl-Balt 67,61% Southern 13,23% Cauc-Gedr 12,73%
K12a: North-E 39,71% Med 37,9% Cauc 12,55% Gedr 5,78% SW Asia 2,13%
palamede
Senior Member
***
Offline Offline

Posts: 64


« Reply #5 on: March 07, 2014, 11:18:42 AM »

Up
Logged

Y=G2a3b1a2-L497 Wallony-Charleroi; Mt=H2a2a1 Normandy-Bray
Dodecad-DiY: E Eur 9,25% W Eur 48,48% Med 28,46% W Asia 11,70%
World9: Atl-Balt 67,61% Southern 13,23% Cauc-Gedr 12,73%
K12a: North-E 39,71% Med 37,9% Cauc 12,55% Gedr 5,78% SW Asia 2,13%
Pages: [1] Go Up Print 
« previous next »
Jump to:  


SEO light theme by © Mustang forums. Powered by SMF 1.1.13 | SMF © 2006-2011, Simple Machines LLC

Page created in 0.255 seconds with 18 queries.