Germany
April 11, 2024
A research team led by Raphaël Mercier and Korbinian Schneeberger from the Max Planck Institute for Plant Breeding Research in Cologne investigated the great genome diversity of the most popular research model plant Arabidopsis thaliana. A valuable toolbox to empower future genetic research. The study is now published in Nature Genetics.
Research model plant Arabidopsis thaliana. - © M. Kalda/MPIPZ
The diverse genetic makeup within a population contributes to the array of traits observed, facilitating species' adaptation and evolution. In addition to local variations in the DNA sequence, large genome rearrangements have the potential to greatly influence genetic diversity.
For several decades now, Arabidopsis thaliana has served as a model organism for biological and plant genetic research. The natural diversity of this species correlates with its wide geographical distribution, spanning various climate zones and habitats. Thus, the scientists are keen to study and describe the genetic diversity of A. thaliana.
Small-scale genetic variations have been extensively studied, while larger and more complex genomic variations have remained unexplored due to technical limitations. However, the process of long-read sequencing technologies has now made possible the exploration of this variations.
The researchers strategically selected Arabidopsis plants from diverse geographical regions including Europe, the Middle East, Asia, Africa, Madeira, and North America, ensuring comprehensive representation of the global Arabidopsis genome diversity.
In total, the team analyzed the complete genome of 69 Arabidopsis strains which vary in its sizes within their collection and examined these for different variations. They observed significant variation in genome length which was surprisingly primarily due to variation of the size of the centromeres; a structure that is essential for the distribution of chromosome during cell division. Intriguingly, the rest of the genome showed very little structural variation, with an almost identical chromosome organisation despite plants living far away from each other, like Japan, Spain and Tanzania. This suggests that strong evolution pressure counter-select genome re-arrangements.
Using pangenome analysis – studying the totality of all genes in all strains within the species – the team identified nearly 20,000 gene families commonly shared across all strains. Surprisingly, a very large number of genes (40% of gene families) seem to be dispensable, evidenced by their absence of it in at least one Arabidopsis strain. Moreover, the team was able to pinpoint genes present exclusively in individual accessions, with most of them resulting from the division and fusion of genes. This shows that large variation in gene content contributes to diversity within a species.
Having access to the full spectrum of genetic diversity will greatly enrich research into the genetic underpinnings of traits, phenotypic adaptability, and adaptation. The results of this study offer a great resource for future genetic studies, such as the mechanisms of genome evolution, including DNA repair, mutation, and recombination.
“Our team will use this knowledge to study the effect of genome organisation on recombination, the mechanism that generate genetic variation between generations, for example what makes you different from your brothers and sisters. As the data is freely available, we predict that it will be used by the research community to address to a large diversity of questions in biology”, says Raphaël Mercier.
Enthüllung der Genom-Vielfalt
Ein Forscherteam unter der Leitung von Raphaël Mercier und Korbinian Schneeberger vom Max-Planck-Institut für Pflanzenzüchtungsforschung in Köln hat die große Genom-Vielfalt, der wohl bekanntesten Forschungsmodellpflanze Arabidopsis thaliana untersucht - ein wertvolles Instrument für die zukünftige Genforschung. Die Studie wurde jetzt in Nature Genetics veröffentlicht.
Die genetische Vielfalt innerhalb einer Population trägt maßgeblich zur Variation beobachtbarer Merkmale bei und begünstigt die Anpassung und Evolution der Arten. Neben lokalen Variationen in der DNA-Sequenz können auch große genomische Umstrukturierungen die genetische Vielfalt stark beeinflussen.
Seit mehreren Jahrzehnten dient Arabidopsis thaliana als Modellorganismus für die biologische und genetische Pflanzenforschung. Die natürliche Vielfalt dieser Art korreliert mit ihrer weiten geografischen Verbreitung, die sich über verschiedene Klimazonen und Lebensräume erstreckt. Daher sind Forschende sehr daran interessiert, die genetische Vielfalt von A. thaliana zu erfassen und genauer zu beschreiben.
Kleinere genetische Variationen wurden bereits ausgiebig untersucht, während größere und komplexere genomische Variationen aufgrund technischer Beschränkungen bisher unerforscht geblieben sind. Der Einsatz von Long-Read-Sequenzierungstechnologien hat nun jedoch die Erforschung dieser Variationen ermöglicht.
Die Wissenschaftlerinnen und Wissenschaftler wählten strategisch Arabidopsis-Pflanzen aus verschiedenen geografischen Regionen aus, darunter Europa, der Nahe Osten, Asien, Afrika, Madeira und Nordamerika, um eine umfassende Repräsentation der globalen Arabidopsis-Genomvielfalt sicherzustellen.
Insgesamt analysierte das Team das vollständige Genom von 69 Arabidopsis-Stämmen und untersuchte diese auf verschiedene Variationen. Sie beobachteten signifikante Variationen in der Genomlänge, die überraschenderweise in erster Linie auf unterschiedliche Größen der Zentromere zurückzuführen waren; Strukturen, die für die Verteilung der Chromosomen während der Zellteilung wesentlich sind. Erstaunlicherweise wies der Rest des Genoms nur sehr geringe strukturelle Variationen auf, mit einer fast identischen Chromosomenorganisation, und das, obwohl die Pflanzen weit voneinander entfernt leben, z. B. in Japan, Spanien und Tansania. Dies deutet darauf hin, dass ein starker Evolutionsdruck einer Neuordnung des Genoms entgegenwirkt.
Mithilfe der Pangenomanalyse - der Untersuchung der Gesamtheit aller Gene in allen Stämmen einer Art - identifizierte das Team fast 20 000 Genfamilien, die allen Stämmen gemeinsam sind. Überraschenderweise scheint eine sehr große Anzahl von Genen (40 % der Genfamilien) entbehrlich zu sein, da diese in mindestens einem Arabidopsis-Stamm gänzlich fehlen. Darüber hinaus konnte das Team Gene ausfindig machen, die ausschließlich in einzelnen Varianten vorkommen, wobei die meisten von ihnen durch Teilung und Fusion von Genen entstanden sind. Dies zeigt, dass große Unterschiede im Gengehalt zur Vielfalt innerhalb einer Art beitragen.
Der Zugang zum gesamten Spektrum der genetischen Vielfalt wird die Forschung über die genetischen Grundlagen von Merkmalen, phänotypischer Anpassungsfähigkeit und Adaptation erheblich bereichern. Die Ergebnisse dieser Studie bieten eine wertvolle Grundlage für zukünftige genetische Untersuchungen, insbesondere bezüglich der Mechanismen der Genomevolution, darunter DNA-Reparatur, Mutation und Rekombination.
„Unser Team wird dieses Wissen nutzen, um die Auswirkungen der Genomorganisation auf die Rekombination zu untersuchen - den Mechanismus, der genetische Variationen zwischen den Generationen hervorbringt wie etwa, dass man sich von seinen Brüdern und Schwestern unterscheidet. Da die Daten frei zugänglich sind, gehen wir davon aus, dass sie von der Forschungsgemeinschaft genutzt werden, um eine Vielzahl von Fragen in der Biologie zu beantworten", sagt Raphaël Mercier.