
KI entschlüsselt regulatorische Mechanismen in Pflanzen-DNA
Ein internationales Forscherteam, geleitet vom IPK Leibniz-Institut und dem Forschungszentrum Jülich, hat mithilfe künstlicher Intelligenz (KI) ein Modell entwickelt, das vorhersagen kann, an welchen Stellen regulatorische Proteine an die DNA von Pflanzen binden, um Gene zu aktivieren oder zu deaktivieren. Das auf umfangreichen Genomdaten der Modellpflanze Arabidopsis thaliana trainierte Modell ist auch auf Nutzpflanzen übertragbar und ermöglicht ein verbessertes Verständnis darüber, wie genetische Variationen die Leistungsfähigkeit von Kulturpflanzen beeinflussen. Die Ergebnisse wurden im Fachjournal Nature Communications veröffentlicht.
Regulatorische Elemente der DNA und ihre Bedeutung
Während Gene häufig als alleinige Träger der Erbinformation betrachtet werden, spielen zahlreiche regulatorische Abschnitte der DNA eine entscheidende Rolle bei der Steuerung pflanzlicher Eigenschaften. Transkriptionsfaktoren sind hierbei zentrale Regulatoren, die an spezifische DNA-Sequenzen binden und bestimmen, wann und in welchem Ausmaß ein Gen exprimiert wird. Dies beeinflusst, ob und wie oft ein Gen abgelesen wird, um RNA oder Proteine zu produzieren, die letztlich physiologische Funktionen steuern.
Eine anschauliche Metapher beschreibt Gene als Räume eines Hauses, während regulatorische Elemente wie Lichtschalter oder Thermostate die Funktionalität steuern. Um das komplexe Zusammenspiel zu verstehen, analysierte das Forschungsteam die Mechanismen anhand der umfangreichen Daten von Arabidopsis thaliana.
Entwicklung eines Deep-Learning-Modells zur Erkennung von Bindungsmustern
Die Wissenschaftlerinnen und Wissenschaftler trainierten ein Deep-Learning-Modell mit Hunderten experimenteller Datensätze zur DNA-Bindung und lehrten es, die Bindungsmuster von 46 verschiedenen Transkriptionsfaktor-Familien gleichzeitig zu erkennen. Dieses sogenannte „Multi-Label“-Verfahren unterscheidet sich von früheren Ansätzen, bei denen für jeden Faktor individuelle Modelle erstellt wurden, was die Anwendung auf das gesamte Genom erschwerte. Anschließend validierten die Forschenden die Fähigkeit des Modells, Bindungsstellen präzise zu lokalisieren und neue regulatorische Zusammenhänge zu identifizieren.
Erkenntnisse zum Zusammenspiel der regulatorischen Elemente
„Unsere Analyse zeigt, dass Transkriptionsfaktoren nicht isoliert einzelne DNA-Motive erkennen, sondern der Kontext und die Wechselwirkungen zwischen den Signalen entscheidend sind“, erläutert Fritz Forban Peleke, Erstautor der Studie. Ähnlich wie bei einem Text erst die Anordnung und der Zusammenhang mehrerer Wörter Sinn ergeben, bestimmt das Zusammenspiel der DNA-Bausteine die Funktionalität.
Die KI klassifizierte zudem die Gene in 14 große regulatorische Cluster, von denen mehrere miteinander korrelieren und gemeinsame biologische Funktionen besitzen. Trotz der Vielzahl an Genen in Pflanzen entstehen viele Funktionen demnach aus einer vergleichsweise kleinen Anzahl regulatorischer Muster.
Analyse genetischer Varianten und deren Einfluss auf Pflanzenmerkmale
Das Team untersuchte über 7.000 DNA-Varianten, die in genomweiten Studien mit Merkmalen wie Blütezeit, Krankheitsresistenz und Keimlingswachstum assoziiert sind. Bei etwa 20 % dieser Varianten sagte das Modell Veränderungen in der Bindung von Transkriptionsfaktoren voraus. „Dies ermöglicht es, den Einfluss einzelner regulatorischer DNA-Varianten auf Genaktivität und damit auf wichtige Pflanzenmerkmale besser zu verstehen“, erklärt Dr. Jędrzej Szymański, Leiter der Forschungsgruppe „Netzwerkanalyse und Modellierung“ am IPK und am Forschungszentrum Jülich. So kann von statistischen Zusammenhängen auf plausible molekulare Mechanismen geschlossen werden.
Ein exemplarisches Beispiel betrifft den Blühzeitpunkt: Die KI prognostizierte, dass eine einzelne Veränderung in einem regulatorischen DNA-Bereich die Bindung mehrerer Transkriptionsfaktoren beeinflusst und somit den Zeitpunkt der Blüte verschieben kann. Diese Vorhersagen wurden experimentell bestätigt.
Übertragbarkeit des Modells auf Nutzpflanzen
Obwohl das Modell mit Daten der Modellpflanze Arabidopsis thaliana entwickelt wurde, ließ es sich erfolgreich auf Mais übertragen. Dort identifizierte die KI Transkriptionsfaktoren, die auf Hitzestress reagieren, darunter bereits bekannte Regulatoren. Dies unterstreicht das Potenzial des Ansatzes für die Pflanzenforschung, insbesondere für Arten mit bislang begrenzten molekularen Bindungsdaten.
Wissenschaftliche Ansprechpartner
- Dr. Jędrzej Jakub Szymański
Telefon: +49 39482 5753
E-Mail: szymanski@ipk-gatersleben.de
Originalpublikation
Peleke et al. (2026): Genome-wide modelling of plant transcription factor binding captures regulatory variants associated with phenotypic traits. Nature Communications.
DOI: 10.1038/s41467-026-73634-8
Weitere Informationen
Gemeinsame Pressemitteilung des IPK Leibniz-Institutes und des Forschungszentrums Jülich




