KI kann giftige Chemikalien aufspüren

Schwedische Forscher der Chalmers University of Technology und der Universität Göteborg haben eine KI-Methode entwickelt, mit der giftige Chemikalien besser identifiziert werden können - und zwar allein aufgrund der Kenntnis der Molekularstruktur. Das Verfahren kann nicht dazu beitragen, die ständig wachsende Zahl der in der Gesellschaft verwendeten Chemikalien besser zu kontrollieren und zu verstehen. Sie trägt womöglich auch dazu bei, die Zahl der Tierversuche zu verringern.

Das jetzt im Fachblatt Science Advances vorgestellte Verfahren basiert auf Transformatoren, einem KI-Modell für Deep Learning, das ursprünglich für die Sprachverarbeitung entwickelt wurde. Chat GPT - dessen Abkürzung für Generative Pretrained Transformer steht - ist ein Beispiel für solche Anwendungen.

Das Modell hat sich auch als äußerst effizient bei der Erfassung von Informationen aus chemischen Strukturen erwiesen. Transformers kann Eigenschaften in der Struktur von Molekülen identifizieren, die zu Toxizität führen, und zwar auf eine ausgefeiltere Weise als bisher möglich.

Anhand dieser Informationen kann die Toxizität des Moleküls dann von einem neuronalen Netz vorhergesagt werden. Neuronale Netze und Transformatoren gehören zu der Art von KI, die sich durch die Verwendung von Trainingsdaten - in diesem Fall große Datenmengen aus früheren Labortests zu den Auswirkungen tausender verschiedener Chemikalien auf verschiedene Tiere und Pflanzen - kontinuierlich verbessert.

Computergestützte Instrumente zum Aufspüren giftiger Chemikalien gibt es bereits, aber bisher waren ihre Anwendungsbereiche zu eng oder ihre Genauigkeit zu gering, um Labortests in größerem Umfang zu ersetzen. In der Studie der Forscher verglichen sie ihre Methode mit drei anderen, häufig verwendeten computergestützten Instrumenten und stellten fest, dass die neue Methode sowohl eine höhere Genauigkeit aufweist als auch allgemeiner anwendbar ist.

"Transformatoren verwenden Self-Attention, einen Mechanismus, der komplexe Abhängigkeiten direkt aus Daten ableitet, um die Teile der chemischen Struktur hervorzuheben, die als besonders informativ gelten. Auf diese Weise lassen sich die Strukturmerkmale identifizieren, die für eine genaue Vorhersage der chemischen Toxizität am wichtigsten sind", heißt es dazu in der Publikation.

Chemikalien werden in der Gesellschaft in großem Umfang verwendet, und sie kommen in allen Bereichen vor, von Haushaltsprodukten bis hin zu industriellen Verfahren. Viele Chemikalien gelangen in unsere Wasserwege und Ökosysteme, wo sie negative Auswirkungen auf Menschen und andere Organismen haben können. Ein Beispiel dafür sind PFAS, eine Gruppe problematischer Stoffe, die in jüngster Zeit in besorgniserregenden Konzentrationen sowohl im Grundwasser als auch im Trinkwasser gefunden wurden (wir berichteten). Sie wurden beispielsweise in Feuerlöschschaum und in vielen Verbraucherprodukten verwendet.

Negative Auswirkungen auf Mensch und Umwelt treten trotz umfangreicher chemischer Vorschriften auf, die oft zeitaufwändige Tierversuche erfordern, um nachzuweisen, wann Chemikalien als sicher angesehen werden können. Allein in der EU werden jährlich mehr als zwei Millionen Tiere verwendet, um die verschiedenen Vorschriften zu erfüllen. Gleichzeitig werden in rasantem Tempo neue Chemikalien entwickelt, und es ist eine große Herausforderung, festzustellen, welche davon aufgrund ihrer Toxizität für Mensch und Umwelt eingeschränkt werden müssen.


Original Paper

 

Lesen Sie dazu auch:

Eine Darstellung der Molekülstruktur wird als Eingabe für einen vortrainierten Transformator verwendet, der die Molekülstruktur interpretiert. Der Transformator erstellt eine sogenannte "Vektoreinbettung" - eine numerische Darstellung der Toxizität der Struktur. Diese wird dann als Eingabe für ein tiefes neuronales Netz (DNN) verwendet, zusammen mit Informationen über die Art der toxischen Wirkung, die Sie bewerten möchten, und die Expositionsdauer. Die Ausgabe des neuronalen Netzes ist die vorhergesagte Molekülkonzentration, die die gewünschte Wirkung verursacht. Credits: Chalmers University of Technology / Universität Göteborg

Eine Darstellung der Molekülstruktur wird als Eingabe für einen vortrainierten Transformator verwendet, der die Molekülstruktur interpretiert. Der Transformator erstellt eine sogenannte "Vektoreinbettung" - eine numerische Darstellung der Toxizität der Struktur. Diese wird dann als Eingabe für ein tiefes neuronales Netz (DNN) verwendet, zusammen mit Informationen über die Art der toxischen Wirkung, die Sie bewerten möchten, und die Expositionsdauer. Die Ausgabe des neuronalen Netzes ist die vorhergesagte Molekülkonzentration, die die gewünschte Wirkung verursacht. Credits: Chalmers University of Technology / Universität Göteborg