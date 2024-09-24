In Tansania nutzt David Guerena, Agrarwissenschaftler am International Center for Tropical Agriculture, KI, um die Pflanzenevolution auf Touren zu bringen.

Guerenas Projekt namens Artemis nutzt KI und Computer Vision, um den Prozess der Phänotypisierung zu beschleunigen. „Die Leute sind nicht gut darin, verlässliche quantitative Schätzungen von Dingen, die wir sehen, abzugeben“, erklärt er. „Es ist für einen Menschen unmöglich, die Blüten von Hunderten von Pflanzen auf Tausenden von Parzellen genau zu zählen. Wir werden müde, verlieren den Fokus oder können einfach physisch nicht alles sehen, was nötig wäre. Ein Computer hat diese Probleme nicht. Gut trainierte Computer-Vision-Modelle liefern sofort konsistente quantitative Daten.“

Als Guerenas Team begann, mit Smartphone-Bildern zu arbeiten, verwendete es Convolutional Neural Networks (CNNs). Sie erledigten die Arbeit, benötigten aber mehr Daten. Um sie zu schulen, waren Tausende von beschrifteten Beispielen nötig, was teuer und zeitaufwändig war. Ihr Ziel war es, Modelle für verschiedene Merkmale (wie das Zählen von Blüten) über verschiedene Nutzpflanzen hinweg zu entwickeln. Dafür waren die CNNs jedoch zu anspruchsvoll.

Vor ein paar Jahren kamen Vision Transformer und Open-Source-Modelle wie YOLO und Segment Anything auf den Markt und veränderten die Rahmenbedingungen, erklärt Guerena. Der Bedarf an gekennzeichneten Daten wurde durch diese Modelle drastisch reduziert. Anstelle von Tausenden von Beispielen für zugeschnittene Bilder benötigen sie jetzt nur noch ein paar Hundert. „Der Vision Transformer und die Foundation-Modelle haben es uns ermöglicht, die Modellentwicklung erheblich zu beschleunigen.“

Guerenas Team arbeitet derzeit daran, Speech to Text und Verarbeitung natürlicher Sprache zusammen mit Computer Vision in die Systeme zu integrieren, die sie entwickeln. Die Interaktion mit Menschen über natürliche Sprache kann helfen, Sprach- und Lesebarrieren zu überwinden, erklärt er. Außerdem kann die Kombination verschiedener Arten von Daten ein umfassenderes Bild der Leistung der Pflanzen auf dem Feld erzeugen. „Die Landwirte selbst können die Sprachfunktion nutzen, um zu beschreiben, mit welchen Herausforderungen sie im Laufe der Saison konfrontiert waren“, sagt er. „Wenn wir diese Daten von Tausenden Betrieben auf der ganzen Welt sammeln, können wir besser erkennen, welchen Einfluss die lokalen Umweltbedingungen auf die Leistung der Vielfalt haben.“