16. September 2022
5 Minuten
Rehbock

PoC Wildtierbeobachtung voller Erfolg

Microsoft Gold Partner Arineo entwickelt künstliche Intelligenz für die Wildtierbeobachtung. Der leidenschaftliche Jäger und Microsoft-Mitarbeiter Christian Heidl hatte eine Idee: Wäre eine künstliche Intelligenz in der Lage, Wildtierindividuen zu beobachten und erkennen?

Der leidenschaftliche Jäger und Microsoft-Mitarbeiter Christian Heidl hatte eine Idee: Wäre eine künstliche Intelligenz in der Lage, Wildtierindividuen zu beobachten und erkennen? Sollte das funktionieren, könnten mit den Erkenntnissen der KI nicht nur der Abschussplan erstellt und der mögliche Verbiss von Neupflanzungen prognostiziert werden, sondern auch pandemische Auffälligkeiten analysiert werden. Also wandte er sich an das KI-Team der Arineo Gmbh. Zu diesem Zeitpunkt arbeiteten die Forschenden rund um Dr. Gerhard Heinzerling und Dimas Wiese gerade an der Entwicklung einer Smart City Verkehrszählung für die Stadt Göttingen. Die beiden Projekte, so fanden sie, würden sich gut ergänzen. Schließlich würden beide auf Bildaugmentierung und -segmentierung basieren.

Die Aufgabe der staatlich geförderten KI-Forschenden war es also, eine künstliche Intelligenz zu programmieren, die Rehe auf Bildern unterschiedlicher Kameras wiedererkennt und richtig zuordnet. Damit sollte das Wanderverhalten der Tiere erfasst, ausgewertet und nutzbar gemacht werden. Sie machten sich ans Werk, sammelten Rehbilder und trainierten ihre Algorithmen. Das Resultat: Im Rahmen der Machbarkeitsstudie konnte das Team beweisen, dass die Tierbeobachtung mit KI-Algorithmen nicht nur möglich, sondern vor allem präzise genug für wissenschaftliche Zwecke ist.

Bildaugmentierung

Als Augmentierung wird ein KI-Verfahren bezeichnet, das aus einem Originalbild eine Vielzahl an Bildvarianten erstellt – zum Beispiel durch Spiegelung, Ausschneiden oder dem Hinzufügen von zusätzlichen Bildebenen wie Regen. Mit solchen künstlich generierten Bildern können KI-Algorithmen besonders effizient trainiert werden. Denn die Bildmenge, die die künstliche Intelligenz zum Trainieren braucht, ist ohne Bildaugmentierung oft schwer zu beschaffen.

Gerhard, Dimas, wie seid ihr das Problem der Reherkennung angegangen?

Als erstes haben wir mit tatkräftiger Unterstützung unserer Werkstudierenden Christin Müller und Sebastian Kampen möglichst viele Bilder von Rehen gesammelt und damit eine Objekterkennung trainiert. Diese kennt man vielleicht schon von anderen Applikationen wie der Gesichts- oder Gestenerkennung in Handykameras. Mithilfe dieser Objekterkennung konnten wir alle Bilder aussortieren, auf denen keine Rehe zu sehen sind. Waren auf den Bildern Rehe zu sehen, haben wir sie ausgeschnitten. Das Ziel: es sollte möglichst viel Reh auf dem Bild zu sehen sein.

Was habt ihr dann mit den Bildern gemacht?

Als nächstes haben wir eine sogenannte semantische Segmentierung darauf ausgeführt. Dadurch kann der Hintergrund ausgeblendet werden, sodass zum Beispiel Bäume und Wiesen nicht mehr berücksichtigt werden.

Bildsegmentierung

Als Segmentierung wird ein KI-Verfahren bezeichnet, das in einem Originalbild ein Zielobjekt erkennt und dieses zu Weiterverarbeitungszwecken aus dem Bild isoliert.

Und mit diesen Bildern könnt ihr dann nach ähnlichen Bildern suchen?

Wenn man das Bild eines Rehes hat und aus einer Menge an weiteren Rehbildern diejenigen herausfinden möchte, die dasselbe Tier zeigen, werden für jedes Bild zunächst die Ausprägungen bestimmter Merkmale mithilfe eines KI-Algorithmus bestimmt. Diese Merkmalsausprägungen sind letzten Endes eine Liste von Zahlen, die in codierter Form angeben, wie genau die jeweilige Rehnase, das Rehohr, die Körperform usw. aussehen. Sind die Merkmalsausprägungen zweier Bilder einander besonders ähnlich, zeigen sie mit hoher Wahrscheinlichkeit dasselbe Rehindividuum.

 

Wir sind aber noch einen Schritt weitergegangen und haben versucht, auf den Bildern bestimmte Merkmale zu finden wie Nasen, oder Ohren. Diese eher abstrakten Merkmale konnten wir dann dazu nutzen, die gleichen Tiere auf anderen Bildern von anderen Kameras zu finden. Hier liegt schließlich die eigentliche Schwierigkeit der Aufgabe, da die Tiere zu unterschiedlichen Tag- und Nachtzeiten aufgenommen worden sein können.

Herausforderung: Bildqualität und -setting

Eine große Herausforderung des Projekts war, dass die Bilder in sehr unterschiedlichen Umgebungen und unterschiedlicher Qualität vorliegen.

Das müsst ihr uns ein bisschen genauer erklären. Wie findet ihr die Ähnlichkeit heraus?

Wir finden die Ähnlichkeit der Bilder heraus, indem wir ein spezielles Netzwerk trainieren. Dieses Netzwerk wird mit drei Bildern gefüttert. Zunächst brauchen wir ein „anchor“-Bild: Das ist das Reh, das es zu erkennen gilt. Zu diesem „anchor“-Bild werden je ein zweites Bild des gleichen Rehes gegeben, das wir als „positiv“ bezeichnen und ein drittes Bild eines ähnlichen, aber dennoch gut unterscheidbaren Rehes. Das bezeichnen wir als „negative“. Trainiert man ein solches Netz mit genügend Bildern, lernt das Netzwerk, das gleiche Reh auf unterschiedlichen Bildern wiederzuerkennen.

Auf diese Weise lassen sich also alle Bilder finden, die ein bestimmtes Reh zeigen. Aber was, wenn man stattdessen an der Gesamtzahl an Individuen auf allen Bildern interessiert ist? Lässt sich diese ebenfalls bestimmen?

Ja, das ist auf eine ganz ähnliche Weise möglich. Dafür werden zunächst die Ähnlichkeiten jedes einzelnen Bildes zu allen anderen Bildern bestimmt. Mithilfe dieser Ähnlichkeiten lassen sich die Bilder dann in Cluster einteilen. Man isoliert quasi die einzelnen Rehe in den Bildern. Innerhalb eines Clusters sind sich die Merkmale der Rehe auf den Bildern sehr ähnlich und zeigen vermutlich dasselbe Individuum. Die Bilder aus anderen Clustern zeigen dagegen Rehe mit stärker abweichenden Merkmalen. Die Anzahl an Clustern entspricht dann der Anzahl an Rehindividuen auf allen Bildern.

Ließe sich das Verfahren auch auf andere Tierarten anwenden?

Dieses Verfahren lässt sich prinzipiell auf die Individuen aller Arten anwenden, die visuell unterscheidbar sind. Wichtig ist dabei immer, dass die Qualität der Bilder die entscheidenden Merkmale auch erkennen lässt. Und es muss zunächst ein gewisser Aufwand in die Erstellung eines Datensatzes für das Training der KI-Algorithmen gesteckt werden. Hier kommt oft die Bildaugmentierung ins Spiel. Denn ein Algorithmus, der auf die Bestimmung der Ähnlichkeit von Rehindividuen hin optimiert wurde, kann nicht direkt für die Erkennung von, sagen wir mal, Waschbären verwendet werden.

Und gibt es schon Interessenten für eine solche Applikation?

Ja, die gibt es. Zum Beispiel die Universität Göttingen, der Tiergarten Nürnberg, der Alpenverein. Sie möchten mithilfe unserer künstlichen Intelligenz die manuellen Aufwände beim Sichten und Sortieren von Kamerabildern reduzieren – und damit schneller an Daten kommen, die für ihre Forschung relevant sind.

Gerhard, Dimas, vielen Dank für das Gespräch.