DiversityScanner – AI-based robotics assist with the discovery of small invertebrates

Biodiversity studies that analyse large numbers of specimens are being published at an unprecedented scale. The study objects, primarily insects, are often obtained using Malaise traps. The traps were invented by the Swedish entomologist Rene Malaise to collect sawflies, but they are very efficient for other insects, in particular flying insects like Diptera and Hymenoptera. Since the traps operate 24/7, they are able to collect enormous amounts of specimens ranging from hundreds to thousands of specimens during a collecting period of 1-2 weeks for a single trap. With multiple traps placed in a habitat to account for local variation, that operate for several seasons to account for temporal variation in insect diversity and abundance, a near-to-complete sample of the species diversity of insects at particular location can be obtained.

Soup in a soup – a typical Malaise trap sample contains thousands of insects, mainly Diptera and Hymenoptera. Stefan Schmidt – ZSM.

The analysis of organisms from Malaise trap samples primarily requires two major steps, the separation of individual specimens from bulk samples, containing thousands of often small-sized insects like tiny parasitoid wasps or flies and midges. A second step is their identification, i.e. the assignment to known species. Traditional procedures and techniques that try to cope with insects and other arthropods from Malaise trap samples suffered from the problem of scalability, and allowed only to utilize a small fraction of specimens (and therefore species). Any attempt to fully explore the diversity would be doomed by the sheer quantity of insects, even from only a single bulk sample. Apart from the labour required for processing, the vast majority of specimens in a sample, in particular megadiverse groups like Diptera Hymenoptera, cannot be assigned to a known species due to the severe lack of taxonomists. This is even the case for countries like Germany with a taxonomic history of over 200 years, and in certain groups of Diptera hundreds or even thousands of species still await discovery and documentation (link to article in German).

DNA barcoding for biodiversity discovery and monitoring

For the identification of unknown specimens of animals and for the discovery of unknown species, DNA barcoding has become the de-facto standard. And the method is scalable. The Centre for Biodiversity Genomics in Guelph, Canada, has been processing about 10 million specimens of over 700,000 species worldwide. A new global project, called BIOSCAN, aims at barcoding 10 million specimens and assembling barcode coverage for two million species. Other technological approaches set out to simplify the sequencing process by minimizing required lab equipment and costs, thus lowering the threshold for using DNA barcoding as the method of choice for species identification, discovery, and monitoring, requiring a minimum of resources and expertise.

While sequencing technology continues to advance at a fast pace, preparing specimens from bulk samples still poses a major obstacle in large-scale biodiversity projects that employ mass-collecting devices like Malaise traps. Attempts to circumvent the problem exist, namely metabarcoding, but the method has several drawbacks, including incomplete coverage due to primer bias and/or due to low DNA concentrations of rare species. 

DiversityScanner – automated sorting of smaller insects using artificial intelligence methods

Image of an darwin wasp (Hymenoptera: Ichneumonidae) with overlaid heatmap, Karlsruhe Institute of Technology – KIT

Sorting specimens from Malaise trap samples is extremely labour intensive and requires the expertise of trained taxonomists. Since this problem is still a key issue with any large-scale biodiversity project, entomologists and machine learning specialists teamed up to remedy the situation. The biodiversity researcher Rudolf Meier from the Museum für Naturkunde in Berlin and the group of Christian Pytuliak from the Karlsruhe Institute of Technology developed, in collaboration with entomologists from the Zoologische Staatssammlung München and the Sapienza University of Rome, developed ‘DiversitScanner’, a robot for the automated sorting of small insects into different classes using artificial intelligence. 

The DiversityScanner is able to pick individual insects from samples and photograph them. A computer then uses a type of artificial intelligence known as machine learning to compare the wings, antennae, legs, and other characters of each individual to known specimens. The warmer the color, e.g. red, the more important the body parts are for the identification. In a further step, each insect is individually transferred to a plate with 95 wells. The samples can then be genetically analyzed, whereby a “DNA barcode” is generated for each insect, which is then compared with known species in a public reference database.

Parasitoid wasp of the family Diapriidae (Hymenoptera). Original image left and same image right with heatmap overlay. Karlsruhe Institute of Technology – KIT

The accuracy of the robot currently is around 91%, i.e. about 9 out of 10 insects are correctly classified. According to the researchers, who recently published their study on the preprint server bioRxiv, the accuracy can be improved if more samples are available for training the robot. The diversity scanner software and 3D printing plans have been made publicly available.


A sorting lab of the future? Sorting and identifying specimens from Malaise trap samples is laborious and time consuming, a task that can be automated with the DiversityScanner. Karlsruhe Institute of Technology – KIT.

One major advantage of the DiversityScanner is its scalability. It therefore addresses one of the major problems of biodiversity studies that deal with large quantities of specimens and species, including many insects that cannot be assigned to any known species, either because of lack of taxonomic expertise or because specimens belong to species that are still awaiting discovery. Identification of organisms through DNA barcoding has become quick, reliable and inexpensive. The DiversityScanner holds great promise for expediting the task of sorting at a similar scale.

German Barcode of Life – GBOL III: Dark Taxa

Setting up Malaise traps in the Bavarian alps as part of ongoing DNA barcoding projects at the ZSM. Stefan Schmidt – ZSM.

Although great progress has been made in assembling the genetic reference database for German animals, many species, in particular insects, are not yet included in the genetic reference database. The new project ‘GBOL: Dark Taxa’, aims to remedy the situation and focuses on unknown species, so-called ‘dark taxa’, including several groups of megadiverse and little known groups of insects of Diptera and parasitoid Hymenoptera. The three-year project that is supported by the Federal Ministry of Education and Research (BMBF), is devoted to the discovery of unknown species, so-called “dark taxa”, in our native fauna using an integrative taxonomic approach, including DNA barcoding.

A species of Mymar that belongs to a group of tiny parasitoids wasps known as fairy flies (Mymaridae). Females of the species place their eggs in eggs of other insects. Stefan Schmidt – ZSM.

GBOL III aims at contributing to the BIOSCAN initiative of the Centre for Biodiversity at a global and a national scale by laying the foundations for a large-scale biomonitoring system to record the biodiversity of our planet.  In times of rising temperatures, increasing weather extremes and receding ice, and unprecedented loss of biodiversity, new technologies like the DiversityScanner are urgently needed to overcome the obstacles any research encounters when trying to record and monitor the species biodiversity on earth, most of which is still little known or even unknown to the present day.


Wuehrl L, Pylatiuk C, Giersch M, Lapp F, von Rintelen T, Balke M, Schmidt S, Cerretti P, Meier R (2021) DiversityScanner: Robotic discovery of small invertebrates with machine learning methods. bioRxiv: 2021.05.17.444523. YouTube:

Science News (4 June 2921): Artificial intelligence could help biologists classify the world’s tiny creatures. doi:10.1126/science.abj8374

Neue DNA-Datenbank der Wasserinsekten verbessert Umweltüberwachung

Im Wasser lebende Insekten spielen eine große Rolle als Zeigerarten bei der Beurteilung der Gewässerqualiät von Bächen, Flüssen und Seen. Die Forscher der Zoologischen Staatssammlung München (SNSB-ZSM) veröffentlichten nun eine genetische Arten-Datenbank der Eintags-, Köcher- und Steinfliegen in Deutschland, die das Umweltmonitoring und die Beurteilung von Ökosystemen erleichtern soll.

Eintagsfliege Rhithrogena germanica (Foto: SNSB-ZSM).

Wasserinsekten sind vor allem bei der Bestimmung der Gewässergüte von Fließ- sowie Standgewässern von enormer Bedeutung. Viele Arten speziell der Eintags-, Köcher- und Steinfliegen sind so optimal an ihre Lebensräume angepasst, dass sie äußerst sensibel auf kleinste Veränderungen ihrer Umwelt durch beispielsweise Verschmutzung oder auch klimatische Abweichungen reagieren. Die Reaktion der Insektenfauna auf veränderte Standortbedingungen werden heute oft zum Zwecke des Umweltmonitoring genutzt. Ökologen können durch die Erfassung der vorkommenden Arten und der Artgemeinschaften innerhalb eines Biotops unter anderem Rückschlüsse auf Wasser- oder Bodenqualität ziehen und somit dessen ökologisches Gleichgewicht bewerten.

Leider gestaltet sich die Artbestimmung bei diesen sogenannten Bioindikator- oder Zeigerarten in der Praxis oft sehr schwierig. Vor allem die Larven sind selbst für Experten anhand ihrer äußeren Merkmale kaum zu unterscheiden. Artbestimmungen sind somit meist zeitaufwändig, teuer und oft fehlerhaft.

Forscher der Zoologischen Staatssammlung München geben Ökologen und Umweltgutachtern mit ihrer nun veröffentlichten Gen-Datenbank für Eintags-, Köcher- und Steinfliegen ein wichtiges Werkzeug an die Hand. Im Rahmen ihrer DNA-Barcoding Projekte haben die ZSM Wissenschaftler die genetischen Fingerabdrücke – sogenannte DNA-Barcodes – von über 2600 Exemplaren der Wasserinsekten aus den drei Gruppen erfasst. Diese konnten insgesamt 363 verschiedenen Arten zugeordnet werden, was rund zwei Dritteln aller in Deutschland vorkommenden Arten entspricht. Diese genetische ‚Bibliothek des Lebens‘ dient nun als solide Referenz für zukünftige Artbestimmungen und gibt Ökologen eine schnellere und zuverlässigere Methode zur Identifikation von Indikatorarten an die Hand.

„Die neu von uns aufgestellte DNA-Datenbank beinhaltet alle für ökologische Fragestellungen relevanten Arten“, so Jérôme Morinière, taxonomischer Koordinator an der ZSM, „unser Ziel ist der weitere Ausbau unserer „Bibliothek des Lebens“ und deren Nutzbarkeit für Prozesse im Umwelt- oder Biodiversitätsmonitoring.“

Bedrohte Artenvielfalt kennt keine politischen Grenzen: Internationales Forscherteam erfasst DNA-Barcodes europäischer Heuschrecken

Gefleckte Schnarrschrecke (Bryodemella tuberculata). Foto: O. Hawlitschek.

Wissenschaftler aus Deutschland, Österreich und der Schweiz haben in einem Kooperationsprojekt gemeinsam fast 80% der mitteleuropäischen Heuschrecken (Orthoptera) genetisch erfasst und stellen deren Gencodes in einer frei zugänglichen Online-Bibliothek zur Verfügung. Ihre Ergebnisse veröffentlichten die Forscher Anfang dieser Woche.

Zoologen aus drei Ländern und vier großen DNA-Barcoding-Initiativen haben zum weitreichenden Erfolg des Projektes beigetragen: Im Rahmen der „Barcode of Life“-Projekte aus Deutschland (BFB, GBOL), Österreich (ABOL) und der Schweiz (SwissBOL) wurden rund 750 genetische Codes, sogenannte DNA-Barcodes, von Heuschrecken erfasst, die über 120 verschiedenen Arten zugeordnet werden konnten. Dies entspricht fast 80% aller Arten in Mitteleuropa, und sogar annähernd 100% der deutschen Arten. „Für die Erforschung der Biodiversität sind solch groß angelegte Projekte unerlässlich. Nur so können wir die Artenvielfalt effektiv erfassen, und zur Erhaltung beitragen“, so der Projektkoordinator Oliver Hawlitschek von der Zoologischen Staatssammlung München. Allen DNA-Barcoding-Projekten ist eines gemeinsam: Sie verfolgen das ehrgeizige Ziel, die genetischen Fingerabdrücke aller Tierarten der Erde zu erfassen – die globale Online-Datenbank umfasst inzwischen über 160.000 Arten. Mehr Informationen zum Projekt gibt es auf „Der genetische Barcode oder Fingerabdruck ist auch eine wichtige Basis für die evolutionsbiologische und ökologische Grundlagenforschung“, ergänzt Gerlind Lehmann, eine am Projekt beteiligte Wissenschaftlerin von der Humboldt Universität zu Berlin.

Heuschrecken sind Laien vor allem durch die sprichwörtlichen Heuschreckenplagen bekannt. Noch bis zur Mitte des 20. Jahrhunderts traten solche Heuschreckenplagen auch in Bayern auf. Heute sind jedoch viele der Arten, die Plagen verursachten, sehr selten geworden, z.B. die Europäische Wanderheuschrecke, die Italienische Schönschrecke oder die Wanstschrecke. Inzwischen sind Heuschrecken in Mitteleuropa auch nicht mehr als Schadinsekten anzusehen. Stattdessen machen sich viele Heuschreckenarten nützlich, indem sie Schadinsekten wie z.B. Blattläuse vertilgen – denn keineswegs  alle Arten sind Vegetarier – oder anderen schutzwürdigen Arten wie dem Weißstorch als Nahrung dienen. Heuschrecken reagieren sehr sensibel auf Veränderungen ihres Lebensraumes. Die Wissenschaftler machen für den Artenschwund vor allem die heutige Kulturlandnutzung verantwortlich: Immer  intensivere Landwirtschaft nimmt den Heuschrecken ihre Lebensräume, vor allem artenreiche Wiesen und Weiden. Auch die Individuenzahlen von Allerweltsarten haben drastisch abgenommen. Die erst kürzlich vom Bayerischen Landesamt für Umwelt aktualisierte Rote Liste der gefährdeten Arten bewertet bereits 45% der bayerischen Heuschreckenarten als bestandsgefährdet. Sechs Arten sind zumindest in Bayern schon vollständig ausgestorben. „Gerade Heuschrecken sind für den Naturschutz von besonderer Relevanz“, ergänzt Nikola Szucsich vom österreichischen Barcoding-Projekt ABOL, „denn sie sind typisch für selten gewordene Lebensräume, die auch viele andere bedrohte Arten beherbergen.“

Publikation: Hawlitschek, O., Morinière, J., Lehmann, G.U.C., Lehmann, A.W., Kropf, M., Dunz, A., Glaw, F., Detcharoen, M., Schmidt, S., Hausmann, A., Szucsich, N.U., Caetano-Wyler, S.A., Haszprunar, G. (2016): DNA barcoding of crickets, katydids, and grasshoppers (Orthoptera) from Central Europe with focus on Austria, Germany, and Switzerland. Molecular Ecology Resources. doi: 10.1111/1755-0998.12638

Schädlingen in die Gene geschaut: Über 1000 Pflanzenwespen-Arten genetisch erfasst

Corynis obscura F. in Geranium flower

Keulhornblattwespe Corynis obscura in Storchschnabelblüte (Foto: S. Schmidt)

Die Zoologische Staatssammlung München (SNSB-ZSM) und das Senckenberg Deutsche Entomologische Institut (SDEI) haben einen großen gemeinsamen wissenschaftlichen Erfolg zu verzeichnen. Die Wissenschaftler entschlüsselten nun den genetischen Code von über 1000 Pflanzenwespen-Arten (Symphyten) und stellen diesen in einer Online-DNA-Bibliothek frei zur Verfügung. Ihre Ergebnisse stellen sie diese Woche in einer Publikation vor.

Sie sind zwar nicht so bekannt wie ihre oft schwarz-gelb gefärbten Verwandten aus der Gruppe der ‚echten‘ Wespen, aber zumindest bei Land- und Forstwirten ebenso unbeliebt: Die Pflanzenwespen oder wissenschaftlich Symphyta. Deren gefräßige Larven ernähren sich bis auf wenige Ausnahmen ausschließlich von Pflanzen und einige Arten können in der Land- und Forstwirtschaft sowie im Zierpflanzenanbau großen Schaden anrichten. Anhand der nun entschlüsselten Gencodes, die in einer frei zugänglichen Internet-Bibliothek zur Verfügung stehen, können die Schädlinge in Zukunft rasch und sicher und vor allem bereits in einem frühen Entwicklungsstadium als Larven selbst durch Nicht-Spezialisten identifiziert werden. Die DNA-Datensammlung ist damit auch von großem wirtschaftlichem Nutzen bei der Schädlingsbekämpfung.

Die genetische Erfassung der Pflanzenwespen erfolgte im Rahmen eines Kooperationsprojektes der Zoologischen Staatssammlung München und des Senckenberg Deutschen Entomologischen Instituts in Müncheberg. Insgesamt lagern in diesen beiden Sammlungen weit über 100.000 präparierte Pflanzenwespen. Seit 2010 werteten die Symphyten-Forscher der beiden Institute 5360 Individuen aus, welche 1030 verschiedenen Arten zugeordnet werden konnten, darunter etwa 300 außereuropäische Formen.  „Die Erfassung dieser großen Artenzahl war nur durch die umfangreichen Sammlungsbestände der beiden beteiligten Institutionen und die tatkräftige Unterstützung durch zahlreiche externe Fachkollegen möglich“, freut sich Stefan Schmidt, Sektionsleiter an der ZSM. Jetzt liegen Daten für etwa 600 deutsche Arten vor, das sind 75% der heimischen Pflanzenwespenfauna. „Das Projekt ist ein großer wissenschaftlicher Erfolg und ein Meilenstein auf dem Weg zu einer umfassenden Genbibliothek der Pflanzenwespen, der in Müncheberg weiter beschritten wird“, so Andreas Taeger vom SDEI.

Die Pflanzen- oder auch Sägewespen sind eine von Taxonomen bislang eher vernachlässigte Insektengruppe innerhalb der sogenannten Hautflügler. Grund hierfür ist die oft schwierige Bestimmung der Tiere anhand ihrer äußeren Merkmale, da sich viele Arten auch bei genauerem Hinsehen kaum voneinander unterscheiden oder die Merkmale innerhalb einer Art sehr variabel sind. Für solche Gruppen eignet sich die DNA-Barcoding-Methode zur Artbestimmung ganz besonders. Die genetischen Daten bilden zudem eine wichtige Grundlage für weiterführende Untersuchungen zur Klärung der Taxonomie und Systematik dieser Gruppe. Die Gensequenzierung erfolgte im Rahmen der Projekte “Barcoding Fauna Bavarica” und “German Barcode of Life”. In diesen Projekten erfassen die Münchener Forscher den Gencode aller bayerischen, beziehungsweise deutschen Tierarten in einer Online-Bibliothek und stellen ihn damit für Fachleute zur Verfügung.

Publikation: Schmidt, S., Taeger, A., Morinière, J., Liston, A., Blank, S. M., Kramp, K., Kraus, M., Schmidt, O., Heibo, E., Prous, M., Nyman, T., Malm, T. and Stahlhut, J. (2016), Identification of sawflies and horntails (Hymenoptera, ‘Symphyta’) through DNA barcodes: successes and caveats. Mol Ecol Resour. doi:10.1111/1755-0998.12614