Definitionen durchsuchen :
Definition

Deep Learning

Deep Learning ist eine Methode der künstlichen Intelligenz (KI), die menschliches Lernen nachahmt und sich dabei an der Funktionsweise des Gehirns orientiert.

Das Verfahren ist inzwischen weit verbreitet und wird von großen IT-Unternehmen wie Google, Apple oder Facebook eingesetzt. Eines der wichtigsten Einsatzgebiete für Deep Learning ist das Erkennen von Dingen auf Bildern. Neben Bilderkennung wird das KI-Verfahren auch für die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP), Sprachübersetzung, medizinische Diagnostik, Börsenhandel und Netzwerksicherheit verwendet.

Deep Learning fällt unter den Oberbegriff Machine Learning (ML), womit die künstliche Generierung von Wissen aus Erfahrung gemeint ist. Ein Computer lernt aus Beispielen und kann diese nach Abschluss der Lernphase verallgemeinern. Im Bereich Machine Learning gibt es eine ganze Reihe unterschiedlicher Verfahren und Algorithmen. Während herkömmliche Algorithmen des maschinellen Lernens linear aufgebaut sind, sind Algorithmen für Deep Learning hierarchisch gegliedert - hin zu zunehmender Komplexität und Abstraktion.

Die mathematischen Prinzipien, die hinter Deep Learning stecken, sind relativ einfach, doch kombiniert mit großen Mengen an Trainingsdaten und schnellen Computern, die parallele Berechnungen machen können, gab es in den vergangenen Jahren enorme Fortschritte.

Beispiel: Was ist ein Hund?

Um Deep Learning zu verstehen, sollte man sich ein Kleinkind vorstellen, das das Wort Hund lernen soll. Mit dem Zeigen entsprechender realer Objekte und dem parallelen Aussprechen des Wortes, lernt das Kind, was ein Hund ist und was kein Hund ist. Die Eltern sagen zum Beispiel: „Ja, das ist ein Hund“ oder „Nein, das ist kein Hund“.

Wenn das Kleinkind im Verlauf weiter auf Objekte zeigt, erfährt es mit Hilfe von Rückmeldungen der Eltern immer genauer, welche Merkmale einen Hund ausmachen und welche nicht. Auf diese Weise baut das Kind, ohne es zu wissen, das Konzept Hund auf: Es lernt eine komplexe Abstraktion (das Konzept Hund), indem es eine Hierarchie konstruiert. Dabei wird jede Abstraktionsebene mit Hilfe des Wissens geschaffen, das auf der vorhergehenden Schicht der Hierarchie gewonnen wurde.

Computerprogramme, die Deep Learning nutzen, verwenden den gleichen Mechanismus. Jeder Algorithmus in der Hierarchie wendet eine nichtlineare Transformation auf seinen Input an und nutzt das, was er lernt, um als Ausgabe ein statistisches Modell zu erzeugen. Die Iterationen werden so lange fortgesetzt, bis der Output ein akzeptables Genauigkeitsniveau erreicht hat. Die Anzahl der Verarbeitungsschichten, die die Daten passieren müssen, ist das, was zur Bezeichnung deep für dieses Verfahren geführt hat.

Deep Learning ist schnell

Beim traditionellen maschinellen Lernen muss der Programmierer sehr spezifisch sein, wenn er dem Computer erklären will, nach welcher Art von Dingen er suchen sollte, bei der Entscheidung, ob ein Bild einen Hund enthält oder nicht. Dies ist ein langwieriger Prozess, der als Merkmalsextraktion bezeichnet wird.

Die Erfolgsrate dieses Verfahrens hängt ganz von den Fähigkeiten des Programmierers ab, eine exakte Menge von Merkmalen (Feature-Set) für das Konzept Hund zu definieren. Der Vorteil von Deep Learning ist, dass das Programm diese Merkmalsmenge selbst aufbaut. Dies ist nicht nur schneller, sondern in der Regel auch genauer.

Der Deep-Learning-Prozess gestaltet sich wie folgt: Zunächst werden dem Computerprogramm Trainingsdaten zur Verfügung gestellt, beispielsweise eine Reihe von Bildern, von denen ein Mensch jedes mit den Meta-Tags Hund oder Nicht-Hund markiert hat. Das Programm verwendet die Informationen, die es aus den Trainingsdaten erhält, um ein Feature-Set für Hunde zu erzeugen und ein Vorhersagemodell zu bauen.

Die Einheiten der ersten Ebene registrieren lediglich Helligkeitswerte der Pixel. Die nächste Ebene erkennt, dass einige der Pixel zu Kanten verbunden sind, woraufhin die darauffolgende zwischen horizontalen und vertikalen Linien unterscheidet – und so weiter, bis schließlich eine Ebene erreicht wird, in der Beine unterschieden werden können.

In einem weiteren Modell sagt der Computer vorher, dass alles in einem Bild, das vier Beine hat, ein Hund ist, bis er schließlich soweit ist, Hunde von Nicht-Hunden unterscheiden zu können. Bei jeder Iteration wird das Vorhersagemodell, das der Computer erstellt, immer komplexer und genauer.

Natürlich ist dem Programm die Bezeichnung vier Beine nicht bewusst im Sinne menschlichen Denkens. Der Rechner sucht einfach in den digitalen Daten nach Mustern. Weil dieser Prozess aber das menschliche Denken zumindest nachahmt, wird Deep Learning manchmal als „deep neural learning“ oder „deep neural networking“ bezeichnet.

Im Gegensatz zum Kleinkind, das Wochen oder sogar Monate braucht, um das Konzept Hund zu verstehen, kann sich ein Deep-Learning-Algorithmus rasend schnell durch Millionen von Bildern arbeiten und innerhalb von wenigen Minuten feststellen, welche Bilder Hunde enthalten und welche nicht.

Trainingsdaten und Rechenleistung

Um ein akzeptables Maß an Genauigkeit zu erreichen, benötigen Deep-Learning-Programme allerdings Zugriff auf immense Mengen von Trainingsdaten und brauchen eine starke Rechenleistung. In der Vergangenheit fehlten sowohl die nötigen Datenmengen als auch die Rechenleistung. Keines von beiden war für Programmierer bis zur Ära von Big Data und Cloud Computing leicht verfügbar. Heute wird Deep Learning oft auf Graphic Processing Units (GPU) umgesetzt und ist dadurch sogar günstiger als andere Verfahren des maschinellen Lernens.

Da Deep-Learning-Programmierung in der Lage ist, komplexe statistische Modelle direkt aus dem eigenen iterativen Output zu erzeugen, kann dieses Verfahren auch präzise Vorhersagemodelle für große Mengen an unstrukturierten und unmarkierten Daten erstellen. Dies ist im Zuge der weiteren Verbreitung des Internet der Dinge (IoT) von zentraler Bedeutung, da die meisten der Daten, die Mensch und Maschine erzeugen, unstrukturiert und nicht markiert sind.

Hier ist eine sehr einfache Darstellung, wie Deep Learning funktioniert. Dieses Video von der LuLu Art Group zeigt am Beispiel von bewegten Bilddaten den Output eines Deep-Learning-Programms nach dem ersten Training. In dem Video sieht man, was das Programm als Konzept Tanz prognostiziert:

Mit jeder Iteration wurde das prädiktive Modell des Programms komplexer und genauer:

Diese Definition wurde zuletzt im April 2018 aktualisiert

- GOOGLE-ANZEIGEN

SearchDataCenter.de

SearchEnterpriseSoftware.de

SearchNetworking.de

SearchSecurity.de

SearchStorage.de

Close