Neuronale Netze sind ein Konzept, das im Kontext Maschinellen Lernens zur Verwirklichung Künstlicher Intelligenz verwendet wird. Künstliche Intelligenz bedeutet, intelligentes Verhalten mit Computern zu verwirklichen. Dazu gibt es unterschiedliche Ansätze, die sich unter anderem dadurch unterscheiden, ob das zu verwirklichende Verhalten (zum Beispiel durch Regelsysteme) vorprogrammiert oder (zum Beispiel durch Künstliche Neuronale Netze) erlernt wird.
Bei vorprogrammiertem Verhalten, muss der Algorithmus, der intelligentes Verhalten hervorbringen soll, vorab programmiert werden, was ein tiefes Verständnis des zu verwirklichenden Verhaltens erfordert. Maschinelles Lernen hingegen ist ein Ansatz, der ohne solches Verständnis auskommt. Statt eines Algorithmus, der konkretes Verhalten hervorbringt, wird dabei ein Algorithmus programmiert, der anhand von Beispielen lernt, sich diesen Beispielen entsprechend zu verhalten. Es besteht die Hoffnung, dass es dadurch möglich wird, ganz unterschiedlichen Situationen angemessenes Verhalten mit dem selben Algorithmus zu erlernen, wobei sich das unterschiedliche Verhalten allein durch Training basierend auf unterschiedlichen Beispielen ergibt.
Da beim Maschinellen Lernen kein tiefes Verständnis des zu verwirklichenden Verhaltens erforderlich ist, bietet es die Möglichkeit, die Fähigkeiten des Menschen nicht nur nachzuahmen sondern sogar zu übertreffen. Da diese Art, Verhalten zu verwirklichen nicht auf Regeln oder logischen Schlussfolgerungen basiert, vergleichen einige es mit Intuition, für die wir auch kein tiefes Verständnis haben.
Künstliche Neuronale Netze wurden in Anlehnung an eine Vorstellung der Arbeitsweise natürlicher neuronaler Netze (Gehirne) entwickelt. Sie bestehen aus (künstlichen) Neuronen, die auf mathematisch einfach zu beschreibende Weise Eingabesignale in Ausgabesignale transformieren. Durch Kombination vieler künstlicher Neuronen, deren Ausgabesignale wieder Eingabesignale für andere Neuronen sind, lassen sich komplexere Funktionen implementieren, als das mit einzelnen Neuronen möglich wäre.
Üblicherweise bestehen Künstliche Neuronale Netze aus mehreren sogenannten Schichten, deren Neuronen mit allen anderen Neuronen benachbarter Schichten verbunden sind, da für eine solche Struktur mathematische Methoden existieren, einen Lernprozess zu verwirklichen. Beim sogenannten Deep Learning werden Künstliche Neuronale Netze mit sehr vielen Schichten verwendet, die nach und nach abstraktere Merkmale der Eingabedaten zu erkennen lernen. Erst neuerdings ist die Rechenleistung von Computern ausreichend, um Neuronale Netze mit vielen großen Schichten zu trainieren. Auch die Erfindung des Internet begünstigt die Entwicklung immer komplexerer Neuronaler Netze, da für das Training benötigte große Datenmengen in größerer Zahl verfügbar sind.