Das maschinelle Lernen ist ein schnell wachsendes Gebiet und wird für eine Vielzahl von Aufgaben eingesetzt, darunter auch für die Gesichtserkennung. Die Technologie der Gesichtserkennung ist heutzutage allgegenwärtig, auch wenn die Menschen sich dessen nicht so bewusst sind. Viele Menschen nutzen die Gesichtserkennungstechnologien, um sich mühelos bei ihren Smartphones anzumelden. Mit fortschrittlicher Gesichtserkennungssoftware kann Überwachungspersonal kriminelle Gesichter aus Menschenmengen herausfiltern. Was weniger bekannt ist, sind die Technik und die Verfahren, die hinter der Gesichtserkennung stehen. Dieser Artikel gibt einen Einblick in die Bereiche des maschinellen Lernens und erklärt, wie es die Technologien zur Gesichtserkennung, wie wir sie in unserem Produkt PXL Ident verwenden, ermöglicht hat.
Was ist maschinelles Lernen?
Maschinelles Lernen ist ein Teilgebiet der künstlichen Intelligenz, das sich mit dem Design und der Entwicklung von Algorithmen beschäftigt. Es ist ein Prozess, bei dem Computern beigebracht wird, aus Daten zu lernen und beinhaltet die Entwicklung von Algorithmen, die automatisch Muster in Daten erkennen und dann auf der Grundlage dieser Muster Vorhersagen machen können. Dies steht im Gegensatz zur traditionellen Programmierung, bei welcher der Programmierer einen Code schreibt, welcher der Maschine ausdrücklich sagt, was sie tun soll.
Algorithmen für maschinelles Lernen lernen aus Daten, um Probleme zu lösen, die zu komplex sind, um sie mit herkömmlicher Programmierung zu lösen.
Deep Learning ist ein Teilbereich des maschinellen Lernens, der sich aus der gleichzeitigen Ausführung mehrerer Schichten von Algorithmen des maschinellen Lernens ergibt. Hinweis: Die Begriffe maschinelles Lernen und Deep Learning werden häufig synonym verwendet. Die meisten maschinellen Lernverfahren werden heute auf der Ebene des Deep Learning konzipiert.
Wie maschinelles Lernen heute eingesetzt wird
Das maschinelle Lernen wächst mit zahlreichen Anwendungen in Bereichen wie Computer Vision, Verarbeitung natürlicher Sprache und prädiktive Analysen. Wahrscheinlich nutzen Sie in Ihrem Alltag schon mehrere Produkte oder Dienstleistungen, die Technologien des maschinellen Lernens einsetzen, denn zunehmend mehr Unternehmen unterschiedlicher Branchen verwenden bereits maschinelles Lernen.
Netflix zum Beispiel nutzt maschinelles Lernen auf verschiedene Weise. Eine Form ist ihr Empfehlungssystem. Diese liefert Ihnen maßgeschneiderte Vorschläge, was Sie als Nächstes sehen sollten. Es stützt sich auf Algorithmen, die Ihre Sehgewohnheiten, Ihre Bewertungen und die Beliebtheit von Netflix berücksichtigen. Eine andere Form des Einsatzes von maschinellen Lernen ist, dass das Unternehmen von Anfang an in mehrere Staffeln neuer Sendungen investiert hat, bei denen es aufgrund der Vorhersagen der Algorithmen sicher war, dass sie ein Erfolg werden würden.Auch andere Streaming Dienste und soziale Medien stützen sich stark auf Algorithmen des maschinellen Lernens, um Inhalte zu liefern, die den Vorlieben der Nutzer entsprechen. Und auch Online-Einkaufsportale wie Amazon setzen Algorithmen des maschinellen Lernens ein, um auf der Grundlage von früheren Suchanfragen andere Dinge zu empfehlen, die Nutzer vielleicht kaufen möchten.
Anwendungsfälle wie die auf maschinellem Lernen basierende Gesichtserkennung werden weniger häufig als die genannten Beispiele verwendet. Konzentrieren wir uns also jetzt darauf.
Was ist Gesichtserkennung?
Die Gesichtserkennung ist eine biometrische Identifizierungstechnik, die einzigartige Merkmale des Gesichts einer Person nutzt, um sie zu identifizieren. Bei den meisten Gesichtserkennungssystemen wird der Gesichtsabdruck mit einer Datenbank bekannter Gesichter verglichen. Wenn es eine Übereinstimmung gibt, kann das System die Person identifizieren. Wenn der Gesichtsabdruck jedoch nicht in der Datenbank enthalten ist, kann das System die Person nicht identifizieren. Technologien zur Gesichtserkennung werden häufig zu Sicherheitszwecken eingesetzt, etwa um Kriminelle zu identifizieren oder Identitätsdiebstahl zu verhindern. Sie können auch für alltägliche Aufgaben eingesetzt werden, z. B. um ein verlorenes Kind in einer Menschenmenge zu finden oder VIPs bei einer Veranstaltung zu identifizieren. Einige Gesichtserkennungssysteme sind mit künstlicher Intelligenz ausgestattet, die lernen kann, Personen zu identifizieren, auch wenn sich ihr Aussehen verändert hat, z. B. wenn sie sich einen Bart wachsen lassen oder an Gewicht zugelegt haben.
Wie maschinelles Lernen in Technologien zur Gesichtserkennung Eingesetzt wird
Der gängigste Algorithmus des maschinellen Lernens, der für die Gesichtserkennung verwendet wird, ist ein Deep Learning Convolutional Neural Network (CNN). CNNs sind eine Art künstliches neuronales Netz, das sich gut für Bildklassifizierung Aufgaben eignet.
CNNs lernen, Merkmale aus Bildern herauszufiltern und diese Merkmale zur Klassifizierung der Bilder in verschiedenen Kategorien zu verwenden. Die Tiefe eines CNN ist für die Gesichtserkennung wichtig, weil es dem CNN ermöglicht, komplexere Gesichtsmerkmale zu lernen.
Ein CNN mit geringer Tiefe kann zum Beispiel nur einfache Gesichtsmerkmale wie die Form der Nase oder die Position der Augen erkennen. Ein tiefes bzw. stärkeres CNN hingegen kann lernen, komplexere Gesichtsmerkmale zu erkennen, wie z. B. die Beschaffenheit der Haut oder die Form des Kinns. Sobald ein CNN mit einem Datensatz von Geschichtsbildern trainiert wurde, kann er dazu verwendet werden, Gesichter in neuen Bildern zu erkennen. Dieser Vorgang wird als Gesichtserkennung bezeichnet.
Die 3 Schritte der Gesichtserkennung
Die Gesichtserkennung ist in drei Schritte unterteilt:
- Ausrichtung und Erkennung von Gesichtern - Der erste Schritt besteht darin, Gesichter im Sichtfeld zu erkennen. Dies kann mit Hilfe eines Haar-Kaskaden-Klassifikators erfolgen, einem Algorithmus für maschinelles Lernen, der auf positiven und negativen Bildern trainiert wird. Die Maschine muss das Gesicht in einem Bild oder Video lokalisieren. Mittlerweile haben die meisten Kameras eine eingebaute Gesichtserkennungsfunktion. Diese wird z.B. auch von Snapchat, Facebook und anderen Social-Media-Plattformen verwendet, um den Nutzern die Möglichkeit zu geben, Fotos und Videos Effekte hinzuzufügen.
Eine Herausforderung im Zusammenhang mit der Gesichtserkennung besteht darin, dass das Gesicht oft nicht frontal in die Kamera gerichtet ist. Gesichter, die vom Brennpunkt abgewandt sind, sehen für einen Computer völlig anders aus. Es ist ein weiterer Algorithmus erforderlich, um das Gesicht zu normalisieren, damit es mit den Gesichtern in der Datenbank übereinstimmt. Eine Möglichkeit, dies zu erreichen, ist die Verwendung mehrerer allgemeiner Gesichtspunkte, wie z.B. die Unterseite des Kinns, die Oberseite der Nase, die Außenseiten der Augen, verschiedene Punkte um die Augen und den Mund herum, usw. Ein Algorithmus für maschinelles Lernen muss also darauf trainiert werden, diese Punkte auf einem beliebigen Gesicht zu finden und das Gesicht dann in die Mitte zu drehen. - Messung und Extraktion von Merkmalen - Sobald Gesichter ausgerichtet und erkannt wurden, besteht der nächste Schritt darin, Merkmale aus ihnen zu extrahieren. An dieser Stelle kommt das Convolutional Neural Network (CNN) ins Spiel. Ein CNN ist in der Lage, hochrangige Merkmale aus einem Bild zu extrahieren, die dann zur Identifizierung von Gesichtern in einer Datenbank verwendet werden.
- Gesichtserkennung - Der letzte Schritt besteht darin, die extrahierten Merkmale mit Gesichtern in einer Datenbank abzugleichen. Das geschieht in der Regel mithilfe einer euklidischen Distanzmetrik, die die Ähnlichkeit zwischen zwei Vektoren misst.
Wie PXL Vision Gesichtserkennung einsetzt
In unseren IDV-Lösungen verwenden wir Technologien des maschinellen Lernens zur Gesichtserkennung. Unsere leistungsstarken Machine-Learning-Systeme werden ständig verbessert und weiter trainiert. Dies ermöglicht es, eine vollständige Identitätsüberprüfung in nur 30 Sekunden durchzuführen, während die Gesichtserkennung selbst nur wenige Sekunden dauert.