Was ist Computer Vision?
Computer Vision ist eine Art von KI, die Computer darin trainiert, menschliches Sehen nachzuempfinden, dem Gesehenen einen Sinn zu geben und basierend auf der so verarbeiteten und analysierten Information zu agieren. Unternehmen, die Computer Vision einsetzen, können vielfältige geschäftliche Vorteile erzielen, wie etwa optimierte Prozesse, erhöhte geschäftliche Leistung, ein verbessertes Kundenerlebnis und eine Differenzierung von Wettbewerbern in ihrem Markt.
Computer Vision wird häufig für Aufgaben genutzt, die zeitaufwendig, fehleranfällig oder für Menschen fast unmöglich im vergleichbaren Umfang zu bewältigen sind, wie z. B. die Erkennung und Klassifizierung von Defekten und Anomalien, Überwachung des Maschinenzustands, automatisierte medizinische Bildgebungsanalyse und Erkennung von Krankheiten. Derartige Aufgaben erfordern von Unternehmen und Organisationen die Überwachung von Betriebsvorgängen, Prozessen oder anderen Aspekten des Geschäfts unter Berücksichtigung mehrerer Touchpoints, was eine enorme Menge an gesammelten visuellen Daten erzeugt, aus denen Erkenntnisse oft nahezu in Echtzeit gewonnen werden müssen und auf die reagiert werden muss.
Wie Computer Vision eingesetzt wird
Computer-Vision-Systeme verwenden maschinelles Lernen und Deep-Learning-Modelle, um das System darin zu trainieren, Aspekte eines Bildes oder Videos zu erkennen und daraus Vorhersagen zu treffen. Es gibt folgende Arten von Computer-Vision-Modellen:
- Bildklassifizierung für die Untersuchung eines Bildes und seine Zuordnung zu einem Klassen-Label basierend auf dem Inhalt. So kann ein Bildklassifizierungsmodell beispielsweise verwendet werden, um zu bestimmen, welche Bilder einen Hund, eine Katze oder einen aufgebrachten Kunden enthalten.
- Bildsegmentierung zur Erkennung von Objekten und ihrer Herauslösung aus dem Hintergrund, wie etwa bei der Isolierung eines Tumors aus dem umgebenden Hirngewebe in Röntgenbildern.
- Objekterkennung für das Scannen von Bildern oder Videos und das Auffinden von Zielobjekten. Modelle für die Objekterkennung markieren im Allgemeinen mehrere Objekte gleichzeitig und können zum Beispiel für die Identifizierung von Artikeln in Regalen zwecks Verbesserung der Bestandsverwaltung oder zur Erkennung von Anomalien in einer Produktionslinie verwendet werden.
- Objektverfolgung für die Verfolgung von Bewegungen erkannter Objekte bei deren Fortbewegung in einer Umgebung. Als Beispiel kann die Objektverfolgung beim autonomen Fahren eingesetzt werden, um Fußgänger auf Gehwegen oder beim Überqueren der Straße zu verfolgen.
- Extraktion von Merkmalen zur Isolierung nützlicher Merkmale in einem Bild oder Video und deren Weitergabe an einen zweiten KI-Algorithmus, der zum Beispiel Bilder sucht und abgleicht. Die Extraktion von Merkmalen kann beispielsweise verwendet werden, um die Verkehrsüberwachung und die Erkennung von Vorfällen zu automatisieren.
- Optische Zeichenerkennung (OCR) für die Extraktion von Text aus einem Bild und die Umwandlung in ein Format, das maschinenlesbar ist. Dies wird häufig im Bankwesen und in der Gesundheitsversorgung verwendet, um wichtige Dokumente und Patientenakten zu verarbeiten.
Computer-Vision-Anwendungen in verschiedenen Branchen
Computer Vision macht eine Reihe neuer Anwendungsfälle möglich und hilft Firmen aus verschiedensten Branchen, Probleme aus der Praxis zu lösen, wie z. B. die Reduzierung von Betriebskosten, die Automatisierung von Geschäftsprozessen und die Entwicklung neuer Dienste oder Einnahmequellen. Im Folgenden werden die wichtigsten Branchen, die Computer Vision einsetzen, behandelt und erläutert, auf welche beeindruckende Weise sie diese Technik anwenden.
Industrieautomation und Fertigung
Hersteller nutzen Computer Vision für die Automation, was dazu beiträgt, Produktionsprozesse effizienter zu gestalten, menschliche Fehler zu reduzieren, die Sicherheit der Mitarbeiter zu verbessern und einen höheren Ausstoß bei geringeren Kosten zu erzielen. Dies sind häufige Anwendungen von Computer Vision in der Fertigung:
- Automatisierte Produktprüfung: Visuelle Produktprüfungen sind für die Qualitätskontrolle unerlässlich. Durch die Automatisierung der optischen Prüfung mit Kameras in Produktionslinien, KI-Modellen für die Fehlerklassifizierung und die Erkennung von Anomalien sowie Edge-Computing können Hersteller die Genauigkeit und Schnelligkeit der Qualitätssicherung verbessern.
- Sicherheitsüberwachung: Computer Vision kann zur Überwachung von Produktionsstätten dienen, um für die Sicherheit der Mitarbeiter zu sorgen. So kann z. B. eine Analyse von Echtzeit-Videostreams dazu beitragen, Unfälle oder Stürze oder den Zutritt zu gesperrten, gefährlichen Bereichen zu erkennen und das Personal zu alarmieren.
Gesundheitswesen
Von der Gesundheitsvorsorge bis zur Planung von Krebsbehandlungen wird Computer Vision von medizinischen Einrichtungen auf verschiedene Weise eingesetzt, um Behandlungsergebnisse zu verbessern, die Genauigkeit zu erhöhen, die Erkennung von Krankheiten zu beschleunigen usw. Beispiele dafür, wie Computer Vision im medizinischen Bereich angewendet wird, sind:
- Medizinische Bildgebung: Die Ausstattung von CT-Scannern, Röntgensystemen, Endoskopiekameras und anderer medizinischer Bildgebungstechnik mit Computer-Vision-Systemen kann helfen, enorme Datenmengen schnell zu verarbeiten, Abläufe zu optimieren und eine genaue und effiziente Bildauswertung zu ermöglichen. In der digitalen Pathologie kommt Deep-Learning-Technik als Unterstützung bei der Digitalisierung ganzer Objektträger (Whole Slide Imaging, WSI) zur Anwendung.
- Patientenfernüberwachung: Mit Computer-Vision-Anwendungen ausgestattete Kameras und Sensoren können verwendet werden, um Daten über die Bewegung von Patienten, wie etwa die Änderung der Position von Sensoren oder des Körpers, zu erfassen und zu analysieren, Abweichungen von festgelegten Normen zu erkennen und Mitglieder des Pflegeteams auf mögliche dringende Maßnahmen hinzuweisen.
Einzelhandel
Angefangen bei der Erkenntnis, wo Produkte platziert werden sollen oder welches der beste Zeitpunkt für das Auffüllen von Beständen ist, bis zur Nachverfolgung des Kundenverhaltens in den Geschäften kann Computer Vision Einzelhändlern dabei helfen, nutzbringende Einblicke in ihre Abläufe zu gewinnen, um fundiertere geschäftliche Entscheidungen zu treffen. Dies sind Anwendungen von Computer Vision im Einzelhandel:
- Schadenverhütung: Computer-Vision-Modelle können Daten von vorhandenen Kameras in Geschäften oder Selbstbedienungskassen analysieren, um verdächtiges Verhalten zu erkennen und in Echtzeit Warnungen an Manager zu senden, damit sie eingreifen und Betrug verhindern können.
- Berührungsfreie Selbstbedienungs-Kassenterminals: Einzelhändler, die die Effizienz steigern und das Kundenerlebnis verbessern möchten, können 3D-Smart-Scan-Technik und Computer-Vision-Modelle nutzen, um Lebensmittel ohne Barcode zu erfassen und zu erkennen, was eine schnelle und bequeme Kassenabfertigung mit minimalem Eingriff seitens des Personals ermöglicht.
Smart Cities
Die Smart-City-Technologie kann helfen, Videodaten von Verkehrskameras zu sammeln, damit die Stadtverwaltung fundiertere betriebliche Entscheidungen treffen kann, um die Sicherheit, Mobilität und Lebensqualität der Bürger zu verbessern. Und so kann Computer Vision beispielsweise in Smart Cities eingesetzt werden:
- Verkehrsregelung: Stadtverwaltungen können Computer-Vision-Systeme nutzen, um Straßenkreuzungen und Verkehrsmuster zu überwachen und zu analysieren und Fahrzeuge und Fußgänger zu erkennen und zu verfolgen, um den Verkehrsfluss zu optimieren und die Sicherheit an Kreuzungen zu verbessern.
- Wartung der Infrastruktur: Computer-Vision-Modelle können darin trainiert werden, Straßen- und Brückenprobleme wie Schlaglöcher oder rissige Fahrbahnbeläge in einer Stadt oder im ganzen Kreis zu erkennen und die Instandhaltungsteams über die zu wartenden Stellen zu informieren.
Wie Computer Vision funktioniert
Computer Vision kombiniert Komponenten wie Edge-Computing, Cloud-Computing, Software und KI-Deep-Learning-Modelle, damit Computer erfasste Daten von Kameras und Videos „sehen“ und schnell bestimmte Objekte, Menschen und Muster erkennen, Vorhersagen dazu treffen und gegebenenfalls Maßnahmen ergreifen können.
Die Rolle von Convolutional Neural Networks
Computer-Vision-Systeme verwenden Deep-Learning-Modelle aus einer Reihe von Algorithmen, die als Convolutional Neural Networks (CNNs) bekannt sind, als Basis für die Bildverarbeitung und -analyse. Diese Deep-Learning-Modelle analysieren die RGB-Werte der Pixel in digitalen Bildern, um identifizierbare Muster zu erkennen. CNNs können so entwickelt werden, dass sie Pixel basierend auf einer Vielzahl von Eigenschaften bewerten, wie Farbverteilung, Form, Textur und Farbtiefe, und Objekte genau erkennen und klassifizieren.
Trainieren von Computer-Vision-Modellen
Bevor ein Computer-Vision-System in der Praxis eingesetzt werden kann, müssen Datenwissenschaftler und Entwickler das Deep-Learning-Modell des Systems entsprechend seinem spezifischen Anwendungsfall trainieren. Das erfordert die Eingabe großer Mengen anwendungsspezifischer Daten, die das Modell verwenden kann, um zu erkennen, wozu es entwickelt wurde. Damit eine Computer-Vision-Anwendung zum Beispiel einen Hund als solchen erkennen kann, muss das Modell zunächst lernen, wie ein Hund aussieht. Dies geschieht durch das Trainieren mit Tausenden, vielleicht sogar Millionen Bildern von Hunden verschiedener Rassen, Größen, Farben und Eigenschaften.
Üblicherweise findet ein solches Training in Rechenzentren oder Cloud-Umgebungen statt. Bei besonders komplexen Trainings können GPUs und KI-Beschleuniger eingesetzt werden, um den Prozess zu beschleunigen und die höhere Anzahl beteiligter Parameter besser zu handhaben. Sobald das Modell die Trainingsphase abgeschlossen hat, verfügt es über die notwendige Kenntnis für das Interpretieren und die Inferenz von Informationen aus digitalen Bildern. Das Modell kann im Laufe der Zeit auch weiter verfeinert oder neu trainiert werden.
Es ist außerdem wichtig zu wissen, dass diejenigen, die Computer-Vision-Lösungen entwickeln möchten, gebrauchsfertige Grundmodelle als Ausgangsbasis für eine Optimierung nutzen können, um die Entwicklungszeiten zu verkürzen und nicht ganz von vorne anfangen zu müssen.
Bereitstellen von Computer-Vision-Modellen
Nach abgeschlossenem Trainieren können Computer-Vision-Modelle für Inferenz-Prozesse und die Interpretation von Bedingungen im praktischen Betrieb auf Computersystemen bereitgestellt werden, um laufend Bild- und Videodaten auszuwerten und Erkenntnisse und Informationen zu gewinnen. Computer-Vision-Lösungen können Inferenz-Workloads zwar in der Cloud oder im Rechenzentrum verarbeiten, viele Unternehmen interessieren sich neuerdings jedoch für Edge-KI-Anwendungen, bei denen Computer-Vision-Modelle näher an dem Ort aktiv sind, wo Daten mit einfacherer, optimierter Edge-Hardware oder Embedded-Bausteinen generiert werden.
Die KI-Inferenzfunktionen näher an den Netzwerkrand zu verlagern, kann mehrere bedeutende Vorteile haben:
- Schnellere Verarbeitung und geringere Latenz: Die Verarbeitung und Analyse von Daten dorthin zu verlagern, wo sie erzeugt werden, kann die Reaktion des Systems beschleunigen und schnellere Transaktionen und bessere Funktion für die Benutzer bewirken, was bei vielen Computer-Vision-Anwendungen unerlässlich ist.
- Verbessertes Management des Netzwerkverkehrs: Dadurch, dass die Menge an Daten, die über ein Netzwerk in die Cloud gesendet werden, minimiert wird, können die Auslastung der Bandbreite und die Kosten für die Übertragung und Speicherung großer Datenmengen reduziert werden.
- Höhere Zuverlässigkeit: Die Menge an Daten, die Netzwerke gleichzeitig übertragen können, ist begrenzt. Für Standorte mit unzureichender Internet-Konnektivität erhöht die Speicherung und Verarbeitung von Daten im Edge-Umfeld die Zuverlässigkeit.
- Mehr Sicherheit: Bei korrekter Umsetzung kann eine Edge-Computing-Lösung die Datensicherheit durch die begrenzte Übertragung von Daten über das Internet erhöhen.
- Datenschutzanforderungen: Einige Regierungen, Kunden oder Branchen können verlangen, dass Daten, die für Computer-Vision-Anwendungen verwendet werden, in dem Rechtsraum verbleiben, in dem sie erzeugt wurden. Edge-Computing kann Unternehmen dabei helfen, solche Regeln und Vorschriften einzuhalten.
Einstieg in Computer Vision
Wie andere Formen der KI hat auch Computer Vision Auswirkungen auf alle Aspekte der Wirtschaft. Sie hilft Unternehmen aus unterschiedlichsten Branchen, Betriebskosten zu senken, die Automation von Geschäftsprozessen umzusetzen und mögliche neue Dienste oder Einnahmequellen zu finden. Unternehmen, die sich die Möglichkeiten von Computer Vision zunutze machen können, um neue Anwendungsfälle, Fähigkeiten und Innovationen zu realisieren, werden sich als Branchenführer etablieren.
Intel unterstützt Ihr Unternehmen auf dem Weg zur KI-basierten Computer Vision und steht bereit, um Ihren KI-Initiativen zum Erfolg zu verhelfen.
Hier finden Sie skalierbare, einsatzbereite, mit Intel® Hardware und Software optimierte KI-Lösungen