Optische Zeichenerkennung (OCR) mithilfe künstlicher Intelligenz revolutioniert das maschinelle Lesen von Labels

16th April 2024

Bei allen Prozessen der Lagerlogistik in Eingangs- und Ausgangslagern sind Effizienz und Rentabilität direkt davon abhängig, dass Güter schnellstmöglich und zuverlässig zu ihrem jeweiligen Bestimmungsort transportiert werden. Labels sind hierbei eine unverzichtbare Hilfe – aber was geschieht, wenn diese maschinell nicht korrekt gelesen werden können? In der Vergangenheit war man bei einer solchen‚ No-Read-Situation‘ auf ein manuelles Eingreifen angewiesen. Heute bietet OCR (optische Zeichenerkennung) in Kombination mit KI (künstlicher Intelligenz) eine intelligente, automatisierte Lösung. Prime Vision hat sich mit seinem maßgefertigten Text Vision System für komplexe und volumenstarke Logistikprozesse auf diese Technologie spezialisiert.

Mathijs Baron, International Sales & Business Development, und Feifei Huo, R&D Ingenieur bei Prime Vision erläutert wie KI-unterstützte OCR dazu beiträgt, die Leserate von Labels der 100%-Marke näherzubringen.

Die Lösung für ‘No-Reads’ in greifbarer Nähe

Labels enthalten eine große Menge an Informationen, wie zum Beispiel Adressdaten, Barcodes, Haltbarkeits- und Produktionsdaten, SKU-Nummern (Stock Keeping Unit), Chargencodes und vieles mehr. Abhängig von spezifischen Anforderungen an die Lagerprozesse verschiedener Logistikunternehmen sind all diese Daten für den Sortierprozess möglicherweise von entscheidender Bedeutung.

Labels werden in der Regel gelesen, wenn Artikel im Rahmen eines Sortierprozesses ein Kameratunnel passieren und liefern verwertbare Informationen, z. B. wo die Sendung hingehen muss, sowie andere wichtige Daten für die weitere Bearbeitung. Allerdings ist es unrealistisch, bei allen Gütern eine perfekte maschinelle Datenerfassung zu erwarten. Labels können verdeckt oder beschädigt sein, was dazu führt, dass eine korrekte automatisierte Lesung unmöglich wird. Auch wenn es sich hierbei nur um einen kleinen Teil der Warenmenge handelt, summieren sich diese Fehler in einem Lager mit hohem Volumen schnell.

Bis vor kurzem resultierten nicht maschinell lesbare Labels in eine zeit- und kostenaufwendige manuelle Intervention, um die entsprechenden Güter wieder in den regulären Sortierprozess zurückzuführen. OCR bietet hierfür eine Lösung. Durch die Verbesserung von Kamerabildern und die Nutzung von Kundeninformationen zur Rekonstruktion und Identifizierung von Schlüsseldatensträngen auf beschädigten oder unleserlichen Etiketten erhöht diese Technologie die Leseraten erheblich. Die Geschwindigkeit, mit der dies geschieht, ermöglicht eine Integration in einen voll automatisierten Prozess.

Verbesserte Leseraten durch Deep Learning

Prime Vision ist bereits vor 20 Jahren damit begonnen, die Leseraten beschädigter oder verdeckter Labels für Postdienstleistungsunternehmen zu optimieren. Seine aktuelle Text-Vision-Lösung unterscheidet sich durch den innovativen Einsatz der KI-Technologien mit der Unterstützung von Deep Learning. Während andere OCR-Systeme Leseraten von 95% erreichen, kann Text Vision diese auf bis zu 98%, in Praxisanwendungen selbst auf bis zu 99% steigern.

Bei der Text Vision Technologie werden Fotos von Labels genommen und diese in einem vorbereitenden Bearbeitungsschritt optimiert. Daraufhin wird der zu lesende Text-Block oder Datenstring ermittelt, extrahiert und schließlich mithilfe von KI rekonstruiert. Durch die Anwendung dieser Schritte gestattet Text Vision eine automatisierte Intervention bei ‚No-Reads‘ mit einer erfolgreichen Zeichenerkennung als Ergebnis, ohne dass hierfür der maschinelle Sortierprozess unterbrochen werden muss.

Um dies zu ermöglichen, muss die KI-Anwendung mithilfe des Deep Learning trainiert werden. So kann die entsprechende Region eines Labels ausfindig gemacht werden, die den Datenstring enthält, der für den Sortierprozess relevant ist. Das System wird anhand realer Beispiele unterschiedlichster Kundenlabels trainiert, damit es schließlich lernt, sich auf den wesentlichen Bereich zu konzentrieren. Um die Rekonstruktion der maßgeblichen Daten noch weiter zu verbessern, kann KI die extrahierten Informationen mit entsprechenden Datenbanken abgleichen. Letztendlich kann das OCR-System für jeden spezifischen Anwendungsbereich optimiert werden, sodass es für jeden individuellen Sortierprozess optimal geeignet ist und bestmögliche Ergebnisse liefert.

Auf der Überholspur

Die Verringerung von Lesefehlern ist zwar für große Logistikbetriebe von großer Bedeutung, aber wie bei allen Lagerhaltungsprozessen ist letztlich die Effizienz des gesamten Systems ausschlaggebend. Die wichtigsten Prinzipien sind: mehr lesen, schneller lesen und Fehler reduzieren. Prime Vision begegnet diesen Herausforderungen mit einem engagierten Forschungs- und Innovationsteam, das aktiv experimentiert und die neuesten Technologien testet, um auf diese Weise das Leistungspotenzial von OCR auf ein noch höheres Niveau anzuheben.

Eine standardmäßige Identifizierung von Barcodes kann mit bereits vorhandener Scan-Hardware schnell durchgeführt werden. Um OCR-Berechnungszeiten zu reduzieren, empfiehlt Prime Vision jedoch den Einsatz eines dedizierten GPU-Prozessors. Die größere Rechenleistung ermöglicht es dem System, eine ‚No-Read-Situation‘ in so kurzer Zeit zu bearbeiten, dass ein manuelles Eingreifen in den autonomen Sortierprozess nicht mehr nötig ist. Stattdessen reagiert das System automatisch und überführt das entsprechende Objekt selbstständig, schnell und kosteneffizient in die nächste Phase des Prozesses.

Die inneren Werte eines Labels

Durch seine enorme Geschwindigkeit und die Fähigkeit, Lesefehler nahezu gänzlich zu eliminieren, ist OCR für Logistikprozesse mit hohen Volumen von unschätzbarem Wert. Gerade zu Spitzenzeiten im Sortierprozess sind die zeitlichen und finanziellen Einsparungen durch die Reduzierung manueller Interventionen erheblich. Der Einsatz der KI-unterstützten Text-Vision-Technologie ermöglicht es, OCR stets weiter zu optimieren, sodass auch die verbliebenen 5% komplexer „Label-No-Reads“ ohne manuelles Eingreifen gelöst werden können. Gerade für hochvolumige Logistikunternehmen ist der proportional zunehmende Gewinn beachtenswert.

Darüber hinaus gehören Vielseitigkeit und Flexibilität zu den Kerneigenschaften von Text Vision. Spezifisch auf unterschiedliche Datenstrings, Einsatzgebiete und Genauigkeitsanforderungen abgestimmt, ist diese Technologie in der Lage, den Durchsatz und die Effizienz eines jeden Logistikprozesses zu optimieren, unabhängig von Komplexität und Volumen.

Image 1: Optische Zeichenerkennung (OCR) mit künstlicher Intelligenz (KI) trägt dazu bei, die Leserate von Labels auf nahezu 100 % zu steigern.

Image 2: Text Vision nimmt digitale Abbildungen von Labels, optimiert diese und rekonstruiert schließlich die fehlenden Daten mithilfe der Logik künstlicher Intelligenz.

About Prime Vision

Prime Vision is a global leader in computer vision integration and robotics for logistics and e-commerce. As an award-winning company, Prime Vision designs and integrates solutions using the latest recognition, identification, and robotics techniques to optimize the automation of sorting processes.

Headquartered in Delft, The Netherlands, more than 170 experts provide comprehensive market and domain knowledge to digital companies around the world.

Editorial Contact: Ollie Eggleton

Tel: +44 (0)1905 917477

Web: news.dmaeuropa.com

Email: [email protected]

Address: Progress House, Midland Road, Worcester, Worcestershire, WR5 1AQ, United Kingdom

Reader Contact:

Prime Vision: Ellen Brender à Brandis

Tel: +31 15 219 2090

Web: https://primevision.com/

Email: [email protected]

Address: Olof Palmestraat 10, P.O. Box 6034, 2600 JA Delft, KVK 08068458