Zuverlässige Texterkennung in Fernseh-Bilddaten
Zuverlässige Texterkennung in Fernseh-Bilddaten
Die automatisierte Analyse von Multimediadaten ist ein Anwendungsfeld von rasch wachsender Bedeutung. Für ein breites Spektrum von Kunden wie Telekommunikationsorganisationen, Finanzdienstleistungen, die Informationsmanagement-Industrie sowie Non-Profit-Organisationen und Behörden bietet eine solche Analyse technische Möglichkeiten um in stetig steigenden Mengen an digitalen Daten relevante Inhalte extrahieren zu können.
Das automatisierte Monitoring von Medieninhalten bietet aufbereitete Inhalte in Echtzeit und mit einer Verfügbarkeit von 24×7 als Information für menschliche Entscheidungsträger um fundierte Entscheidungen treffen zu können. Mögliche Anwendungen umfassen die Analyse der Wettbewerbslage, Reputationsmanagement, Krisenmanagement und viele andere Gebiete.
Innerhalb des K-Projekts Vision+ haben AIT-Forscher gemeinsam mit dem Industriepartner eMedia Monitor, ein führender Anbieter von automatisierten Media-Monitoring-Lösungen und Dienstleistungen, die Grundlagen für ein automatisiertes Texterkennungssystem etabliert. Das entwickelte algorithmische System wurde auf großen Datensätzen validiert. Die erhaltenen Erkennungsergebnisse weisen eine hohe Genauigkeit auf. Wissenschaftliche Herausforderungen betreffen die Fragestellungen wie Text in Bildern durch visuelle Merkmale beschrieben werden kann, trotz Variationen in Größe, Form, Schriftart und Farbe, und wie man eine robuste Textsegmentierung in Anwesenheit von anderen Bildmustern auch für hochauflösende Bilder schnell erzielen kann. Das entwickelte System soll, mit extrahierter Audio und Sprachinformation kombiniert, eine zuverlässige und schnelle Interpretation von Multimediadaten ermöglichen.
Beispiele für Textdetektionsergebnisse in zwei Fernsehbildern (Regionen durch blaue Rechtecke gekennzeichnet):
Erkennungsergebnisse aus Fernsehbildern mit detektierten Textregionen (grüne Rechtecke) und gefundenem Text (blau):
Teile der entwickelten wissenschaftlichen Konzepte wurden in dem Buchkapitel Real-Time Multimedia Policy Analysis of Using Video and Audio Recognition from Radio, TV and User-Generated Content in „Advanced ICT Integration for Governance and Policy Modeling“, 2014 durch den IGI Global Verlag veröffentlicht.