EXTRAHIEREN VON INFORMATIONEN AUS TECHNISCHEN MEDIEN

Der Technologieanbieter Pumacy entwickelt unter carwatch.net eine Plattform zur Analyse technischer und sicherheitsrelevanter Vorfälle von Fahrzeugen. Im EU-Projekt OVeC wurde hierfür zusammen mit dem DAISEC ein Extraktor entwickelt, der aus Nachrichtenartikeln Rückrufinformationen sammelt.

Herausforderung

Fahrzeughersteller und Zulieferer produzieren unter höchsten Qualitäts- und Sicherheitsstandards. Zugleich stehen Fahrzeuge unter besonderer Beobachtung der Behörden. Die gesamte Lieferkette ist gut reguliert und Fahrzeuge werden später im Einsatz regelmäßig überprüft. Maßgebliche Qualitätsnorm für die Fahrzeugindustrie ist die IATF 16949. In ihr ist seit 2020 festgehalten, dass jeder am Fahrzeug beteiligte Hersteller dafür verantwortlich ist, seine Produkte, also auch in Fahrzeugen verbaute Teile, im Feld zu überwachen. Für Komponenten- und Teilefertiger, je weiter hinten sie in der Zulieferkette liegen, ist dies oft nur sehr schwer möglich. Die auf Datenanalyse spezialisierte Firma PUMACY unterstützt Fahrzeugzulieferer, weltweit Daten aus den unterschiedlichsten Informationsquellen zu sammeln, zu strukturieren und mit innovativen Datenanalyse- und KI-Methoden auszuwerten.

Zielsetzung

Im Rahmen des EU-Projektes EUHubs4Data, in dem der DAISEC Mitglied ist, wurde im Experiment OVeC (Open Platform for Vehicle-related Communication) eine offene Plattform für fahrzeugbezogene Kommunikation entwickelt. Hiermit sollen offizielle Rückrufdaten um Zusatzinformationen aus öffentlich zugänglichen Quellen angereichert werden. Während das Aufbereiten rein technisch ausgerichteter Informationsquellen, wie sie beispielsweise von den Fahrzeug- und Verkehrsbehörden angeboten werden, technisch keine allzu große Herausforderung darstellt, ist die Auswertung von Fachpublikationen, die an die breitere Öffentlichkeit gerichtet sind, eine deutlich komplexere Aufgabe. Deshalb entwickelte der DAISEC für das OVeC-Experiment prototypisch einen Nachrichtenextraktor, mit dessen Hilfe Fahrzeugrückrufe betreffende Informationen in Nachrichtenartikeln erkannt und strukturiert den jeweiligen Fahrzeugrückrufen zugeordnet werden können. Ein parallel verfolgtes technisches Ziel des Projektes war die Evaluierung von Wissensgraphen für den Einsatz innerhalb der Carwatch-Plattform.

Grafik: Übersicht über die automatisierte Kategorisierung von Fahrzeugrückrufen.

Projektbeschreibung

Unter einem Wissensgraph wird allgemein eine Wissensbasis verstanden, die ein durch Graphen strukturiertes Modell bzw. eine Topologie zur Darstellung und Bearbeitung von Daten verwendet. Mittels Knoten, Kanten und Beschriftungen lassen sich beliebig komplexe Strukturen aufbauen und miteinander verknüpfen. Die für das Projekt technisch relevanten Textpassagen wurden mit einem Web-Scraper aus Webseiten mit Automobilbezug extrahiert. Wikidata lieferte die notwendigen Strukturinformationen, für den Aufbau des Wissensgraphen, insbesondere Informationen über Automobilhersteller und Fahrzeugmodelle. In der Tiefenanalyse wurden aus den Texten zusätzlich Informationen bezüglich des Kontextes, z. B. das Baujahr des Fahrzeugs und die jeweils betroffenen Komponenten oder Teile, erkannt. Hierbei kamen testweise zwei unterschiedliche Künstliche Intelligenz-Methoden zum Einsatz:

LLM-basierter Textklassifizierer: Große Sprachmodelle (LLMs = Large Language Models) lieferten bereits in vielen Anwendungsbereichen vielversprechende Ergebnisse bei der Informationsextraktion. Dies wurde auch bei der exemplarischen Anwendung im OVeC-Projekt bestätigt.

Transformer-basierter Textklassifizierer: In einem zweiten Ansatz wurde ein transformatorbasiertes Multilabel-Textklassifizierungsmodell anhand eines bestehenden Carwatch-Datensatzes trainiert. Auch dieser Ansatz führte zu guten und praktisch verwertbaren Ergebnissen.

In den kommenden Monaten wird PUMACY die Ergebnisse des Projektes anhand des umfangreichen Carwatch-Datenbestandes weiter erproben und die beiden Methoden auf ihre Stärken und Schwächen hinsichtlich der unterschiedlichen Informationstypen hin testen. Sofern die Ergebnisse sich auch mit größeren und komplexeren Datenmengen bestätigen, werden die Projektergebnisse in der operativen Carwatch-Plattform umgesetzt.

DAISEC Experten
Dr. Simon Gottschalk

Experte für Künstliche Intelligenz

Unternehmensprofil

Die Unternehmensgruppe Pumacy Technologies AG befähigt ihre Kunden, Produkt- und Prozesswissen sowie die Ideen und Erfahrungen ihrer Mitarbeiter optimal im Unternehmen einzusetzen. Hierzu hat das Unternehmen in der Industrie während einer Vielzahl von Beratungs- und Softwareprojekten eine einzigartige Systematik und ein erprobtes Methoden- und Softwareportfolio entwickelt. Als Ergebnis erhalten Kunden eine individuelle Lösung, um aus ihrem Wissen stabile Werte zu schaffen.

Kontaktformular



Dies schließt sich in 0Sekunden

Newsletter


Dies schließt sich in 0Sekunden

Dies schließt sich in 0Sekunden