Datenqualität für KI im Mittelstand

Eine Situation, die sich in vielen Unternehmen ähnlich zeigt: Das ERP läuft seit Jahren, wurde einmal sauber eingeführt und im Alltag danach immer wieder pragmatisch ergänzt. Felder bleiben leer, andere werden zweckentfremdet, und neben dem System wachsen Excel-Listen.

Jetzt steht KI auf der Agenda. Ein Unternehmens-GPT für den Vertrieb, erste Unterstützung bei Angeboten oder schnelle Produkthinweise für Standardfragen. Die entscheidende Frage kommt oft zu spät: Auf welchen Daten soll diese KI eigentlich arbeiten?

Die gute Nachricht: Dafür muss nicht erst die gesamte Datenlandschaft perfekt sein. In vielen Fällen ist ein sicherer Start möglich, wenn Sie den Anwendungsfall sauber eingrenzen, mit einer fokussierten Warengruppe beginnen und nur die dafür kritischen Informationen gezielt ergänzen.

Quick Win

Der praxistaugliche Einstieg ist oft nicht der große Wurf, sondern ein klar abgegrenzter Start: eine Warengruppe, ein konkreter Use Case, ergänzte Schlüsseldaten und kontrollierte Ausweitung von dort aus.

Sicher und kontrolliert starten statt auf perfekte Daten zu warten

Genau darin liegt der sinnvollere Blick auf Datenqualität: nicht als Hürde vor dem KI-Start, sondern als Steuerungsfrage. Sie müssen nicht alles auf einmal bereinigen. Sie brauchen zuerst einen Bereich, in dem Nutzen, Risiko und Datenaufwand in einem vernünftigen Verhältnis stehen.

Eine abgegrenzte Warengruppe wählen

Starten Sie dort, wo Fragen häufig auftreten, die Produktlogik überschaubar ist und die Daten mit vertretbarem Aufwand ergänzt werden können.

Nur die kritischen Attribute ergänzen

Nicht der komplette Artikelstamm muss sofort perfekt sein. Entscheidend sind die Informationen, die Ihr konkreter Use Case für belastbare Antworten wirklich braucht.

Erfahrungswissen gezielt dokumentieren

Ersatzartikel, technische Ausnahmen und Kundensonderfälle werden für diesen Startbereich sauber festgehalten und später schrittweise erweitert.

Inhaltsübersicht

Das Fundament: Warum Datenqualität bei KI anders ist

Klassische Software verzeiht manches. Ein Feld ist leer, ein Sachbearbeiter kennt trotzdem den Zusammenhang oder fragt kurz bei Kollegen nach. Eine KI kann das nicht. Sie kennt nur, was in den Daten steht.

Das Problem ist dabei oft nicht die Schreibweise. Moderne Modelle kommen mit Varianten, Synonymen und unvollständigen Formulierungen erstaunlich gut zurecht. Kritisch wird es dort, wo Informationen schlicht nicht existieren.

Fragen, die vor jedem KI-Use-Case geklärt sein sollten:

Welche Informationen braucht die KI wirklich für eine belastbare Antwort?
Wo liegen diese Informationen heute: im ERP, in Excel, in Outlook oder nur im Kopf?
Welche Beziehungen zwischen Artikeln, Kunden und Prozessen sind dokumentiert und welche nicht?

Eine KI kennt nicht das, was jeder im Unternehmen weiß, sondern nur das, was sauber dokumentiert und zugänglich ist.

Fehlende Attribute: Die KI wird raten und dabei falsch liegen

Das eigentliche Risiko liegt nicht in unsauberen Bezeichnungen, sondern in fehlenden fachlichen Eigenschaften. Wenn Temperaturbereiche, Medienbeständigkeit oder Werkstoffe nicht dokumentiert sind, liefert die KI oft trotzdem eine Antwort. Genau das macht fehlende Attribute so gefährlich.

Typische Frage an die KI

Welche Dichtung hält 180°C aus?

Fehlendes Attribut

Temperaturbereich pro Artikel

Tatsächlich dokumentiert

Nur Artikelbezeichnung

Folge

Die KI rät auf Basis allgemeiner Muster und liegt unter Umständen falsch.

Kernproblem

Die KI formuliert eine Antwort, obwohl ihr die fachliche Grundlage fehlt.

Typische Frage an die KI

Brauche eine Pumpe für Salzsäure

Fehlendes Attribut

Medienbeständigkeit und Werkstoff

Tatsächlich dokumentiert

Kreiselpumpe DN50

Folge

Die Antwort klingt plausibel, ist aber ohne Daten nicht belastbar.

Kernproblem

Die KI formuliert eine Antwort, obwohl ihr die fachliche Grundlage fehlt.

Typische Frage an die KI

Ist dieser O-Ring für Hydrauliköl geeignet?

Fehlendes Attribut

Werkstoff und Medienverträglichkeit

Tatsächlich dokumentiert

O-Ring 30x3

Folge

Die KI antwortet wahrscheinlich Ja, obwohl die Grundlage fehlt.

Kernproblem

Die KI formuliert eine Antwort, obwohl ihr die fachliche Grundlage fehlt.

Wichtig zu wissen

KI sagt selten von sich aus, dass etwas fehlt. Bei unvollständigen Daten entstehen Antworten, die plausibel klingen, aber fachlich nicht belastbar sind.

Fehlende Beziehungen und Kundendaten: Einzelteile ohne Kontext

Viele Systeme enthalten einzelne Datensätze, aber keine sauberen Zusammenhänge. Genau diese Beziehungen braucht KI für Fragen wie: Was passt zusammen, was ist der Nachfolger oder was braucht der Kunde zusätzlich?

Cross-Selling fehlt: Wer Artikel A kauft, braucht oft auch B und C, aber das steht nirgends.
Ersatzteile sind nicht verknüpft: Welche Dichtung gehört zu welcher Pumpe?
Nachfolger werden nicht gepflegt: Ein Artikel ist abgekündigt, der Ersatzartikel aber nicht hinterlegt.
Mindestmengen sind unklar: Geliefert wird in Verpackungseinheiten, im System steht nur Stück.

Das gilt genauso für Kundendaten. Falsch geschriebene Adressen sind selten das Kernproblem. Kritisch ist vielmehr, dass entscheidende Informationen oft gar nicht erfasst werden.

Branche des Kunden

Das Feld existiert, wird aber nur unvollständig gepflegt.

Welche Anlagen oder Maschinen hat der Kunde?

Dieses Wissen steckt häufig beim Außendienst und nicht im System.

Warum wurde der letzte Auftrag verloren?

Der Status ist vorhanden, die Begründung fehlt.

Wer ist für welches Thema der richtige Ansprechpartner?

Kontakte sind vorhanden, Zuständigkeiten aber nicht.

Rahmenverträge und Sonderkonditionen

Oft in separaten Dateien statt im Fachsystem.

Praxisszenario

Ein Außendienstbriefing hilft nur dann wirklich, wenn Branche, Maschinenpark, Ansprechpartner und Besonderheiten des Kunden nicht nur im Kopf einzelner Personen existieren.

Gewachsene Systemlandschaften: Warum die Datenrealität selten an einem Ort liegt

In mittelständischen Unternehmen entsteht Wissen nicht sauber in einem einzigen System. Es verteilt sich über Jahre auf Fachanwendungen, Dateien, E-Mails und eingespielte Routinen im Team. Genau daraus entsteht die typische Spannung zwischen offizieller Datenlage und operativer Wirklichkeit.

Für KI ist das kritisch, weil Antworten immer nur so gut sind wie der erreichbare Kontext. Wenn die relevante Wahrheit auf mehrere Orte verteilt ist, beantwortet das Modell Fragen oft nur auf Basis eines Ausschnitts.

Fachsysteme

ERP, CRM, Ticketsystem, PIM

So sieht die Realität aus

Hier liegen die offiziellen Stamm- und Bewegungsdaten. Sie sind wichtig, aber selten vollständig genug für fachliche Detailfragen.

Folge für die KI

Die KI sieht nur den dokumentierten Teil der Realität.

Operative Nebenwelten

Excel-Listen, lokale Dateien, geteilte Ordner

So sieht die Realität aus

Sonderpreise, Ersatzartikel, Prüflogiken und Ausnahmen werden oft dort gepflegt, wo es schnell geht und nicht dort, wo es dauerhaft sauber wäre.

Folge für die KI

Genau diese Regeln fehlen später in Antworten, Vorschlägen und Automatisierungen.

Kommunikation und Erfahrungswissen

Outlook, Teams, Notizen, Wissen einzelner Personen

So sieht die Realität aus

Reklamationsgründe, Kundenspezifika und technische Faustregeln entstehen im Alltag und werden häufig nie strukturiert festgehalten.

Folge für die KI

Die KI wirkt formal korrekt, kennt aber den entscheidenden Kontext nicht.

Nicht das sichtbarste System ist entscheidend, sondern der Ort, an dem die fachlich relevante Information tatsächlich gepflegt wird.

Schatten-IT: Wenn kritisches Wissen außerhalb der offiziellen Prozesse lebt

Schatten-IT ist nicht automatisch ein Fehler. Sie entsteht oft dort, wo Teams schnell handeln müssen und die offiziellen Systeme dafür zu grob, zu langsam oder nicht passend genug sind. Problematisch wird es dann, wenn diese pragmatischen Nebenlösungen die fachlich wichtigste Informationsquelle werden.

Kundenspezifische Preise und Ausnahmen

Soll

Preislogik im ERP oder in der zentralen Kalkulation

Ist

Excel-Datei im Vertrieb oder einzelne Mail-Verläufe

Risiko im KI-Projekt

Die KI liefert nur Standardlogik und blendet wichtige Absprachen aus.

Technische Kompatibilität und Ersatzartikel

Soll

Artikelstamm oder PIM mit klaren Beziehungen

Ist

Erfahrungswissen im Team oder handschriftliche Notizen

Risiko im KI-Projekt

Bei Rückfragen fehlen belastbare Zuordnungen zwischen Artikeln, Varianten und Alternativen.

Probleme mit Lieferanten oder Serien

Soll

Lieferantenbewertung oder Qualitätsdatenbank

Ist

E-Mail-Ordner im Einkauf und informelle Absprachen

Risiko im KI-Projekt

Die KI empfiehlt Produkte, ohne bekannte Risiken oder Historien zu berücksichtigen.

Wissen über den Kunden vor Ort

Soll

CRM mit Ansprechpartnern, Anlagen und Besonderheiten

Ist

Außendienstwissen, Kalendernotizen, Besuchsberichte

Risiko im KI-Projekt

Briefings bleiben oberflächlich, weil maschinen- oder standortspezifische Informationen fehlen.

Wichtig zu wissen

Das Problem ist nicht, dass Excel oder Outlook existieren. Das Problem beginnt dort, wo die KI nur auf einen Teil der Wahrheit zugreift und entscheidende Informationen im Schatten bleiben.

So bauen Sie die Datenbasis kontrolliert aus

Nach dem fokussierten Start folgt der systematische Ausbau. Der erste größere Schritt ist keine Tool-Auswahl, sondern eine Inventur: Welche Informationen sind für Ihren konkreten KI-Use-Case wirklich kritisch und welche nicht?

Ehrliche Bestandsaufnahme

Eine Inventur zeigt, welche Attribute fehlen, welche Excel-Listen kritisch sind und welches Wissen nirgends dokumentiert ist.

Priorisierung nach KI-Relevanz

Nicht alle Daten sind gleich wichtig. Entscheidend ist, welche Informationen Ihr konkreter Use Case wirklich braucht.

Wissen erfassen

Erfahrungswissen zu Ersatzartikeln, Kundenbesonderheiten und technischen Faustregeln muss aus Köpfen ins System.

Qualität sichern

Pflichtfelder, Verantwortlichkeiten und Reviews sorgen dafür, dass die Datenbasis nicht nach kurzer Zeit wieder erodiert.

Praxis-Szenario: KI-Projekt mit Daten-Realitätscheck

Ein Großhändler für Industriebedarf mit rund 60 Mitarbeitenden möchte ein Unternehmens-GPT für den Innendienst einführen. Der ursprüngliche Gedanke ist einfach: ERP anbinden, Produktdatenblätter ergänzen, Fragen schneller beantworten.

Die Bestandsaufnahme zeigt aber schnell: Für viele technische Fragen fehlen Werkstoffe, Temperaturbereiche, Ersatzartikel und verlässliche Zuordnungen. Der realistische Start liegt deshalb nicht in der Vollintegration, sondern in einer fokussierten Warengruppe mit ergänzten Attributen und dokumentiertem Erfahrungswissen.

Quick Win

Wenn Sie mit einer klar abgegrenzten Warengruppe starten, können Sie Standardfragen bereits früh zuverlässig beantworten und die Datenbasis von dort aus schrittweise erweitern.

Fazit: Daten sind kein reines IT-Thema

KI-Projekte scheitern selten an der Technologie. Die Modelle sind leistungsfähig, die Tools sind verfügbar. Was häufig fehlt, ist die Grundlage: Informationen, die nicht vollständig erfasst, nicht sauber verknüpft oder nicht für andere zugänglich sind.

Der richtige Einstieg beginnt daher nicht mit der Frage nach dem nächsten Tool und auch nicht mit dem Anspruch auf perfekte Vollständigkeit. Sinnvoller ist ein kontrollierter Anfang: Welches Wissen braucht Ihre KI für den ersten sinnvollen Use Case und wo liegt es heute?

Haben Sie Fragen zu diesem Thema oder möchten Sie Ihre Datensituation besprechen? Schreiben Sie uns. Wir bringen langjährige ERP- und Organisationspraxis in diese Fragen ein.

Datenqualität im Mittelstand: Was KI-Projekte wirklich brauchen

Sicher und kontrolliert starten statt auf perfekte Daten zu warten

Das Fundament: Warum Datenqualität bei KI anders ist

Fehlende Attribute: Die KI wird raten und dabei falsch liegen

Fehlende Beziehungen und Kundendaten: Einzelteile ohne Kontext

Gewachsene Systemlandschaften: Warum die Datenrealität selten an einem Ort liegt

Schatten-IT: Wenn kritisches Wissen außerhalb der offiziellen Prozesse lebt

So bauen Sie die Datenbasis kontrolliert aus

Praxis-Szenario: KI-Projekt mit Daten-Realitätscheck

Fazit: Daten sind kein reines IT-Thema

Von Datenrealität zu belastbaren KI-Projekten