Datenqualität im Mittelstand: Was KI-Projekte wirklich brauchen

Eine Situation, die sich in vielen Unternehmen ähnlich zeigt: Das ERP läuft seit Jahren, wurde einmal sauber eingeführt und im Alltag danach immer wieder pragmatisch ergänzt. Felder bleiben leer, andere werden zweckentfremdet, und neben dem System wachsen Excel-Listen.
Jetzt steht KI auf der Agenda. Ein Unternehmens-GPT für den Vertrieb, erste Unterstützung bei Angeboten oder schnelle Produkthinweise für Standardfragen. Die entscheidende Frage kommt oft zu spät: Auf welchen Daten soll diese KI eigentlich arbeiten?
Inhaltsübersicht
Das Fundament: Warum Datenqualität bei KI anders ist
Klassische Software verzeiht manches. Ein Feld ist leer, ein Sachbearbeiter kennt trotzdem den Zusammenhang oder fragt kurz bei Kollegen nach. Eine KI kann das nicht. Sie kennt nur, was in den Daten steht.
Das Problem ist dabei oft nicht die Schreibweise. Moderne Modelle kommen mit Varianten, Synonymen und unvollständigen Formulierungen erstaunlich gut zurecht. Kritisch wird es dort, wo Informationen schlicht nicht existieren.
Fragen, die vor jedem KI-Use-Case geklärt sein sollten:
- Welche Informationen braucht die KI wirklich für eine belastbare Antwort?
- Wo liegen diese Informationen heute: im ERP, in Excel, in Outlook oder nur im Kopf?
- Welche Beziehungen zwischen Artikeln, Kunden und Prozessen sind dokumentiert und welche nicht?
Eine KI kennt nicht das, was jeder im Unternehmen weiß, sondern nur das, was sauber dokumentiert und zugänglich ist.
Fehlende Attribute: Die KI wird raten und dabei falsch liegen
Das eigentliche Risiko liegt nicht in unsauberen Bezeichnungen, sondern in fehlenden fachlichen Eigenschaften. Wenn Temperaturbereiche, Medienbeständigkeit oder Werkstoffe nicht dokumentiert sind, liefert die KI oft trotzdem eine Antwort. Genau das macht fehlende Attribute so gefährlich.
Typische Frage an die KI
Welche Dichtung hält 180°C aus?
Fehlendes Attribut
Temperaturbereich pro Artikel
Tatsächlich dokumentiert
Nur Artikelbezeichnung
Folge
Die KI rät auf Basis allgemeiner Muster und liegt unter Umständen falsch.
Kernproblem
Die KI formuliert eine Antwort, obwohl ihr die fachliche Grundlage fehlt.
Typische Frage an die KI
Brauche eine Pumpe für Salzsäure
Fehlendes Attribut
Medienbeständigkeit und Werkstoff
Tatsächlich dokumentiert
Kreiselpumpe DN50
Folge
Die Antwort klingt plausibel, ist aber ohne Daten nicht belastbar.
Kernproblem
Die KI formuliert eine Antwort, obwohl ihr die fachliche Grundlage fehlt.
Typische Frage an die KI
Ist dieser O-Ring für Hydrauliköl geeignet?
Fehlendes Attribut
Werkstoff und Medienverträglichkeit
Tatsächlich dokumentiert
O-Ring 30x3
Folge
Die KI antwortet wahrscheinlich Ja, obwohl die Grundlage fehlt.
Kernproblem
Die KI formuliert eine Antwort, obwohl ihr die fachliche Grundlage fehlt.
Wichtig zu wissen
Fehlende Beziehungen und Kundendaten: Einzelteile ohne Kontext
Viele Systeme enthalten einzelne Datensätze, aber keine sauberen Zusammenhänge. Genau diese Beziehungen braucht KI für Fragen wie: Was passt zusammen, was ist der Nachfolger oder was braucht der Kunde zusätzlich?
- Cross-Selling fehlt: Wer Artikel A kauft, braucht oft auch B und C, aber das steht nirgends.
- Ersatzteile sind nicht verknüpft: Welche Dichtung gehört zu welcher Pumpe?
- Nachfolger werden nicht gepflegt: Ein Artikel ist abgekündigt, der Ersatzartikel aber nicht hinterlegt.
- Mindestmengen sind unklar: Geliefert wird in Verpackungseinheiten, im System steht nur Stück.
Das gilt genauso für Kundendaten. Falsch geschriebene Adressen sind selten das Kernproblem. Kritisch ist vielmehr, dass entscheidende Informationen oft gar nicht erfasst werden.
Branche des Kunden
Das Feld existiert, wird aber nur unvollständig gepflegt.
Welche Anlagen oder Maschinen hat der Kunde?
Dieses Wissen steckt häufig beim Außendienst und nicht im System.
Warum wurde der letzte Auftrag verloren?
Der Status ist vorhanden, die Begründung fehlt.
Wer ist für welches Thema der richtige Ansprechpartner?
Kontakte sind vorhanden, Zuständigkeiten aber nicht.
Rahmenverträge und Sonderkonditionen
Oft in separaten Dateien statt im Fachsystem.
Praxisszenario
Gewachsene Systemlandschaften: Warum die Datenrealität selten an einem Ort liegt
In mittelständischen Unternehmen entsteht Wissen nicht sauber in einem einzigen System. Es verteilt sich über Jahre auf Fachanwendungen, Dateien, E-Mails und eingespielte Routinen im Team. Genau daraus entsteht die typische Spannung zwischen offizieller Datenlage und operativer Wirklichkeit.
Für KI ist das kritisch, weil Antworten immer nur so gut sind wie der erreichbare Kontext. Wenn die relevante Wahrheit auf mehrere Orte verteilt ist, beantwortet das Modell Fragen oft nur auf Basis eines Ausschnitts.
Fachsysteme
ERP, CRM, Ticketsystem, PIM
So sieht die Realität aus
Hier liegen die offiziellen Stamm- und Bewegungsdaten. Sie sind wichtig, aber selten vollständig genug für fachliche Detailfragen.
Folge für die KI
Die KI sieht nur den dokumentierten Teil der Realität.
Operative Nebenwelten
Excel-Listen, lokale Dateien, geteilte Ordner
So sieht die Realität aus
Sonderpreise, Ersatzartikel, Prüflogiken und Ausnahmen werden oft dort gepflegt, wo es schnell geht und nicht dort, wo es dauerhaft sauber wäre.
Folge für die KI
Genau diese Regeln fehlen später in Antworten, Vorschlägen und Automatisierungen.
Kommunikation und Erfahrungswissen
Outlook, Teams, Notizen, Wissen einzelner Personen
So sieht die Realität aus
Reklamationsgründe, Kundenspezifika und technische Faustregeln entstehen im Alltag und werden häufig nie strukturiert festgehalten.
Folge für die KI
Die KI wirkt formal korrekt, kennt aber den entscheidenden Kontext nicht.
Nicht das sichtbarste System ist entscheidend, sondern der Ort, an dem die fachlich relevante Information tatsächlich gepflegt wird.
Schatten-IT: Wenn kritisches Wissen außerhalb der offiziellen Prozesse lebt
Schatten-IT ist nicht automatisch ein Fehler. Sie entsteht oft dort, wo Teams schnell handeln müssen und die offiziellen Systeme dafür zu grob, zu langsam oder nicht passend genug sind. Problematisch wird es dann, wenn diese pragmatischen Nebenlösungen die fachlich wichtigste Informationsquelle werden.
Kundenspezifische Preise und Ausnahmen
Soll
Preislogik im ERP oder in der zentralen Kalkulation
Ist
Excel-Datei im Vertrieb oder einzelne Mail-Verläufe
Risiko im KI-Projekt
Die KI liefert nur Standardlogik und blendet wichtige Absprachen aus.
Technische Kompatibilität und Ersatzartikel
Soll
Artikelstamm oder PIM mit klaren Beziehungen
Ist
Erfahrungswissen im Team oder handschriftliche Notizen
Risiko im KI-Projekt
Bei Rückfragen fehlen belastbare Zuordnungen zwischen Artikeln, Varianten und Alternativen.
Probleme mit Lieferanten oder Serien
Soll
Lieferantenbewertung oder Qualitätsdatenbank
Ist
E-Mail-Ordner im Einkauf und informelle Absprachen
Risiko im KI-Projekt
Die KI empfiehlt Produkte, ohne bekannte Risiken oder Historien zu berücksichtigen.
Wissen über den Kunden vor Ort
Soll
CRM mit Ansprechpartnern, Anlagen und Besonderheiten
Ist
Außendienstwissen, Kalendernotizen, Besuchsberichte
Risiko im KI-Projekt
Briefings bleiben oberflächlich, weil maschinen- oder standortspezifische Informationen fehlen.
Wichtig zu wissen
Der Weg zur belastbaren Datenbasis
Der erste Schritt ist keine Tool-Auswahl, sondern eine Inventur. Danach folgt die Priorisierung: Welche Informationen sind für Ihren konkreten KI-Use-Case wirklich kritisch und welche nicht?
Ehrliche Bestandsaufnahme
Eine Inventur zeigt, welche Attribute fehlen, welche Excel-Listen kritisch sind und welches Wissen nirgends dokumentiert ist.
Priorisierung nach KI-Relevanz
Nicht alle Daten sind gleich wichtig. Entscheidend ist, welche Informationen Ihr konkreter Use Case wirklich braucht.
Wissen erfassen
Erfahrungswissen zu Ersatzartikeln, Kundenbesonderheiten und technischen Faustregeln muss aus Köpfen ins System.
Qualität sichern
Pflichtfelder, Verantwortlichkeiten und Reviews sorgen dafür, dass die Datenbasis nicht nach kurzer Zeit wieder erodiert.
Praxis-Szenario: KI-Projekt mit Daten-Realitätscheck
Ein Großhändler für Industriebedarf mit rund 60 Mitarbeitenden möchte ein Unternehmens-GPT für den Innendienst einführen. Der ursprüngliche Gedanke ist einfach: ERP anbinden, Produktdatenblätter ergänzen, Fragen schneller beantworten.
Die Bestandsaufnahme zeigt aber schnell: Für viele technische Fragen fehlen Werkstoffe, Temperaturbereiche, Ersatzartikel und verlässliche Zuordnungen. Der realistische Start liegt deshalb nicht in der Vollintegration, sondern in einer fokussierten Warengruppe mit ergänzten Attributen und dokumentiertem Erfahrungswissen.
Quick Win
Fazit: Daten sind kein reines IT-Thema
KI-Projekte scheitern selten an der Technologie. Die Modelle sind leistungsfähig, die Tools sind verfügbar. Was häufig fehlt, ist die Grundlage: Informationen, die nicht vollständig erfasst, nicht sauber verknüpft oder nicht für andere zugänglich sind.
Der richtige Einstieg beginnt daher nicht mit der Frage nach dem nächsten Tool, sondern mit der Bestandsaufnahme: Welches Wissen braucht Ihre KI wirklich und wo liegt es heute?
Haben Sie Fragen zu diesem Thema oder möchten Sie Ihre Datensituation besprechen? Schreiben Sie uns. Wir bringen langjährige ERP- und Organisationspraxis in diese Fragen ein.
Von Datenrealität zu belastbaren KI-Projekten
Wir analysieren mit Ihnen, welche Daten für Ihren Use Case wirklich zählen, wo Lücken liegen und wie Sie eine belastbare Wissensbasis aufbauen.

Gründer
Andres Andreas
Gründer bei viamind. 10+ Jahre Erfahrung in der ERP-Beratung, spezialisiert auf technische Machbarkeitsprüfungen und KI-Tool-Evaluierung. Verbindet technische Umsetzbarkeit mit organisatorischer Realität im Mittelstand.
