Strategie

Datenqualität im Mittelstand: Was KI-Projekte wirklich brauchen

Datenqualität im Mittelstand
Andres Andreas

Andres Andreas

Gründer

14. April 2026
8 Min. Lesezeit

Eine Situation, die sich in vielen Unternehmen ähnlich zeigt: Das ERP läuft seit Jahren, wurde einmal sauber eingeführt und im Alltag danach immer wieder pragmatisch ergänzt. Felder bleiben leer, andere werden zweckentfremdet, und neben dem System wachsen Excel-Listen.

Jetzt steht KI auf der Agenda. Ein Unternehmens-GPT für den Vertrieb, erste Unterstützung bei Angeboten oder schnelle Produkthinweise für Standardfragen. Die entscheidende Frage kommt oft zu spät: Auf welchen Daten soll diese KI eigentlich arbeiten?

Das Fundament: Warum Datenqualität bei KI anders ist

Klassische Software verzeiht manches. Ein Feld ist leer, ein Sachbearbeiter kennt trotzdem den Zusammenhang oder fragt kurz bei Kollegen nach. Eine KI kann das nicht. Sie kennt nur, was in den Daten steht.

Das Problem ist dabei oft nicht die Schreibweise. Moderne Modelle kommen mit Varianten, Synonymen und unvollständigen Formulierungen erstaunlich gut zurecht. Kritisch wird es dort, wo Informationen schlicht nicht existieren.

Fragen, die vor jedem KI-Use-Case geklärt sein sollten:

  • Welche Informationen braucht die KI wirklich für eine belastbare Antwort?
  • Wo liegen diese Informationen heute: im ERP, in Excel, in Outlook oder nur im Kopf?
  • Welche Beziehungen zwischen Artikeln, Kunden und Prozessen sind dokumentiert und welche nicht?

Eine KI kennt nicht das, was jeder im Unternehmen weiß, sondern nur das, was sauber dokumentiert und zugänglich ist.


Fehlende Attribute: Die KI wird raten und dabei falsch liegen

Das eigentliche Risiko liegt nicht in unsauberen Bezeichnungen, sondern in fehlenden fachlichen Eigenschaften. Wenn Temperaturbereiche, Medienbeständigkeit oder Werkstoffe nicht dokumentiert sind, liefert die KI oft trotzdem eine Antwort. Genau das macht fehlende Attribute so gefährlich.

1

Typische Frage an die KI

Welche Dichtung hält 180°C aus?

Fehlendes Attribut

Temperaturbereich pro Artikel

Tatsächlich dokumentiert

Nur Artikelbezeichnung

Folge

Die KI rät auf Basis allgemeiner Muster und liegt unter Umständen falsch.

Kernproblem

Die KI formuliert eine Antwort, obwohl ihr die fachliche Grundlage fehlt.

2

Typische Frage an die KI

Brauche eine Pumpe für Salzsäure

Fehlendes Attribut

Medienbeständigkeit und Werkstoff

Tatsächlich dokumentiert

Kreiselpumpe DN50

Folge

Die Antwort klingt plausibel, ist aber ohne Daten nicht belastbar.

Kernproblem

Die KI formuliert eine Antwort, obwohl ihr die fachliche Grundlage fehlt.

3

Typische Frage an die KI

Ist dieser O-Ring für Hydrauliköl geeignet?

Fehlendes Attribut

Werkstoff und Medienverträglichkeit

Tatsächlich dokumentiert

O-Ring 30x3

Folge

Die KI antwortet wahrscheinlich Ja, obwohl die Grundlage fehlt.

Kernproblem

Die KI formuliert eine Antwort, obwohl ihr die fachliche Grundlage fehlt.


Fehlende Beziehungen und Kundendaten: Einzelteile ohne Kontext

Viele Systeme enthalten einzelne Datensätze, aber keine sauberen Zusammenhänge. Genau diese Beziehungen braucht KI für Fragen wie: Was passt zusammen, was ist der Nachfolger oder was braucht der Kunde zusätzlich?

  • Cross-Selling fehlt: Wer Artikel A kauft, braucht oft auch B und C, aber das steht nirgends.
  • Ersatzteile sind nicht verknüpft: Welche Dichtung gehört zu welcher Pumpe?
  • Nachfolger werden nicht gepflegt: Ein Artikel ist abgekündigt, der Ersatzartikel aber nicht hinterlegt.
  • Mindestmengen sind unklar: Geliefert wird in Verpackungseinheiten, im System steht nur Stück.

Das gilt genauso für Kundendaten. Falsch geschriebene Adressen sind selten das Kernproblem. Kritisch ist vielmehr, dass entscheidende Informationen oft gar nicht erfasst werden.

Branche des Kunden

Das Feld existiert, wird aber nur unvollständig gepflegt.

Welche Anlagen oder Maschinen hat der Kunde?

Dieses Wissen steckt häufig beim Außendienst und nicht im System.

Warum wurde der letzte Auftrag verloren?

Der Status ist vorhanden, die Begründung fehlt.

Wer ist für welches Thema der richtige Ansprechpartner?

Kontakte sind vorhanden, Zuständigkeiten aber nicht.

Rahmenverträge und Sonderkonditionen

Oft in separaten Dateien statt im Fachsystem.


Gewachsene Systemlandschaften: Warum die Datenrealität selten an einem Ort liegt

In mittelständischen Unternehmen entsteht Wissen nicht sauber in einem einzigen System. Es verteilt sich über Jahre auf Fachanwendungen, Dateien, E-Mails und eingespielte Routinen im Team. Genau daraus entsteht die typische Spannung zwischen offizieller Datenlage und operativer Wirklichkeit.

Für KI ist das kritisch, weil Antworten immer nur so gut sind wie der erreichbare Kontext. Wenn die relevante Wahrheit auf mehrere Orte verteilt ist, beantwortet das Modell Fragen oft nur auf Basis eines Ausschnitts.

Fachsysteme

ERP, CRM, Ticketsystem, PIM

So sieht die Realität aus

Hier liegen die offiziellen Stamm- und Bewegungsdaten. Sie sind wichtig, aber selten vollständig genug für fachliche Detailfragen.

Folge für die KI

Die KI sieht nur den dokumentierten Teil der Realität.

Operative Nebenwelten

Excel-Listen, lokale Dateien, geteilte Ordner

So sieht die Realität aus

Sonderpreise, Ersatzartikel, Prüflogiken und Ausnahmen werden oft dort gepflegt, wo es schnell geht und nicht dort, wo es dauerhaft sauber wäre.

Folge für die KI

Genau diese Regeln fehlen später in Antworten, Vorschlägen und Automatisierungen.

Kommunikation und Erfahrungswissen

Outlook, Teams, Notizen, Wissen einzelner Personen

So sieht die Realität aus

Reklamationsgründe, Kundenspezifika und technische Faustregeln entstehen im Alltag und werden häufig nie strukturiert festgehalten.

Folge für die KI

Die KI wirkt formal korrekt, kennt aber den entscheidenden Kontext nicht.

Nicht das sichtbarste System ist entscheidend, sondern der Ort, an dem die fachlich relevante Information tatsächlich gepflegt wird.

Schatten-IT: Wenn kritisches Wissen außerhalb der offiziellen Prozesse lebt

Schatten-IT ist nicht automatisch ein Fehler. Sie entsteht oft dort, wo Teams schnell handeln müssen und die offiziellen Systeme dafür zu grob, zu langsam oder nicht passend genug sind. Problematisch wird es dann, wenn diese pragmatischen Nebenlösungen die fachlich wichtigste Informationsquelle werden.

Kundenspezifische Preise und Ausnahmen

Soll

Preislogik im ERP oder in der zentralen Kalkulation

Ist

Excel-Datei im Vertrieb oder einzelne Mail-Verläufe

Risiko im KI-Projekt

Die KI liefert nur Standardlogik und blendet wichtige Absprachen aus.

Technische Kompatibilität und Ersatzartikel

Soll

Artikelstamm oder PIM mit klaren Beziehungen

Ist

Erfahrungswissen im Team oder handschriftliche Notizen

Risiko im KI-Projekt

Bei Rückfragen fehlen belastbare Zuordnungen zwischen Artikeln, Varianten und Alternativen.

Probleme mit Lieferanten oder Serien

Soll

Lieferantenbewertung oder Qualitätsdatenbank

Ist

E-Mail-Ordner im Einkauf und informelle Absprachen

Risiko im KI-Projekt

Die KI empfiehlt Produkte, ohne bekannte Risiken oder Historien zu berücksichtigen.

Wissen über den Kunden vor Ort

Soll

CRM mit Ansprechpartnern, Anlagen und Besonderheiten

Ist

Außendienstwissen, Kalendernotizen, Besuchsberichte

Risiko im KI-Projekt

Briefings bleiben oberflächlich, weil maschinen- oder standortspezifische Informationen fehlen.


Der Weg zur belastbaren Datenbasis

Der erste Schritt ist keine Tool-Auswahl, sondern eine Inventur. Danach folgt die Priorisierung: Welche Informationen sind für Ihren konkreten KI-Use-Case wirklich kritisch und welche nicht?

1

Ehrliche Bestandsaufnahme

Eine Inventur zeigt, welche Attribute fehlen, welche Excel-Listen kritisch sind und welches Wissen nirgends dokumentiert ist.

2

Priorisierung nach KI-Relevanz

Nicht alle Daten sind gleich wichtig. Entscheidend ist, welche Informationen Ihr konkreter Use Case wirklich braucht.

3

Wissen erfassen

Erfahrungswissen zu Ersatzartikeln, Kundenbesonderheiten und technischen Faustregeln muss aus Köpfen ins System.

4

Qualität sichern

Pflichtfelder, Verantwortlichkeiten und Reviews sorgen dafür, dass die Datenbasis nicht nach kurzer Zeit wieder erodiert.

Praxis-Szenario: KI-Projekt mit Daten-Realitätscheck

Ein Großhändler für Industriebedarf mit rund 60 Mitarbeitenden möchte ein Unternehmens-GPT für den Innendienst einführen. Der ursprüngliche Gedanke ist einfach: ERP anbinden, Produktdatenblätter ergänzen, Fragen schneller beantworten.

Die Bestandsaufnahme zeigt aber schnell: Für viele technische Fragen fehlen Werkstoffe, Temperaturbereiche, Ersatzartikel und verlässliche Zuordnungen. Der realistische Start liegt deshalb nicht in der Vollintegration, sondern in einer fokussierten Warengruppe mit ergänzten Attributen und dokumentiertem Erfahrungswissen.

Fazit: Daten sind kein reines IT-Thema

KI-Projekte scheitern selten an der Technologie. Die Modelle sind leistungsfähig, die Tools sind verfügbar. Was häufig fehlt, ist die Grundlage: Informationen, die nicht vollständig erfasst, nicht sauber verknüpft oder nicht für andere zugänglich sind.

Der richtige Einstieg beginnt daher nicht mit der Frage nach dem nächsten Tool, sondern mit der Bestandsaufnahme: Welches Wissen braucht Ihre KI wirklich und wo liegt es heute?

Haben Sie Fragen zu diesem Thema oder möchten Sie Ihre Datensituation besprechen? Schreiben Sie uns. Wir bringen langjährige ERP- und Organisationspraxis in diese Fragen ein.

Von Datenrealität zu belastbaren KI-Projekten

Wir analysieren mit Ihnen, welche Daten für Ihren Use Case wirklich zählen, wo Lücken liegen und wie Sie eine belastbare Wissensbasis aufbauen.

Andres Andreas

Gründer

Andres Andreas

Gründer bei viamind. 10+ Jahre Erfahrung in der ERP-Beratung, spezialisiert auf technische Machbarkeitsprüfungen und KI-Tool-Evaluierung. Verbindet technische Umsetzbarkeit mit organisatorischer Realität im Mittelstand.