22 May 2026
KI Use Cases priorisieren: Die drei Ebenen, die über den Erfolg deiner KI-Strategie entscheiden

In vielen Unternehmen liegt mittlerweile eine Liste mit zwanzig oder dreißig KI-Ideen auf dem Tisch. Workshops, Innovationsformate und Mitarbeiterbefragungen haben sie produziert. Was fehlt, ist nicht die Idee. Was fehlt, ist die Antwort auf die Frage, womit zuerst.
Die aithoria Mittelstandsstudie 2026 zeigt, dass nur vier Prozent der mittelständischen Unternehmen in Deutschland generative KI strategisch verankert haben [1]. Gleichzeitig sind über siebzig Prozent in der Nutzung aktiv. Diese Lücke zwischen Aktivität und Wirkung ist kein Implementierungsproblem. Sie ist ein Priorisierungsproblem.
Warum die meisten KI-Strategien an der gleichen Stelle scheitern
Das typische Muster sieht so aus: Ein Unternehmen entscheidet sich, ernsthaft in KI einzusteigen. Es entstehen Listen mit Use Cases, oft im dreistelligen Bereich. Aus dieser Liste wählt das Steering Committee den ambitioniertesten aus. Den, der die größte Wirkung verspricht. Den, der nach Innovation aussieht. Sechs Monate später ist das Projekt entweder versandet oder hat die ursprünglichen Ziele um achtzig Prozent reduziert. Die Liste mit den anderen Ideen liegt unbearbeitet im Sharepoint.
Die Ursache ist selten technologisch. Sie liegt in der Annahme, dass Unternehmen direkt mit dem ambitioniertesten Use Case starten können. Eine MIT-Studie zu Enterprise-KI-Initiativen aus 2025 kommt zu dem Ergebnis, dass nur etwa fünf Prozent der untersuchten generativen KI-Pilotprojekte messbaren P&L-Impact liefern, während die übrigen ohne wirtschaftliche Wirkung versanden [2]. Eine RAND-Studie aus 2024 zu KI-Projektabbrüchen zeigt parallel, dass über achtzig Prozent der KI-Projekte scheitern, etwa doppelt so viele wie bei vergleichbaren IT-Projekten ohne KI-Komponente [3]. Der Grund ist nicht mangelnde Technologie, sondern fehlende organisatorische Reife: keine belastbare Datengrundlage, keine KI-kompetenten Teams, keine Erfahrung mit den Eigenheiten generativer Modelle.
Es gibt etablierte Modelle, die diesem Problem begegnen. Gartners AI Maturity Model arbeitet mit fünf Reifegradstufen, McKinseys Three Horizons übertragen das Innovationsdenken auf KI-Investitionen. Beide Modelle sind nützlich, beide sind im Mittelstand zu komplex für die schnelle Anwendung. Was Entscheider brauchen, ist ein pragmatischer Schnitt: ein Raster, das die Frage "welche Art von Wertschöpfung steuern wir hier eigentlich an?" in fünf Minuten beantwortbar macht.
Dieser Artikel beschreibt einen solchen Schnitt. Drei Ebenen, auf denen sich KI-Use-Cases einordnen lassen: Arbeitsproduktivität, Prozesse und Services, Innovation. Die Ebenen sind kein Ersatz für tiefergehende Bewertungsraster wie Impact-Effort-Matrizen oder RICE-Scorings. Sie sind der vorgelagerte Schritt. Wer seine Use Cases nicht zuerst auf diesen drei Ebenen verortet, läuft Gefahr, mit ausgefeilten Matrizen die falsche Frage zu beantworten.
Ebene 1: Arbeitsproduktivität – der Einstieg, den viele unterschätzen
Auf der untersten Ebene geht es um die individuelle Produktivität der Mitarbeitenden. Microsoft Copilot in den M365-Anwendungen, generative Tools für Texterstellung, Bildgenerierung und Recherche, ein selbst gehostetes Unternehmens-LLM für Unternehmen, in denen Copilot architektonisch nicht passt: All das gehört auf diese Ebene. Der Effekt ist sofort spürbar, weil er beim einzelnen Mitarbeitenden ankommt. E-Mails werden schneller beantwortet, Recherchen kürzer, Präsentationen leichter erstellt.
Diese Ebene wird oft als "trivial" abgetan. Das ist ein Fehler. Sie ist die Voraussetzung für alles, was darüber kommt. Ohne KI-Kompetenz auf Mitarbeitendenebene gibt es niemanden, der die Use Cases auf Ebene zwei und drei sinnvoll spezifizieren kann. Wer keine Erfahrung mit der Eigenheit eines Sprachmodells hat, weiß auch nicht, welche Prozesse sich automatisieren lassen und welche nicht.
Konkret gehören auf diese Ebene drei Bausteine. Erstens: Werkzeuge bereitstellen. Copilot-Lizenzen, ein zentral verfügbarer Chat-Assistent, gegebenenfalls Bild- und Videogeneratoren für Marketing-Teams. Zweitens: Routineaufgaben automatisieren. Automatische E-Mail-Klassifikation, Datenweiterleitung, Dokumentenerstellung aus Vorlagen. Drittens: Kompetenz aufbauen. Schulungen, Sprechstunden, interne Communities, in denen Mitarbeitende Prompts und Use Cases teilen.
Ein häufig übersehener Punkt: Werkzeuge ausrollen ohne Begleitung erzeugt nicht Produktivität, sondern Belastung. Wenn die KI in Sekunden Entwürfe produziert, das Prüfen und Veredeln aber weiter am Menschen hängt, entsteht eine neue Form der Überlastung. Forschung zu Technostress und generativer KI [4] zeigt, dass die gleichen Tools bei einem Teil der Belegschaft als Empowerment wirken, bei einem anderen Teil als Frustrations-Verstärker. Der Unterschied liegt nicht in der Software, sondern in der Selbstwirksamkeit der Nutzenden. Wer mehr darüber wissen will, wie sich Technostress bei der KI-Einführung vermeiden lässt, findet in der entsprechenden aithoria-Analyse die vollständige Auseinandersetzung mit dem Phänomen. KI-Einführung auf Ebene 1 ist mindestens so sehr ein HR- und Change-Thema wie ein IT-Thema. Wer das ignoriert, baut sich eine Produktivitäts-Spirale, die irgendwann ins Gegenteil kippt.
Die Ergebnisse auf Ebene 1 sind nicht spektakulär. Niemand schreibt eine Pressemitteilung über "wir nutzen jetzt Copilot". Aber ohne diese Ebene gibt es keine belastbare Basis für alles Folgende.
Ebene 2: Prozesse und Services verbessern – wo der größte Hebel liegt
Auf der zweiten Ebene verlässt KI den individuellen Arbeitsplatz und wird Teil von Geschäftsprozessen. Statt einzelne Mitarbeitende zu unterstützen, übernehmen KI-Systeme Teile von Prozessen ganz oder teilweise autonom. Hier liegt für die meisten mittelständischen Unternehmen der größte Hebel.
Drei Beispiele aus aithoria-Projekten zeigen die Bandbreite.
Erstens: Ein Versicherungsunternehmen aus dem gehobenen Mittelstand hat einen KI-Agenten gebaut, der eingehende Schadensmeldungen verarbeitet. Anrufe werden automatisch entgegengenommen und in strukturierte Tickets umgewandelt. E-Mails werden auf Schadensrelevanz geprüft, klassifiziert und im CRM-System angelegt. Mitarbeitende erhalten Zwischenstände, müssen aber nur noch die Fälle bearbeiten, die echte Entscheidung verlangen. Der Effekt: deutlich kürzere Durchlaufzeiten und freie Kapazitäten in der Sachbearbeitung für die Fälle, die wirklich Erfahrung brauchen.
Zweitens: Ein Industrieunternehmen hat die Projektanlage in seinem CRM-System durch einen Copilot-Agenten ersetzt. Statt sich durch Eingabemasken zu klicken, beschreibt ein Vertriebsmitarbeiter das Projekt im Dialog. Der Agent legt es im CRM an, prüft Budget und Genehmigungsstand, und gibt Projekte bis zu einer definierten Budgetgrenze automatisch frei. Was vorher zwei Stunden pro Projekt gekostet hat, dauert jetzt zehnMinuten.
Drittens: Ein Dienstleistungsunternehmen hat einen KI-Avatar in sein Self-Service-Portal integriert. Kunden, die bestimmte Anliegen klären wollen, sprechen mit einem Video-Avatar statt sich durch FAQ-Bäume zu arbeiten. Der Avatar greift auf das Backend-System zu, kann konkrete Fragen beantworten und einfache Vorgänge auslösen. Die Akzeptanz lag deutlich höher als bei klassischen Chatbots, weil das Interaktions-Gefühl menschlicher war.
Die Gemeinsamkeit dieser Beispiele: Sie greifen in bestehende Prozesse ein, sie verbinden mehrere Systeme, sie übernehmen Aufgaben, die vorher Menschen erledigt haben. Damit ist die technische Komplexität deutlich höher als auf Ebene 1. Und damit auch der Reifegrad, den ein Unternehmen mitbringen muss.
Ebene 2 funktioniert nur, wenn Daten in den anbindenden Systemen sauber, aktuell und mit klaren Berechtigungen versehen sind. CRM-Felder müssen gepflegt sein, ERP-Stammdaten konsistent, Berechtigungsstrukturen klar. Wer auf Ebene 2 einsteigt, ohne die Datengrundlage zu prüfen, bekommt Agenten, die falsche Antworten geben, weil die zugrunde liegenden Daten falsch sind. Mehr dazu im nächsten Abschnitt.
Wer konkrete Beispiele sucht, wie Ebene-2-Use-Cases im Mittelstand aussehen können, findet eine strukturierte Übersicht zu KI-Anwendungsfällen im Mittelstand. Die hier genannten Projekte sind drei Beispiele unter vielen.
Die unsichtbare Voraussetzung: Datenqualität und Datenarchitektur
Es gibt eine Vorbedingung, die in den meisten KI-Strategien zu spät adressiert wird: Datenqualität. KI-Systeme arbeiten mit den Daten, die sie bekommen. Sind diese Daten unvollständig, veraltet, falsch berechtigt oder schwer auffindbar, liefern auch teure und gut konfigurierte KI-Systeme schlechte Ergebnisse.
Konkret heißt Datenqualität im KI-Kontext vier Dinge.

Strukturierung: Dokumente, die in SharePoint, Teams oder Fileservern liegen, müssen für die KI auffindbar und kontextualisierbar sein. Ein Vertrag, der als "Scan_001.pdf" im Ordner "Diverses" liegt, ist für ein Sprachmodell wertlos, egal wie leistungsfähig das Modell ist.
Berechtigungen: KI-Systeme respektieren die Berechtigungen, die in den zugrundeliegenden Systemen gesetzt sind. Wenn ein Mitarbeitender auf einen Ordner Zugriff hat, auf den er aus Compliance-Gründen keinen Zugriff haben dürfte, wird die KI ihm Inhalte aus diesem Ordner präsentieren. Saubere Berechtigungsstrukturen sind keine IT-Hygiene-Übung, sondern Voraussetzung für KI-Einsatz.
Aktualität: KI-Systeme können nicht unterscheiden, ob ein Dokument von 2019 oder 2025 stammt, wenn das Datum nicht im Inhalt steht. Veraltete Inhalte werden ohne Vorwarnung als aktuell präsentiert. Wer KI auf einen Datenbestand anwendet, muss zuerst sortieren, was noch gilt.
Auffindbarkeit: Daten, die in Schatten-IT-Systemen, lokalen Dateiablagen oder persönlichen OneDrives liegen, sind für unternehmensweite KI-Systeme nicht zugänglich. Vor jedem ernsthaften KI-Einsatz steht die Frage, welche Daten überhaupt im erreichbaren Datenraum liegen.
Diese vier Punkte klingen banal. Sie sind es nicht. In den meisten mittelständischen Unternehmen ist mindestens einer davon nicht erfüllt. Der wichtigste Hinweis: Datenqualität ist keine Phase, die zwischen Ebene 1 und Ebene 2 abgeschlossen wird. Sie läuft parallel ab. Wer auf Ebene 1 erste Erfahrungen sammelt und gleichzeitig den Datenraum aufräumt, ist nach zwölf Monaten bereit für Ebene 2. Wer auf Ebene 1 stehen bleibt und Datenqualität als separates Projekt führt, ist nach zwölf Monaten immer noch nicht bereit.
Ebene 3: Innovation ermöglichen – neue Services, neue Märkte
Die dritte Ebene ist die anspruchsvollste, und sie ist die seltenste. Hier geht es nicht mehr darum, bestehende Arbeit zu beschleunigen oder bestehende Prozesse zu automatisieren. Hier entstehen Angebote, die ohne KI nicht möglich wären.
Drei Stoßrichtungen sind typisch.
Erste Stoßrichtung: bestehende interne Lösungen werden zu externen Produkten. Ein aithoria-Kunde aus dem Dienstleistungssektor hat eine interne KI-Lösung entwickelt, die ursprünglich einem konkreten internen Engpass diente. Im Laufe der Entwicklung wurde klar, dass andere Unternehmen in der Branche das gleiche Problem haben. Die Lösung wird inzwischen als eigenständiges Produkt an Marktteilnehmer verkauft und ist zu einem relevanten Umsatzstrang geworden. Aus einer Effizienzlösung wurde ein Geschäftsmodell.
Zweite Stoßrichtung: personalisierte Services in Bereichen, in denen Personalisierung vorher zu teuer war. Versicherungsberatung, Leasing-Konfiguration, Vermögensberatung im unteren Vermögensbereich, technische Erstberatung. Überall dort, wo individuelle Betreuung wirtschaftlich nicht skalierte, ermöglichen KI-Avatare und spezialisierte Sprachmodelle ein Beratungs-Niveau, das sonst nur Premium-Segmenten vorbehalten war.
Dritte Stoßrichtung: schnellere Reaktion auf Markttrends. Wer KI nutzt, um Marktbewegungen, Wettbewerbsverhalten und Kundenverhalten kontinuierlich auszuwerten, erkennt Trends früher und kann Angebote schneller anpassen. Das ist kein Buzz, sondern handfeste Wettbewerbsvorteile in Märkten, in denen Geschwindigkeit zählt.
Die Voraussetzungen für Ebene 3 sind hoch. Es braucht eine funktionierende Daten-Infrastruktur, KI-erfahrene Teams, ein Management, das mit unscharfen Ergebnissen umgehen kann, und eine Organisation, die in Geschäftsmodellen denkt, nicht nur in Prozessen. Diese Kombination findet sich heute in einem kleinen Bruchteil der mittelständischen Unternehmen. Das ist kein Vorwurf, sondern eine realistische Einordnung.
Der wichtige Punkt: Ebene 3 ist nicht das Ziel jedes Unternehmens. Für viele Mittelständler liegt der wirtschaftlich relevante Hebel auf Ebene 2 und wird dort auch bleiben. Innovation als Anspruch ist gut, Innovation als KPI bei einem Unternehmen, das auf Ebene 1 noch nicht stabil unterwegs ist, führt zu enttäuschten Erwartungen und gescheiterten Projekten.

Wie du deine Use Cases bewertest und einordnest
Die praktische Anwendung des Modells ist einfach. Es gilt, jeden Use Case auf der vorhandenen Liste einer der drei Ebenen zuzuordnen. Drei Leitfragen helfen dabei.
Erste Frage: Wer ist der Nutznießer? Wenn die Antwort "ein einzelner Mitarbeitender wird produktiver" lautet, gehört der Use Case auf Ebene 1. Wenn die Antwort "ein Prozess wird schneller oder ein Kundenkontakt wird verbessert" lautet, ist es Ebene 2. Wenn die Antwort "ein neues Angebot oder ein neuer Markt entsteht" lautet, ist es Ebene 3.
Zweite Frage: Welche Systeme sind beteiligt? Use Cases, die im Wesentlichen in einer einzelnen Office-Anwendung stattfinden, sind Ebene 1. Use Cases, die zwei oder mehr Backend-Systeme verbinden, sind Ebene 2. Use Cases, die ein eigenes Produkt oder Service darstellen, sind Ebene 3.
Dritte Frage: Welche Voraussetzungen sind erfüllt? Ein Use Case auf Ebene 2 ist nur dann realistisch, wenn die Datenqualität in den beteiligten Systemen stimmt und die Mitarbeitenden die KI-Kompetenz haben, die Ergebnisse zu prüfen. Wenn diese Voraussetzungen fehlen, gehört der Use Case in den Backlog, nicht in die Roadmap.
Diese Einordnung ist nicht der Endpunkt der Priorisierung. Sie ist der Anfang. Wer seine Use Cases auf die drei Ebenen verteilt hat, sollte anschließend mit weiteren Bewertungsrastern arbeiten. Eine Impact-Effort-Matrix hilft, innerhalb einer Ebene zu priorisieren. RICE-Scorings sind nützlich, um konkurrierende Vorhaben mit Zahlen zu vergleichen. Cost-Impact-Analysen liefern die Wirtschaftlichkeit. Aber alle diese Werkzeuge greifen zu kurz, wenn die vorgelagerte Frage "welche Art von Wertschöpfung wollen wir hier eigentlich?" nicht beantwortet ist.
Eine Faustregel für die ersten zwölf Monate: zwei Drittel der Investition auf Ebene 1 und in Datenqualität, ein Drittel auf erste Ebene-2-Pilotprojekte. Ebene 3 bleibt explizit aus dem Plan, bis die ersten beiden Ebenen stabil laufen. Das fühlt sich konservativ an. Es ist der Weg, der in der Praxis funktioniert. Unternehmen, die diesen Weg gehen, sind nach achtzehn Monaten weiter als Unternehmen, die direkt auf Ebene 3 zielen und nach achtzehn Monaten immer noch keine Pilotprojekte abgeschlossen haben.
Wer aus der Einordnung einen konkreten Fahrplan ableiten will, findet im aithoria-Beitrag zur KI-Roadmap das passende Vorgehensmodell für die nächsten zwölf bis vierundzwanzig Monate.
Die drei Ebenen ersetzen keine Strategie. Sie sind das einfachste verfügbare Werkzeug, um eine bestehende Use-Case-Liste in eine sinnvolle Diskussions-Grundlage zu verwandeln. Wer von zwanzig Ideen drei auf Ebene 1, fünfzehn auf Ebene 2 und zwei auf Ebene 3 stehen sieht, hat eine andere Diskussionsbasis als jemand, der alle zwanzig auf einer Excel-Liste mit Effort- und Impact-Schätzungen anstarrt.
Du hast eine Liste mit Use Cases und weißt nicht, womit du anfangen sollst?
Im KI-Strategie-Workshop sortieren wir gemeinsam deine konkreten Ideen ein, zeigen dir verschiedene Bewertungsraster, die je nach Situation Sinn ergeben, und schauen welche Use Cases bei euch realistisch in den nächsten sechs Monaten liefern. Wir bringen Praxisbeispiele aus vergleichbaren Projekten mit, gehen mit deinem Team ins gemeinsame Brainstorming und entwickeln daraus ein klares Vorgehen für die nächsten Monate. Zwei Tage, klares Ergebnis, kein Strategie-Theater.Lass uns 20 Minuten sprechen, wo bei euch der größte Hebel liegt.
Lass uns 20 Minuten sprechen, wo bei euch der größte Hebel liegt.
Quellen:
[1] aithoria GmbH (2026): Zwischen Aufbruch und Kontrollverlust. Mittelstandsstudie zu generativer KI. Befragung von 134 mittelständischen Unternehmen in Deutschland. Verfügbar unter: https://www.aithoria.de/academy/generative-ki-mittelstand-studie-2026
[2] Challapally, A., Pease, C., Raskar, R., Chari, P. (2025): The GenAI Divide. State of AI in Business 2025. MIT Project NANDA, Juli 2025. Studie basierend auf 300+ analysierten KI-Initiativen, 52 strukturierten Interviews und 153 Survey-Antworten. Verfügbar unter: https://nanda.media.mit.edu/
[3] Ryseff, J., De Bruhl, B. F., Newberry, S. J. (2024): The Root Causes of Failure for Artificial Intelligence Projects and How They Can Succeed. RAND Corporation, Report RR-A2680-1, August 2024. Basierend auf 65 strukturierten Interviews mit erfahrenen Data Scientists und ML-Engineers. Verfügbar unter: https://www.rand.org/pubs/research_reports/RRA2680-1.html
[4] Wekenborg, M. et al. (2025): The effects of information and communication technology (ICT) implementation on psychophysiological markers of stress. A systematic review. In: Behaviour & Information Technology. Else Kröner Fresenius Center for Digital Health, TU Dresden. Verfügbar unter: https://www.tandfonline.com/doi/full/10.1080/0144929X.2025.2504511
.webp)


