Zusammenfassung, Empfehlung und Ausblick#
Zusammenfassung#
Für die vorliegende Arbeit wurden selbstgehostete Large Language Models (LLMs) für die Eignung zum Wissensmanagement mittelständischer Unternehmen untersucht. Dafür wurde unter anderem ein prototypisches RAG‑System entworfen.
- Technisch ist der On‑Premises‑Betrieb mit quantisierten Open‑Weights‑Modellen realisierbar. Modular gestaltete Systeme (Reader, Splitter, Embedder, Retriever, Agenten) und etablierte Frameworks (Ollama, LangChain) senken die Einstiegshürden.
- Organisatorisch bedarf es klarer Richtlinien für den Umgang mit den verwendeten Daten, eines permanenten Monitorings und eines geregelten Change‑ und Schulungsprozesses.
- Rechtlich bietet On‑Premises Vorteile bei Datenschutz, Datenhoheit und Compliance-Konformität, insbesondere für datensensible Anwendungsfälle.
- Im direkten Vergleich sind die Cloud‑Modelle in Sachen Geschwindigkeit, Skalierung und Leistung überlegen. On‑Premises überzeugt überall dort, wo Datenschutz, Kontrolle und Nachvollziehbarkeit dominieren.
- Für typische KMU‑Anwendungsbereiche erscheint ein hybrider Ansatz sinnvoll: Cloud-Lösungen für allgemeine, nicht datenschutzkritische Aufgaben und On‑Premises-LLMs für sensible, domänenspezifische Prozesse.
Die Bewertung der beiden Ansätze erfolgte qualitativ. Formale Vergleichsdaten, Kostenrechnungen und Nutzerstudien waren nicht Gegenstand dieser Arbeit. Insgesamt zeigt die Arbeit, dass On‑Premises‑LLMs kein Ersatz für proprietäre Cloud‑Lösungen sind, wohl aber ein sinnvolles Ergänzungswerkzeug für Unternehmen mit hohen Anforderungen an Datenkontrolle und der Einhaltung von gesetzlichen oder betrieblichen Bestimmungen.
Empfehlung#
Auf Basis der konzeptionellen Evaluierung und des prototypischen Nachweises empfiehlt sich für mittelständische Unternehmen ein hybrider Ansatz:
Cloud-LLMs eignen sich für allgemeine, wenig datensensible Anwendungsbereiche#
- Aufgaben: Ideenfindung, Texterstellung, Übersetzung, Erstellung von Programm-Code, allgemeine Recherche
- Begründung: Hohe Modellqualität und -leistung, schnelle Verfügbarkeit und Skalierbarkeit
On-Premises-LLMs empfehlen sich für datensensible, unternehmensspezifische Anwendungsbereiche#
- Aufgaben: Interne Wissensrecherche (RAG) mit vertraulichen Dokumenten, Einsatz in regulierten Branchen und Arbeitsbereichen wie der Rechtsberatung oder der Medizin
- Begründung: Datenhoheit, Kontrollierbarkeit, Gesetz-Konformität
Entscheidungskriterien#
| Frage | Empfehlung |
|---|---|
| Enthalten Prompts oder Dokumente personenbezogene, vertrauliche oder klassifizierte Daten? | On-Premises |
| Sollen viele Personen gleichzeitig arbeiten und die Reaktionszeit im Sekundenbereich bleiben? | Cloud-Lösung |
| Stehen Erklärbarkeit und Nachvollziehbarkeit im Vordergrund? | On-Premises vorteilhaft |
| Fehlen Fachleute oder andere betriebliche Kapazitäten? | Cloud-first, schrittweise On-Premises aufbauen |
Implementierungsstrategie#
- Cloud‑first, sensitive‑data‑last: Standardaufgaben mit Hilfe von Cloud-Lösungen optimieren, sensible Wissensbereiche inhouse halten
- RAG vor Finetuning: Einbindung von spezifischem Wissen durch RAG hat Vorrang vor dem Finetuning von Modellen
- Security-by-Design: Schutz vor Prompt-Injection, Schutz von personenbezogenen Daten (DSGVO), rollenbasierte Zugriffsberechtigungen, Audit‑Logging, regelmäßige Reviews entlang von OWASP Top 10
- Iteratives Vorgehen:
- Pilotprojekt
- Eingeschränkter Parallelbetrieb
- Schrittweiser Rollout, begleitet durch Schulungen und Change-Management
Ausblick#
Die vorliegende Arbeit ist eine konzeptionelle Analyse für den Einsatz von On-Premises-LLMs in mittelständischen Unternehmen. Darauf aufbauend bieten sich die folgenden konkreten Schritte an:
- Vertiefende Evaluation der Systemleistung und Antwortqualität in unterschiedlichen Setups
- Definition und Einführung von LLMOps für die Versionierung von Modellen, Prompts und Konfigurationen, Telemetrie, Alerting, Security- und Compliance-Checks
- Definition einer Daten- und Wissensstrategie für Quelldaten, Dokumenttypen und Qualitätsstandards
- Weiterentwicklung des Prototypen und nutzungsspezifische Tests
- Produktentwicklung bis zur Marktreife und Roll-out
Prototyp#
Der entwickelte Prototyp steht als Open-Source-Projekt auf GitHub zur Verfügung: