• Autor: Peter Vnuk
Die Cloud bringt Unternehmens-KI schnell in den Betrieb, doch regelmäßige Nutzung braucht finanzielle Kontrolle. Sobald interne Assistenten, die Arbeit mit Dokumenten oder die Entwicklung von Agenten jeden Monat ähnliche Kosten verursachen, reicht die Frage nicht mehr aus, wie viel eine einzelne Anfrage kostet. Wichtiger ist, nach wie vielen Monaten sich dieselbe Last auf eigener Hardware bezahlt machen würde.
Auf den ersten Blick wirkt eigene KI-Infrastruktur teuer, weil der Preis auf einmal anfällt. Die Cloud verteilt sich dagegen auf monatliche Zahlungen, die das Budget weniger stark belasten, über einen längeren Zeitraum aber auf eine deutlich höhere Summe anwachsen können. Eine TCO-Berechnung vergleicht beide Varianten auf derselben Zeitachse: einmalige Anschaffung und Betrieb auf der einen Seite, wiederkehrende Cloudnutzung auf der anderen.
Zur Cloudseite gehört die gesamte Rechnung für den KI-Betrieb, nicht nur der Preis des Modells. Unternehmenslösungen zahlen in der Regel auch für Dokumentenverarbeitung, Datenspeicherung, Suchschicht, Logging und Monitoring. Bei einem kleineren Pilotprojekt sind das Nebenposten, bei einem stabilen Einsatz können sie die Amortisation eigener Hardware jedoch um Monate verschieben.
Bei lokaler Infrastruktur reicht es nicht, nur den Anschaffungspreis einzusetzen. Unternehmen müssen auch Strom, Basisadministration, eine Servicereserve und die Zeit des IT-Teams bei der Einführung einrechnen. Die Verlagerung eines Teils der Last aus der Cloud kann außerdem zusätzliche einmalige Arbeit erfordern: Einrichtung der Umgebung, Anpassung von Datenflüssen und Prüfung der Sicherheitsregeln.
| Kostenposition | Cloudbetrieb | Eigene Infrastruktur |
|---|---|---|
| Berechnungsgrundlage | monatliche Rechnung für KI-Dienste | Anschaffungspreis der Hardware |
| Regelmäßiger Overhead | Dienste rund um das Modell und Monitoring | Strom und Administration |
| Einmalige Arbeit | zum Start meist geringer | Einführung, Integration, Sicherheitseinstellungen |
| Wichtigstes finanzielles Risiko | steigende Nutzung ohne feste Obergrenze | ungenutzte Kapazität nach dem Kauf |
| Am besten geeignet für | schnelle Validierung eines Szenarios | wiederkehrenden Betrieb mit bekannter Last |
Für die Modellrechnung verwenden wir die Workstation NVIDIA DGX Spark mit einem Anschaffungspreis von 5.219 €. Es handelt sich um eine lokale KI-Workstation mit 128 GB Arbeitsspeicher, 4 TB SSD und einer Leistung von bis zu 1 PetaFLOP bei FP4-Inferenz. Dank des bekannten Anschaffungspreises lässt sich gut zeigen, wie sich die Amortisation je nach Höhe der regelmäßigen Cloudrechnung verändert.
i
Amortisationsdauer in Monaten = (Anschaffungspreis der Hardware + einmalige Einführungskosten) ÷ (monatliche Cloudkosten – monatliche Betriebskosten der eigenen Infrastruktur)
Bei monatlichen Cloudkosten von 1.033 € und modellhaften lokalen Betriebskosten von 103 € ergibt sich eine Amortisation von rund 5,6 Monaten. Wenn dasselbe Unternehmen 413 € pro Monat für die Cloud zahlt, verlängert sich die Amortisation auf 16,8 Monate. Der Unterschied entsteht nicht durch den Preis der Hardware, sondern dadurch, wie viel wiederkehrende Arbeit sie übernehmen kann.
| Monatliche Cloudrechnung | Modellhafter lokaler Betrieb | Amortisation bei 5.219 € Anschaffungspreis |
|---|---|---|
| 413 € | 103 € | 16,8 Monate |
| 620 € | 103 € | 10,1 Monate |
| 1.033 € | 103 € | 5,6 Monate |
| 1.652 € | 103 € | 3,4 Monate |
Die Tabelle zeigt ein Grundmodell mit Anschaffungspreis und regelmäßigem lokalem Betrieb. Wenn ein Unternehmen auch einmalige Arbeit bei der Einführung einrechnet, etwa die Einrichtung der Umgebung, die Anpassung von Datenflüssen oder die Sicherheitsprüfung, wird diese zur Anfangsinvestition addiert und der Break-even verschiebt sich nach hinten. Bei einmaligen Kosten von 2.066 € würde sich die Amortisation bei Cloudkosten von 1.033 € pro Monat beispielsweise von 5,6 Monaten auf rund 7,8 Monate verlängern.
Eine solche Tabelle ist eine bessere Entscheidungsgrundlage als eine allgemeine Debatte über Cloud und Hardware. Bei niedriger Nutzung muss ein Kauf noch nicht überzeugend sein, besonders wenn ein Unternehmen geeignete KI-Szenarien erst sucht. Sobald sich die monatliche Rechnung jedoch im mittleren dreistelligen bis niedrigen vierstelligen Eurobereich bewegt und die Nutzung einen klaren Rhythmus hat, bekommt die Investition einen konkreten Amortisationshorizont.
NVIDIA DGX Spark richtet sich an Unternehmen und Teams, die größere KI-Modelle lokal betreiben oder testen möchten, ohne dass die Cloudkosten ständig steigen. Geeignet ist sie für interne Assistenten über Unternehmensdokumenten, die Entwicklung von Agenten, das Testen offener Modelle und die Arbeit mit Daten, die unter Kontrolle des Unternehmens bleiben sollen. Entscheidend ist vor allem die Kombination aus hoher Speicherkapazität, kompakter Bauform und fertiger Softwareumgebung.
Die Kapazität von 128 GB Arbeitsspeicher ist in dieser Kategorie wichtiger als klassische Prozessorleistung. Lokale KI-Aufgaben stoßen nämlich häufig genau an Speicher- und Modellgrößengrenzen, nicht daran, ob ein Gerät Büroarbeit bewältigt. In der Praxis handelt es sich daher um einen dedizierten Knoten für KI-Lasten, den ein Unternehmen wiederholt nutzen kann.
Bei einem solchen Kauf sollten zwei Schwellen betrachtet werden. Die erste ist die Amortisation bei aktueller Nutzung, die zweite die Amortisation bei realistischem Wachstum. Wenn KI nach einem erfolgreichen Pilotprojekt auf ein weiteres Team ausgeweitet wird, steigt die Cloudrechnung sofort. Eigene Hardware steht dagegen bereits einmal im Budget, was am Ende einen erheblichen finanziellen Unterschied ausmachen kann.
TCO-Kalkulationen werden vor allem dann ungenau, wenn sie mit optimistischen Eingaben arbeiten. Unternehmen unterschätzen die Zeit des IT-Teams, vergessen Monitoring oder rechnen mit einer Auslastung, die sich später nicht bestätigt. Ein konservativeres Szenario ist für Freigaben hilfreicher als eine Tabelle, die nur deshalb eine schöne Amortisation zeigt, weil nicht alle Kosten enthalten sind.
| Eingabe in die Kalkulation | Häufiger Fehler | Besserer Ansatz |
|---|---|---|
| Monatliche Cloudrechnung | es wird nur der Modellpreis berücksichtigt | auch umliegende Dienste und Monitoring einbeziehen |
| Lokaler Betrieb | Strom wird einberechnet, Administration nicht | monatliche Reserve für IT-Zeit ergänzen |
| IT-Kapazität | es wird angenommen, dass die Betreuung nebenbei erledigt wird | prüfen, ob eine Person für Einführung, Updates und laufende Überwachung verfügbar ist |
| Einmalige Einführung | Migration wird als selbstverständlich betrachtet | sie in die Anfangskosten des Projekts aufnehmen |
| Auslastung der Hardware | es wird mit idealer Auslastung gerechnet | auch mit einem schwächeren Szenario arbeiten |
| Künftiges Wachstum | Ausweitung auf weitere Teams wird ignoriert | eine Variante für 6 bis 12 Monate später berechnen |
| Flexibilität | die Cloud wird nur als Kostenfaktor gesehen | die Möglichkeit bewerten, Nutzung schnell zu reduzieren |
Das Risiko gebundenen Kapitals gehört genauso in die Berechnung wie der Preis der Hardware. Wenn sich die geplante Nutzung nicht bestätigt, steht die lokale Workstation einen Teil der Zeit ungenutzt da, während sich Cloudnutzung einfach reduzieren ließe. Deshalb sollte die Kalkulation nicht nur mit einem Basisszenario arbeiten, sondern auch mit einer konservativen Variante, die zeigt, ob der Kauf auch bei langsamerem Anlauf tragfähig bleibt.
Lokale KI-Workstationen sind ein guter erster Schritt, wenn ein Unternehmen einen stabilen Teil der Cloudlast übernehmen und eine eigene Umgebung für Entwicklung, Inferenz oder Arbeit mit internen Daten gewinnen möchte. Bei größeren Implementierungen können jedoch Grenzen bei Leistung, Speicher, Verfügbarkeit oder Verwaltung für mehrere Teams entstehen. Dann geht es nicht mehr nur um den Kauf eines einzelnen Geräts, sondern um den Entwurf einer breiteren KI-Infrastruktur anhand des konkreten Betriebs.
Ein Zwischenschritt können mehrere eigenständige Workstations derselben Klasse sein, wenn ein Unternehmen Teams, Projekte oder parallele Aufgaben trennen muss. Wirtschaftlich wird ein solches Szenario nach Anzahl der Geräte und deren Betriebskosten berechnet. Technisch bedeutet es aber keine automatische Bündelung von Leistung und Speicher zu einem größeren System. Mehrere Workstations sind vor allem dort sinnvoll, wo sich die Last aufteilen lässt; für einen großen zentralen KI-Betrieb ist ein individueller Entwurf höherer Infrastruktur besser geeignet.
Das entscheidende Signal ist das Lastvolumen. Wenn ein Unternehmen langfristig mehrere Tausend Euro monatlich für KI-Betrieb zahlt, mit mehreren Teams arbeitet und getrennte Umgebungen benötigt, ist eine individuelle Kalkulation höherer Infrastruktur sinnvoll. Die grundlegende Amortisationsformel bleibt gleich, in die Berechnung fließen dann aber ein konkretes Angebot, eine genauere Schätzung der Betriebskosten und der Anteil der Cloudnutzung ein, den die neue Lösung übernehmen soll.
Bei niedrigeren Beträgen ist es überzeugender, mit einer bepreisten Workstation zu beginnen und die tatsächliche Auslastung zu messen. So erhält das Unternehmen eigene Daten zu Leistung, Betrieb und Nutzung. Eine spätere Erweiterung der Infrastruktur basiert dann nicht auf Schätzungen, sondern auf realem Betrieb.
Für eine erste Orientierung reichen vier Zahlen:
Das Ergebnis zeigt anschließend den Break-even in Monaten und die Differenz gegenüber der Cloud über drei Jahre. Gerade drei Jahre sind für Unternehmenshardware ein praktischer Horizont, weil sie die Lebensdauer eines Geräts besser abbilden als der einmalige Vergleich mit einer einzelnen Rechnung.
| Ergebnis der Berechnung | Was es bedeutet | Empfohlener nächster Schritt |
|---|---|---|
| Amortisation innerhalb von 12 Monaten | starkes wirtschaftliches Signal für den Kauf | technische Parameter der Hardware prüfen und Freigabe vorbereiten |
| Amortisation in 12 bis 24 Monaten | Grenzbereich, in dem weitere Faktoren entscheiden | Nutzungswachstum, Datensicherheit und verfügbare IT-Kapazität einrechnen |
| Amortisation über 24 Monate | die reine Ersparnis rechtfertigt den Kauf möglicherweise noch nicht | Cloudrechnung weiter messen und nach steigender Last erneut berechnen |
| Negative oder keine Ersparnis | lokaler Betrieb ist nicht günstiger als die Cloud | Szenario in der Cloud belassen oder Eingaben der Berechnung ändern |
Eine Amortisation unter 12 Monaten ist ein starkes Kaufsignal, sofern die lokale Hardware die gewünschte Last technisch bewältigt. Ein Ergebnis zwischen 12 und 24 Monaten hängt stärker von weiteren Faktoren ab, vor allem von der Arbeit mit sensiblen Daten und dem erwarteten Wachstum der KI-Nutzung. Ein längerer Horizont schließt den Kauf nicht automatisch aus, erfordert aber einen klaren Grund jenseits der reinen Ersparnis, zum Beispiel interne Sicherheitsregeln oder den Bedarf an lokaler Entwicklung.
Bei Cloudkosten von 1.033 € pro Monat und modellhaftem lokalem Betrieb für 103 € amortisiert sich Hardware für 5.219 € in rund 5,6 Monaten. Bei 620 € pro Monat verschiebt sich die Amortisation auf etwa zehn Monate, also immer noch auf einen Zeitraum, der eine Budgetdiskussion rechtfertigt. Entscheidend ist nicht der Anschaffungspreis allein, sondern die Differenz zwischen wiederkehrender Cloudzahlung und dem Betrieb eigener Kapazität.
Der nächste Schritt besteht darin, die letzten Cloudrechnungen zu nehmen, wiederkehrende KI-Last von einmaligen Experimenten zu trennen und konkrete Hardware in die Berechnung einzusetzen. Wenn das Ergebnis im Bereich weniger Monate liegt, hat ein Unternehmen eine klare Grundlage für den Kauf einer lokalen KI-Workstation. Wenn die Zahlen noch nicht aufgehen, lohnt es sich, die monatliche Cloudrechnung, die Zahl aktiver Nutzer und den Anteil wiederkehrender Last weiter zu beobachten. Genau diese Werte zeigen am schnellsten, wann der Kauf eigener KI-Infrastruktur wirtschaftlich vertretbar wird.
i
Wir bereiten einen interaktiven Rechner vor. Bis dahin können Sie die Amortisation anhand der Formel und der Modellszenarien oben abschätzen.

Peter Vnuk
Technologien sind für mich sowohl Beruf als auch Hobby – am meisten beschäftige ich mich mit Smartphones, Notebooks, Audiotechnik, künstlicher Intelligenz und allem, was hi-tech ist. Ich rezensiere gerne Neuheiten, verfolge futuristische Trends und versuche, die zukünftige Entwicklung von Technologien abzuschätzen. Science-Fiction und Visionen zukünftiger Welten faszinieren mich – sie sind oft auch eine Inspiration für reale technologische Fortschritte. Beruflich beschäftige ich mich zudem mit Videospielen und der Gaming-Branche. Und wenn ich mal nicht arbeite, entspanne ich gerne bei einem guten Spiel, einem qualitativ hochwertigen Bier oder beim Erstellen von Tech-Memes auf Facebook.