TCO-Rechner: Nach welcher Zeit amortisiert sich eine eigene Infrastruktur im Vergleich zur Cloud

Aktualisiert: 12. Juni 2026 • Autor: Peter Vnuk

Die Cloud bringt Unternehmens-KI schnell in den Betrieb, doch regelmäßige Nutzung braucht finanzielle Kontrolle. Sobald interne Assistenten, die Arbeit mit Dokumenten oder die Entwicklung von Agenten jeden Monat ähnliche Kosten verursachen, reicht die Frage nicht mehr aus, wie viel eine einzelne Anfrage kostet. Wichtiger ist, nach wie vielen Monaten sich dieselbe Last auf eigener Hardware bezahlt machen würde.

TCO-Rechner — INHALT

Der Anschaffungspreis allein entscheidet nicht
Der Break-even lässt sich mit einer Gleichung berechnen
Eine lokale KI-Workstation ist bei wiederkehrender Arbeit am wertvollsten
Woran die Berechnung am häufigsten scheitert
Wann eine Workstation nicht mehr ausreicht
Berechnen Sie Ihre eigene Amortisation
Wann sich eigene KI-Infrastruktur zu rechnen beginnt

Der Anschaffungspreis allein entscheidet nicht

Auf den ersten Blick wirkt eigene KI-Infrastruktur teuer, weil der Preis auf einmal anfällt. Die Cloud verteilt sich dagegen auf monatliche Zahlungen, die das Budget weniger stark belasten, über einen längeren Zeitraum aber auf eine deutlich höhere Summe anwachsen können. Eine TCO-Berechnung vergleicht beide Varianten auf derselben Zeitachse: einmalige Anschaffung und Betrieb auf der einen Seite, wiederkehrende Cloudnutzung auf der anderen.

Zur Cloudseite gehört die gesamte Rechnung für den KI-Betrieb, nicht nur der Preis des Modells. Unternehmenslösungen zahlen in der Regel auch für Dokumentenverarbeitung, Datenspeicherung, Suchschicht, Logging und Monitoring. Bei einem kleineren Pilotprojekt sind das Nebenposten, bei einem stabilen Einsatz können sie die Amortisation eigener Hardware jedoch um Monate verschieben.

Bei lokaler Infrastruktur reicht es nicht, nur den Anschaffungspreis einzusetzen. Unternehmen müssen auch Strom, Basisadministration, eine Servicereserve und die Zeit des IT-Teams bei der Einführung einrechnen. Die Verlagerung eines Teils der Last aus der Cloud kann außerdem zusätzliche einmalige Arbeit erfordern: Einrichtung der Umgebung, Anpassung von Datenflüssen und Prüfung der Sicherheitsregeln.

Kostenposition	Cloudbetrieb	Eigene Infrastruktur
Berechnungsgrundlage	monatliche Rechnung für KI-Dienste	Anschaffungspreis der Hardware
Regelmäßiger Overhead	Dienste rund um das Modell und Monitoring	Strom und Administration
Einmalige Arbeit	zum Start meist geringer	Einführung, Integration, Sicherheitseinstellungen
Wichtigstes finanzielles Risiko	steigende Nutzung ohne feste Obergrenze	ungenutzte Kapazität nach dem Kauf
Am besten geeignet für	schnelle Validierung eines Szenarios	wiederkehrenden Betrieb mit bekannter Last

Der Break-even lässt sich mit einer Gleichung berechnen

Für die Modellrechnung verwenden wir die Workstation NVIDIA DGX Spark mit einem Anschaffungspreis von 5.219 €. Es handelt sich um eine lokale KI-Workstation mit 128 GB Arbeitsspeicher, 4 TB SSD und einer Leistung von bis zu 1 PetaFLOP bei FP4-Inferenz. Dank des bekannten Anschaffungspreises lässt sich gut zeigen, wie sich die Amortisation je nach Höhe der regelmäßigen Cloudrechnung verändert.

Amortisationsdauer in Monaten = (Anschaffungspreis der Hardware + einmalige Einführungskosten) ÷ (monatliche Cloudkosten – monatliche Betriebskosten der eigenen Infrastruktur)

Bei monatlichen Cloudkosten von 1.033 € und modellhaften lokalen Betriebskosten von 103 € ergibt sich eine Amortisation von rund 5,6 Monaten. Wenn dasselbe Unternehmen 413 € pro Monat für die Cloud zahlt, verlängert sich die Amortisation auf 16,8 Monate. Der Unterschied entsteht nicht durch den Preis der Hardware, sondern dadurch, wie viel wiederkehrende Arbeit sie übernehmen kann.

Monatliche Cloudrechnung	Modellhafter lokaler Betrieb	Amortisation bei 5.219 € Anschaffungspreis
413 €	103 €	16,8 Monate
620 €	103 €	10,1 Monate
1.033 €	103 €	5,6 Monate
1.652 €	103 €	3,4 Monate

Die Tabelle zeigt ein Grundmodell mit Anschaffungspreis und regelmäßigem lokalem Betrieb. Wenn ein Unternehmen auch einmalige Arbeit bei der Einführung einrechnet, etwa die Einrichtung der Umgebung, die Anpassung von Datenflüssen oder die Sicherheitsprüfung, wird diese zur Anfangsinvestition addiert und der Break-even verschiebt sich nach hinten. Bei einmaligen Kosten von 2.066 € würde sich die Amortisation bei Cloudkosten von 1.033 € pro Monat beispielsweise von 5,6 Monaten auf rund 7,8 Monate verlängern.

Eine solche Tabelle ist eine bessere Entscheidungsgrundlage als eine allgemeine Debatte über Cloud und Hardware. Bei niedriger Nutzung muss ein Kauf noch nicht überzeugend sein, besonders wenn ein Unternehmen geeignete KI-Szenarien erst sucht. Sobald sich die monatliche Rechnung jedoch im mittleren dreistelligen bis niedrigen vierstelligen Eurobereich bewegt und die Nutzung einen klaren Rhythmus hat, bekommt die Investition einen konkreten Amortisationshorizont.

Entwicklung und Betrieb künstlicher Intelligenz

Eine lokale KI-Workstation ist bei wiederkehrender Arbeit am wertvollsten

NVIDIA DGX Spark richtet sich an Unternehmen und Teams, die größere KI-Modelle lokal betreiben oder testen möchten, ohne dass die Cloudkosten ständig steigen. Geeignet ist sie für interne Assistenten über Unternehmensdokumenten, die Entwicklung von Agenten, das Testen offener Modelle und die Arbeit mit Daten, die unter Kontrolle des Unternehmens bleiben sollen. Entscheidend ist vor allem die Kombination aus hoher Speicherkapazität, kompakter Bauform und fertiger Softwareumgebung.

Die Kapazität von 128 GB Arbeitsspeicher ist in dieser Kategorie wichtiger als klassische Prozessorleistung. Lokale KI-Aufgaben stoßen nämlich häufig genau an Speicher- und Modellgrößengrenzen, nicht daran, ob ein Gerät Büroarbeit bewältigt. In der Praxis handelt es sich daher um einen dedizierten Knoten für KI-Lasten, den ein Unternehmen wiederholt nutzen kann.

Bei einem solchen Kauf sollten zwei Schwellen betrachtet werden. Die erste ist die Amortisation bei aktueller Nutzung, die zweite die Amortisation bei realistischem Wachstum. Wenn KI nach einem erfolgreichen Pilotprojekt auf ein weiteres Team ausgeweitet wird, steigt die Cloudrechnung sofort. Eigene Hardware steht dagegen bereits einmal im Budget, was am Ende einen erheblichen finanziellen Unterschied ausmachen kann.

Woran die Berechnung am häufigsten scheitert

TCO-Kalkulationen werden vor allem dann ungenau, wenn sie mit optimistischen Eingaben arbeiten. Unternehmen unterschätzen die Zeit des IT-Teams, vergessen Monitoring oder rechnen mit einer Auslastung, die sich später nicht bestätigt. Ein konservativeres Szenario ist für Freigaben hilfreicher als eine Tabelle, die nur deshalb eine schöne Amortisation zeigt, weil nicht alle Kosten enthalten sind.

Eingabe in die Kalkulation	Häufiger Fehler	Besserer Ansatz
Monatliche Cloudrechnung	es wird nur der Modellpreis berücksichtigt	auch umliegende Dienste und Monitoring einbeziehen
Lokaler Betrieb	Strom wird einberechnet, Administration nicht	monatliche Reserve für IT-Zeit ergänzen
IT-Kapazität	es wird angenommen, dass die Betreuung nebenbei erledigt wird	prüfen, ob eine Person für Einführung, Updates und laufende Überwachung verfügbar ist
Einmalige Einführung	Migration wird als selbstverständlich betrachtet	sie in die Anfangskosten des Projekts aufnehmen
Auslastung der Hardware	es wird mit idealer Auslastung gerechnet	auch mit einem schwächeren Szenario arbeiten
Künftiges Wachstum	Ausweitung auf weitere Teams wird ignoriert	eine Variante für 6 bis 12 Monate später berechnen
Flexibilität	die Cloud wird nur als Kostenfaktor gesehen	die Möglichkeit bewerten, Nutzung schnell zu reduzieren

Das Risiko gebundenen Kapitals gehört genauso in die Berechnung wie der Preis der Hardware. Wenn sich die geplante Nutzung nicht bestätigt, steht die lokale Workstation einen Teil der Zeit ungenutzt da, während sich Cloudnutzung einfach reduzieren ließe. Deshalb sollte die Kalkulation nicht nur mit einem Basisszenario arbeiten, sondern auch mit einer konservativen Variante, die zeigt, ob der Kauf auch bei langsamerem Anlauf tragfähig bleibt.

Wann eine Workstation nicht mehr ausreicht

Lokale KI-Workstationen sind ein guter erster Schritt, wenn ein Unternehmen einen stabilen Teil der Cloudlast übernehmen und eine eigene Umgebung für Entwicklung, Inferenz oder Arbeit mit internen Daten gewinnen möchte. Bei größeren Implementierungen können jedoch Grenzen bei Leistung, Speicher, Verfügbarkeit oder Verwaltung für mehrere Teams entstehen. Dann geht es nicht mehr nur um den Kauf eines einzelnen Geräts, sondern um den Entwurf einer breiteren KI-Infrastruktur anhand des konkreten Betriebs.

Ein Zwischenschritt können mehrere eigenständige Workstations derselben Klasse sein, wenn ein Unternehmen Teams, Projekte oder parallele Aufgaben trennen muss. Wirtschaftlich wird ein solches Szenario nach Anzahl der Geräte und deren Betriebskosten berechnet. Technisch bedeutet es aber keine automatische Bündelung von Leistung und Speicher zu einem größeren System. Mehrere Workstations sind vor allem dort sinnvoll, wo sich die Last aufteilen lässt; für einen großen zentralen KI-Betrieb ist ein individueller Entwurf höherer Infrastruktur besser geeignet.

Wenn eine Workstation nicht mehr ausreicht

Das entscheidende Signal ist das Lastvolumen. Wenn ein Unternehmen langfristig mehrere Tausend Euro monatlich für KI-Betrieb zahlt, mit mehreren Teams arbeitet und getrennte Umgebungen benötigt, ist eine individuelle Kalkulation höherer Infrastruktur sinnvoll. Die grundlegende Amortisationsformel bleibt gleich, in die Berechnung fließen dann aber ein konkretes Angebot, eine genauere Schätzung der Betriebskosten und der Anteil der Cloudnutzung ein, den die neue Lösung übernehmen soll.

Bei niedrigeren Beträgen ist es überzeugender, mit einer bepreisten Workstation zu beginnen und die tatsächliche Auslastung zu messen. So erhält das Unternehmen eigene Daten zu Leistung, Betrieb und Nutzung. Eine spätere Erweiterung der Infrastruktur basiert dann nicht auf Schätzungen, sondern auf realem Betrieb.

Berechnen Sie Ihre eigene Amortisation

Für eine erste Orientierung reichen vier Zahlen:

der Anschaffungspreis der Hardware,
die aktuelle monatliche Cloudrechnung,
eine Schätzung der lokalen Betriebskosten
und die einmalige Arbeit bei der Einführung.

Das Ergebnis zeigt anschließend den Break-even in Monaten und die Differenz gegenüber der Cloud über drei Jahre. Gerade drei Jahre sind für Unternehmenshardware ein praktischer Horizont, weil sie die Lebensdauer eines Geräts besser abbilden als der einmalige Vergleich mit einer einzelnen Rechnung.

Ergebnis der Berechnung	Was es bedeutet	Empfohlener nächster Schritt
Amortisation innerhalb von 12 Monaten	starkes wirtschaftliches Signal für den Kauf	technische Parameter der Hardware prüfen und Freigabe vorbereiten
Amortisation in 12 bis 24 Monaten	Grenzbereich, in dem weitere Faktoren entscheiden	Nutzungswachstum, Datensicherheit und verfügbare IT-Kapazität einrechnen
Amortisation über 24 Monate	die reine Ersparnis rechtfertigt den Kauf möglicherweise noch nicht	Cloudrechnung weiter messen und nach steigender Last erneut berechnen
Negative oder keine Ersparnis	lokaler Betrieb ist nicht günstiger als die Cloud	Szenario in der Cloud belassen oder Eingaben der Berechnung ändern

Eine Amortisation unter 12 Monaten ist ein starkes Kaufsignal, sofern die lokale Hardware die gewünschte Last technisch bewältigt. Ein Ergebnis zwischen 12 und 24 Monaten hängt stärker von weiteren Faktoren ab, vor allem von der Arbeit mit sensiblen Daten und dem erwarteten Wachstum der KI-Nutzung. Ein längerer Horizont schließt den Kauf nicht automatisch aus, erfordert aber einen klaren Grund jenseits der reinen Ersparnis, zum Beispiel interne Sicherheitsregeln oder den Bedarf an lokaler Entwicklung.

So wählen Sie einen KI-Beschleuniger aus

Wann sich eigene KI-Infrastruktur zu rechnen beginnt

Bei Cloudkosten von 1.033 € pro Monat und modellhaftem lokalem Betrieb für 103 € amortisiert sich Hardware für 5.219 € in rund 5,6 Monaten. Bei 620 € pro Monat verschiebt sich die Amortisation auf etwa zehn Monate, also immer noch auf einen Zeitraum, der eine Budgetdiskussion rechtfertigt. Entscheidend ist nicht der Anschaffungspreis allein, sondern die Differenz zwischen wiederkehrender Cloudzahlung und dem Betrieb eigener Kapazität.

Der nächste Schritt besteht darin, die letzten Cloudrechnungen zu nehmen, wiederkehrende KI-Last von einmaligen Experimenten zu trennen und konkrete Hardware in die Berechnung einzusetzen. Wenn das Ergebnis im Bereich weniger Monate liegt, hat ein Unternehmen eine klare Grundlage für den Kauf einer lokalen KI-Workstation. Wenn die Zahlen noch nicht aufgehen, lohnt es sich, die monatliche Cloudrechnung, die Zahl aktiver Nutzer und den Anteil wiederkehrender Last weiter zu beobachten. Genau diese Werte zeigen am schnellsten, wann der Kauf eigener KI-Infrastruktur wirtschaftlich vertretbar wird.

Wir bereiten einen interaktiven Rechner vor. Bis dahin können Sie die Amortisation anhand der Formel und der Modellszenarien oben abschätzen.

Server

Peter Vnuk

Technologien sind für mich sowohl Beruf als auch Hobby – am meisten beschäftige ich mich mit Smartphones, Notebooks, Audiotechnik, künstlicher Intelligenz und allem, was hi-tech ist. Ich rezensiere gerne Neuheiten, verfolge futuristische Trends und versuche, die zukünftige Entwicklung von Technologien abzuschätzen. Science-Fiction und Visionen zukünftiger Welten faszinieren mich – sie sind oft auch eine Inspiration für reale technologische Fortschritte. Beruflich beschäftige ich mich zudem mit Videospielen und der Gaming-Branche. Und wenn ich mal nicht arbeite, entspanne ich gerne bei einem guten Spiel, einem qualitativ hochwertigen Bier oder beim Erstellen von Tech-Memes auf Facebook.

Free delivery
Alzaboxes and stores

Intel Arc Pro B70 32GB

Graphics Card - 32GB GDDR6 (19000MHz), Intel ARC Battlemage (BMG-G31, 2280 MHz), Boost 2800 MHz, PCI Express x16 5.0, 256Bit, HDMI 2.1, width 266,7 mm

1,269 €

Buy

In stock > 5 pcs

Order Code: BOpb70a1

SAPPHIRE AMD Radeon AI PRO R9700 32GB - Graphics Card

Free delivery
Alzaboxes and stores

5.0 3×

SAPPHIRE AMD Radeon AI PRO R9700 32GB

Graphics Card - 32GB GDDR6 (20000MHz), AMD Radeon RDNA 4.0 (Navi 48, 1666 MHz), Boost 2920 MHz, PCI Express x16 5.0, 256Bit, DisplayPort 2.1a, width 266,7 mm

1,509 €

Buy

In stock > 5 pcs

Order Code: ELr97ap1

NVIDIA RTX PRO 6000 96GB Blackwell Max-Q Workstation Edition

Graphics Card - 96GB GDDR7 (28000MHz), NVIDIA Blackwell (GB202, 1590 MHz), Boost 2288 MHz, PCI Express x16 5.0, 512Bit, DisplayPort 2.1b, width 266,7 mm

13,679 €

Buy

In stock 1 pcs

Order Code: NVrpr02

Free delivery
Alzaboxes and stores

PNY NVIDIA RTX PRO 2000 Blackwell 16GB GDDR7 ECC

Graphics Card - 16GB GDDR7 (18000MHz), NVIDIA Blackwell (GB206, 790 MHz), Boost 1950 MHz, PCI Express x16 5.0, 128Bit, mini DisplayPort 2.1, width 167 mm

937.90 €

Buy

In stock > 5 pcs

Order Code: PNYrpb01

3.3 3×

Intel Arc Pro B50 16GB

Graphics Card - 16GB GDDR6 (14000MHz), Intel ARC Battlemage (BMG-G21, 1700 MHz), Boost 2600 MHz, PCI Express x16 5.0, 128Bit, mini DisplayPort 2.1, width 168 mm

406.90 €

Buy

In stock > 5 pcs

Order Code: BOpb50a1

Free delivery
Alzaboxes and stores

NVIDIA RTX PRO 4500 32GB Blackwell

Graphics Card - 32GB GDDR7 (28000MHz), NVIDIA Blackwell (GB203, 1590 MHz), Boost 2617 MHz, PCI Express x16 5.0, 256Bit, DisplayPort 2.1b, width 266,7 mm

3,819 €

Buy

In stock 5 pcs

Order Code: NVrpr05

Free delivery
Alzaboxes and stores

PNY NVIDIA RTX PRO 4000 SFF Blackwell 24GB GDDR7 ECC

Graphics Card - 24GB GDDR7 (18000MHz), NVIDIA Blackwell (GB203, 790 MHz), Boost 1337 MHz, PCI Express x16 5.0, 192Bit, mini DisplayPort 2.1, width 167 mm

2,119 €

Buy

In stock > 5 pcs

Order Code: PNYrpb03

PNY NVIDIA RTX PRO 4000 Blackwell 24GB GDDR7 ECC - Graphics Card

Free delivery
Alzaboxes and stores

5.0 1×

PNY NVIDIA RTX PRO 4000 Blackwell 24GB GDDR7 ECC

Graphics Card - 24GB GDDR7 (28000MHz), NVIDIA Blackwell (GB203, 1590 MHz), Boost 2617 MHz, PCI Express x16 5.0, 192Bit, DisplayPort 2.1b, width 241 mm

2,079 €

Buy

In stock > 5 pcs

Order Code: PNYrpb02

HP GFX NVIDIA RTX 4000 Ada 20GB 4DP - Graphics Card

Free delivery
Alzaboxes and stores

HP GFX NVIDIA RTX 4000 Ada 20GB 4DP

Graphics Card - 20GB GDDR6 (2000MHz), NVIDIA Ada Lovelace (AD104, 720 MHz), Boost 1560 MHz, PCI Express x16 4.0 , 160Bit, DisplayPort 1.4a, width 243 mm

2,619 €

Buy

In stock 2 pcs

Order Code: EN064p7c

Free delivery
Alzaboxes and stores

GIGABYTE Radeon AI PRO R9700 AI TOP 32G

Graphics Card - 32GB GDDR6 (20000MHz), AMD Radeon RDNA 4.0 (Navi 48, 1666 MHz), Boost 2920 MHz, PCI Express x16 5.0, 256Bit, DisplayPort 2.1a and HDMI 2.1b, width 267 mm

1,489 €

Buy

In stock > 5 pcs

Order Code: EGair97a1

Free delivery
Alzaboxes and stores

ASUS TURBO Radeon AI PRO R9700 32GB

Graphics Card - 32GB GDDR6 (20000MHz), AMD Radeon RDNA 4.0 (Navi 48, 1666 MHz), Boost 2940 MHz, PCI Express x16 5.0, 256Bit, DisplayPort 2.1a and HDMI 2.1b, width 266,7 mm

1,569 €

Buy

In stock 3 pcs

Order Code: ECpr97t1