Skip to content
Voice Agents

KI-Agenten für Telefonie: Kosten und Amortisation

Orange ITS — KI-Engineering-Team 7 Min. Lesezeit

Die meisten Anbieter zeigen gerne eine Demo, bei der ein Voice Agent einen Anruf entgegennimmt. Eine klare Antwort auf die Frage, was das pro Monat kostet — und ob das günstiger ist als Ihre aktuelle Lösung — ist deutlich schwieriger zu bekommen.

Dieser Artikel legt die Zahlen offen. Keine exakten Angebote (die hängen von Ihrer Infrastruktur, Ihrem Anrufvolumen und Ihren Anforderungen ab), sondern eine reale Aufschlüsselung der Kostenfaktoren, was sie nach oben oder unten treibt — und eine einfache Methode, die Wirtschaftlichkeit zu prüfen, bevor Sie mit jemandem sprechen.

Wenn Sie zuerst einen technischen Überblick möchten, finden Sie diesen unter KI-Voice-Agents: Was sie sind und wie Unternehmen sie nutzen.


Die vier Kostenbereiche jedes KI-Voice-Agent-Deployments

Anbieter nennen meist eine einzige monatliche Zahl. Diese setzt sich aus vier verschiedenen Komponenten zusammen. Zu verstehen, welche Komponente Ihre Rechnung treibt, ist der Unterschied zwischen einer guten Kaufentscheidung und einer unangenehmen Überraschung sechs Monate später.

1. Telefonie (Kosten pro Minute)

Jeder Anruf, den Ihr Agent bearbeitet, läuft über eine Telefonieschicht — einen VoIP-Carrier, einen SIP-Trunk oder eine Cloud-Telefonieplattform (Twilio, Vonage, Bandwidth und weitere sind in diesem Bereich aktiv). Sie zahlen pro Minute für eingehende und ausgehende Anrufe.

Realistische Bandbreite: ca. CHF 0,01–0,04 pro Minute für eingehende/ausgehende Anrufe auf Schweizer Festnetznummern im Standard-Pay-as-you-go-Betrieb. Anrufe auf Schweizer Mobilnummern sind deutlich teurer (CHF 0,18–0,25/min auf grösseren Plattformen wie Twilio und Peoplefone). Volumenvereinbarungen oder Enterprise-SIP-Verträge können diese Kosten spürbar senken.

Für ein Unternehmen mit 500 Anrufminuten pro Monat — etwa 50 Anrufe à durchschnittlich 10 Minuten — beträgt diese Kostenposition CHF 2,50–10. Bei 5.000 Minuten sind es CHF 25–100. Telefonie ist selten der dominante Kostenfaktor; sie wird erst bei hohem Anrufvolumen oder vielen ausgehenden Anrufen relevant.

2. Speech- und Language-Model-Kosten (pro Minute oder pro Token)

Das ist die eigentliche Engine: Speech-to-Text wandelt die Stimme des Anrufers in Text um, ein Language Model verarbeitet diesen und generiert eine Antwort, Text-to-Speech wandelt diese Antwort wieder in Audio um. Sie zahlen für alle drei Schritte — typischerweise pro Audiominute oder pro 1.000 verarbeitete Token.

Realistische Bandbreite für eine vollständige Speech-Pipeline: CHF 0,05–0,25 pro Gesprächsminute, abhängig von den gewählten Modellen. Hochwertige Speech-Modelle mit geringer Latenz kosten mehr als Optionen mit kürzeren Vokabularen. Längere, komplexere Gespräche verbrauchen mehr Token. Premium-Stacks mit hochwertigen neuronalen Stimmen und frontier-LLMs können CHF 0,30+ pro Minute erreichen.

Das ist in der Regel der grösste variable Kostenfaktor für Voice Agents. Ein Unternehmen mit 500 Gesprächsminuten pro Monat zahlt allein für Modellkosten CHF 25–100. Bei 5.000 Minuten sind es CHF 250–1.000.

3. Integrations- und Entwicklungskosten (einmalig, amortisiert)

Bevor ein Voice Agent den ersten Anruf beantwortet, muss er gebaut werden: Gesprächsflüsse entwerfen, Anbindung an Ihren Kalender, Ihr Buchungssystem, CRM oder Ticketing-System, Fallback-Verhalten konfigurieren, Edge Cases testen und Monitoring einrichten. Hier steckt der grösste Teil des tatsächlichen Engineering-Aufwands.

Realistische Bandbreite für einen individuellen Agenten:

  • Einfacher Agent (FAQs, erfasst Name und Rückrufnummer, versendet Benachrichtigung): CHF 3.000–8.000 einmalig
  • Mittelkomplexer Agent (bucht Termine, bearbeitet Umplanungen, integriert ein externes System): CHF 8.000–20.000
  • Full-Service-Agent (mehrere Intents, CRM + Kalender + Eskalations-Routing, mehrsprachig): CHF 20.000–50.000+

Das sind Grössenordnungen. Der tatsächliche Betrag hängt von Ihren bestehenden Systemen, der API-Qualität und dem Grad der Abweichung der Gesprächsflüsse von einem einfachen linearen Pfad ab. Eine breitere Aufschlüsselung des Engineering-Investments nach Agententypen finden Sie unter Was KI-Agent-Entwicklung 2026 wirklich kostet.

Amortisieren Sie die Entwicklungskosten über zwei Jahre: ein Projekt für CHF 12.000, verteilt auf 24 Monate, ergibt CHF 500/Monat in Ihrem Gesamtkostenmodell.

4. Laufende Wartung und Optimierung

Ein Voice Agent ist kein System, das man einmal einrichtet und dann vergisst. Gespräche entwickeln sich — Kunden stellen Fragen, die Sie nicht erwartet haben, Produktlinien ändern sich, Telefonnummern werden aktualisiert. Sie brauchen jemanden, der Anrufprotokolle prüft, Antworten verfeinert und Schwachstellen erkennt, bevor diese Kunden kosten.

Realistische monatliche Bandbreite: CHF 200–800/Monat für ein leichtes Wartungsretainer bei einem stabilen Agenten — mehr, wenn Sie aktiv iterieren oder Funktionen erweitern. Manche Unternehmen übernehmen dies intern nach der Übergabe; die meisten profitieren von einem Partner, der die Produktionsqualität kontinuierlich überwacht.


Die andere Seite der Rechnung: Was Sie heute ausgeben

Die Kosten eines Voice Agents sind nur relativ zu den Alternativen aussagekräftig. Es gibt drei Hauptvergleichspunkte:

Eine Rezeptionistin oder ein Anruf-Team. In der Schweiz kosten eine Teilzeit-Rezeptionistin (ca. 40–60 % FTE) für erweiterte Öffnungszeiten gesamthaft CHF 2.500–4.500/Monat in den Gesamtarbeitgeberkosten inklusive obligatorischer Sozialabgaben. Vollzeit-Abdeckung über Geschäfts- und Randzeiten hinaus liegt noch höher. Der Voice Agent ruft sich nicht krank, macht keine Mittagspause und nimmt mehrere Anrufe gleichzeitig an.

Ein professioneller Telefonservice. Externe Telefondienste in der Schweiz sind typischerweise mit einer monatlichen Grundgebühr zuzüglich eines Entgelts pro Anruf oder Minute aufgebaut — die genauen Schweizer Marktpreise variieren je nach Anbieter und Servicelevel, es lohnt sich also, Angebote bei Anbietern wie Callpoint oder ähnlichen einzuholen. Die Qualität variiert; sie haben keinen Zugriff auf Ihr Live-Buchungssystem. Unter Die KI-Rezeptionistin: 24/7-Telefonabdeckung für KMU finden Sie einen detaillierten Vergleich beider Optionen.

Verpasste Anrufe. Das ist am schwierigsten zu beziffern, aber oft am bedeutsamsten. Wenn Ihr Telefon nach Geschäftsschluss klingelt und niemand abnimmt, bucht ein Teil dieser Anrufer woanders oder gibt auf. Für ein Dienstleistungsunternehmen, bei dem ein einziger Neukunde CHF 500–5.000 wert ist, ist es eine reale Zahl, wenn monatlich 10 Anrufe entgehen, die bei 15 % Konversionsrate zu Aufträgen geworden wären.


Break-even-Rechner: Rechnet sich das für Sie?

Wenden Sie diesen Ansatz auf Ihre eigene Situation an. Die Eingaben sind Ihre; die Struktur ist die Logik.

Schritt 1 — Schätzen Sie Ihre monatlichen Gesamtkosten für den KI-Voice-Agent

KomponenteIhre Schätzung
Telefonie (Anrufminuten × Minutenpreis)CHF ___
Modellkosten (Gesprächsminuten × Minutenpreis)CHF ___
Entwicklungskosten amortisiert über 24 MonateCHF ___
WartungsretainerCHF ___
Monatliche GesamtkostenCHF ___

Schritt 2 — Schätzen Sie Ihre Einsparungen oder Erträge

WerttreiberIhre Schätzung
Ersetzte Kosten für Rezeptionistin / TelefondienstCHF ___
Wert der Anrufe ausserhalb der Betriebszeiten (Volumen × Konversionsrate × durchschn. Kundenwert)CHF ___
Reduktion der Verwaltungszeit des Personals (Stunden × Stundensatz)CHF ___
Monatlicher GesamtnutzenCHF ___

Schritt 3 — Prüfen Sie das Vorzeichen

Wenn monatlicher Nutzen minus monatliche Kosten positiv ist, trägt der Business Case. Bei einem knappen Ergebnis sind die sensibelsten Eingangsparameter in der Regel das Anrufvolumen und der Wert der aufgefangenen Anfragen ausserhalb der Betriebszeiten.

Illustratives Beispiel: Ein Boutique-Hotel mit 15 Zimmern nimmt 20 Buchungsanrufe pro Woche entgegen, davon 40 % ausserhalb der besetzten Zeiten. Durchschnittlicher Buchungswert: CHF 300. Wenn der Agent die Hälfte dieser unbeantworteten Anrufe ausserhalb der Öffnungszeiten konvertiert (ca. 8/Woche × 0,5 × CHF 300 = CHF 2.400/Monat) und die Gesamtkosten des Agenten CHF 800/Monat betragen, ist der Break-even eindeutig. Das ist ein illustratives Rechenbeispiel; Ihre Konversionsrate und Ihr Buchungswert werden abweichen.


Was die Kosten treibt (und wie Sie sie steuern)

Mehrere Faktoren treiben die Kosten über die beworbene Herstellerzahl hinaus:

  • Komplexe Gesprächsflüsse. Ein Agent, der acht Intents mit bedingten Verzweigungen bearbeitet, kostet deutlich mehr in der Entwicklung als einer mit zwei Intents. Definieren Sie den Scope bewusst.
  • Qualitätsschwache Integrationen. Undokumentierte APIs in Ihrem Buchungssystem oder CRM verlängern den Integrationsaufwand und die Kosten. Prüfen Sie das frühzeitig.
  • Lange durchschnittliche Bearbeitungszeit. Modellkosten skalieren mit den Minuten. Voice-Agenten performen am besten bei strukturierten Aufgaben (Buchungen, Informationen, Routing) — nicht bei offenen Support-Gesprächen, die 15+ Minuten dauern.
  • Mehrere Sprachen. Mehrsprachigkeit ist machbar — Mehrsprachige Voice Agents: eine Telefonleitung, vier Sprachen beschreibt den Ansatz — erhöht aber den Testumfang und den Wartungsaufwand.

Wann Voice Agents nicht die richtige Antwort sind

Ehrliche Einschränkung: Ein Voice Agent ist nicht immer die richtige Lösung.

Wenn Sie weniger als 20–30 Anrufe pro Woche erhalten, dominieren die amortisierten Entwicklungskosten die Rechnung. Wenn die meisten Anrufe echtes menschliches Urteilsvermögen erfordern — komplexe Beschwerden, sensible Beziehungen, nicht-routinemässige Verhandlungen — verschlechtert Automatisierung die Erfahrung gegenüber einem Menschen. Und wenn Ihr Team das Anrufvolumen problemlos innerhalb der Arbeitszeiten bewältigt und kein nennenswerter Bedarf ausserhalb der Öffnungszeiten besteht, ist das Problem schlicht zu klein.

Den ROI von KI-Agenten messen: ein Framework für KMU bietet ein prozessorientiertes Framework zur Identifikation der Workflows, die eine Investition rechtfertigen.


Zu einer genauen Zahl für Ihr Unternehmen kommen

Die Spannen in diesem Artikel sind ehrliche Näherungswerte. Ihre tatsächlichen Kosten hängen von Ihren spezifischen Gegebenheiten ab: Ihrem Telefonie-Setup, den Systemen, die der Agent anbinden muss, der Anzahl relevanter Gesprächspfade und dem sinnvollen Umfang laufender Optimierungen.

Der schnellste Weg von «Macht das für uns Sinn?» zu einer realen Zahl ist ein fokussiertes Gespräch. Unsere Practice für Prozessoptimierung umfasst Voice-Agent-Deployments — wir haben Agenten für Buchungen, Anfragen ausserhalb der Öffnungszeiten und eingehende Lead-Qualifizierung entwickelt.

Wenn Sie Ihre Zahlen mit jemandem durchgehen möchten, der die Annahmen kritisch hinterfragt, buchen Sie ein 30-minütiges Gespräch mit unserem Team. Wir bewerten Ihr Anrufvolumen, Ihr aktuelles Setup und ob ein Voice Agent der richtige Hebel ist — oder ob eine andere Automatisierung eine bessere Rendite liefert.

Insights

Setzen Sie diese Ideen um

Ein 30-minütiges Gespräch genügt, um herauszufinden, ob ein KI-Agent zu Ihrem Workflow passt — und was er einbringen würde.