Skip to content
Agenti vocali

Costo degli agenti AI vocali — e quando si ripagano

Orange ITS — Team di ingegneria AI 8 min di lettura

La maggior parte dei vendor è felice di mostrarti una demo di un agente vocale AI che risponde a una chiamata. Ottenere una risposta diretta su quanto costa al mese — e se conviene rispetto alla soluzione attuale — è tutta un’altra storia.

Questo articolo pubblica i numeri. Non preventivi precisi (che dipendono dalla tua infrastruttura, dal volume di chiamate e dai requisiti specifici), ma una vera scomposizione delle voci di costo, cosa le fa salire o scendere, e un metodo semplice per valutare la convenienza economica prima di parlare con chiunque.

Se vuoi prima una panoramica della tecnologia, Agenti AI vocali: cosa sono e come li usano le aziende è il punto di partenza giusto.


Le quattro voci di costo in ogni deployment di agenti AI vocali

I vendor di solito quotano una cifra mensile unica. Quella cifra è composta da quattro componenti distinte, e capire quale guida la tua spesa è ciò che distingue una buona decisione d’acquisto da una brutta sorpresa sei mesi dopo.

1. Telefonia (costi al minuto)

Ogni chiamata gestita dall’agente passa attraverso uno strato di telefonia — un carrier VoIP, un trunk SIP o una piattaforma di telefonia cloud (Twilio, Vonage, Bandwidth e altri operano in questo spazio). Paghi per ogni minuto di chiamata in entrata e in uscita.

Fascia realistica: circa CHF 0,01–0,04 al minuto per chiamate verso numeri fissi svizzeri con tariffazione pay-as-you-go standard. Le chiamate verso numeri mobili svizzeri costano notevolmente di più (CHF 0,18–0,25/min sulle principali piattaforme come Twilio e Peoplefone). Impegni su volumi elevati o accordi SIP enterprise possono ridurre questi costi in modo significativo.

Per un’azienda che gestisce 500 minuti di chiamata al mese — circa 50 chiamate da 10 minuti in media — questa voce è CHF 2,50–10. A 5.000 minuti, è CHF 25–100. La telefonia è raramente la voce dominante; diventa significativa solo ad alti volumi o con molte chiamate in uscita.

2. Costi di speech e language model (al minuto o per token)

È il motore: lo speech-to-text converte la voce del chiamante in testo, il language model elabora e genera una risposta, il text-to-speech riconverte quella risposta in audio. Paghi per tutti e tre, tipicamente addebitati per minuto audio o per 1.000 token elaborati.

Fascia realistica per una pipeline vocale completa: CHF 0,05–0,25 per minuto di conversazione, a seconda dei modelli scelti. I modelli speech ad alta qualità e bassa latenza costano di più rispetto a opzioni con vocabolari più ridotti. Chiamate più lunghe e complesse consumano più token. Stack premium con voci neurali di alta qualità e LLM di frontiera possono raggiungere CHF 0,30+ al minuto.

Questa è di solito la voce variabile più alta per gli agenti vocali. Un’azienda con 500 minuti di conversazione al mese potrebbe pagare CHF 25–100 solo per i costi del modello. A 5.000 minuti, si arriva a CHF 250–1.000.

3. Costo di integrazione e sviluppo (una tantum, ammortizzato)

Prima che un agente vocale risponda a una sola chiamata, qualcuno deve costruirlo: progettare i flussi conversazionali, collegarlo al calendario o al sistema di prenotazione, CRM o piattaforma di ticketing, configurare i comportamenti di fallback, testare i casi limite e impostare il monitoraggio. È qui che si concentra la maggior parte del vero lavoro ingegneristico.

Fascia realistica per un agente personalizzato:

  • Agente semplice (FAQ, raccoglie nome e numero di richiamata, invia una notifica): CHF 3.000–8.000 una tantum
  • Agente di media complessità (prenota appuntamenti, gestisce riprogrammazioni, si integra con un sistema esterno): CHF 8.000–20.000
  • Agente full-service (più intent, CRM + calendario + routing per escalation, multilingue): CHF 20.000–50.000+

Sono cifre indicative. Il numero reale dipende dai tuoi sistemi esistenti, dalla qualità delle API e da quanto i flussi conversazionali si discostano da un percorso lineare semplice. Vedi Quanto costa davvero sviluppare un agente AI nel 2026 per un’analisi più ampia dell’investimento ingegneristico tra i diversi tipi di agenti.

Ammortizzando il costo di sviluppo su due anni: un progetto da CHF 12.000 distribuito su 24 mesi aggiunge CHF 500/mese al tuo modello di costo totale.

4. Manutenzione e ottimizzazione continua

Un agente vocale non è un sistema da impostare e dimenticare. Le conversazioni evolvono — i clienti fanno domande che non avevi previsto, le linee di prodotto cambiano, i numeri di telefono vengono aggiornati. Serve qualcuno che revisioni i log delle chiamate, affini le risposte e intercetti i malfunzionamenti prima che si traducano in clienti persi.

Fascia mensile realistica: CHF 200–800/mese per un contratto di manutenzione leggero su un agente stabile, di più se stai iterando attivamente o espandendo le funzionalità. Alcune aziende gestiscono questo internamente dopo il rilascio; la maggior parte trae vantaggio da un partner che monitora la qualità in produzione su base continuativa.


L’altro lato della bilancia: cosa spendi attualmente

Il costo di un agente vocale ha senso solo in relazione alle alternative. I principali termini di confronto sono tre:

Un receptionist o un team di risposta alle chiamate. In Svizzera, un receptionist part-time (circa il 40–60% di un FTE) per la copertura di orari estesi potrebbe costare CHF 2.500–4.500/mese in costo totale datore di lavoro, inclusi i contributi sociali obbligatori. La copertura a tempo pieno su orari estesi è ancora più alta. L’agente vocale non si ammala, non va a pranzo e gestisce più chiamate contemporaneamente.

Un servizio di risposta professionale. I servizi di risposta telefonica di terze parti in Svizzera sono tipicamente strutturati con una quota mensile fissa più un addebito per chiamata o per minuto — le tariffe del mercato svizzero variano per provider e livello di servizio, quindi vale la pena richiedere preventivi a fornitori come Callpoint o simili. La qualità varia; non hanno accesso al tuo sistema di prenotazione in tempo reale. Vedi Il receptionist AI: copertura telefonica 24/7 per le piccole imprese per un confronto più dettagliato tra le due opzioni.

Chiamate perse. È la voce più difficile da quantificare, ma spesso la più significativa. Se il telefono squilla fuori orario e nessuno risponde, una parte di quei chiamanti prenota altrove o semplicemente passa oltre. Per un’azienda di servizi in cui un nuovo cliente vale CHF 500–5.000, perdere 10 chiamate al mese che avrebbero convertito anche solo al 15% è un numero reale.


Foglio di calcolo del break-even: i conti tornano per te?

Applica questo schema alla tua situazione. I dati sono tuoi; la struttura è la logica.

Passo 1 — Stima il tuo costo mensile totale dell’agente AI vocale

ComponenteLa tua stima
Telefonia (minuti di chiamata × tariffa al minuto)CHF ___
Costi del modello (minuti di conversazione × tariffa al minuto)CHF ___
Costo di sviluppo ammortizzato su 24 mesiCHF ___
Canone di manutenzioneCHF ___
Costo mensile totaleCHF ___

Passo 2 — Stima cosa risparmi o guadagni

Fattore di valoreLa tua stima
Costo del receptionist / servizio di risposta sostituitoCHF ___
Valore delle chiamate gestite fuori orario (volume × tasso di conversione × valore medio cliente)CHF ___
Riduzione del tempo amministrativo del personale (ore × costo orario)CHF ___
Beneficio mensile totaleCHF ___

Passo 3 — Verifica il segno

Se il beneficio mensile meno il costo mensile è positivo, il caso regge. Se è al limite, gli input più sensibili sono di solito il volume di chiamate e il valore delle richieste fuori orario intercettate.

Esempio illustrativo: Un boutique hotel da 15 camere riceve 20 chiamate di prenotazione a settimana, il 40% fuori dagli orari presidiati. Valore medio prenotazione: CHF 300. Se l’agente converte metà di quelle chiamate fuori orario senza risposta (circa 8/settimana × 0,5 × CHF 300 = CHF 2.400/mese) e il costo totale dell’agente è CHF 800/mese, il break-even è evidente. Si tratta di aritmetica illustrativa; il tuo tasso di conversione e il valore della prenotazione saranno diversi.


Cosa fa salire i costi (e come tenerli sotto controllo)

Diversi fattori spingono i costi al di sopra della cifra pubblicizzata dal vendor:

  • Flussi conversazionali complessi. Un agente che gestisce otto intent con ramificazioni condizionali costa significativamente di più da costruire rispetto a uno che ne gestisce due. Definisci lo scope con attenzione.
  • Integrazioni di scarsa qualità. API non documentate nel tuo sistema di prenotazione o CRM allungano i tempi di integrazione e il costo. Valuta questo aspetto presto.
  • Tempo medio di gestione lungo. I costi del modello scalano con i minuti. Il canale vocale funziona meglio su task strutturati (prenotazioni, informazioni, routing) — non su chiamate di supporto aperte che durano 15+ minuti.
  • Più lingue. La capacità multilingue è raggiungibile — Agenti vocali multilingue: una linea telefonica, quattro lingue illustra l’approccio — ma aumenta lo scope dei test e il carico di manutenzione.

Quando gli agenti vocali non sono la risposta giusta

Ammissione onesta: un agente vocale non è sempre la risposta giusta.

Se ricevi meno di 20–30 chiamate a settimana, il costo di sviluppo ammortizzato domina i calcoli. Se la maggior parte delle chiamate richiede un vero giudizio umano — reclami complessi, relazioni delicate, negoziazioni non di routine — l’automazione crea un’esperienza peggiore rispetto a una persona. E se il tuo team gestisce i volumi di chiamate comodamente negli orari di lavoro senza una domanda significativa fuori orario, il problema è semplicemente piccolo.

Misurare il ROI degli agenti AI: un framework per le PMI offre un framework a livello di processo per identificare quali flussi di lavoro giustificano l’investimento.


Arrivare a un numero accurato per la tua azienda

Le fasce di questo articolo sono approssimazioni oneste. Il tuo costo reale dipende dai dettagli: il tuo setup telefonico, i sistemi con cui l’agente deve integrarsi, quanti percorsi conversazionali contano, e quale livello di ottimizzazione continuativa ha senso.

Il modo più rapido per passare da “ha senso per noi?” a un numero reale è una conversazione mirata. La nostra practice di ottimizzazione dei processi include i deployment di agenti vocali — abbiamo costruito agenti per prenotazioni, richieste fuori orario e qualificazione di lead in entrata.

Se vuoi lavorare sui tuoi numeri con qualcuno che può mettere alla prova le ipotesi, prenota una call di 30 minuti con il nostro team. Valuteremo il tuo volume di chiamate, il setup attuale e se un agente vocale è la leva giusta — o se una diversa automazione offre un rendimento migliore.

Insights

Metti queste idee al lavoro

Bastano 30 minuti per capire se un agente AI si adatta al tuo flusso di lavoro — e quanto può rendere.