Nel 2022 fece scalpore la notizia che Tencent Music Entertainment (TME) aveva pubblicato oltre 1.000 brani con voci generate dall’Intelligenza Artificiale. Uno di questi aveva superato i 100 milioni di stream, aprendo un fronte inedito nell’industria musicale globale. Oggi, nel 2026, quella che sembrava una provocazione tecnologica è diventata una delle trasformazioni più profonde e ovviamente controverse della musica contemporanea.
Dalla sperimentazione alla normalità industriale
All’epoca TME aveva lanciato il suo motore proprietario di sintesi vocale, il Lingyin Engine, capace di replicare in modo “rapido e vivido” la voce di cantanti reali e di creare brani in qualsiasi stile e lingua. Tra i casi più discussi ci fu la “resurrezione” vocale di Anita Mui e Teresa Teng, due icone della musica asiatica scomparse da tempo.
Nel 2026 la clonazione vocale non è più un’eccezione celebrativa, ma un segmento di mercato. Le principali piattaforme asiatiche integrano cataloghi di “AI singer” accanto agli artisti umani. In Cina, Corea del Sud e Giappone le voci sintetiche sono utilizzate non solo per brani pop, ma anche per colonne sonore, videogiochi, audiolibri e campagne pubblicitarie. Il successo del brano “Today” in versione AI, primo a superare i 100 milioni di stream, è stato il segnale che il pubblico non solo accettava, ma premiava l’innovazione.
L’effetto domino globale
Se nel 2022 la mossa di TME sembrava isolata, in realtà anticipava una corsa globale. In Corea del Sud, HYBE, la casa madre del gruppo musicale K-pop coreano BTS, aveva acquisito la startup di sintesi vocale Supertone, dichiarando apertamente l’intenzione di integrare voci AI nei propri contenuti. Oggi HYBE utilizza la tecnologia per produzioni “indirect involvement”, come videogiochi, animazioni e contenuti immersivi, dove la voce dell’artista può essere impiegata senza la sua presenza fisica in studio.
Nel frattempo, l’ecosistema di TikTok e della sua casa madre ByteDance ha investito massicciamente in ricerca su sintesi vocale e generazione musicale. Le piattaforme social nel 2026 non sono solo veicoli promozionali, sono anche fabbriche creative in cui creator e brand possono generare brani originali con voci sintetiche personalizzate in pochi minuti.
Nel 2026 quanto vale una voce?
La domanda che nel 2022 sembrava filosofica è ora giuridica ed economica: di chi è una voce? Negli ultimi quattro anni, Stati Uniti, Unione Europea e Cina hanno avviato percorsi normativi per regolare il diritto alla voce come estensione del diritto d’immagine, che dovrebbero comportare la necessità di un consenso esplicito per l’addestramento dei modelli AI e la trasparenza sull’utilizzo di voci sintetiche nelle piattaforme di streaming. Nel 2026 molti contratti discografici includono clausole specifiche sulla “replicazione digitale della voce”. Alcuni artisti vendono licenze ufficiali per creare “versioni AI certificate” del proprio timbro, mentre altri rifiutano categoricamente.
Parallelamente è nato un nuovo mercato, quello dei performer che non esistono fisicamente ma hanno identità, fanbase e tour virtuali nel Metaverso. Alcuni di questi progetti generano milioni di dollari l’anno, con costi produttivi drasticamente inferiori rispetto a una star tradizionale.
Panico o opportunità?
Nel 2022 si parlava di “panico nel mondo della musica”, nel 2026 la situazione è più sfumata a seconda del punto di vista da cui lo si osserva. Per gli artisti emergenti, la concorrenza è effettivamente aumentata. Ogni giorno vengono caricati oltre 150.000 brani sulle principali piattaforme globali, una quota crescente dei quali include componenti vocali sintetiche. L’offerta è virtualmente illimitata. Per le major e le tech company, invece, l’AI è diventata uno strumento di ottimizzazione, perché permette test di mercato su versioni alternative della stessa canzone, le localizzazioni linguistiche automatiche con la stessa voce, il recupero e la monetizzazione di cataloghi storici. Per il pubblico, la linea di demarcazione tra umano e artificiale si è assottigliata. Molti ascoltatori dichiarano di non percepire differenze qualitative. Altri rivendicano un ritorno all’“imperfezione umana” come valore distintivo.
Il futuro: ibrido o sostitutivo?
Se c’è una lezione emersa in questi quattro anni è che l’AI non ha sostituito completamente i cantanti in carne e ossa, ma ha comunque ridefinito il concetto stesso di performance. Oggi il modello dominante sembra ibrido. Gli artisti usano la propria voce AI per moltiplicare le produzioni. Vengono scritti brani da umani, che, però, sono interpretati da sintetizzatori vocali. Le star digitali hanno team creativi umani dietro le quinte. La vera posta in gioco non è più se “l’AI ruberà il lavoro ai musicisti?”, ma “chi controllerà i modelli, i dati e i diritti?”.
La canzone AI da 100 milioni di stream del 2022 è stata il primo segnale forte. Nel 2026 non è più un’eccezione, è un precedente storico, che ha inaugurato l’era della voce come software. E la musica, come sempre, sta cambiando pelle più in fretta delle sue paure.
