Questa IA può parlare, pensare e non ha bisogno del cloud. Ecco il nuovo modello di Alibaba che vive sul tuo telefono.
Ok. Andiamo dritti al dunque:
Alibaba ha appena lanciato un modello di intelligenza artificiale in grado di parlare, ascoltare, vedere e pensare, direttamente sul tuo telefono.
Nessuna nuvola.
Nessun ritardo.
Nessuna scusa del tipo "In questo momento ho dei problemi".
Un'intelligenza artificiale veloce, intelligente e privata, direttamente dalla tua tasca.
Il suo nome? Qwen2.5-Omni-7B.
(Non è molto orecchiabile, ma lo perdoneremo. Sta facendo grandi cose.)
Cosa rende tutto questo così importante?
Tutti i giganti della tecnologia stanno sviluppando un'intelligenza artificiale che vive nel cloud.
Alibaba ha detto: "No, lo faremo in modo diverso".
Hanno creato un'intelligenza artificiale che:
✅ Comprende testo, immagini, audio e video
✅ Risponde come un vero assistente
✅ Funziona direttamente sul tuo dispositivo
✅ È open source (sì, è gratuito da usare, sviluppare e personalizzare)
✅ Non ha bisogno del cloud per funzionare
Questo non è un altro chatbot.
Questa è un'intelligenza artificiale intelligente, privata e integrata nel dispositivo.
È come dare al tuo telefono un cervello e una voce, senza vincoli.
Ma aspetta: può davvero fare tutto questo?
Sì. Ecco cosa contiene:
🧠 Configurazione “Pensatore-Parlatore”
Può pensare e parlare allo stesso tempo. (Sinceramente, meglio della maggior parte di noi prima del caffè.)
🎥 Input multimodale
Lanciategli qualsiasi cosa: testo, foto, voce, video, e lui gestisce tutto insieme. Come un professionista.
💬 Risposte in tempo reale
Non più "Aspetta un attimo mentre penso". Semplicemente... risponde. Immediatamente.
🔓 Licenza Apache 2.0
Usalo, modificalo, costruisci con esso. Nessun dramma.
📱 Dimensioni compatte
7 miliardi di parametri = abbastanza potenti da essere intelligenti, abbastanza piccoli da vivere sul tuo telefono.
Come si confronta con gli altri?
Ecco la versione breve:
🔹 OpenAI GPT-4o – Molto intelligente. Ma solo cloud. Non può essere eseguito localmente.
🔹 Google Gemini Nano – Funziona sul dispositivo, ma niente voce, niente immagini. Solo Pixel.
🔹 Meta LLaMA 3 – Open-source, ma non multimodale. Nessun utilizzo del telefono.
🔹 LLM di Apple: un po' di voce, un po' di utilizzo locale, ma bloccati nella bolla Apple.
Qwen2.5-Omni-7B di Alibaba?
✅ Aperto
✅ Local
✅ Multimodal
✅ Compatibile con la voce
Davvero? Ha tutti i requisiti.
Panoramica tecnica
Salta questo se è come parlare di "Cina" con te (hai visto il gioco di parole che abbiamo fatto qui... occhiolino occhiolino)
Ma per farti arrivare il messaggio senza troppi tecnicismi, questo è un modulo LLM efficiente che può essere eseguito sul tuo telefono senza servizio cloud, ma che comunque funziona senza paragoni con quelli a cui siamo abituati da altri importanti player che funzionano sul tuo laptop e sono supportati dall'infrastruttura cloud.
Questo modulo di efficienza è il messaggio principale che arriva dalla Cina, a partire da DeepSeek e proseguendo con ciò che vediamo da Alibaba.
Per coloro che hanno familiarità con le specifiche tecniche, buon divertimento:
Dimensioni: 7 miliardi di parametri (abbastanza piccolo per i telefoni)
Modalità di input: testo, immagine, audio, video
Architettura: divisione Thinker-Talker + TMRoPE (codifica posizionale allineata nel tempo)
Streaming: input e risposta vocale in tempo reale
Licenza: Apache 2.0 (uso commerciale consentito, modifica libera)
Prestazioni: output vocale dal suono naturale, pronto per app in stile assistente
In conclusione: è uno dei modelli di intelligenza artificiale locale più efficienti oggi disponibili.
Parliamo della vita reale. Cosa puoi farci?
Siamo contenti che tu l'abbia chiesto. Perché è qui che le cose si fanno divertenti.
Con questo modello sul tuo telefono potresti:
🌍 Traduci le conversazioni sul posto mentre viaggi
🍳 Fagli leggere le tue ricette mentre hai le mani ricoperte di farina
🪛 Ricevi istruzioni vocali mentre costruisci mobili IKEA (finalmente!)
♿️ Descrivi l'ambiente circostante in tempo reale per facilitare l'accessibilità
📝 Prendi appunti parlando al tuo telefono, anche scrivendo a mano
📸 Punta la tua fotocamera su qualcosa e chiedi alla tua IA di cosa si tratta
🎙️ Gestisci il tuo assistente vocale privato, personalizzato e senza cloud
🎥 Crea contenuti in movimento, senza caricare nulla
Nessuna bolletta del server. Nessuna perdita di privacy. Nessuna attesa per una ruota della morte che gira.
Solo un'intelligenza artificiale fluida, riservata e pronta all'uso.
La prospettiva della luce congelata
Questo è un grande momento per l'intelligenza artificiale.
Siamo rimasti bloccati nel cloud per troppo tempo.
In attesa. In pagamento. Ricezione di messaggi di errore.
Ora stiamo scoprendo cosa significa davvero libertà sul dispositivo.
Non stiamo dicendo che dovrete cambiare tutto domani.
Forse il tuo portatile è ancora Team ChatGPT.
Ma il tuo telefono?
La tua vita è sempre in movimento?
Ha appena trovato un nuovo migliore amico.
È qui che le cose si fanno interessanti.
Una piccola cosa... il nome 😅Saremo sinceri: consigliamo comunque di cambiare il nome.
Perché se qualcuno ci chiede quale modello stiamo utilizzando, è probabile che risponderemo:
"È quell'intelligenza artificiale di... Alibaba...? Quella lì." numeri lettere bene... ???
Diciamo che abbiamo difficoltà a ricordarlo.
Quindi, se stai leggendo questo, Alibaba: forse la prossima volta proverai a scrivere qualcosa di più breve e accattivante?
Resta freddo. Resta curioso. ❄️
Per saperne di più puoi leggere:
Affari quotidiani degli investitori
La CNBC
Post del mattino della Cina meridionale
IT Breve Cina