NotebookLlama per generare i podcast

NotebookLlama, un’implementazione “aperta” realizzata da Meta, della popolare funzione di generazione di podcast di NotebookLM di Google. Questo progetto sfrutta i modelli Llama di Meta per la maggior parte dell’elaborazione, consentendo agli utenti di generare sintesi in formato podcast a partire da file di testo caricati, in modo simile a quanto offerto, appunto, da NotebookLM.

Il funzionamento di NotebookLlama prevede diversi passaggi. In primo luogo, il sistema crea una trascrizione del file di input, che può essere un PDF di un articolo di giornale o un post di un blog. Successivamente, aggiunge elementi di “drammatizzazione” e pause strategiche prima di inviare la trascrizione a modelli text-to-speech di tipo open-source per la generazione dell’audio finale.

Attualmente, i risultati ottenuti con NotebookLlama non raggiungono la qualità di quelli prodotti da NotebookLM di Google. Nei campioni ascoltati, le voci generate presentano una marcata caratteristica robotica e tendono a sovrapporsi in punti inaspettati. Tuttavia, i ricercatori di Meta che stanno sviluppando il progetto ritengono che la qualità possa essere migliorata utilizzando modelli più robusti.

Sulla pagina GitHub di NotebookLlama, hanno evidenziato come il modello text-to-speech rappresenti il principale limite per la naturalezza del suono. Inoltre, hanno suggerito un approccio alternativo per la scrittura del podcast, che prevederebbe l’utilizzo di due agenti in grado di discutere l’argomento di interesse e generare la scaletta del podcast in modo collaborativo, anziché affidarsi a un singolo modello.

Da tenere sott’occhio il nuovo Llama 3.1

Ha ben 405 miliardi di parametri e, fa sapere sempre l’azienda, per l’addestrato sono stati utilizzati più di 16.000 GPU H100 di Nvidia, uno dei prodotti più performanti del settore.

Ed è proprio questo il vero punto di forza di questo strumento che, per la prima volta in assoluto, porta un modello open-source, e quindi utilizzabile liberamente, a competere con le atre realtà del settore sviluppate da aziende che ne detengono la completa proprietà.

In questo senso, quindi è chiaro che Meta voglia portare un tool AI “libero” a diventare un punto di riferimento del settore oltre che un passaggio chiave per l’evoluzione futura degli strumenti basati sull’intelligenza artificiale che, così facendo, potrebbero essere più accessibili per chiunque ne abbia bisogno.

Per quanto riguarda le potenzialità di questo modello, sappiamo che Llama 3.1 può svolgere moltissime attività differenti, dalla generazione di testo, alla traduzione multilingue fino ad arrivare alla scrittura di linee di codice e alla risoluzione di problemi matematici complessi.

Chiaramente, come accade per tutti gli strumenti del genere, Llama è anche in grado di comprendere tutte le informazioni fornite dagli utenti o prese dal web e utilizzare tali dati per assolvere ai compiti che gli vengono assegnati.

Dai primi test condivisi da Meta, sembra che il modello abbia già ottenuto risultati molto interessanti che, chiaramente, lo mettono subito in competizione con i vari avversari del settore come GPT-4 e GPT-4o sviluppati da OpenAI oppure Claude 3.5 Sonnet sviluppato da Anthropic.

Llama 3.1 può essere già scaricato gratuitamente dalla pagina ufficiale e gli utenti possono utilizzarlo come meglio credono sfruttando una delle varie piattaforme cloud a loro disposizione come, ad esempio AWS di AmazonAzure di Microsoft oppure Google Cloud.

Inoltre, al momento solo per gli utenti residenti negli Stati Uniti, il nuovo modello è già attivo su WhatsApp e Meta AI, dove viene utilizzato per alimentare i chatbot sviluppati dall’azienda.

Come considerazione finale è di nuovo importante tornare per un momento sulla natura open-source di Llama 3.1, un discorso fondamentale per rendere l’intelligenza artificiale accessibile a tutti e più democratica¸ come ogni tecnologia così rivoluzionaria dovrebbe essere.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *