Immagina di poter generare qualsiasi suono che ti viene in mente, dalla colonna sonora per un film, al suono di spade medievali o di una pistola laser, oppure la playlist per darti la carica mentre sei in "deep work" (no, non è un AD di Spotify).
Ecco, Meta ha appena *reso possibile tutto questo*, rendendo opensource AudioCraft.
Ma di che si tratta?
AudioCraft è uno strumento AI composto da tre modelli: MusicGen, AudioGen e EnCodec.
MusicGen, addestrato con musica di proprietà di Meta e specificamente con licenza, genera musica da prompt di testo.
AudioGen, addestrato su effetti sonori pubblici, genera audio ed effetti sonori da prompt di testo.
EnCodec è invece una utility per la codifica e compressione Audio (roba da nerd).
Alcune cose che si possono provare al volo:
*Dove si possono usare questi poi?*
Alla fine sono dei "blocchetti LEGO" dell'audio, quindi possiamo usarli ovunque:
Probabilmente stiamo per assistere a un'esplosione cambriana di applicazioni legate all'audio e alla creatività!
In generale: Meta sta andando forte sul rilascio dei modelli open source.
Sta “spaccando” il mercato, aggredisce le altre big tech con tecnologia rilasciata "in the wild".
Rischia di spaccare anche *la società* però:
Modelli open source, senza alcun tipo di filtro o controllo, saranno ben presto capaci come quelli commerciali di oggi.
Magari nel momento in cui accadrà, i modelli commerciali saranno più avanti (sicuro eh), ma se anche solo nel 2024 avessimo modelli opensource alla pari del GPT-4 di oggi?
Ci rendiamo conto delle implicazioni?
Osserviamo attentamente lo spazio opensource…
Ecco alcuni nuovi tools AI che durante la settimana abbiamo provato:
Questa settimana ti lasciamo una risorsa importantissima se lavori con i dati.
Si chiama Data Engineering Cookbook, ed è una delle risorse (gratuite) più utili che abbiamo mai trovato. Anche se il tuo ruolo non è nello specifico quello del Data Engineer, ci puoi trovare tantissimo valore. Ecco i capitoli:
Dai un’occhiata a questo sito, contiene tutte le best practices e le tecniche di Prompt Engineering, la scienza “emergente” della programmazione dei Large Language Models.
È una vera miniera d’oro!