Immagina di poter generare qualsiasi suono che ti viene in mente, dalla colonna sonora per un film, al suono di spade medievali o di una pistola laser, oppure la playlist per darti la carica mentre sei in "deep work" (no, non è un AD di Spotify).
Ecco, Meta ha appena reso possibile tutto questo, rendendo opensource AudioCraft.
Ma di che si tratta?
AudioCraft è uno strumento AI composto da tre modelli: MusicGen, AudioGen e EnCodec.
MusicGen, addestrato con musica di proprietà di Meta e specificamente con licenza, genera musica da prompt di testo.
AudioGen, addestrato su effetti sonori pubblici, genera audio ed effetti sonori da prompt di testo.
EnCodec è invece una utility per la codifica e compressione Audio (roba da nerd).
Alcune cose che si possono provare al volo:
Dove si possono usare questi poi?
Alla fine sono dei "blocchetti LEGO" dell'audio, quindi possiamo usarli ovunque:
Probabilmente stiamo per assistere a un'esplosione cambriana di applicazioni legate all'audio e alla creatività!
In generale: Meta sta andando forte sul rilascio dei modelli open source.
Sta “spaccando” il mercato, aggredisce le altre big tech con tecnologia rilasciata "in the wild".
Rischia di spaccare anche la società però:
Modelli open source, senza alcun tipo di filtro o controllo, saranno ben presto capaci come quelli commerciali di oggi.
Magari nel momento in cui accadrà, i modelli commerciali saranno più avanti (sicuro eh), ma se anche solo nel 2024 avessimo modelli opensource alla pari del GPT-4 di oggi?
Ci rendiamo conto delle implicazioni?
Osserviamo attentamente lo spazio opensource…
Ecco alcuni nuovi tools AI che durante la settimana abbiamo provato:
Questa settimana ti lasciamo una risorsa importantissima se lavori con i dati.
Si chiama Data Engineering Cookbook, ed è una delle risorse (gratuite) più utili che abbiamo mai trovato. Anche se il tuo ruolo non è nello specifico quello del Data Engineer, ci puoi trovare tantissimo valore. Ecco i capitoli:
Dai un’occhiata a questo sito, contiene tutte le best practices e le tecniche di Prompt Engineering, la scienza “emergente” della programmazione dei Large Language Models.
È una vera miniera d’oro!