Siz yazın, o üretsin! Meta, metin komutlarından müzik üretebilen yapay zeka modelini duyurdu
ChatGPT bir geldi pir geldi. Son birkaç aydır neredeyse her gün yapay zeka ile ilgili gelişmeler duyuyoruz. Öyle ki internet tarayıcıları ve arama motorları için de birbirinden farklı modeller duyuruldu, hatta bazıları kullanıma sunuldu.
Yine bu alanda hamlelerde bulunan Meta, halihazırda Instagram ve WhatsApp için yapay zeka sohbet robotu üzerine çalıştığını doğrulamıştı. Bunun ardından belki de ilk girişimi olan komutlardan müzik üretebilen 'MusicGen' isimli yapay zeka modeli duyuruldu.
Siz komut veren, MusicGen üretsin!
Meta, sohbet botu Metamate ile gündeme gelen bir firma. Şimdi de yazılanları müziğe dönüştürebilen bir yapay zeka sistemi olan MusicGen'i duyurdu ve bir ilke imza attı.
MusicGen, metin girdilerini alıp farklı türlerde müzikler oluşturabiliyor. Bu yapay zeka modeli, 20 bin saatlik lisanslı müzik kullanılarak geliştirilirken, ücretsiz olarak faydalanılabiliyor.
Baktığımızda ChatGPT'nin sesli versiyonu denilebilecek MusicGen, metin komutlarıyla yeni müzikler üretebiliyor. Kullanıcılar, istediği müzik tarzını tanımlayarak modeli kullanabiliyor. Bunun dışında isterlerse mevcut bir melodiyi de eklemek mümkün.
We present MusicGen: A simple and controllable music generation model. MusicGen can be prompted by both text and melody.
— Felix Kreuk (@FelixKreuk) June 9, 2023
We release code (MIT) and models (CC-BY NC) for open research, reproducibility, and for the music community: https://t.co/OkYjL4xDN7 pic.twitter.com/h1l4LGzYgf
Meta'da yapay zekâ araştırmacısı Felix Kreuk tarafından paylaşılan bir video MusicGen'in nasıl yeteneklere sahip olduğunu ortaya koyuyor. Videoda hâlihazırda bir müziğin eklendiği, sonrasında ise bir komut girerek bu müziğin değiştirilebildiği görülüyor. Bir diğer videoda ise herhangi bir hazır ses kullanılmadan "akılda kalıcı melodiler, tropikal vurmalı çalgılar ve hareketli ritimler içeren plaj için uygun pop dans şarkısı" komutu yazılarak bir ses oluşturulabildiği görülüyor.
Apple'ın karma gerçeklik başlığını Metaverse için yeni umut oldu
Projenin araştırma ekibi, 12 saniye civarında ses üretebilen modelin eğitimi için dahili bir veri kümesinden 10.000 yüksek kaliteli müziğin yanı sıra Shutterstock ve Pond5 parçaları dahil 20.000 saatlik lisanslı müzik kullandı. MusicGen'in Hugging Face AI üzerinden bir demosuna ulaşmak mümkün.
Kaynak: Metaw