Yapay zeka tabanlı görsel üretiminde Stable Diffusion ile devrim yaratan Stability AI, ses ve müzik üretimi alanındaki çıtayı çok daha yukarı taşıyor. Şirket, profesyonel kalitede ve 6 dakikadan uzun kesintisiz müzik üretebilen yeni yapay zeka model serisi Stable Audio 3.0’ı resmi olarak duyurdu.
Yeni seride, cihaz üzerinde yerel olarak çalışabilen küçük modellerden, bulut tabanlı devasa kurumsal çözümlere kadar her ihtiyaca uygun seçenekler yer alıyor.
Stable Audio 3.0 Model Ailesinin Teknik Detayları
Stability AI, yeni seride farklı parametre büyüklüklerine sahip dört farklı yapay zeka modeli sundu:
Stable Audio 3.0 Small SFX (459 Milyon Parametre): Özellikle ses efektleri üretimi için optimize edilmiş özel bir model.
Stable Audio 3.0 Small (459 Milyon Parametre): Akıllı telefon veya bilgisayarlarda, yani cihaz içi (on-device) hızlı üretimler için tasarlandı.
Stable Audio 3.0 Medium (1.4 Milyar Parametre): Dengeli performans ve yüksek ses kalitesini bir arada sunuyor.
Stable Audio 3.0 Large (2.7 Milyar Parametre): Serinin en güçlüsü. En üst düzey profesyonel kalitede müzik üretimi gerçekleştiriyor.
Süre İki Katına Çıktı: Müzikal Yapı ve Melodi Korunuyor
Stable Audio 3.0'ın en dikkat çekici özelliği, sunduğu parçaların uzunluğu oldu. Hem Medium hem de Large modelleri, müzikal yapıyı ve melodik tonu tamamen koruyarak 6 dakika 20 saniye uzunluğunda eksiksiz besteler oluşturabiliyor.
Bu süre, şirketin daha önce piyasaya sürdüğü modellerle kıyaslandığında devasa bir sıçramayı temsil ediyor:
2024 yılında çıkan Stable Audio Open sadece 47 saniye müzik üretebiliyorken, Stable Audio 2.0 bu süreyi yaklaşık 3 dakikaya çıkarmıştı. Yeni model ise bu sınırı tam iki katına katlıyor.
İnternet bağlantısı olmadan yerel cihazlarda çalışan Small modelleri bile artık 2 dakikaya varan ses ve müzik üretimleri gerçekleştirebiliyor.
'Ticari Lisans Şartları'
Stability AI, yapay zeka topluluğunu destekleyen açık kaynak politikasını bu seride de sürdürüyor. Small SFX, Small ve Medium modelleri, herkesin indirip değiştirebilmesi için açık ağırlıklarla (open-weights) ücretsiz olarak kullanıma sunuldu.
Ancak en güçlü model olan Stable Audio 3.0 Large için farklı kurallar geçerli:
Büyük model yalnızca Stability AI’ın API’si ve ücretli sunucu hizmetleri aracılığıyla deneyimlenebiliyor.
Ayrıca, yıllık geliri 1 milyon doların üzerinde olan şirketlerin bu modelleri ticari projelerinde kullanabilmesi için kurumsal lisans alması zorunlu tutuluyor.
Telif Sorununa Çözüm: Tamamen Lisanslı Verilerle Eğitildi
Yapay zeka dünyasındaki telif tartışmalarına karşı önlemini alan Stability AI; Warner Music Group ve Universal Music Group gibi müzik endüstrisinin devleriyle yaptığı anlaşmaları hatırlattı. Şirket, Stable Audio 3.0 setinin tamamen lisanslı veriler üzerine inşa edildiğini ve profesyonel müzisyenlerin haklarının korunduğunu vurguladı.
Profesyonel Müzisyenler İçin Yeni Ürün Paketi Yolda
Stability AI, müzik sektöründeki profesyoneller için özel bir ürün paketi üzerinde çalıştığını da çıtlattı. Detayları henüz gizli tutulan bu projenin başına ise oldukça tanıdık bir isim getirildi: Universal Audio ve ünlü gitar üreticisi Fender'ın eski dijital baş sorumlusu (CDO) Ethan Kaplan, Stability AI’ın profesyonel müzik hizmetlerini yönetmek üzere ekibe katıldı.
