Nvidia, San Diego'daki NeurIPS Yapay Zeka Konferansı'nda Alpamayo-R1 adlı yeni açık kaynaklı görsel-dil modelini tanıttı. Otonom sürüş araştırmalarına yönelik geliştirilen bu modelin, bu alana ait ilk görsel-dil eylem modeli olduğu vurgulandı.
Bu tür modeller, hem metni hem görüntüyü işleyerek araçların çevreyi daha doğru algılamasına ve buna göre karar vermesine imkân tanıyor.
Model, Nvidia'nın karar süreçlerini analiz eden Cosmos-Reason yapay zeka modeli üzerine inşa edildi. Cosmos ailesi Ocak 2025'te, ek sürümleri ise Ağustos 2025'te yayımlanmıştı.
Nvidia, Alpamayo-R1'in Seviye 4 otonomi hedefi için kritik bir adım olduğunu, araca insana yakın 'sağduyu' kazandıracağını belirtti.
Model şu anda GitHub ve Hugging Face üzerinden erişilebilir.
Cosmos Cookbook, Veri ve model geliştirenlere kapsamlı rehber
Yeni modelin yanında Nvidia, geliştiriciler için Cosmos Cookbook adlı bir kaynak paketi de paylaştı. Rehber;
- veri hazırlama,
- sentetik veri üretimi,
- model eğitimi,
- performans değerlendirme
gibi konularda adım adım yönlendirmeler sunuyor. Hedef, geliştiricilerin Cosmos tabanlı modelleri kendi projelerine daha hızlı ve doğru şekilde uyarlayabilmesi.
CEO Jensen Huang geleceğin en büyük dönüşüm alanlarından biri olarak tanımlıyor. Şirketin baş bilim insanı Bill Dally de robotik ve otonom sistemlerde yapay zekanın rolüne sürekli dikkat çekiyor.

