FramePack, Lvmin Zhang ve Stanford Üniversitesi’nden Maneesh Agrawala tarafından geliştirilmiş bir video modeli olarak dikkat çekiyor.
Burada yer alan FramePack, yazılanlardan video üreten 13 milyar parametreli bir model ve doğrudan yerel olarak çalıştırılabiliyor. Yerel yapay zeka video üretimini sağlamak için çok aşamalı optimizasyon tekniklerinden güç alan model, 6 GB VRAM’e sahip standart bir ekran kartında dahi 60 saniyelik videolar üretebilmesiyle fark yaratıyor. RTX 30/40/50 serisi ekran kartlarında kullanılabilen model (AMD ve Intel ekran kartı desteği hakkında bilgi yok), küçük çaplı video ihtiyaçları için pahalı üçüncü parti servislere olan gereksinimi ortadan kaldırıyor. Linux desteğine de sahip olan FramePack, girdi karelerini önem derecelerine göre sabit boyutlu bir bağlam uzunluğuna sıkıştırarak GPU bellek yükünü önemli ölçüde azaltan yeni mimarisiyle büyük bir gelecek vadediyor.
Teknoloji Haberleri sitesinden daha fazla şey keşfedin
Subscribe to get the latest posts sent to your email.