Tencent-in «Voyager» AI modeli tək şəkildən 3D video yaradır

Tencent-in «Voyager» süni zəka modeli tək şəkildən qısa 3D effektli videolar yaradır və dərinlik xəritələrini nöqtə buluduna çevirə bilir.

08.09.25 - 17:03
 0  5
Tencent-in «Voyager» AI modeli tək şəkildən 3D video yaradır
Tencent-in «Voyager» AI modelinin 3D video generasiyası üçün nümunə görüntü @techspot.com

Mediahub.az-da reklam xidməti

Mediahub.az-da reklam xidməti

Tencent-in «Voyager» süni zəka modeli: bir şəkildən 3D video

«Techspot» xəbər verir ki, Tencent-in «Voyager» süni zəka modeli tək şəkildən hərəkətli 3D səhnə effekti ilə qısa videolar yarada bilir. Videolara əlavə olunan dərinlik məlumatı isə 3D nöqtə buludlarına çevrilə bilir.

Model yaradıcılar üçün yeni imkanlar açır, amma hələ tam interaktiv mühit yaratmaq gücündə deyil. «Voyager» açıq-çəki model olub, 49 kadr – təxminən iki saniyəlik – video parçaları istehsal edir. İstifadəçilər həmin parçaları birləşdirərək daha uzun ardıcıllıq qura bilirlər.

Son Xəbərlər
Xiaomi 15 Ultra Qlobal Versiyası
Xiaomi 15 Ultra Qlobal Versiyası

Xiaomi yeni flaqman modeli Xiaomi 15 Ultra-nı qlobal satışa çıxaracağını təsdiqlədi. HyperOS 2.0 ilə yeni dövr başlayır!

Samsung-un Üçqatlanan Telefonu
Samsung-un Üçqatlanan Telefonu

Samsung, Galaxy Unpacked tədbirində üçqatlanan telefon konseptini təqdim etdi. Yeniliklər haqqında daha çox məlumat əldə edin.

Realme GT 7
Realme GT 7: Ən Ucuz Smartfon

Snapdragon 8 Elite çipi ilə Realme GT 7 fevral ayında təqdim ediləcək. Yeni xüsusiyyətlər və uyğun qiymət gözləyir.

Virtual kamera səhnə daxilində hərəkət edərkən obyektlər mövqelərini qoruyur və daha real üçölçülü vizual effekt yaranır. Lakin çıxış materialı klassik 2D videodur, sadəcə onun əsasında 3D rekonstruksiyanı aparmaq daha asandır.

Proses sadədir: istifadəçi şəkil seçir, kameranın trayektoriyasını müəyyən edir və sistem həm rəngli video, həm də dərinlik xəritəsi yaradır. Burada «World cache» adlı modul 3D nöqtələri saxlayaraq kadrlar arasında uyğunluğu təmin edir.

Həndəsi sabitliyi qorumaq üçün hər kadr əvvəlcə nöqtələrlə təhlil olunaraq müqayisədən keçir. Bununla belə, uzun videolarda və xüsusilə 360° döngələrdə təhriflər ola bilər.

Tencent bu modeli 100 mindən çox video ilə öyrədib – həm real çəkilişlər, həm də Unreal Engine səhnələri. Hər kadra avtomatik dərinlik xəritəsi əlavə olunaraq manual əməyin qarşısı alınıb.

Sistem yüksək resurs tələb edir: 540p çözünürlük üçün minimum 60GB, ən yaxşı nəticə üçün isə 80GB GPU yaddaşı lazımdır. Modelin çəki faylları Hugging Face platformasında yerləşdirilib.

«Voyager» digər modellərdən fərqli olaraq kadrlar arasında həndəsi uyğunluğu saxlayan geribildirim mexanizmi tətbiq edir. OpenAI-nin «Sora»sı daha çox vizual realizmə üstünlük verdiyi halda, «Voyager» koordinasiyada sabitliyi ilə seçilir.

Stanford WorldScore testində model 77.62 xal toplayaraq WonderWorld (72.69) və CogVideoX-I2V (62.15)-i geridə qoyub. Kamera idarəsində isə WonderWorld-dən geri qalır.

Hazırda məhdudiyyətlər mövcuddur: model Avropa İttifaqı, Birləşmiş Krallıq və Cənubi Koreyada istifadəyə qadağandır və böyük kommersiya layihələri üçün ayrıca razılaşma tələb olunur.

Nəticə etibarilə, «Voyager» süni zəka modeli vizual aləmlərin generasiyasında mühüm addım hesab olunur. Lakin yüksək hesablama tələbləri və sabitlik problemlərinə görə hələ real vaxtlı interaktiv sistemlər üçün hazır deyil.

Bu xəbəri necə dəyərləndirirsiniz?

like

dislike

love

funny

angry

sad

wow

Anar Mirzəyev Bu, mənim sevdiyim işdir və bu işdən zövq alıram. Xəbər və məqalələr yaratmaq, onları araşdırıb təqdim etmək mənim üçün çox maraqlıdır. Oxucularla dəyərli və maraqlı məlumatları paylaşmaqdan böyük məmnunluq duyuram.