Tahlil

Google сунъий интеллект – видео яратувчиси устида ишламоқда

Google сунъий интеллект – видео яратувчиси устида ишламоқда

Сурат сиз бир қарашда ўйлаганингиздек «кепкали шер» эмас, балки Google нейрон тармоғи иши натижасидир. Яқинда компания матн тавсифидан видеоклиплар яратиши мумкин бўлган сунъий интеллект тизими Imagen Video бўйича ўз ишини батафсил баён қилди.

Натижалар мукаммал бўлмасада, тизим томонидан яратилган ҳалқали клипларда артефакт ва шовқин мавжуд. Бироқ компаниянинг фикрича, уларнинг ривожланиши «юқори даражада бошқарилувчанлик» ва дунёни билиш, жумладан, турли услубдаги клипларни яратиш қобилиятига эга тизим сари қадамдир.

Google тадқиқот гуруҳининг тушунтиришича, тизим матн тавсифини олади ва сониясига уч кадр тезликда ва 24 дан 48 пикселгача бўлган 16 кадрли видеони яратади. Шундан сўнг тизим қўшимча кадрларни ўлчайди ва «башорат қилади», 720 п (1280х768) да 24 кадр тезликда 128 кадрдан иборат якуний видеони яратади.

Imagen Video 14 миллион тавсифловчи видео ва 60 миллион тасвир, шунингдек, LAION-400M умумий тасвир-матн маълумотлар тўпламига ўргатилган. Тажриба орқали улар алгоритм Ван Гог расмлари ва аквареллар услубида видеолар яратиши мумкинлигини аниқладилар. Бундан ташқари, сунъий интеллект космоснинг чуқурлиги ва уч ўлчовлилигини тушунишни намойиш этди. Бу унга дронга ўхшаш видеоларни яратишга имкон берди, улар орбитада айланади ва объектларни бузиб ташламасдан турли бурчаклардан суратга олади.

Бугунги кунда мавжуд тасвирларни яратиш тизимларига нисбатан муҳимлиги  – бу хизмат матнни тўғри кўрсатиши мумкин. Stable Diffusion и DALL-E 2 «логотип (бренд)» каби матн ифодаларини ўқилиши мумкин бўлган матнга таржима қилиш учун курашаётган бўлса-да, Imagen Video уни муаммосиз тақдим этади.

Бу янги хизматда чекловлар йўқ дегани эмас. У билан яратилган клиплар щзгартирилган ва баъзан бошқалар билан жуда ғалати, жисмонан имконсиз ва ғайритабиий усуллар билан аралаштирилади. Сунъий интеллектнинг ишлашини яхшилаш учун Imagen Video жамоаси Phenaki тадқиқотчилари билан ҳамкорлик қилишни режалаштирмоқда. Бу эса узоқ ва батафсил кўрсатмаларни пастроқ сифатда бўлса-да, икки дақиқали видеога айлантира оладиган матндан видеога бошқа дебют тизимдир.