هوش مصنوعی نو گوگل از یک تصویر، ویدئو می سازد!
به گزارش وبلاگ فروش ساعت، اوایل این هفته، دانشمندان گوگل از ایجاد Transframer، قابلیت جدیدی که قادر به فراوری ویدئو های کوتاه بر اساس تصاویر ورودی است، خبر دادند.
به گزارش وبلاگ فروش ساعت، این قابلیت تازه ادای احترامی به مدل مبتنی بر هوش مصنوعی دیگری است که با نام Transformer شناخته می گردد. Transformer که در ابتدا در سال 2017 معرفی گردید، یک معماری شبکه عصبی تازه با قابلیت فراوری متن و با استفاده از شبیه سازی و مقایسه کلمات دیگر در یک جمله است.
این مدل از آن موقع در چارچوب های یادگیری عمیق استاندارد مانند TensorFlow و PyTorch گنجانده شده است. همانطور که Transformer قدیمی از زبان برای پیش بینی نتایج استفاده می نماید، فناوری تازه نیز از تصاویر متنی با ویژگی های مشابه برای ایجاد ویدئو های کوتاه استفاده می نماید. فیلم های حاصل در سراسر تصویر هدف حرکت می نمایند و با وجود نداشتن هندسه در ورودی تصویر اصلی، پرسپکتیو های دقیقی را ارائه می دهند.
فناوری تازه که با استفاده از پلتفرم هوش مصنوعی DeepMind پیشرفته است، از تجزیه یک تصویر متنی واحد برای استخراج قطعات کلیدی داده های تصویر و فراوری تصاویر اضافی استفاده می نماید. در طی این تجزیه و تحلیل، سیستم کادر بندی تصویر را شناسایی نموده و به سیستم یاری می نماید تا محیط اطراف تصویر را پیش بینی کند. سپس برای پیش بینی بیشتر یک تصویر از زوایای مختلف، از تصاویر متنی استفاده می گردد. این پیش بینی ها، احتمال وجود فریم های تصویر اضافی را بر اساس داده ها، حاشیه نویسی ها و هر اطلاعات دیگری که از فریم های زمینه موجود است، مدل می نمایند.
این پلتفرم با ارائه توانایی فراوری ویدئوهای دقیق و معقول بر اساس مجموعه بسیار محدودی از داده ها، گام بزرگی در فناوری ویدئو برداشته است. فناوری Transframer نتایج بسیار امیدوارنماینده ای را در سایر وظایف و آزمایش های مرتبط با ویدئو مانند تقسیم بندی معنایی، طبقه بندی تصویر و پیش بینی جریان نوری ارائه می دهد. این فناوری در صنایع مبتنی بر ویدئو مانند بازی سازی کاربرد های بسیاری خواهد داشت.
محیط های توسعه بازی مدرن بر تکنیک هایی مانند سایه زنی، نقشه برداری بافت، عمق میدان و ردیابی پرتو تکیه دارند. فن آوری هایی مانند Transframer می توانند راه تازهی برای استفاده از هوش مصنوعی و یادگیری ماشینی در ساخت بازی ها به توسعه دهندگان ارائه دهند و در عین حال زمان، منابع و کوشش لازم برای این کار را نیز کاهش می دهند.
منبع: newsprepare
منبع: فرارو