هوش مصنوعی ۳D-GPT فرایند مدلسازی سهبعدی را به بخشهای قابل دسترس تقسیم میکند؛ هر بخش نیز بهوسیله یک عامل انجام میگردد. بدین ترتیب پرامپت کاربر طی سه مرحله تجزیه و تحلیل و درنهایت کد دستوری مدل سهبعدی تولید میشود.
هوش مصنوعی ۳D-GPT با تجزیه پرامپتها و با کمک سه عامل خود، مدلهای سه بعدی دقیقی تولید میکند.
به گزارش دیجیاتو، محققان دانشگاه ملی استرالیا، دانشگاه آکسفورد و آکادمی هوش مصنوعی پکن یک سیستم هوش مصنوعی جدید به نام «۳D-GPT» توسعه دادهاند که میتواند مدلهای سه بعدی را به سادگی از توضیحات متنی ایجاد کند. این هوش مصنوعی قادر است با تجزیهکردن پرامپت کاربر و با استفاده از سه عامل خود، مدلهای سهبعدی دقیقی بسازد. هوش مصنوعی ۳D-GPT میتواند صنایع مختلف تولید محتواهای سه بعدی را متحول کند.
براساس مقاله منتشرشده در arXiv، این هوش مصنوعی در مقایسه با عملکردهای سنتی، مدلهای سهبعدی را به صورت کارآمدتری میسازد. هوش مصنوعی ۳D-GPT فرایند مدلسازی سهبعدی را به بخشهای قابل دسترس تقسیم میکند؛ هر بخش نیز بهوسیله یک عامل انجام میگردد. بدین ترتیب پرامپت کاربر طی سه مرحله تجزیه و تحلیل و درنهایت کد دستوری مدل سهبعدی تولید میشود.
هوش مصنوعی ۳D-GPT برای مدلسازی سه عامل کلیدی دارد. «عامل ارسال تسک» که پرامپتهای متنی را تجزیه میکند. «عامل مفهومسازی» که جزئیات ذکرنشده را به توضیحات اولیه اضافه میکند و «عامل مدلسازی» که پارامترها را تنظیم و کد نهایی را تولید میکند. کد بهدستآمده را میتوان در نرمافزارهای سهبعدی مانند Blender به مدل سهبعدی تبدیل کرد.
محققان هوش مصنوعی ۳D-GPT را با پرامپت «یک صبح مهآلود بهاری، جایی که گلهای شبنم زده در علفزاری سرسبز با درختان پُرجوانه احاطه شده است» آزمایش کردند. ۳D-GPT توانست صحنههای سهبعدی کاملی را با گرافیک واقعی ایجاد کند که عناصر توصیفشده در متن را به دقت انعکاس میدهد. خروجی نهایی را در پایین مشاهده میکنید:
در حالی که کیفیت گرافیک نهایی هنوز به واقعیت نزدیک نیست، نتایج اولیه نشان میدهد که رویکرد این هوش مصنوعی (تجزیه متن و تخصیص هر کدام به یک عامل) میتواند محتوای سهبعدی بسیار خوبی تولید کند. معماری مدولار این هوش مصنوعی این امکان را فراهم میکند تا هر جزء هوش مصنوعی به طور مستقل بهبود یابد.
محققان این هوش مصنوعی میگویند: «تحقیقات تجربی ما تأیید میکند که ۳D-GPT نه تنها پرامپتها را تفسیر و اجرا میکند و نتایج قابل اعتمادی ارائه میدهد، بلکه به طور مؤثر با طراحان انسانی همکاری میکند». محققان به این نتیجه رسیدند که سیستم و پتانسیل «مدلهای زبانی بزرگ» (LLM) در مدلسازی سهبعدی اهمیت برجستهای دارد و یک چارچوب اساسی برای پیشرفتهای آینده در تولید صحنه و انیمیشن ارائه میدهد.
این هوش مصنوعی میتواند صنعت مدلسازی سه بعدی را متحول، کارآمدتر و در دسترستر کند. همانطور که به سمت عصر متاورس پیش میرویم، ایجاد محتوای سهبعدی بهوسیله ابزارهایی مانند ۳D-GPT برای سازندگان در طیف وسیعی از صنایع، از بازی و واقعیت مجازی تا سینما و بخشهای چندرسانهای، میتواند ارزشمند باشد.