محققان هوش مصنوعی یک ربات Minecraft ساختهاند که میتواند قابلیتهای خود را در دنیای باز بازی کاوش کرده و گسترش دهد – اما برخلاف سایر رباتها، این ربات اساساً کد خود را از طریق آزمون و خطا نوشت. مقدار زیادی از جستارهای GPT-4.
این سیستم آزمایشی که وویجر نامیده میشود، نمونهای از یک «عامل تجسمشده» است، یک هوش مصنوعی که میتواند آزادانه و هدفمند در یک محیط شبیهسازی شده یا واقعی حرکت کند و عمل کند. هوش مصنوعی و چت رباتهای نوع دستیار شخصی نیازی به انجام کارها ندارند، چه رسد به اینکه برای انجام این کارها در دنیای پیچیده حرکت کنند. اما این دقیقاً همان کاری است که از یک ربات خانگی انتظار می رود در آینده انجام دهد، بنابراین تحقیقات زیادی در مورد چگونگی انجام این کار وجود دارد.
Minecraft مکان خوبی برای آزمایش چنین چیزهایی است زیرا نمایشی بسیار (بسیار) تقریبی از دنیای واقعی، با قوانین و فیزیک ساده و سرراست، اما همچنین به اندازه کافی پیچیده و باز است که کارهای زیادی برای انجام دادن یا امتحان کردن وجود دارد. شبیه سازهای هدفمند نیز عالی هستند، اما محدودیت های خاص خود را دارند.
MineDojo یک چارچوب شبیهسازی است که حول Minecraft ساخته شده است، زیرا شما نمیتوانید فقط یک هوش مصنوعی تصادفی را در آنجا قرار دهید و انتظار داشته باشید که بفهمد همه این بلوکها و خوکها چه میکنند. سازندگان آن (همپوشانی های زیادی با تیم Voyager) ویدیوهای YouTube درباره بازی، رونوشت ها، مقالات ویکی، و تعداد زیادی پست Reddit از r/minecraft، در میان داده های دیگر را گرد هم می آورند، بنابراین کاربران می توانند یک مدل هوش مصنوعی ایجاد یا تنظیم کنند. بر روی آنها همچنین این امکان را فراهم میکند که این مدلها با مشاهده اینکه چقدر خوب کارهایی مانند ساختن حصار دور یک لاما یا پیدا کردن و استخراج الماس را انجام میدهند، کم و بیش عینی ارزیابی شوند.
وویجر در این وظایف عالی عمل می کند و عملکرد بسیار بهتری نسبت به تنها مدل نزدیک به آن یعنی AutoGPT دارد. اما آنها رویکرد مشابهی دارند: استفاده از GPT-4 برای نوشتن کد خود در حین حرکت.
معمولاً شما فقط یک مدل را با تمام دادههای خوب Minecraft آموزش میدهید و امیدواریم که بفهمد وقتی خورشید غروب میکند چگونه با اسکلتها مبارزه کند. با این حال، Voyager نسبتا ساده شروع میکند، و همانطور که در بازی با چیزهایی روبرو میشود، گفتگوی داخلی کمی با GPT-4 در مورد اینکه چه کاری باید انجام دهد و چگونه انجام میدهد، دارد.
برای مثال، بگویید شب میرسد و آن اسکلتها بیرون میآیند. نماینده یک ایده کلی از این موضوع دارد، اما از خود می پرسد، وقتی هیولاهایی در این نزدیکی وجود دارند، یک بازیکن خوب این بازی چه می کند؟ خوب، GPT-4 میگوید، اگر میخواهید با خیال راحت جهان را کاوش کنید، میخواهید یک شمشیر بسازید و مجهز کنید، سپس اسکلت را با آن بکوبید و از ضربه خوردن اجتناب کنید. و این حس کلی از اینکه چه باید کرد به اهداف ملموس تبدیل می شود: جمع آوری سنگ و چوب، ساختن شمشیر روی میز کاردستی، تجهیز آن و مبارزه با اسکلت.
پس از انجام آن کارها، آنها وارد یک کتابخانه مهارت عمومی می شوند تا بعداً، زمانی که کار این است که «به اعماق غار بروید تا سنگ آهن پیدا کنید»، لازم نیست دوباره از ابتدا جنگیدن را یاد بگیرد. هنوز هم از GPT استفاده میکند، اما از GPT-3.5 ارزانتر و سریعتر، که به آن مهارتهای مرتبطتر با یک موقعیت خاص را میگوید – بنابراین سعی نمیکند اسکلت را استخراج کند و با سنگ معدن مبارزه کند.
این شبیه به عاملی مانند AutoGPT است، هنگامی که با رابطی روبرو می شود که هنوز نمی شناسد، باید به خود یاد دهد که در آن حرکت کند تا به هدف خود برسد. اما Minecraft یک محیط بسیار عمیق تر از آن است که برای حل آن استفاده می شود، بنابراین یک عامل تخصصی مانند Voyager بسیار بهتر عمل می کند. این ربات ها چیزهای بیشتری پیدا می کند، مهارت های بیشتری را می آموزد و منطقه بسیار بیشتری را نسبت به سایر ربات ها کاوش می کند.
جالب است هر چند شاید تعجب آور نباشد، GPT-4 وقتی نوبت به تولید کد مفید می رسد، زمین را با GPT-3.5 (یعنی ChatGPT) پاک می کند. آزمایشی که جایگزین اولی با دومی شد، باعث شد که عامل در اوایل، شاید حتی به معنای واقعی کلمه، به دیوار برخورد کند و بهبود نیابد. ممکن است از صحبت کردن با این دو مدل مشخص نباشد که یکی بسیار باهوشتر است، اما حقیقت این است که برای انجام یک مکالمه ظاهراً هوشمند، لازم نیست بهویژه باهوش باشید (از من بپرسید از کجا میدانم). کدنویسی بسیار دشوارتر است و GPT-4 یک به روز رسانی بزرگ در آنجا بود.
هدف این تحقیق منسوخ شدن بازیکنان Minecraft نیست، بلکه یافتن روشهایی است که مدلهای هوش مصنوعی نسبتاً ساده میتوانند بر اساس «تجارب» خود، به دلیل نداشتن کلمه بهتر، خود را بهبود بخشند. اگر میخواهیم روباتهایی داشته باشیم که در خانهها، بیمارستانها و ادارات به ما کمک میکنند، آنها باید این درسها را یاد بگیرند و در اقدامات آینده به کار ببرند.
شما می توانید اطلاعات بیشتری در مورد Voyager در اینجا بخوانید.