Auto-GPT چیست و چرا اهمیت دارد؟

تلاش سیلیکون ولی برای خودکار کردن همه چیز بی وقفه است، که آخرین وسواس آن را توضیح می دهد: Auto-GPT.

در اصل، Auto-GPT از تطبیق پذیری آخرین مدل‌های هوش مصنوعی OpenAI برای تعامل با نرم‌افزار و سرویس‌های آنلاین استفاده می‌کند و به آن اجازه می‌دهد تا به‌طور خودکار وظایفی مانند X و Y را انجام دهد. اما همانطور که ما در حال یادگیری با مدل‌های زبان بزرگ هستیم، به نظر می‌رسد که این قابلیت وجود دارد. به وسعت یک اقیانوس اما به عمق یک گودال.

Auto-GPT – که ممکن است اخیراً در رسانه های اجتماعی منفجر شده باشد – یک برنامه متن باز است که توسط توسعه دهنده بازی Toran Bruce Richards ایجاد شده است. که از مدل‌های تولید متن OpenAI، عمدتاً GPT-3.5 و GPT-4، برای عمل «خودکار» استفاده می‌کند.

هیچ جادویی در آن خودمختاری وجود ندارد. Auto-GPT به سادگی پیگیری های اولیه مدل های OpenAI را انجام می دهد، تا زمانی که یک کار کامل شود، آنها را می پرسد و پاسخ می دهد.

Auto-GPT، اساسا، GPT-3.5 و GPT-4 است که با یک ربات همراه جفت شده است که به GPT-3.5 و GPT-4 دستور می دهد که چه کاری انجام دهند. یک کاربر به Auto-GPT می گوید که هدفش چیست و ربات نیز به نوبه خود از GPT-3.5 و GPT-4 و چندین برنامه برای انجام هر مرحله لازم برای رسیدن به هدفی که تعیین کرده است استفاده می کند.

چیزی که Auto-GPT را تا حد معقولی می‌سازد، توانایی آن در تعامل با برنامه‌ها، نرم‌افزارها و سرویس‌های آنلاین و محلی است، مانند مرورگرهای وب و پردازشگرهای کلمه. به عنوان مثال، با توجه به درخواستی مانند “به من کمک کنید تجارت گل من را توسعه دهم”، Auto-GPT می تواند یک استراتژی تبلیغاتی تا حدودی قابل قبول ایجاد کنید و یک وب سایت اولیه بسازید.

همانطور که جو کوئن، یک توسعه‌دهنده نرم‌افزاری که با Auto-GPT آزمایش کرده است، از طریق ایمیل به TechCrunch توضیح داد، Auto-GPT اساساً پروژه‌های چند مرحله‌ای را خودکار می‌کند که نیاز به اعلان‌های رفت و برگشتی با یک مدل هوش مصنوعی مبتنی بر چت‌بات دارند، مثلاً. ، ChatGPT OpenAI.

کوئن گفت: “Auto-GPT عاملی را تعریف می کند که با API OpenAI ارتباط برقرار می کند.” “هدف این عامل اجرای دستورات مختلفی است که هوش مصنوعی در پاسخ به درخواست های عامل ایجاد می کند. از کاربر خواسته می شود تا قبل از اینکه عامل شروع به اجرای دستورات کند، نقش و اهداف هوش مصنوعی را مشخص کند.”

در یک ترمینال، کاربران نام، نقش و هدف عامل Auto-GPT را توصیف می کنند و حداکثر پنج راه را برای دستیابی به آن هدف مشخص می کنند. مثلا:

  • نام: گوشی هوشمند-GPT
  • نقش: هوش مصنوعی طراحی شده برای یافتن بهترین گوشی هوشمند
  • هدف، واقعگرایانه: بهترین گوشی های هوشمند موجود در بازار را پیدا کنید
  • هدف 1: تحقیقات بازار را برای گوشی های هوشمند مختلف موجود در بازار امروز انجام دهید
  • هدف 2: پنج گوشی هوشمند برتر را دریافت کنید و مزایا و معایب آنها را فهرست کنید

در پشت صحنه، Auto-GPT به ویژگی هایی مانند مدیریت حافظه برای اجرای وظایف، همراه با GPT-4 و GPT-3.5 برای تولید متن، ذخیره سازی فایل و خلاصه سازی متکی است.

Auto-GPT همچنین می تواند به سینت سایزرهای گفتار مانند ElevenLabs متصل شود، به طوری که می تواند تماس های تلفنی را به عنوان مثال “قرار دهد”.

Auto-GPT به صورت عمومی در GitHub در دسترس است، اما برای راه‌اندازی و اجرا به برخی تنظیمات و دانش نیاز دارد. برای استفاده از آن، Auto-GPT باید در یک محیط توسعه مانند Docker نصب شود، و باید با یک کلید API از OpenAI ثبت شود – که به یک حساب OpenAI پولی نیاز دارد.

ممکن است ارزشش را داشته باشد – اگرچه هیئت منصفه در این مورد نظر دارند. پذیرندگان اولیه از Auto-GPT برای انجام انواع کارهای پیش پا افتاده استفاده کرده اند که بهتر به یک ربات واگذار می شود. برای مثال، Auto-GPT می‌تواند مواردی مانند اشکال‌زدایی کد و نوشتن ایمیل یا چیزهای پیشرفته‌تری مانند ایجاد یک طرح کسب‌وکار برای یک استارت‌آپ جدید را وارد کند.

عدنان مسعود، معمار ارشد در UST، یک شرکت مشاوره فناوری، گفت: «اگر Auto-GPT با هر گونه مانع یا ناتوانی در تکمیل کار مواجه شود، دستورات جدیدی را برای کمک به موقعیت و تعیین گام های بعدی مناسب ایجاد می کند. TechCrunch در یک ایمیل. «مدل‌های زبان بزرگ در ایجاد پاسخ‌هایی شبیه به انسان برتری دارند، اما برای ارائه نتایج دلخواه به پیام‌های کاربر و تعاملات متکی هستند. در مقابل، Auto-GPT از قابلیت‌های پیشرفته API OpenAI استفاده می‌کند تا به‌طور مستقل و بدون دخالت کاربر عمل کند.

در هفته‌های اخیر، اپلیکیشن‌های جدیدی ظاهر شده‌اند که استفاده از Auto-GPT را حتی آسان‌تر می‌کنند، مانند AgentGPT و GodMode، که یک رابط کاربری ساده را ارائه می‌کنند که در آن کاربران می‌توانند آنچه را که می‌خواهند مستقیماً در یک صفحه مرورگر وارد کنند. توجه داشته باشید که مانند Agent-GPT، هر دو به یک کلید API از OpenAI نیاز دارند تا قابلیت‌های کامل خود را باز کنند.

با این حال، مانند هر ابزار قدرتمندی، Auto-GPT محدودیت‌ها و خطرات خود را دارد.

بسته به هدفی که ابزار ارائه شده است، Auto-GPT می تواند به روش های بسیار غیرمنتظره ای رفتار کند. یکی از کاربران Reddit ادعا می کند که با توجه به بودجه 100 دلاری برای خرج کردن در یک نمونه سرور، Auto-GPT یک صفحه ویکی روی گربه ها ایجاد کرد، از یک نقص در نمونه برای دسترسی به سطح مدیریت سوء استفاده کرد و محیط پایتون را که در آن قرار داشت تحت کنترل گرفت. دویدن – و سپس خود را “کشت”.

همچنین ChaosGPT، یک نسخه اصلاح شده از Auto-GPT با اهدافی مانند «از بین بردن بشریت» و «برقراری سلطه جهانی» وجود دارد. جای تعجب نیست که ChaosGPT به ایجاد آخرالزمان ربات نزدیک نشده است – اما توئیتی نسبتاً نامطلوب در مورد نوع بشر منتشر کرده است.

البته خطرناک‌تر از تلاش Auto-GPT برای «نابودی بشریت»، مشکلات پیش‌بینی نشده‌ای هستند که می‌توانند در سناریوهای کاملاً عادی ظاهر شوند. از آنجا که بر روی مدل‌های زبان OpenAI ساخته شده است – مدل‌هایی که مانند همه مدل‌های زبانی مستعد عدم دقت هستند – می‌تواند خطا ایجاد کند.

این تنها مشکل نیست. پس از انجام موفقیت آمیز یک کار، Auto-GPT معمولاً نحوه اجرای آن را برای استفاده بعدی به خاطر نمی آورد، و – حتی زمانی که انجام می دهد – اغلب استفاده از برنامه را به خاطر نمی آورد. Auto-GPT همچنین برای تقسیم مؤثر وظایف پیچیده به وظایف فرعی ساده‌تر تلاش می‌کند و در درک نحوه همپوشانی اهداف مختلف مشکل دارد.

Clara Shih، مدیر عامل Salesforce’s Service Cloud و یکی از علاقه مندان Auto-GPT، از طریق ایمیل گفت: “Auto-GPT قدرت و خطرات ناشناخته هوش مصنوعی مولد را نشان می دهد.” برای شرکت‌ها، در هنگام توسعه و استفاده از فناوری‌های هوش مصنوعی مانند Auto-GPT، بسیار مهم است که انسان را در رویکرد حلقه قرار دهند.