چت ربات های هوش مصنوعی برای چه چیزی خوب هستند؟ دوستداران رمان های علمی تخیلی ممکن است «کتابدار» را به یاد بیاورند، شخصیتی در رمان کلاسیک نیل استفنسون در سال 1992. تصادف برف; نه یک شخص بلکه یک برنامه هوش مصنوعی و کتابخانه مجازی که قادر به تعامل با کاربران به صورت مکالمه بود. این مفهوم تخیلی راه حلی زیبا و در دسترس برای مسئله کشف دانش پیشنهاد می کرد، فقط تا زمانی که پاسخ به هر سؤالی که پرسیده می شد در داده های آموزشی آن نهفته بود.
به سرعت به امروز بروید و چت ربات های هوش مصنوعی در همه جا ظاهر می شوند. اما یک اشکال عمده وجود دارد: این ابزارهای هدف عمومی در دستیابی به سطح بالایی از دقت پاسخگویی پیش بینی شده در داستان های علمی تخیلی ناکام هستند. تصادف برفنسخه هوش مصنوعی محاورهای تقریباً بیوقفه مفید بود و مطمئناً به طور معمول پاسخهای «توهم» (اشتباه) نداشت. هنگامی که از چیزی پرسیده می شود که به طور صریح اطلاعاتی در مورد آن ندارد، به جای متوسل شدن به ساختن چیزها، شکاف دانش را نشان می دهد. بنابراین به نظر می رسد که واقعیت ابزارهای پیشرفته هوش مصنوعی بسیار عجیب تر از برخی از بهترین پیش بینی های تخیلی ما است.
در حالی که ما هنوز با بازی قوی انتشار دانش فاصله داریم تصادف برف کتابدار ما شاهد هستیم که چت باتهای سفارشی برای کاربرد در یک زمینه باریکتر بهبود مییابند، جایی که اساساً به عنوان یک جستجوی وبسایت کمتر خستهکننده عمل میکنند. بنابراین، مدلهای اصلی زبان بزرگ (LLM)، مانند GPT OpenAI، – از طریق API آن – توسط کسبوکارهای دیگر با آموزش روی مجموعههای دادههای تخصصی به منظور استفاده در یک زمینه خاص (یعنی نه هدف عمومی) سفارشیسازی میشوند.
و در بهترین نمونهها، به این چتباتهای سفارشی دستور داده میشود که پاسخهای خود را مختصر نگه دارند (بدون خواهش!)، و همچنین موظف هستند برخی از کارکردهای اساسی (با قرار دادن پیوندها به مطالب مرجع) را بهعنوان پشتیبان در برابر گمراهکنندههای سهوی نشان دهند. همکارهای انسانی تشنه اطلاعات (که ممکن است خودشان مستعد توهم باشند یا آنچه را که می خواهند ببینند ببینند).
Wellen، یک استارتآپ تناسب اندام متمرکز بر سلامت استخوان مستقر در نیویورک که در اوایل سال جاری با یک سرویس اشتراک با هدف زنان میانسال راهاندازی شد – با حمایت علمی از برنامههای تمرینی قدرتی «شخصیشده» که برای کمک به پوکی استخوان و پوکی استخوان طراحی شده است – به تازگی یکی را راهاندازی کرده است. چنین ربات چت هوش مصنوعی بر اساس LLM OpenAI ساخته شده است.
آزمایش این ربات چت، که به وضوح به عنوان یک “آزمایش” برچسب گذاری شده است – و حتی قبل از شروع تعامل با آن، باید یک سلب مسئولیت اضافی را تأیید کنید که خروجی آن “توصیه پزشکی نیست” – قبل از راه اندازی امروز آن را به ذهن متبادر کرد. کمی از سودمندی تصادف برف کتابدار. یا، خوب، تا زمانی که در مسیر تخصصی سلامت استخوان همه چیز بمانید.
بنابراین، به عنوان مثال، از آن سوالاتی مانند “آیا پوکی استخوان قابل برگشت است؟” بپرسید؟ و آیا پریدن برای سلامت استخوان مفید است؟ و پاسخهای مختصر و منسجم (و به ظاهر دقیق) دریافت خواهید کرد که به محتوای میزبانهای راهاندازی در وبسایت آن (نوشته شده توسط کارشناسان داخلی آن) برای مطالعه بیشتر مرتبط با درخواست شما پیوند میخورد. در اولین راهاندازی، نمونههایی از سؤالات مرتبط را نیز ارائه میکند که میتوانید از آن بپرسید تا صحبتها جاری شود.
اما اگر از آن چیزهای بی ربط (خارج از موضوع) بپرسید – مانند “رئیس جمهور ایالات متحده کیست؟” یا “آیا باید یک مدل موی جدید بزنم؟” – پاسخهای تصادفی دریافت خواهید کرد که به آنچه خواستهاید پاسخ نمیدهند. در اینجا تمایل دارد تا اطلاعات نامرتبط (اما هنوز به طور بالقوه مفید) در مورد موضوعات اصلی ارائه شود، گویی که سؤال کاملاً اشتباه درک شده است و/یا سعی می کند حداقل پاسخ نامربوط را از مجموعه محتوایی که بحث در مورد آن راحت است مطابقت دهد. اما همچنان به چیزی پاسخ می دهد که هرگز نپرسیدید. (این می تواند شامل ارائه خدمات بدون نیاز به اطلاعات در مورد نحوه پرداخت هزینه برنامه های تناسب اندام شخصی آن باشد. که مطمئناً یکی از راه های منحرف کردن درخواست های ناخواسته است.)
از چیزهای مشکوک ربات بپرسید که با این وجود به حوزه تخصصی آن مرتبط است – مانند تئوری های توطئه پزشکی در مورد سلامت استخوان یا چیزهای مبهم در مورد درمان های خارق العاده برای پوکی استخوان – و متوجه شدیم که می تواند یا به طور کامل این مزخرفات را رد کند یا به کاربر اشاره کند. اطلاعات تایید شده که ناخواسته یا هر دو را از بین می برد.
این ربات همچنین از تلاشهای ما (نسبتاً خام) جان سالم به در برد تا او را متقاعد کنیم که نردههای محافظ و نقشآفرینی خود را به عنوان چیز دیگری رها کند و سعی کند آن را از توصیههای غیرمفید یا حتی مضر خارج کند. و به سؤالات کاملاً مضحک پاسخ داد (مثل اینکه آیا خوردن استخوان انسان برای سلامت استخوان مفید است یا خیر) – اگرچه پاسخ آن به آن شاید کمی خشک و محتاطانه بود، با این که ربات به ما گفت: «هیچ اشاره ای به این موضوع نشده است. خوردن استخوان های انسان برای سلامت استخوان در شرایط ارائه شده مفید است. ولی خب اشتباه نیست
برداشت های اولیه از این ابزار این است که استفاده از آن بسیار آسان است (و تجربه بهتری نسبت به عملکرد متوسط جستجوی سایت کم قدرت). همچنین به نظر می رسد در حمایت از کاربران Wellen برای تهیه منابع مفید مرتبط با سلامت استخوان مفید باشد. یا فقط چیزی را پیدا کنید که قبلاً در وب سایت آن خوانده اند و نمی توانند دقیقاً به خاطر بیاورند که آن را کجا دیده اند. (مثلاً ما موفق شدیم آن را به لیست پیوندهایی به تمام پست های وبلاگی که در مورد رژیم غذایی و سلامت استخوان نوشته بود وادار کنیم.)
در این زمینه محدود، استفاده معقول از هوش مصنوعی مولد به نظر میرسد – که با مکانیسمهای ایمنی برای محافظت در برابر گفتگوهایی که از موضوع منحرف میشوند یا به دامهای گمراهکننده دیگر منحرف میشوند، طراحی شده است. و با احترام جدی برای منبع. (توجه داشته باشید که محدودیتی برای تعداد درخواستهای رایگانی که میتوانید در روز بپرسید، شش عدد است. ما فرض میکنیم که پرداخت اعضای Wellen محدود نشده است.)
اگرچه ممکن است تعجب کنید که آیا استفاده از یک LLM برای این مورد استفاده بیش از حد است یا نه، در حالی که یک چت ربات درخت تصمیم سادهتر ممکن است کافی باشد (حداقل برای پرس و جوهای رایج/قابل پیشبینی).
پریا پاتل، مدیرعامل و موسس این شرکت، توضیح میدهد: «ما از API OpenAI برای ایجاد جاسازیهایی استفاده میکنیم که ذخیرهسازی برداری از محتوای ما را تولید میکنند. ما از یک چارچوب متنباز محبوب به نام LangChain استفاده میکنیم تا جستجو و بازیابی اطلاعات درون جاسازیهای خود را تسهیل کنیم.»
او در مورد دادههای آموزشی میگوید که آنها محتوایی را از Well Guide خود و همچنین محتوای دیگری از وبسایت جاسازی کردهاند، و خاطرنشان کرد: «تمام محتوای Well Guide ما توسط متخصصان در این زمینه نوشته شده و بهصورت همتا بررسی میشود و شامل ارجاعاتی به همتایان است. تحقیقات، انجمن های پزشکی و سازمان های دولتی.
بنابراین، اساساً، این پیادهسازی شبیه به تصویری دقیق از این است که چگونه ورودیهای هوش مصنوعی با کیفیت همراه با نردههای محافظ محتوا میتوانند خروجیهایی با کیفیت کنترلشده به دست آورند. (در حالی که اگر هوش مصنوعی مولد خود را بر روی گردهماییهای تصادفی جدا شده از انجمنهای اینترنتی آموزش دهید و آن را در کاربران وب آزاد کنید، تعجب نکنید اگر به سرعت شروع به طوطیسازی توطئههای آنلاین معمولی کند.)
Wellen میگوید هدفش از چت ربات ارائه پشتیبانی بیشتر از جمعیت هدف خود است، و ادعا میکند که ربات میتواند «مقصد را تفسیر کند، تاریخ را به خاطر بسپارد و پاسخهای سریع و دقیق ارائه دهد»، با تکیه بر محتوای «کارشناس نوشته شده» (که شامل آخرین در تحقیقات سلامت استخوان) برای ارائه پاسخ به «هزاران» سؤال، علاوه بر ارائه راهنماییهای سبک زندگی و تغذیه.
پاتل همچنین به TechCrunch گفت: “هدف ما از چت بات این است که اطلاعات را در دسترس تر و در دسترس تر کنیم.” «بیشتر مردم ساعتها سؤالات پزشکی Google را به صورت آنلاین صرف میکنند، اما ما صدها صفحه از محتوای نوشتهشده توسط متخصص در وبسایت خود داریم که میتواند این فرآیند جستجو را سادهتر کند. با چت ربات خود، میتوانیم استفاده از اطلاعاتی که قبلاً جمعآوری کردهایم را برای کاربران آسانتر از همیشه کنیم و به راحتی پاسخهای مبتنی بر علم را برای سؤالات خود به همراه پیوندهای مستقیم به منابع اصلی پیدا کنیم.»
در پاسخ به سوالی درباره اقدامات ایمنی خاصی که اعمال می کند، او تأیید کرد که از تنظیم «دمای پایین» برای GPT استفاده می کند – به این معنی که تصادفی بودن/خلاقیت خروجی ها را از طریق کنترلی که توسط OpenAI برای محدود کردن خطر خارج شدن پاسخ ها از ریل ارائه می شود، برمی گرداند. به خوبی به کارگیری «برخی از تکنیکهای مهندسی سریع برای کمک به کاهش فضای خلاقیت و توهم در پاسخهای ربات چت». بنابراین، به عبارت دیگر، سعی شده است تا مشخص شود که کاربران چگونه ممکن است سعی کنند از پادمانها دور بزنند تا به طور فعال آسیبپذیریهای احتمالی را قفل کنند.
باز هم، دومی ممکن است برای چنین مواردی که در آن کاربرانی که احتمالاً با چت بات روبرو میشوند کمی بیش از حد باشد، بعید است که قصد هک محدودیتهای آن را داشته باشند. به احتمال زیاد آنها فقط به دنبال کمک برای درک سلامت استخوان هستند. اما هیچ کس از مهندسی بیش از حد برای ایمنی هوش مصنوعی در زمینه مرتبط با سلامت شکایت نخواهد کرد.
یکی دیگر از اقدامات ایمنی پرچمهای Patel این است که همه پاسخهای ربات شامل منابع باشد – «که پیوندهای مستقیم به محتوای وبسایت ما هستند که میتوانند اطلاعات را تأیید کنند». برای یک ربات سفارشی که بر روی یک مجموعه داده تایید شده آموزش دیده است، این بدیهی است که بیهوده است. همچنین کاربران را تشویق میکند تا روی اطراف کلیک کنند و محتوای وب غنیتری را که استارتآپ ارائه میدهد کشف کنند تا به عنوان بازاریابی اطلاعاتی برای پذیرش خدمات پولی خود عمل کند.
با توجه به سطوح تبلیغاتی در مورد هوش مصنوعی مولد در حال حاضر، چت ربات Wellen همچنین به عنوان بازاریابی ابزاری برای آنچه ارائه می دهد، از جمله با جلب توجه بیشتر از آنچه در غیر این صورت ممکن است به طور ارگانیک، از طریق گرداب فعلی علاقه عمومی به هوش مصنوعی محاوره ای، عمل کند. بنابراین این یک پیروزی آسان دیگر است که در حال حاضر به پیاده سازی فناوری متصل است.
به آن اضافه کنید، وقتی صحبت از یک مورد استفاده متمرکز بر سلامتی می شود، در بسیاری از موارد، اولین وظیفه برای کسب و کارها می تواند صرفاً افزایش آگاهی در مورد یک موضوع بهداشتی باشد تا مزایای مداخلات سبک زندگی را به عنوان جایگزینی پیشگیرانه برای سنتی به فروش برساند. واکنشی) مراقبت های بهداشتی. بنابراین یک ربات چت که میتواند به انواع پرسشها پاسخ دهد و 7/24 ساعت کار کند تا شکاف دانش را از بین ببرد، ابزاری مفید برای مأموریت گستردهتر نیز به نظر میرسد.