مایکروسافت با ویژگی های جدید بینگ هوش مصنوعی را دوچندان کرده است

مایکروسافت شروع به کار می کند در مرحله بعدی گسترش بینگ. و – جای تعجب نیست – به شدت حول محور هوش مصنوعی می چرخد.

در یک رویداد پیش نمایش این هفته در شهر نیویورک، مدیران مایکروسافت از جمله یوسف مهدی، CVP و مدیر بازاریابی مصرف کننده، به اعضای مطبوعات از جمله این گزارشگر نگاهی به طیف وسیعی از ویژگی هایی که طی چند روز، هفته آینده به بینگ می روند، ارائه کردند. و ماه ها

آنها آنقدر چرخ را دوباره اختراع نمی کنند، بلکه بر اساس آنچه مایکروسافت طی سه ماه گذشته یا بیشتر به تجربه بینگ تزریق کرده است، می پردازند. مایکروسافت از زمان راه‌اندازی Bing Chat، چت ربات مبتنی بر هوش مصنوعی که از مدل‌های GPT-4 و DALL-E 2 OpenAI پشتیبانی می‌کند، می‌گوید که بازدیدکنندگان Bing – که به بیش از 100 میلیون کاربر فعال روزانه افزایش یافته است – در بیش از نیم میلیارد چت و چت شرکت کرده‌اند. بیش از 200 میلیون تصویر ایجاد کرد.

با نگاه کردن به آینده، Bing بصری تر خواهد شد، به لطف پاسخ های بیشتر تصویر و گرافیک محور در Bing Chat. همچنین شخصی‌تر می‌شود، با قابلیت‌هایی که به کاربران اجازه می‌دهد تا تاریخچه‌های گپ بینگ خود را صادر کنند و محتوا را از افزونه‌های شخص ثالث بکشند (در ادامه به آن‌ها خواهیم پرداخت). و چندوجهی بودن را در بر می گیرد، حداقل به این معنا که بینگ چت می تواند به سوالات در زمینه تصاویر پاسخ دهد.

مهدی در اظهارات آماده شده گفت: «فکر می‌کنم به جرات بتوان گفت که در حال تحول در جستجو هستیم. “در ذهن ما، ما فکر می کنیم که امروز آغاز نسل بعدی این “ماموریت جستجو” خواهد بود.”

باز و بصری

از امروز، Bing جدید – یکی با Bing Chat – اکنون بدون لیست انتظار در دسترس است. هرکسی می‌تواند با ورود به سیستم با یک حساب مایکروسافت آن را امتحان کند.

این کم و بیش تجربه ای است که چند ماه پیش راه اندازی شد. اما همانطور که قبلا اشاره شد، بینگ چت به زودی با تصاویر پاسخ خواهد داد – حداقل در جایی که منطقی باشد. پاسخ به سؤالات (مثلاً “ماچو پیچو کجاست؟”) در صورت وجود، با تصاویر مرتبط همراه خواهد بود، بسیار شبیه به جریان جستجوی استاندارد Bing اما در یک رابط کارت مانند فشرده شده است.

مایکروسافت بینگ چت

پاسخ هایی با تصاویر، جدید در بینگ چت.

در یک دمو در این رویداد، یک سخنگوی این سوال را تایپ کرد: “آیا کاکتوس ساگوارو گل می‌سازد؟” و بینگ چت پاسخی به طول پاراگراف در کنار تصویری از کاکتوس مورد نظر ارائه کردند. برای من، “پانل های دانش” را در جستجوی گوگل برانگیخت.

مایکروسافت نمی گوید که کدام دسته از محتوا، دقیقاً ممکن است یک تصویر را تحریک کند. اما برای جلوگیری از ظاهر شدن تصاویر صریح – یا اینطور ادعا می کند، فیلتری در آن وجود دارد.

سارا برد، رئیس هوش مصنوعی مسئول در مایکروسافت، به من گفت که بینگ چت از فیلتر کردن و تعدیل موجود در جستجوی بینگ سود می برد. فراتر از این، بینگ چت از ترکیبی از «طبقه‌بندی‌کننده‌های سمیت» یا مدل‌های هوش مصنوعی آموزش‌دیده برای شناسایی پیام‌های بالقوه مضر و لیست‌های سیاه برای تمیز نگه داشتن چت استفاده می‌کند.

شایان ذکر است، این اقدامات مانع از آن نشد که بینگ چت در ابتدای فوریه در پیش نمایش منتشر شود. پوشش ما متوجه شد که ربات چت اطلاعات نادرست واکسن را منتشر می‌کند و از دیدگاه آدولف هیتلر سخنی نفرت‌انگیز می‌نویسد. گزارشگران دیگر آن را برای تهدید، ادعای هویت های متعدد و حتی شرمساری آنها به خاطر توصیه آن دریافت کردند.

در یک ضربه دیگر به مایکروسافت، این شرکت فقط چند ماه پیش تیم اخلاق و جامعه را در سازمان بزرگتر هوش مصنوعی خود اخراج کرد. این اقدام مایکروسافت را بدون تیم اختصاصی برای اطمینان از اینکه اصول هوش مصنوعی آن با طراحی محصول مرتبط است، رها کرد.

با این حال، Bird ادعا می‌کند که پیشرفت‌های معنی‌داری حاصل شده است و این نوع مشکلات هوش مصنوعی یک شبه حل نمی‌شوند – هر چند Bing Chat ممکن است عمومی باشد. او گفت که در میان اقدامات دیگر، تیمی از ناظران انسانی برای نظارت بر سوء استفاده وجود دارد، مانند تلاش کاربران برای استفاده از بینگ چت برای تولید ایمیل‌های فیشینگ.

اما – از آنجایی که به اعضای مطبوعات این فرصت داده نشد تا با آخرین نسخه بینگ فراتر از نمایش‌های نمایشی کنترل‌شده تعامل داشته باشند – نمی‌توانم بگویم تا چه حد همه اینها تفاوت ایجاد کرده است. بدون شک زمانی که افراد دیگری دست خود را به آن برسانند، روشن خواهد شد.

یکی از جنبه های بینگ چت که است بهبود شفافیت پیرامون پاسخ‌های آن است – به‌ویژه پاسخ‌هایی که ماهیت مبتنی بر واقعیت دارند. به زودی، وقتی از شما خواسته می‌شود که یک سند یا محتوای یک سند را خلاصه کنید (مثلاً «این صفحه در مورد پل بروکلین چه می‌گوید؟»)، چه یک PDF 20 صفحه‌ای یا یک مقاله ویکی‌پدیا، بینگ چت شامل نقل قول‌هایی خواهد شد که نشان می‌دهد از کجا در متنی که اطلاعات از آن آمده است. با کلیک بر روی آنها، قسمت مربوطه برجسته می شود.

بهره وری در حال ظهور

در یکی دیگر از ویژگی‌های جدید در بخش بصری، بینگ چت می‌تواند نمودارها و نمودارها را در صورت تغذیه مناسب و داده‌ها ایجاد کند. قبلاً چیزی مانند “پرجمعیت ترین شهرهای برزیل کدامند؟” یک لیست اساسی از نتایج را به همراه خواهد داشت. اما در یک پیش‌نمایش نزدیک به آینده، بینگ چت این نتایج را به صورت بصری و در نوع نمودار انتخابی کاربر ارائه می‌کند.

این ظاهراً نشان‌دهنده گامی برای Bing به سمت یک پلت‌فرم بهره‌وری کامل است، به‌ویژه زمانی که با قابلیت‌های تولید متن به تصویر بهبودیافته همراه شود.

مایکروسافت بینگ چت

خالق تصویر در بینگ چت.

در هفته‌های آینده، Bing Image Creator – ابزار مایکروسافت که می‌تواند تصاویر را از پیام‌های متنی تولید کند، با پشتیبانی از DALL-E 2 – زبان‌های بیشتری را به غیر از انگلیسی (در مجموع بیش از 100) درک خواهد کرد. همانند انگلیسی، کاربران می‌توانند تصاویری را که تولید می‌کنند با اعلان‌های بعدی اصلاح کنند (مثلاً «تصویری از خرگوش خرگوش بسازید» و سپس «حالا خز را صورتی کنید»).

هوش مصنوعی هنری مولد اخیراً بسیار در سرفصل اخبار بوده است – و لزوماً به دلایل خوش بینانه نیست.

شاکیان شکایت های متعددی را علیه OpenAI و فروشندگان رقیب آن مطرح کرده اند و ادعا می کنند که داده های دارای حق چاپ – عمدتاً هنر – بدون اجازه آنها برای آموزش مدل های مولد مانند DALL-E 2 استفاده شده است. نمونه تصاویر و متن، که معمولاً بدون تفکیک از وب عمومی حذف می شوند.

از Bird پرسیدم که آیا مایکروسافت در حال بررسی راه‌هایی برای جبران خسارت سازندگانی است که کارشان در داده‌های آموزشی گنجانده شده است، حتی اگر موضع رسمی شرکت مبنی بر استفاده منصفانه باشد. پلتفرم‌های متعددی که ابزارهای هوش مصنوعی مولد را راه‌اندازی می‌کنند، از جمله Shutterstock، سرمایه‌گذاری سازندگان را در همین راستا آغاز کرده‌اند. دیگران، مانند Spawning، در حال ایجاد مکانیسم‌هایی هستند که به هنرمندان اجازه می‌دهد به طور کلی از آموزش مدل‌های هوش مصنوعی منصرف شوند.

برد اشاره کرد که در نهایت باید با این مسائل مقابله کرد – و سازندگان محتوا مستحق نوعی پاداش هستند. اما او حاضر نبود این هفته به هیچ چیز مشخصی متعهد شود.

جستجوی چندوجهی

در جای دیگری در جلوی تصویر، بینگ چت توانایی درک تصاویر و همچنین متن را به دست می آورد. کاربران می‌توانند تصاویر را آپلود کنند و محتوای مرتبط را در وب جستجو کنند، به عنوان مثال پیوندی به تصویر یک اختاپوس قلاب‌بافی شده را کپی کنند و از بینگ چت این سوال را بپرسند “چگونه آن را درست کنم؟” برای دریافت دستورالعمل های گام به گام

چندوجهی عملکرد بافت صفحه جدید را در برنامه Edge برای موبایل نیز تقویت می کند. کاربران می‌توانند در چت بینگ درباره صفحه موبایلی که مشاهده می‌کنند، سؤال بپرسند.

مایکروسافت هیچ کدام را نمی گوید، اما به نظر می رسد که این توانایی های چندوجهی جدید از GPT-4 سرچشمه می گیرند، که می تواند تصاویر را علاوه بر متن درک کند. زمانی که OpenAI GPT-4 را معرفی کرد، قابلیت‌های درک تصویر مدل را در دسترس همه مشتریان قرار نداد – و هنوز هم اینطور نیست. من شرط می بندم که مایکروسافت، به عنوان یک سرمایه گذار بزرگ و همکار نزدیک با OpenAI، دارای نوعی دسترسی ممتاز است.

به گفته Bird، البته از هر ابزار آپلود تصویری می توان سوء استفاده کرد، به همین دلیل است که مایکروسافت از فیلترینگ و هش خودکار برای مسدود کردن آپلودهای غیرقانونی استفاده می کند. با این حال، هیئت داوران در مورد اینکه اینها چقدر خوب کار می‌کنند نمی‌دانند – ما این فرصت را نداشتیم که خودمان آپلود تصاویر را آزمایش کنیم.

ویژگی های جدید چت

چندوجهی بودن و ویژگی‌های بصری جدید همه چیزهایی نیستند که به چت بینگ می‌آیند.

به زودی، بینگ چت تاریخچه چت کاربران را ذخیره می کند و به آنها اجازه می دهد از جایی که کار را ترک کردند ادامه دهند و در صورت تمایل به چت های قبلی بازگردند. این تجربه ای شبیه به ویژگی تاریخچه چت است که OpenAI اخیراً به ChatGPT آورده است و لیستی از چت ها و پاسخ های ربات به هر یک از آن چت ها را نشان می دهد.

مشخصات ویژگی تاریخچه چت هنوز مشخص نشده است، مانند مدت زمانی که چت ها دقیقاً ذخیره می شوند. اما مایکروسافت می‌گوید کاربران می‌توانند تاریخچه خود را در هر زمانی حذف کنند – با توجه به انتقاداتی که چندین دولت اتحادیه اروپا علیه ChatGPT داشتند.

مایکروسافت بینگ چت

صادرات و به اشتراک گذاری چت ها از بینگ چت.

Bing Chat همچنین قابلیت‌های صادرات و اشتراک‌گذاری را به دست می‌آورد و به کاربران اجازه می‌دهد مکالمات را در رسانه‌های اجتماعی یا یک سند Word به اشتراک بگذارند. دنا ساندرز، شریک GM در تیم تجربیات وب مایکروسافت، به TechCrunch گفت که یک سیستم کپی و چسباندن قوی‌تر در حال کار است – اما هنوز در پیش نمایش نیست – برای نمودارها و تصاویر ایجاد شده از طریق چت بینگ.

با این حال، شاید متحول کننده ترین افزونه به چت بینگ، افزونه ها هستند. از شرکایانی مانند OpenTable و Wolfram Alpha، افزونه‌ها کارهایی را که Bing Chat می‌تواند انجام دهد را تا حد زیادی گسترش می‌دهند، به‌عنوان مثال به کاربران کمک می‌کنند رزرو کنند یا تصاویری بسازند و به سوالات چالش‌برانگیز علوم و ریاضی پاسخ دهند.

مانند تاریخچه چت، عملکرد افزونه ها هنوز فعال نشده است در مراحل اولیه است. هیچ بازار پلاگینی برای صحبت وجود ندارد. افزونه ها را می توان از رابط وب بینگ چت روشن یا خاموش کرد.

ساندرز اشاره کرد، اما تایید نکرد، که طرح افزونه‌های چت بینگ با پلاگین‌های اخیراً معرفی‌شده OpenAI برای ChatGPT مرتبط است – یا شاید مشابه باشد. با توجه به شباهت های بین این دو، مطمئناً منطقی است.

لبه، تازه شده

بینگ چت البته از طریق Edge و همچنین وب در دسترس است. و Edge در کنار بینگ چت یک لایه رنگ تازه می گیرد.

Edge جدید و بهبود یافته برای اولین بار در فوریه پیش نمایش شد و دارای گوشه های گرد مطابق با فلسفه طراحی ویندوز 11 مایکروسافت است. همانطور که یکی از سخنگویان مایکروسافت بیان کرد، عناصر موجود در مرورگر اکنون بیشتر “کانتینری” هستند، و تغییرات ظریفی در سراسر آن وجود دارد، مانند حرکت تصویر حساب مایکروسافت در سمت چپ وسط.

در Compose، ابزار قدرتمند Bing Chat Edge که می‌تواند ایمیل‌ها و غیره بنویسد (مثلاً «یک دعوتنامه برای جشن تولد سگم بنویسید»)، یک گزینه جدید به کاربران امکان می‌دهد طول، عبارت و لحن متن تولید شده را تنظیم کنند. تقریبا هر چیزی که دوست دارند لحن مورد نظر را تایپ کنید، و بینگ چت پیامی برای مطابقت می‌نویسد – برد می‌گوید فیلترهایی برای جلوگیری از استفاده از زنگ‌های آشکارا مشکل‌ساز، مانند «نفرت‌آمیز» یا «نژاد پرستانه» وجود دارد.

بسیار جذاب‌تر از Compose – حداقل برای من – اقداماتی در Edge هستند که برخی از درخواست‌های Bing Chat را به خودکار تبدیل می‌کنند.

تایپ دستوری مانند «گذرواژه‌های من را از مرورگر دیگری بیاورید» در چت بینگ در نوار کناری Edge، صفحه تنظیمات داده‌های مرور Edge را باز می‌کند، در حالی که فرمان «بازی «شیطان می‌پوشد پرادا» فهرستی از گزینه‌های پخش از جمله Vudu و (قابل پیش‌بینی ) فروشگاه مایکروسافت. حتی یک عمل وجود دارد که به طور خودکار برگه های مرور را سازماندهی می کند – و رنگ ها را هماهنگ می کند.

مایکروسافت بینگ چت

اقدامات لبه در… عمل.

کنش ها در حال حاضر در مرحله ابتدایی هستند. اما واضح است که مایکروسافت در اینجا به کجا می رود. تصور می‌شود که در نهایت اقداماتی فراتر از Edge گسترش می‌یابد تا به سایر محصولات مایکروسافت، مانند Office 365، و شاید روزی به کل دسک‌تاپ ویندوز برسد.

ساندرز تایید یا تکذیب نمی کند که این پایان بازی است. او با اشاره به کنفرانس توسعه دهندگان آتی مایکروسافت به من گفت: «منتظر مایکروسافت بیلد باشید. ما باید.