بقراط در حال ساخت یک مدل زبان بزرگ برای مراقبت های بهداشتی است

هوش مصنوعی، به ویژه هوش مصنوعی مولد، پتانسیل تغییر مراقبت های بهداشتی را دارد.

حداقل، این میزان فروش از هوش مصنوعی بقراطی، که امروز از مخفی کاری بیرون آمد، با سرمایه گذاری عظیم 50 میلیون دلاری در پشت آن و ارزش گذاری در “میلیون های سه رقمی” ظاهر شد. تراشه، به رهبری مشترک عمومی کاتالیزور و Andreessen Horowitz، یک رای اعتماد بزرگ به فناوری بقراط است، یک مدل تولید متن که به طور خاص برای برنامه های مراقبت های بهداشتی تنظیم شده است.

هیپوکراتیک – که از جنرال کاتالیست بیرون آمده است – توسط گروهی از پزشکان، مدیران بیمارستان، متخصصان مدیکر و محققان هوش مصنوعی از سازمان هایی مانند جان هاپکینز، استنفورد، گوگل و انویدیا تاسیس شد. پس از اینکه مونجال شاه، یکی از بنیانگذاران و مدیر عامل شرکت قبلی خود، Like.com، یک سایت مقایسه خرید، را در سال 2010 به گوگل فروخت، او بخش بیشتری از دهه بعد را صرف ساختن بقراط کرد.

شاه در مصاحبه ای با TechCrunch گفت: «بقراط اولین مدل زبان بزرگ (LLM) با تمرکز بر ایمنی را ایجاد کرده است که به طور خاص برای مراقبت های بهداشتی طراحی شده است. ماموریت این شرکت توسعه ایمن ترین سلامت مصنوعی استبطور کلی هوش به منظور بهبود چشمگیر دسترسی به مراقبت های بهداشتی و نتایج بهداشتی.

هوش مصنوعی در مراقبت های بهداشتی، از لحاظ تاریخی، با موفقیت های متفاوتی روبرو شده است.

بابیلون هلث، یک استارت آپ هوش مصنوعی که توسط سرویس بهداشت ملی بریتانیا حمایت می شود، به دلیل ادعاهایی مبنی بر اینکه فناوری تشخیص بیماری آن می تواند بهتر از پزشکان عمل کند، بارها مورد بررسی قرار گرفته است. IBM مجبور شد بخش Watson Health متمرکز بر هوش مصنوعی خود را با ضرر بفروشد، زیرا مشکلات فنی منجر به بدتر شدن مشارکت مشتریان عمده شد. در جای دیگر، GPT-3 OpenAI، سلف GPT-4، حداقل یک کاربر را ترغیب به خودکشی کرد.

شاه تأکید کرد که بقراط بر تشخیص متمرکز نیست. او می‌گوید، در عوض، این فناوری – که با مصرف‌کننده مواجه است – در موارد استفاده مانند توضیح مزایا و صورت‌حساب، ارائه توصیه‌های غذایی و یادآوری داروها، پاسخ دادن به سؤالات قبل از عمل، پذیرش بیماران و ارائه نتایج آزمایش «منفی» است که نشان‌دهنده هیچ چیز نیست. اشتباه.

بقراط در حال ساخت یک مدل زبان بزرگ برای مراقبت های بهداشتی است

نتایج معیار بقراط در طیف وسیعی از معاینات پزشکی است.

باید بگویم که مورد استفاده از توصیه‌های غذایی، با توجه به پیشنهادات ضعیف مرتبط با رژیم غذایی، مانند ChatGPT OpenAI، به من مکث کرد. اما شاه ادعا می کند که هوش مصنوعی بقراط از مدل های زبانی پیشرو از جمله GPT-4 و کلود در بیش از 100 گواهینامه مراقبت های بهداشتی، از جمله NCLEX-RN برای پرستاری، آزمون هیئت اورولوژی آمریکا و آزمون ثبت شده متخصص تغذیه، بهتر عمل می کند.

شاه گفت: «مدل های زبان باید ایمن باشند. “به همین دلیل است که ما در حال ساخت مدلی هستیم که فقط بر ایمنی متمرکز شده است، آن را با متخصصان مراقبت های بهداشتی تایید می کنیم و با صنعت همکاری نزدیک داریم … این به اطمینان حاصل می کند که حفظ داده ها و سیاست های حفظ حریم خصوصی با هنجارهای فعلی صنعت مراقبت های بهداشتی سازگار است.”

شاه می‌گوید یکی از راه‌هایی که بقراط برای دستیابی به این هدف می‌خواهد «تشخیص لحن» و «ارتباط همدلی» بهتر از فناوری رقیب است – تا حدی با «ایجاد» شیوه خوب کنار تخت (یعنی «لمس انسانی» گریزان). او معتقد است که شیوه کنار بالین – به ویژه تعاملاتی که باعث می‌شود بیماران احساس امیدواری کنند، حتی در شرایط تلخ – می‌توانند و می‌توانند بر نتایج سلامتی تأثیر بگذارند.

بقراط برای ارزیابی شیوه کنار تخت، معیاری برای آزمایش مدل برای نشانه‌های انسان‌گرایی طراحی کرد – مواردی مانند “نشان دادن همدلی” و “علاقه شخصی به زندگی بیمار”. (البته این که آیا یک آزمون می تواند موضوعاتی را با دقت به تصویر بکشد، جای بحث دارد.) با توجه به منبع، مدل بقراطی بالاترین امتیاز را در بین تمام دسته های مدل هایی که بقراط آزمایش کرده است، از جمله GPT-4، کسب کرد.

اما آیا واقعاً یک مدل زبان می تواند جایگزین یک کارمند مراقبت های بهداشتی شود؟ بقراط این سوال را مطرح می کند و استدلال می کند که مدل های آن تحت نظارت متخصصان پزشکی آموزش دیده اند و بنابراین توانایی بالایی دارند.

شاه گفت: «ما تنها زمانی هر نقش را آزاد می کنیم – متخصص تغذیه، کارگزار صورتحساب، مشاور ژنتیک، و غیره. در همه‌گیری، هزینه‌های نیروی کار برای اکثر سیستم‌های بهداشتی 30 درصد افزایش یافت، اما درآمد افزایش پیدا نکرد. از این رو، اکثر سیستم های بهداشتی کشور از نظر مالی دچار مشکل هستند. مدل‌های زبانی می‌توانند به آن‌ها کمک کنند تا با پرکردن سطح بالای جای خالی فعلی‌شان به روشی مقرون‌به‌صرفه، هزینه‌ها را کاهش دهند.»

من مطمئن نیستم که پزشکان مراقبت های بهداشتی موافق باشند – به ویژه با توجه به نمرات پایین مدل بقراط در برخی از گواهینامه های فوق الذکر. به گفته بقراط، این مدل 71 درصد در آزمون کدنویس حرفه ای گواهی شده، که دانش صورتحساب و کدگذاری پزشکی را پوشش می دهد، و 72.7 درصد در آزمون انطباق با آموزش ایمنی بیمارستان، کسب کرد.

موضوع سوگیری احتمالی نیز وجود دارد. سوگیری صنعت مراقبت‌های بهداشتی را آزار می‌دهد و این اثرات به مدل‌های آموزش‌دیده در سوابق پزشکی، مطالعات و تحقیقات مغرضانه می‌رسد. به عنوان مثال، یک مطالعه در سال 2019 نشان داد که الگوریتمی که بسیاری از بیمارستان‌ها برای تصمیم‌گیری در مورد بیماران سیاه پوست با حساسیت کمتری نسبت به بیماران سفیدپوست به مراقبت نیاز دارند، استفاده می‌کنند.

در هر صورت، می توان امیدوار بود که بقراط روشن کند که مدل هایش خطاناپذیر نیستند. در حوزه‌هایی مانند مراقبت‌های بهداشتی، سوگیری اتوماسیون یا تمایل افراد به اعتماد به هوش مصنوعی نسبت به منابع دیگر، حتی اگر درست باشند، با خطرات بالایی همراه است.

این جزییات از جمله مواردی است که بقراط هنوز نتوانسته است به آنها اشاره کند. این شرکت جزئیاتی را در مورد شرکا یا مشتریان خود منتشر نمی کند، در عوض ترجیح می دهد تمرکز خود را بر تامین مالی نگه دارد. این مدل حتی در حال حاضر در دسترس نیست – و همچنین اطلاعاتی در مورد اینکه بر روی چه داده هایی آموزش دیده است، یا اینکه ممکن است در آینده بر روی چه داده هایی آموزش داده شود. (بقراط فقط می‌گوید که از داده‌های «شناسایی‌شده» برای آموزش مدل استفاده می‌کند.)

اگر بیش از حد صبر کند، بقراط با خطر عقب ماندن از رقبایی مانند Truveta و Latent روبرو می شود – که برخی از آنها مزیت منابع اصلی دارند. برای مثال، گوگل اخیراً پیش‌نمایش Med-PaLM 2 را آغاز کرده است، که ادعا می‌کند اولین مدل زبانی است که در سطح متخصص در ده‌ها سؤال امتحان پزشکی انجام می‌دهد. مانند مدل بقراط، Med-PaLM 2 توسط متخصصان بهداشت در مورد توانایی آن در پاسخگویی دقیق و ایمن به سوالات پزشکی ارزیابی شد.

اما همینت تنجا، مدیر عامل جنرال کاتالیست، ابراز نگرانی نکرد.

او از طریق ایمیل گفت: «من و مونجل این شرکت را با این باور راه‌اندازی کردیم که مراقبت‌های بهداشتی به مدل زبانی خاص خود نیاز دارد که به طور خاص برای برنامه‌های مراقبت‌های بهداشتی ساخته شده است – مدلی که منصفانه، بی‌طرفانه، ایمن و مفید برای جامعه باشد.» ما شروع به ایجاد یک برنامه کاربردی هوش مصنوعی با یکپارچگی بالا کردیم که از یک رژیم داده‌ای «سالم» تغذیه می‌کند و شامل یک رویکرد آموزشی است که به دنبال ترکیب بازخورد انسانی گسترده از متخصصان پزشکی برای هر کار تخصصی است. در مراقبت‌های بهداشتی، ما به سادگی نمی‌توانیم «سریع حرکت کنیم و چیزها را خراب کنیم».

شاه می‌گوید که بخش عمده‌ای از 50 میلیون دلار بخش اولیه برای سرمایه‌گذاری در استعدادها، داده‌های محاسباتی و مشارکت‌ها صرف خواهد شد.