هوش مصنوعی، به ویژه هوش مصنوعی مولد، پتانسیل تغییر مراقبت های بهداشتی را دارد.
حداقل، این میزان فروش از هوش مصنوعی بقراطی، که امروز از مخفی کاری بیرون آمد، با سرمایه گذاری عظیم 50 میلیون دلاری در پشت آن و ارزش گذاری در “میلیون های سه رقمی” ظاهر شد. تراشه، به رهبری مشترک عمومی کاتالیزور و Andreessen Horowitz، یک رای اعتماد بزرگ به فناوری بقراط است، یک مدل تولید متن که به طور خاص برای برنامه های مراقبت های بهداشتی تنظیم شده است.
هیپوکراتیک – که از جنرال کاتالیست بیرون آمده است – توسط گروهی از پزشکان، مدیران بیمارستان، متخصصان مدیکر و محققان هوش مصنوعی از سازمان هایی مانند جان هاپکینز، استنفورد، گوگل و انویدیا تاسیس شد. پس از اینکه مونجال شاه، یکی از بنیانگذاران و مدیر عامل شرکت قبلی خود، Like.com، یک سایت مقایسه خرید، را در سال 2010 به گوگل فروخت، او بخش بیشتری از دهه بعد را صرف ساختن بقراط کرد.
شاه در مصاحبه ای با TechCrunch گفت: «بقراط اولین مدل زبان بزرگ (LLM) با تمرکز بر ایمنی را ایجاد کرده است که به طور خاص برای مراقبت های بهداشتی طراحی شده است. ماموریت این شرکت توسعه ایمن ترین سلامت مصنوعی استبطور کلی هوش به منظور بهبود چشمگیر دسترسی به مراقبت های بهداشتی و نتایج بهداشتی.
هوش مصنوعی در مراقبت های بهداشتی، از لحاظ تاریخی، با موفقیت های متفاوتی روبرو شده است.
بابیلون هلث، یک استارت آپ هوش مصنوعی که توسط سرویس بهداشت ملی بریتانیا حمایت می شود، به دلیل ادعاهایی مبنی بر اینکه فناوری تشخیص بیماری آن می تواند بهتر از پزشکان عمل کند، بارها مورد بررسی قرار گرفته است. IBM مجبور شد بخش Watson Health متمرکز بر هوش مصنوعی خود را با ضرر بفروشد، زیرا مشکلات فنی منجر به بدتر شدن مشارکت مشتریان عمده شد. در جای دیگر، GPT-3 OpenAI، سلف GPT-4، حداقل یک کاربر را ترغیب به خودکشی کرد.
شاه تأکید کرد که بقراط بر تشخیص متمرکز نیست. او میگوید، در عوض، این فناوری – که با مصرفکننده مواجه است – در موارد استفاده مانند توضیح مزایا و صورتحساب، ارائه توصیههای غذایی و یادآوری داروها، پاسخ دادن به سؤالات قبل از عمل، پذیرش بیماران و ارائه نتایج آزمایش «منفی» است که نشاندهنده هیچ چیز نیست. اشتباه.

نتایج معیار بقراط در طیف وسیعی از معاینات پزشکی است.
باید بگویم که مورد استفاده از توصیههای غذایی، با توجه به پیشنهادات ضعیف مرتبط با رژیم غذایی، مانند ChatGPT OpenAI، به من مکث کرد. اما شاه ادعا می کند که هوش مصنوعی بقراط از مدل های زبانی پیشرو از جمله GPT-4 و کلود در بیش از 100 گواهینامه مراقبت های بهداشتی، از جمله NCLEX-RN برای پرستاری، آزمون هیئت اورولوژی آمریکا و آزمون ثبت شده متخصص تغذیه، بهتر عمل می کند.
شاه گفت: «مدل های زبان باید ایمن باشند. “به همین دلیل است که ما در حال ساخت مدلی هستیم که فقط بر ایمنی متمرکز شده است، آن را با متخصصان مراقبت های بهداشتی تایید می کنیم و با صنعت همکاری نزدیک داریم … این به اطمینان حاصل می کند که حفظ داده ها و سیاست های حفظ حریم خصوصی با هنجارهای فعلی صنعت مراقبت های بهداشتی سازگار است.”
شاه میگوید یکی از راههایی که بقراط برای دستیابی به این هدف میخواهد «تشخیص لحن» و «ارتباط همدلی» بهتر از فناوری رقیب است – تا حدی با «ایجاد» شیوه خوب کنار تخت (یعنی «لمس انسانی» گریزان). او معتقد است که شیوه کنار بالین – به ویژه تعاملاتی که باعث میشود بیماران احساس امیدواری کنند، حتی در شرایط تلخ – میتوانند و میتوانند بر نتایج سلامتی تأثیر بگذارند.
بقراط برای ارزیابی شیوه کنار تخت، معیاری برای آزمایش مدل برای نشانههای انسانگرایی طراحی کرد – مواردی مانند “نشان دادن همدلی” و “علاقه شخصی به زندگی بیمار”. (البته این که آیا یک آزمون می تواند موضوعاتی را با دقت به تصویر بکشد، جای بحث دارد.) با توجه به منبع، مدل بقراطی بالاترین امتیاز را در بین تمام دسته های مدل هایی که بقراط آزمایش کرده است، از جمله GPT-4، کسب کرد.
اما آیا واقعاً یک مدل زبان می تواند جایگزین یک کارمند مراقبت های بهداشتی شود؟ بقراط این سوال را مطرح می کند و استدلال می کند که مدل های آن تحت نظارت متخصصان پزشکی آموزش دیده اند و بنابراین توانایی بالایی دارند.
شاه گفت: «ما تنها زمانی هر نقش را آزاد می کنیم – متخصص تغذیه، کارگزار صورتحساب، مشاور ژنتیک، و غیره. در همهگیری، هزینههای نیروی کار برای اکثر سیستمهای بهداشتی 30 درصد افزایش یافت، اما درآمد افزایش پیدا نکرد. از این رو، اکثر سیستم های بهداشتی کشور از نظر مالی دچار مشکل هستند. مدلهای زبانی میتوانند به آنها کمک کنند تا با پرکردن سطح بالای جای خالی فعلیشان به روشی مقرونبهصرفه، هزینهها را کاهش دهند.»
من مطمئن نیستم که پزشکان مراقبت های بهداشتی موافق باشند – به ویژه با توجه به نمرات پایین مدل بقراط در برخی از گواهینامه های فوق الذکر. به گفته بقراط، این مدل 71 درصد در آزمون کدنویس حرفه ای گواهی شده، که دانش صورتحساب و کدگذاری پزشکی را پوشش می دهد، و 72.7 درصد در آزمون انطباق با آموزش ایمنی بیمارستان، کسب کرد.
موضوع سوگیری احتمالی نیز وجود دارد. سوگیری صنعت مراقبتهای بهداشتی را آزار میدهد و این اثرات به مدلهای آموزشدیده در سوابق پزشکی، مطالعات و تحقیقات مغرضانه میرسد. به عنوان مثال، یک مطالعه در سال 2019 نشان داد که الگوریتمی که بسیاری از بیمارستانها برای تصمیمگیری در مورد بیماران سیاه پوست با حساسیت کمتری نسبت به بیماران سفیدپوست به مراقبت نیاز دارند، استفاده میکنند.
در هر صورت، می توان امیدوار بود که بقراط روشن کند که مدل هایش خطاناپذیر نیستند. در حوزههایی مانند مراقبتهای بهداشتی، سوگیری اتوماسیون یا تمایل افراد به اعتماد به هوش مصنوعی نسبت به منابع دیگر، حتی اگر درست باشند، با خطرات بالایی همراه است.
این جزییات از جمله مواردی است که بقراط هنوز نتوانسته است به آنها اشاره کند. این شرکت جزئیاتی را در مورد شرکا یا مشتریان خود منتشر نمی کند، در عوض ترجیح می دهد تمرکز خود را بر تامین مالی نگه دارد. این مدل حتی در حال حاضر در دسترس نیست – و همچنین اطلاعاتی در مورد اینکه بر روی چه داده هایی آموزش دیده است، یا اینکه ممکن است در آینده بر روی چه داده هایی آموزش داده شود. (بقراط فقط میگوید که از دادههای «شناساییشده» برای آموزش مدل استفاده میکند.)
اگر بیش از حد صبر کند، بقراط با خطر عقب ماندن از رقبایی مانند Truveta و Latent روبرو می شود – که برخی از آنها مزیت منابع اصلی دارند. برای مثال، گوگل اخیراً پیشنمایش Med-PaLM 2 را آغاز کرده است، که ادعا میکند اولین مدل زبانی است که در سطح متخصص در دهها سؤال امتحان پزشکی انجام میدهد. مانند مدل بقراط، Med-PaLM 2 توسط متخصصان بهداشت در مورد توانایی آن در پاسخگویی دقیق و ایمن به سوالات پزشکی ارزیابی شد.
اما همینت تنجا، مدیر عامل جنرال کاتالیست، ابراز نگرانی نکرد.
او از طریق ایمیل گفت: «من و مونجل این شرکت را با این باور راهاندازی کردیم که مراقبتهای بهداشتی به مدل زبانی خاص خود نیاز دارد که به طور خاص برای برنامههای مراقبتهای بهداشتی ساخته شده است – مدلی که منصفانه، بیطرفانه، ایمن و مفید برای جامعه باشد.» ما شروع به ایجاد یک برنامه کاربردی هوش مصنوعی با یکپارچگی بالا کردیم که از یک رژیم دادهای «سالم» تغذیه میکند و شامل یک رویکرد آموزشی است که به دنبال ترکیب بازخورد انسانی گسترده از متخصصان پزشکی برای هر کار تخصصی است. در مراقبتهای بهداشتی، ما به سادگی نمیتوانیم «سریع حرکت کنیم و چیزها را خراب کنیم».
شاه میگوید که بخش عمدهای از 50 میلیون دلار بخش اولیه برای سرمایهگذاری در استعدادها، دادههای محاسباتی و مشارکتها صرف خواهد شد.