برتری هوش مصنوعی جراح از پزشکان جراح

مدل هوش مصنوعی پزشکی گوگل موسوم به Med-Gemini یک هوش مصنوعی متخصص در پزشکی است که ادعا می‌شود در برخی کارها حتی از پزشکان انسانی نیز عملکرد بهتری دارد.

به گزارش تجارت‌نیوز، گروه گوگل ریسرچ(Google Research) و آزمایشگاه تحقیقاتی هوش مصنوعی گوگل به نام دیپ‌مایند(DeepMind)، مدل هوش مصنوعی مد-جمینای(Med-Gemini) که خانواده‌ای از مدل‌های پیشرفته هوش مصنوعی متخصص در پزشکی است را شرح داده‌اند. این مدل، یک پیشرفت بزرگ در تشخیص بالینی با پتانسیل عظیم در دنیای واقعی است.

پزشکان روزانه تعداد زیادی از بیماران را با نیازهای ساده تا بسیار پیچیده معاینه و درمان می‌کنند. آنها برای ارائه مراقبت موثر باید با پرونده پزشکی هر بیمار آشنا باشند و با جدیدترین روش‌ها و درمان‌ها به‌روز باشند.

سپس موضوع بسیار مهم رابطه میان پزشک و بیمار وجود دارد که بر پایه همدلی، اعتماد و ارتباط بنا می‌شود و برای اینکه یک هوش مصنوعی به تقلید از یک پزشک در دنیای واقعی نزدیک شود، باید بتواند همه این کارها را انجام دهد.

هوش مصنوعی و پزشکی این روزها متقارن شده‌اند. طی ماه‌های اخیر اخبار و گزارشات زیادی درباره مدل‌های هوش مصنوعی گزارش شده است که به پزشکان کمتر باتجربه در شناسایی پیش‌سازهای سرطان، تشخیص اوتیسم دوران کودکی از روی تصاویر چشم‌ها و پیش‌بینی آنی اینکه آیا جراح تمام بافت‌های سرطانی را در طول جراحی سرطان سینه برداشته است یا خیر، کمک می‌کند.اکنون گفته می‌شود که Med-Gemini چیز دیگری است و از همه مدل‌های پیشین سر است.

مدل‌های جمینای گوگل نسل جدیدی از مدل‌های هوش مصنوعی چندوجهی هستند، به این معنی که می‌توانند اطلاعات را از حالت‌های مختلف، از جمله متن، تصویر، ویدئو و صدا پردازش کنند.

این مدل‌ها در زبان و مکالمه، درک اطلاعات متنوعی که بر روی آنها آموزش دیده‌اند و آنچه که «استدلال با زمینه طولانی» یا استدلال از مقادیر زیادی داده مانند ساعت‌ها ویدیو یا ده‌ها ساعت صوت نامیده می‌شود، مهارت دارند.

هوش مصنوعی Med-Gemini تمام مزایای مدل‌های پایه جمینای را دارد، اما آنها را به خوبی تنظیم و متعادل کرده است. محققان این ترفندهای متمرکز بر دارو را آزمایش کردند و نتایج آنها را در مقاله گنجاندند. در این مقاله ۵۸ صفحه‌ای مطالب زیادی وجود دارد که در این گزارش به بیان چشمگیرترین آنها می‌پردازیم.

قابلیت‌های خودآموزی و جستجوی وب

رسیدن به یک تشخیص و تدوین یک برنامه درمانی مستلزم آن است که پزشکان دانش پزشکی خود را با مجموعه‌ای از اطلاعات مرتبط دیگر مانند علائم بیمار، تاریخچه پزشکی، جراحی و اجتماعی، نتایج آزمایشگاهی و نتایج سایر آزمایشات تحقیقاتی و واکنش بیمار به درمان‌های قبلی گردآوری کنند تا درمان‌های موجود به‌روزرسانی شوند و درمان‌های جدیدی معرفی می‌شوند. همه این موارد بر استدلال بالینی پزشک تأثیر می‌گذارد.

به همین دلیل است که گوگل با Med-Gemini دسترسی به جستجوی مبتنی بر وب را برای فعال کردن استدلال بالینی پیشرفته‌تر فراهم کرده است. این هوش مصنوعی مانند بسیاری از مدل‌های زبان بزرگ(LLM) متمرکز بر پزشکی با MedQA که حاوی سؤالات چند گزینه‌ای نماینده سؤالات آزمون مجوز پزشکی ایالات متحده(USMLE) است، آموزش دیده که برای آزمایش دانش پزشکی و استدلال در سناریوهای مختلف طراحی شده است.

با این حال، گوگل همچنین دو مجموعه داده جدید را برای مدل خود توسعه داده است. اولی MedQA-R (استدلال) است که MedQA را با توضیحات استدلالی تولید شده مصنوعی به نام «زنجیره افکار»(CoTs) گسترش می‌دهد. دومی MedQA-RS (استدلال و جستجو) است که دستورالعمل‌هایی را برای استفاده از نتایج جستجوی وب به عنوان زمینه اضافی برای بهبود دقت پاسخ به مدل ارائه می‌دهد. بدین ترتیب اگر یک سوال پزشکی منجر به پاسخ نامطمئن شود، از مدل خواسته می‌شود تا یک جستجوی وب را برای به دست آوردن اطلاعات بیشتر برای رفع عدم قطعیت انجام دهد.

هوش مصنوعی Med-Gemini بر روی ۱۴ معیار پزشکی آزمایش شد و عملکرد جدیدی را روی ۱۰ معیار اجرا کرد که از مدل GPT-۴ ساخته شرکت اوپن‌ای‌آی(OpenAI) پیشی گرفت. این مدل در معیار MedQA با استفاده از استراتژی جستجوی هدایت‌شده به دقت ۹۱.۱ درصدی دست یافت و از مدل زبان بزرگ مبتنی بر پزشکی پیشین گوگل موسوم به Med-PaLM ۲ تا ۴.۵ درصد بهتر عمل کرد.

هوش مصنوعی Med-Gemini در هفت معیار چندوجهی، از جمله چالش تصویری مجله پزشکی نیوانگلند حاوی تصاویر موارد چالش برانگیز بالینی که از یک لیست ۱۰تایی تشخیص داده می‌شود، به طور متوسط از ۴۴.۵ درصد بهتر از GPT-۴ عمل کرد.

محققان می‌گویند: در حالی که نتایج امیدوارکننده هستند، تحقیقات بیشتری مورد نیاز است. به عنوان مثال ما محدود کردن نتایج جستجو به منابع پزشکی معتبرتر، با استفاده از بازیابی جستجوی چندوجهی یا تجزیه و تحلیل انجام شده در مورد دقت و ارتباط نتایج جستجو و کیفیت استنادها را در نظر نگرفته‌ایم. علاوه بر این، باید دید که آیا می‌توان به مدل‌های زبان بزرگ کوچک‌تر نیز استفاده از جستجوی وب را آموزش داد؟ ما این اکتشافات را به کارهای آینده واگذار می‌کنیم.

بازیابی اطلاعات خاص از پرونده‌های الکترونیکی پزشکی طولانی

پرونده الکترونیک سلامت(EHR) ممکن است بلندبالا باشد، اما پزشکان باید از محتوای آنها آگاه باشند. آنها گاهی پیچیده‌ هستند، چرا که معمولاً حاوی شباهت‌های متنی، املای غلط، کلمات اختصاری و مترادف‌ها هستند که می‌توانند هوش مصنوعی را به چالش بکشند.

بنابراین محققان برای آزمایش توانایی Med-Gemini در درک و استدلال از اطلاعات پزشکی بلندبالا و طولانی از یک پایگاه داده بزرگ و در دسترس عموم(Medical Information Mart for Intensive Care) که به مثابه پیدا کردن سوزن در انبار کاه است، استفاده کردند. این پایگاه حاوی داده‌های بیماران بستری در بخش‌های مراقبت‌های ویژه است.

هدف این بود که مدل بتواند یک وضعیت، علامت، یا درمان پزشکی کم‌استفاده و ظریف را در مجموعه بزرگی از یادداشت‌های بالینی بازیابی کند.

دویست نمونه انتخاب شد و هر نمونه شامل مجموعه‌ای از پرونده‌های این پایگاه از ۴۴ بیمار بستری شده در بخش مراقبت‌های ویژه با سابقه پزشکی طولانی بود.

هوش مصنوعی Med-Gemini دو مرحله برای یافتن سوزن در انبار کاه پیش رو داشت. اول اینکه مجبور بود همه موارد ذکر شده در مورد مشکل پزشکی مشخص شده را از سوابق گسترده بازیابی می‌کرد. دوم اینکه باید ارتباط همه موارد را با هم ارزیابی می‌کرد، آنها را دسته‌بندی می‌کرد و نتیجه می‌گرفت که آیا بیمار سابقه آن مشکل را داشته است و دلیل روشنی برای تصمیم خود ارائه می‌کرد. در نهایت این هوش مصنوعی عملکرد خوبی داشت.

محققان می‌گویند: شاید برجسته‌ترین جنبه Med-Gemini، قابلیت‌های پردازش سوابق طولانی باشد، زیرا آنها مرزهای عملکردی جدیدی را باز می‌کنند و امکانات کاربردی جدیدی را که قبلاً غیرممکن بود برای سیستم‌های هوش مصنوعی پزشکی فراهم می‌کنند. این وظیفه یافتن «سوزن در انبار کاه» منعکس کننده یک چالش در دنیای واقعی است که پزشکان با آن مواجه هستند و عملکرد Med-Gemini پتانسیل آن را برای کاهش قابل توجه بار شناختی و افزایش قابلیت‌های پزشکان با استخراج و تجزیه و تحلیل کارآمد اطلاعات حاصل از حجم وسیعی از داده‌های بیماران نشان می‌دهد.

گفتگو با Med-Gemini

در یک آزمایش در دنیای واقعی، یک کاربر بیمار از Med-Gemini در مورد یک توده پوستی که خارش دارد، پرسید. این مدل پس از درخواست تصویر، سؤالات مناسب بعدی را پرسید و آن ضایعه نادر را به درستی تشخیص داد و به کاربر توصیه کرد که چه کاری باید انجام دهد.

همچنین از Med-Gemini خواسته شد تا زمانی که پزشک منتظر گزارش رسمی رادیولوژیست بود، عکس رادیوگرافی قفسه سینه یک بیمار را تفسیر کند و یک نسخه انگلیسی ساده از گزارش را تنظیم کند که بتوان آن را در اختیار بیمار قرار داد.

محققان می‌گویند: قابلیت‌های مکالمه چندوجهی Med-Gemini امیدوارکننده است و چنین قابلیت‌هایی امکان تعامل یکپارچه و طبیعی بین افراد، پزشکان و سیستم‌های هوش مصنوعی را فراهم می‌کنند. با این حال، محققان دریافتند که کار بیشتری لازم است.

آنها گفتند: این قابلیت دارای پتانسیل قابل توجهی برای کاربردهای مفید در دنیای واقعی، از جمله کمک به پزشکان و بیماران است، البته خطرات قابل توجهی نیز به دنبال دارد. در حالی که پتانسیل تحقیقات آینده در این حوزه را برجسته می‌کنیم، ما توانایی‌های مکالمه بالینی را در این کار، همانطور که قبلاً توسط دیگران در تحقیقات اختصاصی در زمینه هوش مصنوعی تشخیصی محاوره‌ای بررسی شده بود، به ‌طور دقیق مورد بررسی قرار نداده‌ایم.

چشم اندازهای آینده

محققان اذعان می‌کنند که کارهای بیشتری برای انجام دادن وجود دارد، اما قابلیت‌های اولیه مدل Med-Gemini امیدوارکننده است. مهمتر از همه، آنها قصد دارند اصول هوش مصنوعی مسئول، از جمله حفظ حریم خصوصی و انصاف را در سراسر فرآیند توسعه مدل بگنجانند.

محققان می‌گویند: ملاحظات حریم خصوصی به طور ‌ویژه باید در سیاست‌ها و مقررات مراقبت‌های بهداشتی موجود که از اطلاعات بیمار محافظت می‌کنند، ریشه داشته باشد. انصاف و عدالت حوزه دیگری است که ممکن است نیاز به توجه داشته باشد، زیرا این خطر وجود دارد که سیستم‌های هوش مصنوعی در مراقبت‌های بهداشتی ممکن است ناخواسته سوگیری‌ها و نابرابری‌های تاریخی را منعکس یا تقویت کنند و به طور بالقوه منجر به عملکرد مدل متفاوت و نتایج مضر برای گروه‌هایی شود. اما در نهایت، مدل Med-Gemini به عنوان یک ابزار خوب در نظر گرفته می‌شود.

پژوهشگران می‌گویند: مدل‌های زبان بزرگ چندوجهی در حال آغاز دوره جدیدی از امکانات برای سلامت و پزشکی هستند. قابلیت‌های نشان‌ داده‌ شده توسط جمینای و Med-Gemini نشان‌دهنده جهش قابل توجهی در عمق و وسعت فرصت‌ها برای تسریع اکتشافات زیست‌پزشکی و کمک به ارائه مراقبت‌های بهداشتی و تجارب است. با این حال، بسیار مهم است که پیشرفت در قابلیت‌های مدل با توجه دقیق به قابلیت اطمینان و ایمنی این سیستم‌ها همراه باشد. با اولویت‌بندی هر دو جنبه می‌توانیم با مسئولیت‌پذیری هوش مصنوعی، آینده‌ای را متصور شویم که در آن قابلیت‌های سیستم‌های هوش مصنوعی شتاب‌دهنده‌های معنادار و ایمن در پیشرفت علمی و مراقبت در پزشکی باشند.