گوگل بالاخره از مدل هوش مصنوعی Gemini برای اولین بار رونمایی کرد و خود را رقیب اصلی مدل GPT که در ChatGPT استفاده میشود، معرفی کرد. البته گوگل مدل Gemini خود را برتر از مدل GPT میداند و بر اساس داده های منتشر شده توسط تیم توسعه دهنده مدل Gemini یعنی deepmind.google، مدل هوش مصنوعی Gemini در بخش های مختلف یادگیری بر اساس نوع داده ورودی تقریبا یک سر و گردن از GPT بالاتر است. در ادامه به مقایسه دقیقتر این دو مدل خواهیم پرداخت. با ما همراه باشید.
مدل هوش مصنوعی Gemini در 3 سطح در دسترس است
طبق ادعای وبسایت دیپمایند گوگل (deepmind.google) مدل Gemini در سه سطح مختلف با کاربری های مختلف در دسترس خواهد یود:
- Gemini Nano
- Gemini Pro
- Gemini Ultra
نسخه Gemini Nano یک ورژن سبک و با کاربری on-device-task است که بر روی پلتفرم های مختلفی مانند گوشی های هوشمند اندرویدی قابل نصب است تا کاربران بصورت آفلاین قابلیت استفاده از این نسخه از Gemini را داشته باشند.
کاربران گوشی پیکسل 8 پرو میتوانند از قابلیت های Gemini Nano استفاده کنند. (جزئیات نحوه استفاده منتشر نشده)
نسخه Gemini Pro یک نسخه قدرتمند تر نسبت به نسخه Nano است که در سرویس هوش مصنوعی بارد گوگل (Google Bard) در حال پیاده سازی است و کاربران به واسطه گوگل بارد میتوانند از توانمندی های مدل Gemini نیز بهره مند شوند.
نسخه Gemini Ultra مناسب دیتاسنتر ها و مصارف سازمانی و در مقیاس کلان است که کامل ترین نسخه مدل هوش مصنوعی جمینای گوگل محسوب میشود. این مدل طبق شنیده ها از 13 December سال سال جاری از طریق Vertex AI یا Generative Studio در Google cloud برای استفاده عرضه خواهد شد.
مقایسه مدل هوش مصنوعی Gemini با GPT
در باب مقایسه مدل هوش مصنوعی Gemini و مدل GPT بحث خیلی داغی به راه است که گوگل در دفاع از Gemini یک گزارش کامل از نحوه عملکرد مدل خود در مواجهه با انواع دیتا ارائه داده است و خود را برتر از مدل GPT معرفی میکند. همچنان این مقایسه بین این دو مدل محبوب هوش مصنوعی در جریان است و در مقایسه تجربه کاربری و نظرات کاربران باید مقایسه نهایی را انجام داد. با این حال روی کاغذ Gemini خیلی حرف ها برای گفتن دارد که میتوانید جدول کامل مقایسه مدل Gemini و GPT را مشاهده نمایید.
همانطور که در تصویر مشخص است تنها فیلدی که گوگل به ضعف مدل Gemini در آن اشاره دارد، بحث تشخیص کلمات در محتوای صوتی است. با این حال میتوان اختلاف فاحش در بخش تشخیص و فهم محتواهای ویدئویی را مشاهده کرد. همچنین مدل جمینای در بخش تفسیر محتواهای بصری اینفوگرافیک و تشخیص عبارات ریاضی نسبت به رقیب خود عملکرد به مراتب بهتری داشته است.
گوگل میگوید در 30 بنچ مارک از 32 بنچ مارک موجود، Gemini بهتر از GPT عمل میکند
قابلیت های مدل هوش مصنوعی Gemini (پیش بینی اشکال تا ایجاد بازی)
با انتشار یک ویدئو جنجالی توسط تیم توسعه دهنده Gemini، قابلیت های خارق العاده مدل هوش مصنوعی Gemini توصیح داده شده است که در آن به توانایی بینظیر درک این مدل از عناصر موجود در دنیای طبیعی اشاره کرد. این مدل توانایی بینایی رنگی، تشخیص و حدس نوع مواد تشکیل دهنده اجسام، پیشبینی اتفاقات و حتی درک علت برخی حوادث طبیعی و بسیاری موارد دیگر را داراست که در ویدئو بصورت جزئی تر به برخی از توانایی های هوش مصنوعی جمینای (جمینی) اشاره شده است.