محققان شرکت اپل به تلاشهای فراوانی در راستای بهبود عملکرد مدلهای هوش مصنوعی بر پایه متن و تصویر پرداختهاند، که این تلاشها در نهایت منجر به توسعه سیستمهای هوشمند و قابل انعطاف شده است. در یک مقاله تحقیقاتی اخیر، اپل به این نکته پرداخته است که ترکیب دقیقی از انواع مختلف دادههای آموزشی و معماریهای متنوع میتواند عملکرد پیشرفتهتری را در سیستمهای هوش مصنوعی فراهم کند.
به عنوان مثال، استفاده از ترکیب دادههای تصویر کپشن، متن-تصویر مداخلهای و دادههای فقط متنی برای پیشآموزش مدلها در مقیاس بزرگ، امکاناتی چون نوشتن شرح تصاویر، پاسخگویی به سؤالات بصری و استنتاج زبان طبیعی را بهبود میبخشد. این تلاشها منجر به توسعه مدلهایی شده است که با نام MM1 شناخته میشوند و با دارا بودن 30 میلیارد پارامتر، توانایی بسیار بالایی در درک زمینههای مختلف تصاویر و ارائه استدلالهای چندمرحلهای را دارند.
با توجه به این تحقیقات، اپل به دنبال تقویت سرمایهگذاریهای خود در زمینه هوش مصنوعی است تا بتواند با رقبایی چون گوگل، مایکروسافت و آمازون که در ادغام قابلیتهای هوش مصنوعی در محصولات خود پیشتازند، رقابت کند. این سرمایهگذاریها هدف دارند که فناوریهای هوش مصنوعی را در محصولات و خدماتی چون سیری، اپل موزیک و سایر برنامهها و سرویسهای اپل بهکار گرفته شوند.
پایداری در تحقیقات و توسعه مدلهای MM1 و همچنین کار بر روی فریمورک مدل زبان بزرگ بهنام “Ajax” و چتبات داخلی به نام “Apple GPT” نشان دهنده تعهد اپل به پیشروی در زمینه هوش مصنوعی و ادغام آن در محصولات و خدمات خود است.
همچنین، میتوان به خرید شماره مجازی نیز اشاره کرد که بهعنوان یکی از ابزارهای مورد استفاده در این حوزه میتواند نقش مهمی در ارتقای این سیستمهای هوش مصنوعی ایفا کند.