در جريان كنفرانس «2025 Google I/O »

جديدترين مدل هوش مصنوعي «گوگل» رونمايي شد

۱۴۰۴/۰۳/۰۱ - ۰۱:۰۵:۳۷
|
کد خبر: ۳۴۳۸۸۴

جديدترين مدل هوش مصنوعي «گوگل» از خانواده مدل‌هاي «جما» كه روي تلفن همراه اجرا مي‌شود، رونمايي شد. به گزارش ايسنا، خانواده مدل‌هاي هوش مصنوعي باز «جما» (Gemma) شركت «گوگل» در حال گسترش است.

جديدترين مدل هوش مصنوعي «گوگل» از خانواده مدل‌هاي «جما» كه روي تلفن همراه اجرا مي‌شود، رونمايي شد. به گزارش ايسنا، خانواده مدل‌هاي هوش مصنوعي باز «جما» (Gemma) شركت «گوگل» در حال گسترش است. گوگل در جريان كنـــفرانس « 2025 Google I/O» در روز سه‌شنبه از مدل «3n Gemma» رونمايي كرد كه براي اجراي روان روي تلفن‌ها، لپ‌تاپ‌ها و تبلت‌ها طراحي شده است. به گفته گوگل، Gemma 3n كه از سه‌شنبه در پيش‌نمايش موجود است، مي‌تواند صدا، متن، تصاوير و ويديوها را مديريت كند. به نقل از تك كرانچ، مدل‌هايي كه به اندازه كافي كارآمد هستند تا به صورت آفلاين و بدون نياز به محاسبات ابري اجرا شوند، در سال‌هاي اخير در جامعه هوش مصنوعي مورد توجه قرار گرفته‌اند. استفاده از آنها نه تنها ارزان‌تر از مدل‌هاي بزرگ است، بلكه با حذف نياز به انتقال داده‌ها به يك مركز داده در راه دور، حريم خصوصي را نيز حفظ مي‌كنند. «گاس مارتينز» مدير محصول جما در جريان سخن‌راني در كنفرانس I/O گفت: 3n Gemma روي دستگاه‌هايي با كمتر از دو گيگابايت حافظه قابل اجراست. اين مدل از همان ساختار «جميناي نانو» بهره مي‌برد و براي داشتن يك عملكرد فوق‌العاده‌ طراحي شده است. مارتينز گفت: مدجما يك مجموعه‌ از مدل‌هاي باز ما براي درك متن و تصوير چندوجهي حوزه سلامت است. مدجما در طيف گسترده‌اي از اپليكيشن‌هاي تصوير و متن به خوبي كار مي‌كند؛ به‌طوري كه توسعه‌دهندگان مي‌توانند مدل‌ها را با اپليكيشن‌هاي سلامت خود تطبيق دهند. در آينده نزديك شاهد رونمايي از «ساين‌جما» خواهيم بود كه يك مدل متن ‌باز براي ترجمه زبان اشاره به متن گفتاري است. گوگل مي‌گويد كه ساين‌جما به توسعه‌دهندگان امكان مي‌دهد تا اپليكيشن‌ها و ادغام‌هاي جديدي را براي كاربران ناشنوا و كم‌شنوا ايجاد كنند. مارتينز گفت: ساين‌جما يك خانواده جديد از مدل‌هايي است كه براي ترجمه زبان اشاره به متن گفتاري آموزش ديده‌اند اما در زبان اشاره امريكايي و انگليسي بهترين عملكرد را دارد. اين مدل، توانمندترين مدل درك زبان اشاره تا به امروز است و ما بي‌صبرانه منتظر شما - توسعه‌دهندگان و جوامع ناشنوا و كم‌شنوا - هستيم تا اپليكيشن‌ها را بر اين پايه بسازيد.

 

همكاري ۱۵۰ ميليون دلاري «گوگل»

براي توسعه عينك هوش مصنوعي

«گوگل» مبلغ ۱۵۰ ميليون دلار را به توسعه عينك هوش مصنوعي با همكاري شركت «واربي پاركر» اختصاص داد. در جريان اين كنفرانس همچنين گوگل اعلام كرد كه تا سقف ۱۵۰ ميليون دلار به شركت امريكايي «واربي پاركر» توليدكننده عينك‌هاي طبي و آفتابي متعهد خواهد شد تا به‌طور مشترك عينك‌هاي مجهز به هوش مصنوعي مبتني بر اندرويد XR را توسعه دهند. اين دو شركت‌ در يك بيانيه مطبوعاتي اعلام كردند كه گوگل تاكنون ۷۵ ميليون دلار براي هزينه‌هاي توسعه و تجاري‌سازي محصول واربي ​​پاركر اختصاص داده است. گوگل مي‌گويد در صورتي كه اين توليدكننده عينك به اهداف مشخصي دست يابد، ۷۵ ميليون دلار ديگر نيز با خريد سهام واربي ​​پاركر سرمايه‌گذاري خواهد كرد. در كنفرانس 2025 Google I/O، گوگل از همكاري با چندين شركت از جمله «سامسونگ» و «جنتل مانستر» براي توسعه عينك‌هاي هوشمند مجهز به قابليت‌هاي هوش مصنوعي «جميناي» و واقعيت افزوده خبر داد. در بيانيه مطبوعاتي، واربي ​​پاركر و گوگل اعلام كردند كه قصد دارند مجموعه‌اي از محصولات را به مرور زمان عرضه كنند. اولين خط توليد عينك آنها پس از سال ۲۰۲۵ راه‌اندازي خواهد شد و هوش مصنوعي چندوجهي را با عينك‌هاي طبي و غير طبي تركيب خواهد كرد.

 

گوگل تماس تصويري ۳ بُعدي را  محقق كرد

گوگل همچنين در رويداد جديد خود به انتظارها پايان داد و قابليت كنفرانس ويدئويي ۳ بعدي را به نمايش گذاشت. گوگل براي اولين‌بار در سال ۲۰۲۱ پروژه استارلاين را به اشتراك گذاشت و در آن زمان آن را به عنوان يك «پنجره جادويي» معرفي كرد كه از سخت افزار ويژه، بينش رايانه‌اي و يادگيري ماشيني براي ايجاد يك تجربه تماس تصويري تقريبا هولوگرافيك استفاده مي‌كند. از آن زمان، ما متوجه شديم كه اين شركت با شركت HP همكاري مي‌كند تا يك نسخه كوچك شده از اين محصول را براي مشتريان سازماني ارايه كند. در رويداد 2025 I/O، گوگل اعلام كرد كه پروژه «Starline» در حال تبديل شدن به يك پلتفرم ارتباط ويدئويي سه بعدي با هوش مصنوعي به نام «Beam» است. ساندار پيچاي، مديرعامل اين شركت روي صحنه گفت كه اولين دستگاه‌ها اواخر امسال براي «مشتريان انتخابي» در دسترس خواهند بود، اگرچه هنوز درباره قيمت آن صحبتي نشده است.

 

«گوگل ميت» به ترجمه زنده مجهز شد

شركت گوگل در رويداد خود اعلام كرد كه قابليت ترجمه زنده را به سرويس Meet مي‌آورد و زبان اسپانيايي اولين زبان قابل ترجمه در اين سرويس خواهد بود. گوگل سرويس تماس تصويري خود را به ترجمه زنده با هوش مصنوعي مجهز كرد و اين ويژگي جديد اكنون براي مشتركين هوش مصنوعي گوگل در دسترس است. بنابراين اگر ابزارهاي ترجمه زنده گوگل را مفيد مي‌دانيد، به زودي مي‌توانيد در طول تماس‌ها و جلسات تصويري به‌طور طبيعي از آنها استفاده كنيد. اين شركت امروز در كنفرانس توسعه‌دهندگان I/O خود اعلام كرد كه اين ويژگي را به «Google Meet» مي‌آورد. از اين هفته، ترجمه اسپانيايي با هوش مصنوعي در اين برنامه در دسترس خواهد بود. گوگل مي‌گويد زبان‌هاي بيشتري در راه است و اين فناوري بسيار بسيار نزديك به داشتن يك مكالمه طبيعي و آزاد است. در نمونه‌اي كه گوگل در اين رويداد به نمايش گذاشت، ترجمه زنده در Meet با لحن و آهنگ گفتار گوينده مطابقت داشت و حتي مي‌توانست عبارات را كاناليزه كند. بدون شك اين براي بسياري از افراد، به خصوص در تماس‌هاي كاري با همكاران در كشورهاي ديگر مفيد خواهد بود. ترجمه زنده به همه اين امكان را مي‌دهد كه به زباني كه راحت‌تر و بهتر صحبت مي‌كنند، گفت‌وگو كنند. پيش از اين، براي انجام هر گونه ترجمه بايد به زيرنويس‌هاي زنده در Google Meet تكيه مي‌كرديد، بنابراين عدم نياز به خواندن آنها باعث مي‌شود كاربران با مكالمه هماهنگ‌تر باشند. از همين امروز، ترجمه زنده در سرويس «Google Meet» در نسخه بتا براي مشتركان AI Pro و Ultra در دسترس خواهد بود. اين شركت مي‌گويد ويژگي‌هاي جديد در اواخر امسال به عنوان بخشي از مرحله آزمايش اوليه براي كاربران سازماني در دسترس خواهد بود.

 

بهبود استدلال، ويژگي‌هاي صوتي و  پشتيباني چندزبانه در هوش مصنوعي «گوگل»

مدل «جميناي ۲.۵ پرو» تنظيمات جديدي را براي بهبود استدلال، ويژگي‌هاي صوتي و پشتيباني چندزبانه دريافت كرد. گوگل از به‌روزرساني‌هاي جديدي براي مجموعه مدل‌هاي «جميناي ۲.۵» (2.5 Gemini) خود رونمايي كرد كه شامل استدلال قوي‌تر، خروجي صداي بومي، ارتقاء امنيت و قابليت‌هاي بهبوديافته براي توسعه‌دهندگان است. گوگل در اعلام به‌روزرساني‌هاي جديد گفت: ما در ماه مارس «جميناي ۲.۵ پرو» (Gemini 2.5 Pro) را معرفي كرديم كه هوشمندترين مدل ما تا به امروز است و امروز، قابليت‌هاي جديدي را به ۲.۵ پرو و «۲.۵ فلش» (2.5 Flash) اضافه مي‌كنيم. مدل ارتقاءيافته جميناي ۲.۵ پرو اكنون در صدر نمودارهاي عملكرد از جمله «WebDev Arena» براي كدنويسي و «LMArena» براي آزمايش ترجيحات انساني قرار دارد. همچنين، اين مدل داراي يك پنجره زمينه با يك ميليون توكن است كه به آن امكان مي‌دهد تا ورودي‌هاي طولاني‌تر و وظايف درك ويدئو را مديريت كند. گوگل اعلام كرد: به لطف «LearnLM» - نسخه‌اي از جميناي كه با متخصصان آموزشي توسعه داده شده - اين مدل اكنون در وظايف مرتبط با يادگيري نيز پيشرو است. مربيان و متخصصان، جميناي ۲.۵ پرو را در طيف متنوعي از سناريوها نسبت به ساير مدل‌ها ترجيح دادند. گوگل خروجي صداي بومي را نيز براي داشتن يك تجربه طبيعي‌تر با هوش مصنوعي معرفي كرد. جميناي اكنون مي‌تواند با تُن‌ها، لهجه‌ها و سبك‌هاي گوناگون صحبت كند. براي مثال، هنگام تعريف كردن يك داستان مي‌تواند صداي دراماتيك داشته باشد. گوگل اعلام كرد كه در حال آزمايش يك حالت استدلال پيشرفته به نام «تفكر عميق» است كه به جميناي كمك مي‌كند تا پيش از پاسخ دادن، چندين پاسخ را در نظر بگيرد. اين حالت براي چالش‌هاي دشواري مانند رياضيات پيشرفته و برنامه‌نويسي طراحي شده است. سخنگوي اين شركت گفت: ما در حال آغاز كردن آزمايش يك حالت استدلال بهبوديافته به نام «ديپ ثينك» (Deep Think) هستيم. ما زمان بيشتري را به ارزيابي‌هاي ايمني پيشرفته‌تر و دريافت نظرات بيشتر از متخصصان ايمني اختصاص مي‌دهيم. ديپ ثينك در حال حاضر در معيارهايي مانند «2025 USAMO» براي رياضي، «LiveCodeBench» براي كدنويسي و «MMMU» براي استدلال چندوجهي پيشرو است. انتظار مي‌رود نسخه عمومي مدل به‌روزرساني‌شده در اوايل ژوئن عرضه شود و نسخه ۲.۵ پرو نيز اندكي پس از آن از راه برسد.

 

هوش مصنوعي گوگل به جي‌ميل‌ها  پاسخ مي‌دهد

گوگل اعلام كرد كه پاسخ‌هاي هوشمند شخصي‌شده با هوش مصنوعي به جي‌ميل مي‌آيند و مدل‌هاي هوش مصنوعي جميناي مي‌توانند از طريق رايانامه‌هاي گذشته و ساير برنامه‌ها با اجازه كاربر، به رايانامه‌هاي دريافتي پاسخ دهند.ساندار پيچاي، مديرعامل گوگل در كنفرانس توسعه‌دهندگان 2025 I/O اعلام كرد كه اپليكيشن جي‌ميل در آينده‌اي نزديك داراي ويژگي جديدي به نام «پاسخ‌هاي هوشمند شخصي» خواهد بود. ايده اين است كه هوش مصنوعي جميناي با اجازه كاربر بتواند رايانامه‌ها يا ايميل‌هاي گذشته و اسناد گوگل را بررسي كند، سپس به وي كمك كند تا به ايميل‌هاي شخصي يا تجاري پاسخ دهد. «جميناي» همچنين مي‌تواند تمام يادداشت‌هاي موجود در Drive را بررسي كند، از طريق ايميل، رزروهاي مربوطه را جست‌وجو كند و يك برنامه سفر را در Google Docs پيدا كند. همه اين موارد را جمع مي‌كند و سپس يك ايميل پيش‌نويس مي‌كند كه با لحن، سبك و حتي كلماتي كه كاربر معمولاً استفاده مي‌كند، مطابقت دارد. گوگل همچنين مي‌خواهد به كاربرانش كمك كند تا ايميل‌هاي خود را با ويژگي پاك‌سازي صندوق ورودي بهتر مديريت كنند. بنابراين به سادگي مي‌توان به «جميناي» گفت كه چه كاري مي‌خواهيد انجام دهيد. به عنوان مثال مي‌توان گفت «تمام ايميل‌هاي خوانده نشده من از يك شركت خاص را در سال گذشته حذف كن.»