جديدترين مدل هوش مصنوعي «گوگل» رونمايي شد
جديدترين مدل هوش مصنوعي «گوگل» از خانواده مدلهاي «جما» كه روي تلفن همراه اجرا ميشود، رونمايي شد. به گزارش ايسنا، خانواده مدلهاي هوش مصنوعي باز «جما» (Gemma) شركت «گوگل» در حال گسترش است.
جديدترين مدل هوش مصنوعي «گوگل» از خانواده مدلهاي «جما» كه روي تلفن همراه اجرا ميشود، رونمايي شد. به گزارش ايسنا، خانواده مدلهاي هوش مصنوعي باز «جما» (Gemma) شركت «گوگل» در حال گسترش است. گوگل در جريان كنـــفرانس « 2025 Google I/O» در روز سهشنبه از مدل «3n Gemma» رونمايي كرد كه براي اجراي روان روي تلفنها، لپتاپها و تبلتها طراحي شده است. به گفته گوگل، Gemma 3n كه از سهشنبه در پيشنمايش موجود است، ميتواند صدا، متن، تصاوير و ويديوها را مديريت كند. به نقل از تك كرانچ، مدلهايي كه به اندازه كافي كارآمد هستند تا به صورت آفلاين و بدون نياز به محاسبات ابري اجرا شوند، در سالهاي اخير در جامعه هوش مصنوعي مورد توجه قرار گرفتهاند. استفاده از آنها نه تنها ارزانتر از مدلهاي بزرگ است، بلكه با حذف نياز به انتقال دادهها به يك مركز داده در راه دور، حريم خصوصي را نيز حفظ ميكنند. «گاس مارتينز» مدير محصول جما در جريان سخنراني در كنفرانس I/O گفت: 3n Gemma روي دستگاههايي با كمتر از دو گيگابايت حافظه قابل اجراست. اين مدل از همان ساختار «جميناي نانو» بهره ميبرد و براي داشتن يك عملكرد فوقالعاده طراحي شده است. مارتينز گفت: مدجما يك مجموعه از مدلهاي باز ما براي درك متن و تصوير چندوجهي حوزه سلامت است. مدجما در طيف گستردهاي از اپليكيشنهاي تصوير و متن به خوبي كار ميكند؛ بهطوري كه توسعهدهندگان ميتوانند مدلها را با اپليكيشنهاي سلامت خود تطبيق دهند. در آينده نزديك شاهد رونمايي از «ساينجما» خواهيم بود كه يك مدل متن باز براي ترجمه زبان اشاره به متن گفتاري است. گوگل ميگويد كه ساينجما به توسعهدهندگان امكان ميدهد تا اپليكيشنها و ادغامهاي جديدي را براي كاربران ناشنوا و كمشنوا ايجاد كنند. مارتينز گفت: ساينجما يك خانواده جديد از مدلهايي است كه براي ترجمه زبان اشاره به متن گفتاري آموزش ديدهاند اما در زبان اشاره امريكايي و انگليسي بهترين عملكرد را دارد. اين مدل، توانمندترين مدل درك زبان اشاره تا به امروز است و ما بيصبرانه منتظر شما - توسعهدهندگان و جوامع ناشنوا و كمشنوا - هستيم تا اپليكيشنها را بر اين پايه بسازيد.
همكاري ۱۵۰ ميليون دلاري «گوگل»
براي توسعه عينك هوش مصنوعي
«گوگل» مبلغ ۱۵۰ ميليون دلار را به توسعه عينك هوش مصنوعي با همكاري شركت «واربي پاركر» اختصاص داد. در جريان اين كنفرانس همچنين گوگل اعلام كرد كه تا سقف ۱۵۰ ميليون دلار به شركت امريكايي «واربي پاركر» توليدكننده عينكهاي طبي و آفتابي متعهد خواهد شد تا بهطور مشترك عينكهاي مجهز به هوش مصنوعي مبتني بر اندرويد XR را توسعه دهند. اين دو شركت در يك بيانيه مطبوعاتي اعلام كردند كه گوگل تاكنون ۷۵ ميليون دلار براي هزينههاي توسعه و تجاريسازي محصول واربي پاركر اختصاص داده است. گوگل ميگويد در صورتي كه اين توليدكننده عينك به اهداف مشخصي دست يابد، ۷۵ ميليون دلار ديگر نيز با خريد سهام واربي پاركر سرمايهگذاري خواهد كرد. در كنفرانس 2025 Google I/O، گوگل از همكاري با چندين شركت از جمله «سامسونگ» و «جنتل مانستر» براي توسعه عينكهاي هوشمند مجهز به قابليتهاي هوش مصنوعي «جميناي» و واقعيت افزوده خبر داد. در بيانيه مطبوعاتي، واربي پاركر و گوگل اعلام كردند كه قصد دارند مجموعهاي از محصولات را به مرور زمان عرضه كنند. اولين خط توليد عينك آنها پس از سال ۲۰۲۵ راهاندازي خواهد شد و هوش مصنوعي چندوجهي را با عينكهاي طبي و غير طبي تركيب خواهد كرد.
گوگل تماس تصويري ۳ بُعدي را محقق كرد
گوگل همچنين در رويداد جديد خود به انتظارها پايان داد و قابليت كنفرانس ويدئويي ۳ بعدي را به نمايش گذاشت. گوگل براي اولينبار در سال ۲۰۲۱ پروژه استارلاين را به اشتراك گذاشت و در آن زمان آن را به عنوان يك «پنجره جادويي» معرفي كرد كه از سخت افزار ويژه، بينش رايانهاي و يادگيري ماشيني براي ايجاد يك تجربه تماس تصويري تقريبا هولوگرافيك استفاده ميكند. از آن زمان، ما متوجه شديم كه اين شركت با شركت HP همكاري ميكند تا يك نسخه كوچك شده از اين محصول را براي مشتريان سازماني ارايه كند. در رويداد 2025 I/O، گوگل اعلام كرد كه پروژه «Starline» در حال تبديل شدن به يك پلتفرم ارتباط ويدئويي سه بعدي با هوش مصنوعي به نام «Beam» است. ساندار پيچاي، مديرعامل اين شركت روي صحنه گفت كه اولين دستگاهها اواخر امسال براي «مشتريان انتخابي» در دسترس خواهند بود، اگرچه هنوز درباره قيمت آن صحبتي نشده است.
«گوگل ميت» به ترجمه زنده مجهز شد
شركت گوگل در رويداد خود اعلام كرد كه قابليت ترجمه زنده را به سرويس Meet ميآورد و زبان اسپانيايي اولين زبان قابل ترجمه در اين سرويس خواهد بود. گوگل سرويس تماس تصويري خود را به ترجمه زنده با هوش مصنوعي مجهز كرد و اين ويژگي جديد اكنون براي مشتركين هوش مصنوعي گوگل در دسترس است. بنابراين اگر ابزارهاي ترجمه زنده گوگل را مفيد ميدانيد، به زودي ميتوانيد در طول تماسها و جلسات تصويري بهطور طبيعي از آنها استفاده كنيد. اين شركت امروز در كنفرانس توسعهدهندگان I/O خود اعلام كرد كه اين ويژگي را به «Google Meet» ميآورد. از اين هفته، ترجمه اسپانيايي با هوش مصنوعي در اين برنامه در دسترس خواهد بود. گوگل ميگويد زبانهاي بيشتري در راه است و اين فناوري بسيار بسيار نزديك به داشتن يك مكالمه طبيعي و آزاد است. در نمونهاي كه گوگل در اين رويداد به نمايش گذاشت، ترجمه زنده در Meet با لحن و آهنگ گفتار گوينده مطابقت داشت و حتي ميتوانست عبارات را كاناليزه كند. بدون شك اين براي بسياري از افراد، به خصوص در تماسهاي كاري با همكاران در كشورهاي ديگر مفيد خواهد بود. ترجمه زنده به همه اين امكان را ميدهد كه به زباني كه راحتتر و بهتر صحبت ميكنند، گفتوگو كنند. پيش از اين، براي انجام هر گونه ترجمه بايد به زيرنويسهاي زنده در Google Meet تكيه ميكرديد، بنابراين عدم نياز به خواندن آنها باعث ميشود كاربران با مكالمه هماهنگتر باشند. از همين امروز، ترجمه زنده در سرويس «Google Meet» در نسخه بتا براي مشتركان AI Pro و Ultra در دسترس خواهد بود. اين شركت ميگويد ويژگيهاي جديد در اواخر امسال به عنوان بخشي از مرحله آزمايش اوليه براي كاربران سازماني در دسترس خواهد بود.
بهبود استدلال، ويژگيهاي صوتي و پشتيباني چندزبانه در هوش مصنوعي «گوگل»
مدل «جميناي ۲.۵ پرو» تنظيمات جديدي را براي بهبود استدلال، ويژگيهاي صوتي و پشتيباني چندزبانه دريافت كرد. گوگل از بهروزرسانيهاي جديدي براي مجموعه مدلهاي «جميناي ۲.۵» (2.5 Gemini) خود رونمايي كرد كه شامل استدلال قويتر، خروجي صداي بومي، ارتقاء امنيت و قابليتهاي بهبوديافته براي توسعهدهندگان است. گوگل در اعلام بهروزرسانيهاي جديد گفت: ما در ماه مارس «جميناي ۲.۵ پرو» (Gemini 2.5 Pro) را معرفي كرديم كه هوشمندترين مدل ما تا به امروز است و امروز، قابليتهاي جديدي را به ۲.۵ پرو و «۲.۵ فلش» (2.5 Flash) اضافه ميكنيم. مدل ارتقاءيافته جميناي ۲.۵ پرو اكنون در صدر نمودارهاي عملكرد از جمله «WebDev Arena» براي كدنويسي و «LMArena» براي آزمايش ترجيحات انساني قرار دارد. همچنين، اين مدل داراي يك پنجره زمينه با يك ميليون توكن است كه به آن امكان ميدهد تا وروديهاي طولانيتر و وظايف درك ويدئو را مديريت كند. گوگل اعلام كرد: به لطف «LearnLM» - نسخهاي از جميناي كه با متخصصان آموزشي توسعه داده شده - اين مدل اكنون در وظايف مرتبط با يادگيري نيز پيشرو است. مربيان و متخصصان، جميناي ۲.۵ پرو را در طيف متنوعي از سناريوها نسبت به ساير مدلها ترجيح دادند. گوگل خروجي صداي بومي را نيز براي داشتن يك تجربه طبيعيتر با هوش مصنوعي معرفي كرد. جميناي اكنون ميتواند با تُنها، لهجهها و سبكهاي گوناگون صحبت كند. براي مثال، هنگام تعريف كردن يك داستان ميتواند صداي دراماتيك داشته باشد. گوگل اعلام كرد كه در حال آزمايش يك حالت استدلال پيشرفته به نام «تفكر عميق» است كه به جميناي كمك ميكند تا پيش از پاسخ دادن، چندين پاسخ را در نظر بگيرد. اين حالت براي چالشهاي دشواري مانند رياضيات پيشرفته و برنامهنويسي طراحي شده است. سخنگوي اين شركت گفت: ما در حال آغاز كردن آزمايش يك حالت استدلال بهبوديافته به نام «ديپ ثينك» (Deep Think) هستيم. ما زمان بيشتري را به ارزيابيهاي ايمني پيشرفتهتر و دريافت نظرات بيشتر از متخصصان ايمني اختصاص ميدهيم. ديپ ثينك در حال حاضر در معيارهايي مانند «2025 USAMO» براي رياضي، «LiveCodeBench» براي كدنويسي و «MMMU» براي استدلال چندوجهي پيشرو است. انتظار ميرود نسخه عمومي مدل بهروزرسانيشده در اوايل ژوئن عرضه شود و نسخه ۲.۵ پرو نيز اندكي پس از آن از راه برسد.
هوش مصنوعي گوگل به جيميلها پاسخ ميدهد
گوگل اعلام كرد كه پاسخهاي هوشمند شخصيشده با هوش مصنوعي به جيميل ميآيند و مدلهاي هوش مصنوعي جميناي ميتوانند از طريق رايانامههاي گذشته و ساير برنامهها با اجازه كاربر، به رايانامههاي دريافتي پاسخ دهند.ساندار پيچاي، مديرعامل گوگل در كنفرانس توسعهدهندگان 2025 I/O اعلام كرد كه اپليكيشن جيميل در آيندهاي نزديك داراي ويژگي جديدي به نام «پاسخهاي هوشمند شخصي» خواهد بود. ايده اين است كه هوش مصنوعي جميناي با اجازه كاربر بتواند رايانامهها يا ايميلهاي گذشته و اسناد گوگل را بررسي كند، سپس به وي كمك كند تا به ايميلهاي شخصي يا تجاري پاسخ دهد. «جميناي» همچنين ميتواند تمام يادداشتهاي موجود در Drive را بررسي كند، از طريق ايميل، رزروهاي مربوطه را جستوجو كند و يك برنامه سفر را در Google Docs پيدا كند. همه اين موارد را جمع ميكند و سپس يك ايميل پيشنويس ميكند كه با لحن، سبك و حتي كلماتي كه كاربر معمولاً استفاده ميكند، مطابقت دارد. گوگل همچنين ميخواهد به كاربرانش كمك كند تا ايميلهاي خود را با ويژگي پاكسازي صندوق ورودي بهتر مديريت كنند. بنابراين به سادگي ميتوان به «جميناي» گفت كه چه كاري ميخواهيد انجام دهيد. به عنوان مثال ميتوان گفت «تمام ايميلهاي خوانده نشده من از يك شركت خاص را در سال گذشته حذف كن.»