هوش مصنوعي «گوگل» در ارزيابي ايمني امتياز پاييني گرفت
نتايج آزمايش داخلي «گوگل» نشان ميدهند مدل هوش مصنوعي اين شركت كه اخيرا منتشر شده، در برخي از ارزيابيهاي ايمني نسبت به مدل پيشين خود امتياز پايينتري را به دست آورده است.
نتايج آزمايش داخلي «گوگل» نشان ميدهند مدل هوش مصنوعي اين شركت كه اخيرا منتشر شده، در برخي از ارزيابيهاي ايمني نسبت به مدل پيشين خود امتياز پايينتري را به دست آورده است. به گزارش ايسنا، گوگل در يك گزارش فني فاش كرد كه مدل «جميناي ۲.۵ فلش» آن نسبت به «جميناي ۲.۰ فلش» بيشتر ممكن است متني را توليد كند كه نقضكننده دستورالعملهاي ايمني آن باشد. جميناي ۲.۵ فلش در دو معيار «ايمني متن به متن» و «ايمني تصوير به متن» به ترتيب ۴.۱ درصد و ۹.۶ درصد پسرفت داشت. به نقل از تكرانچ، ايمني متن به متن، ميزان نقض دستورالعملهاي گوگل توسط يك مدل را در صورت دريافت پيام بررسي ميكند. اين در حالي است كه ايمني تصوير به متن، ميزان پايبندي مدل به اين مرزها را هنگام دريافت پيام با استفاده از يك تصوير ارزيابي ميكند. هر دو آزمايش، خودكار هستند و تحت نظارت انسان انجام نميشوند. سخنگوي گوگل در بيانيهاي كه از طريق ايميل فرستاده شد، تأييد كرد كه جميناي ۲.۵ فلش عملكرد ضعيفتري را در زمينه ايمني تبديل متن به متن و تصوير به متن دارد. اين نتايج شگفتانگيز در حالي به دست آمد كه شركتهاي هوش مصنوعي در تلاش هستند تا مدلهاي خود را سهلگيرانهتر كنند. به عبارت ديگر، احتمال امتناع از پاسخ به موضوعات بحثبرانگيز يا حساس را كاهش دهند. شركت «متا» در جديدترين نسخه مدلهاي «لاما» اعلام كرد مدلها را طوري تنظيم كرده است كه برخي ديدگاهها را بر برخي ديگر ترجيح ندهند و به درخواستهاي سياسي مورد بحثتر پاسخ دهند. شركت «اوپنايآي» اوايل سال جاري ميلادي اعلام كرد مدلهاي آينده را طوري تنظيم خواهد كرد كه موضع نداشته باشند و ديدگاههاي متعددي را درباره موضوعات بحثبرانگيز ارايه دهند. اين تلاشهاي سهلگيرانه گاهي اوقات نتيجه معكوس دادهاند. روز دوشنبه گزارش شد كه مدل پيشفرض «چتجيپيتي» شركت اوپنايآي به افراد زير سن قانوني امكان ميدهد تا گفتوگوهاي نامناسبي را داشته باشند. اوپنايآي اين رفتار را ناشي از يك مشكل دانست. براساس گزارش فني گوگل، جميناي ۲.۵ فلش كه هنوز در مرحله پيشنمايش است، دستورالعملها را از جمله دستورالعملهايي كه از حدود مشكلساز عبور ميكنند، با دقت بيشتري نسبت به جميناي ۲.۰ فلش دنبال ميكند. اين شركت ادعا كرد كه اين مشكلات را ميتوان تا حدي به مثبتهاي كاذب نسبت داد، اما همچنين اذعان داشت كه جميناي ۲.۵ فلش گاهي اوقات وقتي صريحا از آن خواسته شود، محتواي نقضكننده محدوديت را توليد ميكند.