هوش مصنوعي «گوگل» در ارزيابي ايمني امتياز پاييني گرفت

۱۴۰۴/۰۲/۱۴ - ۰۱:۰۶:۵۵
|
کد خبر: ۳۴۱۸۵۴

نتايج آزمايش داخلي «گوگل» نشان مي‌دهند مدل هوش مصنوعي اين شركت كه اخيرا منتشر شده، در برخي از ارزيابي‌هاي ايمني نسبت به مدل پيشين خود امتياز پايين‌تري را به دست آورده است.

نتايج آزمايش داخلي «گوگل» نشان مي‌دهند مدل هوش مصنوعي اين شركت كه اخيرا منتشر شده، در برخي از ارزيابي‌هاي ايمني نسبت به مدل پيشين خود امتياز پايين‌تري را به دست آورده است. به گزارش ايسنا، گوگل در يك گزارش فني فاش كرد كه مدل «جميناي ۲.۵ فلش» آن نسبت به «جميناي ۲.۰ فلش» بيشتر ممكن است متني را توليد كند كه نقض‌كننده دستورالعمل‌هاي ايمني آن باشد. جميناي ۲.۵ فلش در دو معيار «ايمني متن به متن» و «ايمني تصوير به متن» به ترتيب ۴.۱ درصد و ۹.۶ درصد پسرفت داشت. به نقل از تكرانچ، ايمني متن به متن، ميزان نقض دستورالعمل‌هاي گوگل توسط يك مدل را در صورت دريافت پيام بررسي مي‌كند. اين در حالي است كه ايمني تصوير به متن، ميزان پايبندي مدل به اين مرزها را هنگام دريافت پيام با استفاده از يك تصوير ارزيابي مي‌كند. هر دو آزمايش، خودكار هستند و تحت نظارت انسان انجام نمي‌شوند. سخنگوي گوگل در بيانيه‌اي كه از طريق ايميل فرستاده شد، تأييد كرد كه جميناي ۲.۵ فلش عملكرد ضعيف‌تري را در زمينه ايمني تبديل متن به متن و تصوير به متن دارد. اين نتايج شگفت‌انگيز در حالي به دست آمد كه شركت‌هاي هوش مصنوعي در تلاش هستند تا مدل‌هاي خود را سهل‌گيرانه‌تر كنند. به عبارت ديگر، احتمال امتناع از پاسخ به موضوعات بحث‌برانگيز يا حساس را كاهش دهند. شركت «متا» در جديدترين نسخه مدل‌هاي «لاما» اعلام كرد مدل‌ها را طوري تنظيم كرده است كه برخي ديدگاه‌ها را بر برخي ديگر ترجيح ندهند و به درخواست‌هاي سياسي مورد بحث‌تر پاسخ دهند. شركت «اوپن‌اي‌آي» اوايل سال جاري ميلادي اعلام كرد مدل‌هاي آينده را طوري تنظيم خواهد كرد كه موضع نداشته باشند و ديدگاه‌هاي متعددي را درباره موضوعات بحث‌برانگيز ارايه دهند. اين تلاش‌هاي سهل‌گيرانه گاهي اوقات نتيجه‌ معكوس داده‌اند. روز دوشنبه گزارش شد كه مدل پيش‌فرض «چت‌جي‌پي‌تي» شركت اوپن‌اي‌آي به افراد زير سن قانوني امكان مي‌دهد تا گفت‌وگوهاي نامناسبي را داشته باشند. اوپن‌اي‌آي اين رفتار را ناشي از يك مشكل دانست. براساس گزارش فني گوگل، جميناي ۲.۵ فلش كه هنوز در مرحله پيش‌نمايش است، دستورالعمل‌ها را از جمله دستورالعمل‌هايي كه از حدود مشكل‌ساز عبور مي‌كنند، با دقت بيشتري نسبت به جميناي ۲.۰ فلش دنبال مي‌كند. اين شركت ادعا كرد كه اين مشكلات را مي‌توان تا حدي به مثبت‌هاي كاذب نسبت داد، اما همچنين اذعان داشت كه جميناي ۲.۵ فلش گاهي اوقات وقتي صريحا از آن خواسته ‌شود، محتواي نقض‌كننده محدوديت را توليد مي‌كند.