هوش مصنوعي دروغ گفتن و فريب دادن سازندگانش را ياد گرفت
پيشرفتهترين مدلهاي هوش مصنوعي جهان رفتارهاي نگرانكنندهاي مانند دروغگويي و تقلب را از خود نشان ميدهند و حتي براي دستيابي به اهدافشان مبدعان خود را تهديد ميكنند.
پيشرفتهترين مدلهاي هوش مصنوعي جهان رفتارهاي نگرانكنندهاي مانند دروغگويي و تقلب را از خود نشان ميدهند و حتي براي دستيابي به اهدافشان مبدعان خود را تهديد ميكنند. به گزارش خبرگزاري مهر به نقل ازاي اف پي، در يك نمونه خاص، مدل رايانشي «كلاود ۴»، جديدترين محصول آنتروپيك از يك مهندس اخاذي و او را تهديد به افشاي خيانت كرد. از سوي ديگر مدل o۱ شركت اوپناي آي خود را روي سرورهاي خارجي دانلود ميكند و پس از افشاي امر، آن را انكار كرد. اين رويدادها نشاندهنده يك واقعيت مهم هستند؛ باگذشت بيش از دو سال پس از آنكه چت جي پي تي جهان را دگرگون كرد، محققان هوش مصنوعي هنوز بهطور كامل شيوه عملكرد محصولشان را نميدانند. با اين وجود رقابت براي بهكارگيري مدلهاي قدرتمندتر همچنان ادامه دارد. به نظر ميرسد رفتار فريبكارانه هوش مصنوعي به ظهور مدلهاي «استدلالي» كه بهجاي توليد پاسخهاي آني، چالشها را گامبهگام حل ميكنند، مرتبط است. به گفته سيمون گلداستاين، پروفسور دانشگاه هنگكنگ مدلهاي جديدتر بهخصوص در معرض چنين مشكلاتي قرار دارند. ماريوس هابهان رييس موسسه آپولو ريسرچ كه در حوزه تست سيستمهاي هوش مصنوعي بزرگ فعاليت ميكند، در اين باره ميگويد: o۱ نخستين مدل هوش مصنوعي بزرگي بود كه چنين رفتاري در آن مشاهده شد. گاهي اوقات اين مدلها «همراستايي» را شبيهسازي ميكنند، يعني به نظر ميرسد از دستورالعملها پيروي ميكنند؛ اما پنهاني اهداف متفاوتي را دنبال ميكنند. در حال حاضر اين رفتار فريبكارانه هوش مصنوعي فقط زماني ظهور ميكند كه محققان بهطور عمدي تست استرس را با سناريوهايي شديد روي مدلها اجرا ميكنند. اما مايكل چان از موسسه METR هشدار ميدهد اين يك سوال بيپاسخ است كه آيا در آينده مدلهاي آتي قدرتمندتر تمايلي نسبت به صداقت يا فريب خواهند داشت يا خير. رفتارهاي نگرانكننده فراتر از توهمهاي معمول هوش مصنوعي يا اشتباهات آنها است. هابهان در اين باره تأكيد كرد: باوجود فشارهاي مداوم از سوي كاربران، آنچه ما مشاهده ميكنيم، يك پديده واقعي است. ما چيزي را جعل نميكنيم. كاربران گزارش ميدهند كه مدلها به آنها دروغ ميگويند و شواهدي جعلي ارايه ميدهند. وي در ادامه افزود: اين فقط توهم نيست؛ بلكه نوعي استراتژيك از فريب است.