مجلات علمي زير سيل مقالات «كپيشده» توسط هوش مصنوعي
ابزارهايي مانند چت جيپيتي ميتوانند براي توليد مقالات پژوهشي تقريبا كپي شده استفاده شوند؛ مقالاتي كه از سد بررسيهاي استاندارد سرقت علمي عبور ميكنند.
ابزارهايي مانند چت جيپيتي ميتوانند براي توليد مقالات پژوهشي تقريبا كپي شده استفاده شوند؛ مقالاتي كه از سد بررسيهاي استاندارد سرقت علمي عبور ميكنند. تصور ميشود صدها مورد از اين مقالات منتشر شده باشند. به گزارش ايسنا، يك تحليل از يك پايگاه داده مقالات علمي نشان ميدهد كه ابزارهاي هوش مصنوعي توليدكننده متن از جمله چت جيپيتي و جميناي ميتوانند براي بازنويسي مقالات علمي و توليد نسخههاي «كپيشده» بهكار گرفته شوند؛ نسخههايي كه سپس به عنوان تحقيقات جديد معرفي ميشوند.
به نقل از نيچر، در يك نسخه پيشچاپ مقالهاي كه قبل از بررسي همتا منتشر ميشود كه در ۱۲ سپتامبر در پايگاه medRxiv قرار گرفت، پژوهشگران بيش از ۴۰۰ مقاله از اين نوع را شناسايي كردند كه در ۱۱۲ مجله در طول ۴.۵ سال گذشته منتشر شدهاند. آنها نشان دادند كه مطالعات زيستپزشكي توليدشده توسط هوش مصنوعي ميتوانند از سد بررسيهاي ضدسرقت علمي ناشران عبور كنند. نويسندگان اين مطالعه هشدار ميدهند كه افراد و كارخانههاي مقاله كه شركتهايي هستند كه مقالات جعلي توليد ميكنند و ميفروشند، ممكن است با سوءاستفاده از مجموعهدادههاي سلامت عمومي و استفاده از مدلهاي زباني بزرگ اقدام به توليد انبوه مقالات بيكيفيت و بيارزش علمي كنند. چابا سابو (Csaba Szabó)، داروشناس در دانشگاه فريبورگ سويس كه در اين پژوهش دخيل نبوده است، ميگويد: اگر اين مساله حلنشده باقي بماند، اين رويكرد مبتني بر هوش مصنوعي ميتواند روي همه پايگاههاي داده متنباز بهكار رود و تعداد بسيار بيشتري مقاله توليد شود؛ بيش از چيزي كه بتوان تصور كرد. اين ميتواند رويدادي پر از خطرات غيرقابلكنترل را شكل دهد و مقالات علمي را با مقالات مصنوعي جايگزين كند.
پژوهش تكراري
براي بررسي اين موضوع، پژوهشگران مطالعات ارتباطي مطالعاتي كه ارتباط آماري بين يك متغير و يك پيامد سلامت را بررسي ميكنند را كه بر اساس دادههاي پيمايش ملي سلامت و تغذيه ايالات متحده كه يك پايگاه عظيم داده درباره سلامت، تغذيه و سبك زندگي هزاران نفر است، غربال كردند. آنها بررسي خود را روي مطالعاتي متمركز كردند كه آنها را «تكراري» تعريف كردند؛ يعني مطالعاتي كه ارتباط بين يك متغير و يك پيامد سلامت را مثل تحقيقات ديگر آزمايش كرده بودند، اما با كمي تغيير در بخش كوچكي از دادهها براي مثال نتايج سالهاي متفاوت پيمايش يا شركتكنندگان در گروه سني يا جنسيت متفاوت را آزمايش كرده بودند. جستوجوي آنها نشان داد ۴۱۱ مطالعه تكراري بين ماه ژانويه سال ۲۰۲۱ تا ژوئيه ۲۰۲۵ منتشر شدهاند. بيشتر اينها موارد «تكراري» بودند كه شامل دو مقاله تقريبا يكسان نيز ميشد. مت اسپيك زيستپزشك در دانشگاه سوري (Surrey) بريتانيا و نويسنده همكار اين مقاله ميگويد: اين نبايد اتفاق بيفتد و كمكي به سلامت مقالات علمي نميكند. بيشتر ناشران سازوكارهايي براي جلوگيري از ارسال يك تحقيق مشابه به چند مجله دارند، اما اسپيك و همكارانش مشكوك هستند كه ممكن است ابزارهاي هوش مصنوعي براي دور زدن اين سازوكارها استفاده ميشوند.
دور زدن شناسايي
براي آزمايش اينكه آيا هوش مصنوعي ميتواند به توليد چند مقاله از يك مجموعه داده كمك كند، پژوهشگران از چتبات چت جيپيتي و جميناي گوگل براي بازنويسي سه مقاله از تكراريترين مقالات استفاده كردند كه هر كدام يك ارتباط خاص را گزارش ميكرد كه پيشتر از پنج يا ۶ بار منتشر شده بود. آنها از مدلهاي زباني خواستند كه بر اساس اطلاعات همان مقاله و دادههاي NHANES يك دستنوشته جديد توليد كنند كه بتواند از سد ابزارهاي شناسايي سرقت علمي بگذرد. اسپيك ميگويد: ما شوكه شديم كه بلافاصله جواب داد. مقالات كامل و بينقص نبودند و مدلهاي زباني چند خطا ايجاد كردند. ولي تنها دو ساعت كار ويرايش براي هر دستنوشته لازم بود. وقتي اين مقالات با ابزار شناسايي سرقت علمي كه بسياري از ناشران استفاده ميكنند بررسي شدند، نمرهاي به دست آوردند كه از نظر ويراستاران مشكلساز تلقي نميشد. اين نشان ميدهد كه مدلهاي زباني ميتوانند چيزي مشتق شده از همه مطالعات قبلي توليد كنند بدون اينكه چيز جديدي اضافه كنند. اما باز هم از سد بررسيهاي سرقت علمي عبور كنند. اين مساله تشخيص ميان پژوهشگراني كه مطالعه واقعي با دادههاي عمومي مانند NHANES انجام ميدهند و كساني كه عمدا با مدلهاي زباني مقالات تكراري ميسازند را سختتر ميكند. ايگور رودان از دانشگاه ادينبورگ، بريتانيا، كه متخصص سلامت عمومي جهاني است، ميگويد: اينها چالشهاي كاملا جديدي براي ويراستاران و ناشران است.
