مجلات علمي زير سيل مقالات «كپي‌شده» توسط هوش مصنوعي

۱۴۰۴/۰۷/۰۵ - ۰۲:۳۶:۵۱
کد خبر: ۳۵۹۰۰۰

ابزارهايي مانند چت جي‌پي‌تي مي‌توانند براي توليد مقالات پژوهشي تقريبا كپي شده استفاده شوند؛ مقالاتي كه از سد بررسي‌هاي استاندارد سرقت علمي عبور مي‌كنند.

ابزارهايي مانند چت جي‌پي‌تي مي‌توانند براي توليد مقالات پژوهشي تقريبا كپي شده استفاده شوند؛ مقالاتي كه از سد بررسي‌هاي استاندارد سرقت علمي عبور مي‌كنند. تصور مي‌شود صدها مورد از اين مقالات منتشر شده باشند. به گزارش ايسنا، يك تحليل از يك پايگاه داده مقالات علمي نشان مي‌دهد كه ابزارهاي هوش مصنوعي توليدكننده متن از جمله چت جي‌پي‌تي و جميناي مي‌توانند براي بازنويسي مقالات علمي و توليد نسخه‌هاي «كپي‌شده» به‌كار گرفته شوند؛ نسخه‌هايي كه سپس به عنوان تحقيقات جديد معرفي مي‌شوند.

به نقل از نيچر، در يك نسخه پيش‌چاپ مقاله‌اي كه قبل از بررسي همتا منتشر مي‌شود كه در ۱۲ سپتامبر در پايگاه medRxiv قرار گرفت، پژوهشگران بيش از ۴۰۰ مقاله از اين نوع را شناسايي كردند كه در ۱۱۲ مجله در طول ۴.۵ سال گذشته منتشر شده‌اند. آنها نشان دادند كه مطالعات زيست‌پزشكي توليدشده توسط هوش مصنوعي مي‌توانند از سد بررسي‌هاي ضدسرقت علمي ناشران عبور كنند. نويسندگان اين مطالعه هشدار مي‌دهند كه افراد و كارخانه‌هاي مقاله كه شركت‌هايي هستند كه مقالات جعلي توليد مي‌كنند و مي‌فروشند، ممكن است با سوءاستفاده از مجموعه‌داده‌هاي سلامت عمومي و استفاده از مدل‌هاي زباني بزرگ اقدام به توليد انبوه مقالات بي‌كيفيت و بي‌ارزش علمي كنند. چابا سابو (Csaba Szabó)، داروشناس در دانشگاه فريبورگ سويس كه در اين پژوهش دخيل نبوده است، مي‌گويد: اگر اين مساله حل‌نشده باقي بماند، اين رويكرد مبتني بر هوش مصنوعي مي‌تواند روي همه پايگاه‌هاي داده متن‌باز به‌كار رود و تعداد بسيار بيشتري مقاله توليد شود؛ بيش از چيزي كه بتوان تصور كرد. اين مي‌تواند رويدادي پر از خطرات غيرقابل‌كنترل را شكل دهد و مقالات علمي را با مقالات مصنوعي جايگزين كند.

  پژوهش تكراري

براي بررسي اين موضوع، پژوهشگران مطالعات ارتباطي مطالعاتي كه ارتباط آماري بين يك متغير و يك پيامد سلامت را بررسي مي‌كنند را كه بر اساس داده‌هاي پيمايش ملي سلامت و تغذيه ايالات متحده كه يك پايگاه عظيم داده درباره سلامت، تغذيه و سبك زندگي هزاران نفر است، غربال كردند. آنها بررسي خود را روي مطالعاتي متمركز كردند كه آنها را «تكراري» تعريف كردند؛ يعني مطالعاتي كه ارتباط بين يك متغير و يك پيامد سلامت را مثل تحقيقات ديگر آزمايش كرده بودند، اما با كمي تغيير در بخش كوچكي از داده‌ها براي مثال نتايج سال‌هاي متفاوت پيمايش يا شركت‌كنندگان در گروه سني يا جنسيت متفاوت را آزمايش كرده‌ بودند. جست‌وجوي آنها نشان داد ۴۱۱ مطالعه تكراري بين ماه ژانويه سال ۲۰۲۱ تا ژوئيه ۲۰۲۵ منتشر شده‌اند. بيشتر اينها موارد «تكراري» بودند كه شامل دو مقاله تقريبا يكسان نيز مي‌شد. مت اسپيك زيست‌پزشك در دانشگاه سوري (Surrey) بريتانيا و نويسنده همكار اين مقاله مي‌گويد: اين نبايد اتفاق بيفتد و كمكي به سلامت مقالات علمي نمي‌كند. بيشتر ناشران سازوكارهايي براي جلوگيري از ارسال يك تحقيق مشابه به چند مجله دارند، اما اسپيك و همكارانش مشكوك‌ هستند كه ممكن است ابزارهاي هوش مصنوعي براي دور زدن اين سازوكارها استفاده مي‌شوند.

 دور زدن شناسايي

براي آزمايش اينكه آيا هوش مصنوعي مي‌تواند به توليد چند مقاله از يك مجموعه داده كمك كند، پژوهشگران از چت‌بات چت جي‌پي‌تي و جميناي گوگل براي بازنويسي سه مقاله از تكراري‌ترين مقالات استفاده كردند كه هر كدام يك ارتباط خاص را گزارش مي‌كرد كه پيش‌تر از پنج يا ۶ بار منتشر شده بود. آنها از مدل‌هاي زباني خواستند كه بر اساس اطلاعات همان مقاله و داده‌هاي NHANES يك دست‌نوشته جديد توليد كنند كه بتواند از سد ابزارهاي شناسايي سرقت علمي بگذرد. اسپيك مي‌گويد: ما شوكه شديم كه بلافاصله جواب داد. مقالات كامل و بي‌نقص نبودند و مدل‌هاي زباني چند خطا ايجاد كردند. ولي تنها دو ساعت كار ويرايش براي هر دست‌نوشته لازم بود. وقتي اين مقالات با ابزار شناسايي سرقت علمي كه بسياري از ناشران استفاده مي‌كنند بررسي شدند، نمره‌اي به دست آوردند كه از نظر ويراستاران مشكل‌ساز تلقي نمي‌شد. اين نشان مي‌دهد كه مدل‌هاي زباني مي‌توانند چيزي مشتق شده از همه مطالعات قبلي توليد كنند بدون اينكه چيز جديدي اضافه كنند. اما باز هم از سد بررسي‌هاي سرقت علمي عبور كنند. اين مساله تشخيص ميان پژوهشگراني كه مطالعه واقعي با داده‌هاي عمومي مانند NHANES انجام مي‌دهند و كساني كه عمدا با مدل‌هاي زباني مقالات تكراري مي‌سازند را سخت‌تر مي‌كند. ايگور رودان از دانشگاه ادينبورگ، بريتانيا، كه متخصص سلامت عمومي جهاني است، مي‌گويد: اينها چالش‌هاي كاملا جديدي براي ويراستاران و ناشران است.