تواناييهاي نويدبخش مدل هوش مصنوعي «5.2 GPT »
شركت «اوپنايآي» روز پنجشنبه از عرضه مدل هوش مصنوعي «5.2 GPT» خبر داد و خاطرنشان كرد كه اين مدل داراي تواناييهاي قابل توجهي در بسياري از زمينهها خواهد بود.
به گزارش ايسنا، در بحبوحه رقابت شديد با شركتهايي مانند «گوگل»، «سم آلتمن» (Sam Altman)، مديرعامل شركت «اوپنايآي» (OpenAI) در تلاش همهجانبه براي تسريع عرضه يك مدل جديد، «كد قرمز» صادر كرد. اكنون مدل هوش مصنوعي 5.2 GPTرسماً عرضه شده است و افراد كنجكاو در حال بررسي تواناييهاي آن براي بهروزرساني طراحي مدلهاي پيشرفته و كارهايي هستند كه مدلهاي زباني بزرگ ميتوانند براي ما انجام دهند. به نقل از فوربس، سخنگوي اوپنايآي در اطلاعيه رسمي اين مدل كه روز پنجشنبه منتشر شد، با اشاره به عملكرد نسخه 5.2 در معيارهاي SWE-Bench و آزمايشهاي ARC توضيح داد: اين مدل در ايجاد صفحات گسترده، ساخت ارايهها، نوشتن كد، درك تصاوير، درك متنهاي طولاني، استفاده از ابزارها و مديريت پروژههاي پيچيده و چندمرحلهاي بهتر عمل ميكند.
اوپنايآي در قسمتي از اين اطلاعيه اظهار كرد كه پلتفرمهاي هوش مصنوعي «نوشن» (Notion)، «باكس» (Box)، «شاپيفاي» (Shopify)، «هاروي» (Harvey) و «زوم» (Zoom) شاهد برتري GPT 5.2 در عملكرد پيشرفته استدلال بلندمدت بودهاند، «ديتابريكس» (Databricks)، «هكس» (Hex) و «تريپل ويل» (Triple Whale) از كار ماهرانه آن در علوم داده عاملي و وظايف تحليل اسناد خوششان آمده است و «كاگنيشن» (Cognition)، «رپ» (Warp)، «چارلي لبز» (Charlie Labs)، «جتبرينز» (JetBrains) و «اوگمنت كد» (Augment Code) شاهد عملكرد عالي اين مدل در كدنويسي عاملي بودهاند.
اعضاي اوپنايآي توضيح دادند كه نسخه 5.2 را به منظور كمك به وظايف حرفهاي رايج و فراهم كردن ارزش اقتصادي بيشتر براي كاربران ايجاد كردهاند. با آنچه يكي از منتقدان انتزاع قويتر، تعادل و پاسخهاي راهبردي واضحتر و واقعگرايانهتر و اطلاعات مفهومي عميقتر ناميده است، اين مدل ميتواند روي وظايفي مانند جداول سرمايه و برنامهريزي نيروي كار تمركز كند. اين منتقد خاطرنشان كرد نسخه 5.2 براي وظايفي كه نياز به درجه بالايي از قابليتهاي تحليلي يا استدلال رياضي دارند، عالي است. از نظر ارزش، يك نظرسنجي سازماني روي GPT اوپنايآي نشان داد كه مدلهاي پيشين چيزي حدود ۴۰ تا ۶۰ دقيقه در روز براي كاربران حرفهاي صرفهجويي ميكنند و انتظار ميرود صرفهجويي 5.2 در زمان از اين مقدار هم بيشتر باشد.
علاوه بر آزمونهاي SWE و ARC، روشهاي مشخص ديگري نيز براي بررسي تكامل مدل وجود دارد. اوپنايآي در اوايل سال جاري، مفهوم GDPVal را برجسته كرد و از ايده توليد ناخالص داخلي براي توضيح نقش مدلهاي زباني بزرگ در كسبوكار بهره برد. اين شركت اظهار كرد: ارزيابيهاي پيشين هوش مصنوعي مانند آزمونهاي دانشگاهي چالشبرانگيز و چالشهاي رقابتي كدنويسي در پيشبرد مرزهاي قابليت استدلال مدل ضروري بودهاند، اما اغلب در نوع وظايفي كه بسياري از افراد در كار روزمره خود انجام ميدهند، كم ميآورند.
ما براي پر كردن اين شكاف، در حال توسعه ارزيابيهايي هستيم كه قابليتهاي واقعبينانهتر و مرتبط با اقتصاد را بررسي ميكنند. تقريباً به نظر ميرسد كه اين كد بهطور ويژه براي ChatGPT 5.2 نوشته شده و اين همان چيزي است كه اعضاي شركت درباره قدرت اين مدل تبليغ ميكنند. اين كد، دامنه كاربرد مشخصي دارد. GDPVal مجموعهاي از ۴۴ شغل در ۹ صنعت برتر موثر در توليد ناخالص داخلي امريكا را به همراه ۱۳۲۰ وظيفه تخصصي پوشش ميدهد. بخش ديگري از آنچه اوپنايآي درباره بررسي گسترده معيارهاي GDPVal و كاربردي بودن آن در مقايسه با ساير معيارها ميگويد، به اين شرح است: GDPval هم از نظر واقعگرايي و هم از نظر تنوع وظايف مورد ارزيابي، متمايز است. برخلاف ساير ارزيابيهاي مرتبط با ارزش اقتصادي كه بر حوزههاي ويژه تمركز دارند، GDPval وظايف و مشاغل زيادي را پوشش ميدهد و برخلاف معيارهايي كه شامل ايجاد مصنوعي وظايف به سبك يك امتحان يا آزمون دانشگاهي هستند، GDPval بر وظايف مبتني بر نتايج قابل تحويل تمركز ميكند كه يك كار يا محصول واقعي هستند يا يك محصول كاري مشابه به شمار ميروند.
يكي ديگر از پيشرفتهايي كه كاربران درباره نسخه 5.2 به آن اشاره ميكنند، مربوط به يادگيري ماشيني كلاسيك است كه مهندسان در آن توانايي يك برنامه را براي همگرايي يا ادغام اطلاعات به روشي هدفمند بررسي كردند.
روشهاي بسياري براي فكر كردن درباره اين موضوع وجود دارد؛ از تحليل چگونگي درك دادههاي بصري توسط يك ارگانيسم بيولوژيكي گرفته تا توجه به اينكه چگونه تغييرات ابعادي بر نتيجه توجه يك شبكه عصبي تأثير ميگذارند، اما برخي از كاربران اوليه ادعا ميكنند نسخه 5.2 در همگرايي، انسجام و هدف قرار دادن نتيجهاي كه منطقي است، بهتر عمل ميكند. برخي از انسانها نيز در اين زمينه بهتر از ديگران هستند. اين موارد تنها بخشي از نكات شنيدهشده درباره 5.2 GPT هستند و مطمئنا بهروزرسانيهاي بسياري براي آن ارايه خواهد شد.
