توانايي‌هاي نويدبخش مدل هوش مصنوعي «5.2 GPT »

۱۴۰۴/۰۹/۲۵ - ۰۱:۵۳:۵۱
کد خبر: ۳۷۰۰۶۱

شركت «اوپن‌اي‌آي» روز پنجشنبه از عرضه مدل هوش مصنوعي «5.2 GPT» خبر داد و خاطرنشان كرد كه اين مدل داراي توانايي‌هاي قابل توجهي در بسياري از زمينه‌ها خواهد بود.

به گزارش ايسنا، در بحبوحه رقابت شديد با شركت‌هايي مانند «گوگل»، «سم آلتمن» (Sam Altman)، مديرعامل شركت «اوپن‌اي‌آي» (OpenAI) در تلاش همه‌جانبه براي تسريع عرضه يك مدل جديد، «كد قرمز» صادر كرد. اكنون مدل هوش مصنوعي 5.2 GPTرسماً عرضه شده است و افراد كنجكاو در حال بررسي توانايي‌هاي آن براي به‌روزرساني طراحي مدل‌هاي پيشرفته و كارهايي هستند كه مدل‌هاي زباني بزرگ مي‌توانند براي ما انجام دهند. به نقل از فوربس، سخنگوي اوپن‌اي‌آي در اطلاعيه رسمي اين مدل كه روز پنجشنبه منتشر شد، با اشاره به عملكرد نسخه 5.2 در معيارهاي SWE-Bench و آزمايش‌هاي ARC توضيح داد: اين مدل در ايجاد صفحات گسترده، ساخت ارايه‌ها، نوشتن كد، درك تصاوير، درك متن‌هاي طولاني، استفاده از ابزارها و مديريت پروژه‌هاي پيچيده و چندمرحله‌اي بهتر عمل مي‌كند.

اوپن‌اي‌آي در قسمتي از اين اطلاعيه اظهار كرد كه پلتفرم‌هاي هوش مصنوعي «نوشن» (Notion)، «باكس» (Box)، «شاپيفاي» (Shopify)، «هاروي» (Harvey) و «زوم» (Zoom) شاهد برتري GPT 5.2 در عملكرد پيشرفته استدلال بلندمدت بوده‌اند، «ديتابريكس» (Databricks)، «هكس» (Hex) و «تريپل ويل» (Triple Whale) از كار ماهرانه آن در علوم داده عاملي و وظايف تحليل اسناد خوششان آمده است و «كاگنيشن» (Cognition)، «رپ» (Warp)، «چارلي لبز» (Charlie Labs)، «جت‌برينز» (JetBrains) و «اوگمنت كد» (Augment Code) شاهد عملكرد عالي اين مدل در كدنويسي عاملي بوده‌اند.

اعضاي اوپن‌اي‌آي توضيح دادند كه نسخه 5.2 را به منظور كمك به وظايف حرفه‌اي رايج و فراهم كردن ارزش اقتصادي بيشتر براي كاربران ايجاد كرده‌اند. با آنچه يكي از منتقدان انتزاع قوي‌تر، تعادل و پاسخ‌هاي راهبردي واضح‌تر و واقع‌گرايانه‌تر و اطلاعات مفهومي عميق‌تر ناميده است، اين مدل مي‌تواند روي وظايفي مانند جداول سرمايه و برنامه‌ريزي نيروي كار تمركز كند. اين منتقد خاطرنشان كرد نسخه 5.2 براي وظايفي كه نياز به درجه بالايي از قابليت‌هاي تحليلي يا استدلال رياضي دارند، عالي است. از نظر ارزش، يك نظرسنجي سازماني روي GPT اوپن‌اي‌آي نشان داد كه مدل‌هاي پيشين چيزي حدود ۴۰ تا ۶۰ دقيقه در روز براي كاربران حرفه‌اي صرفه‌جويي مي‌كنند و انتظار مي‌رود صرفه‌جويي 5.2 در زمان از اين مقدار هم بيشتر باشد.

علاوه بر آزمون‌هاي SWE و ARC، روش‌هاي مشخص ديگري نيز براي بررسي تكامل مدل وجود دارد. اوپن‌اي‌آي در اوايل سال جاري، مفهوم GDPVal را برجسته كرد و از ايده توليد ناخالص داخلي براي توضيح نقش مدل‌هاي زباني بزرگ در كسب‌وكار بهره برد. اين شركت اظهار كرد: ارزيابي‌هاي پيشين هوش مصنوعي مانند آزمون‌هاي دانشگاهي چالش‌برانگيز و چالش‌هاي رقابتي كدنويسي در پيشبرد مرزهاي قابليت‌ استدلال مدل ضروري بوده‌اند، اما اغلب در نوع وظايفي كه بسياري از افراد در كار روزمره خود انجام مي‌دهند، كم مي‌آورند. 

ما براي پر كردن اين شكاف، در حال توسعه ارزيابي‌هايي هستيم كه قابليت‌هاي واقع‌بينانه‌تر و مرتبط با اقتصاد را بررسي مي‌كنند. تقريباً به نظر مي‌رسد كه اين كد به‌طور ويژه براي ChatGPT 5.2 نوشته شده و اين همان چيزي است كه اعضاي شركت درباره قدرت اين مدل تبليغ مي‌كنند. اين كد، دامنه كاربرد مشخصي دارد. GDPVal مجموعه‌اي از ۴۴ شغل در ۹ صنعت برتر موثر در توليد ناخالص داخلي امريكا را به همراه ۱۳۲۰ وظيفه تخصصي پوشش مي‌دهد. بخش ديگري از آنچه اوپن‌اي‌آي درباره بررسي گسترده معيارهاي GDPVal و كاربردي بودن آن در مقايسه با ساير معيارها مي‌گويد، به اين شرح است: GDPval هم از نظر واقع‌گرايي و هم از نظر تنوع وظايف مورد ارزيابي، متمايز است. برخلاف ساير ارزيابي‌هاي مرتبط با ارزش اقتصادي كه بر حوزه‌هاي ويژه تمركز دارند، GDPval وظايف و مشاغل زيادي را پوشش مي‌دهد و برخلاف معيارهايي كه شامل ايجاد مصنوعي وظايف به سبك يك امتحان يا آزمون دانشگاهي هستند، GDPval بر وظايف مبتني بر نتايج قابل تحويل تمركز مي‌كند كه يك كار يا محصول واقعي هستند يا يك محصول كاري مشابه به شمار مي‌روند. 

يكي ديگر از پيشرفت‌هايي كه كاربران درباره نسخه 5.2 به آن اشاره مي‌كنند، مربوط به يادگيري ماشيني كلاسيك است كه مهندسان در آن توانايي يك برنامه را براي هم‌گرايي يا ادغام اطلاعات به روشي هدفمند بررسي كردند.

روش‌هاي بسياري براي فكر كردن درباره اين موضوع وجود دارد؛ از تحليل چگونگي درك داده‌هاي بصري توسط يك ارگانيسم بيولوژيكي گرفته تا توجه به اينكه چگونه تغييرات ابعادي بر نتيجه توجه يك شبكه عصبي تأثير مي‌گذارند، اما برخي از كاربران اوليه ادعا مي‌كنند نسخه 5.2 در هم‌گرايي، انسجام و هدف قرار دادن نتيجه‌اي كه منطقي است، بهتر عمل مي‌كند. برخي از انسان‌ها نيز در اين زمينه بهتر از ديگران هستند. اين موارد تنها بخشي از نكات شنيده‌شده درباره 5.2 GPT هستند و مطمئنا به‌روزرساني‌هاي بسياري براي آن ارايه خواهد شد.