«نانوبنانا» در ارايه عكس‌هاي واقع‌گرايانه بهتر از «چت‌جي‌پي‌تي» است

۱۴۰۴/۱۰/۰۸ - ۰۲:۰۶:۲۶
کد خبر: ۳۷۱۸۳۸

يك مقاله جديد، قابليت توليد تصوير دو مدل هوش مصنوعي «چت‌جي‌پي‌تي» و «نانوبنانا» را براي ايجاد عكس‌هاي آرشيوي با يكديگر مقايسه كرده و برتري نانوبنانا را در ارايه عكس‌هاي واقع‌گرايانه، داراي ثبات و قابليت استفاده براي متخصصان برجسته كرده است.

به گزارش ايسنا، در عرصه‌ هوش مصنوعي كه به سرعت تكامل مي‌يابد و فناوري‌هاي مولد تصوير، صنايع خلاق را متحول مي‌كنند، رقابت شديدي بين قابليت‌هاي توليد تصوير «چت‌جي‌پي‌تي» شركت «اوپن‌اي‌آي»و «نانوبنانا پرو» شركت «گوگل» پديد آمده است. به گزارش وب ‌پرو نيوز، اين رقابت تنها درباره توليد تصاوير زيبا نيست، بلكه درباره توليد گزينه‌هاي كاربردي و با كيفيت بالاست كه متخصصان بازاريابي، طراحي و رسانه مي‌توانند بدون نياز به دوباره‌كاري گسترده از آنها استفاده كنند. پيشرفت‌هاي اخير، نحوه مديريت اين پلتفرم‌ها را در ايجاد عكس‌هاي آرشيوي برجسته كرده است. در اين جايگاه، واقع‌گرايي، قابليت استفاده و پايبندي به دستورالعمل‌ها برنده را تعيين مي‌كند. اين بررسي عميق با استفاده از مقايسه‌هاي عملي و تحليل‌هاي تخصصي بررسي مي‌كند كه چرا يك فناوري در ارايه تصاوير آرشيوي مناسب پيشي مي‌گيرد؛ در حالي كه ديگري با ناسازگاري‌هايي دست‌وپنجه نرم مي‌كند كه پتانسيل آن را تضعيف مي‌كنند. هسته اصلي اين رويارويي، تفاوت‌هاي اساسي در نحوه پردازش ورودي‌هاي كاربر و ارايه خروجي‌ها توسط هر سيستم است. چت‌جي‌پي‌تي كه توسط جديدترين مدل‌هاي اوپن‌اي‌آي پشتيباني مي‌شود، گام‌هاي بلندي را در ادغام مستقيم توليد تصوير در رابط مكالمه‌اي خود برداشته است و به كاربران امكان مي‌دهد تا از طريق زبان طبيعي، تصاوير را تكرار كنند. با وجود اين، آزمايش‌ها نشان مي‌دهند كه اگرچه چت‌جي‌پي‌تي در خلاقيت عالي است، اما اغلب در توليد تصاوير آماده استفاده كه آرشيوهاي عكس به آن نياز دارند، دچار مشكل مي‌شود. در مقابل، نانوبنانا پرو از الگوريتم‌هاي پيشرفته براي اولويت‌بندي «واقع‌گرايي عكس‌وار» يا «فوتورئاليسم» و حفظ جزييات استفاده مي‌كند و اين ويژگي، آن را به گزينه‌اي مناسب براي متخصصاني تبديل مي‌كند كه به فناوري‌هاي تقليدكننده از عكاسي سنتي نياز دارند. ناظران صنعت خاطرنشان مي‌كنند كه تلاش براي ارايه فناوري‌هاي مولد تصوير بهتر، حاصل تقاضاي گسترده‌تر براي هوش مصنوعي است تا خلاقيت انسان را بدون جايگزيني كامل آن تقويت كند. در قلب چت‌جي‌پي‌تي، يك مدل ارتقاءيافته وجود دارد كه زمان توليد سريع‌تر -تا چهار برابر سريع‌تر از مدل‌هاي پيشين- و بهبود وفاداري به دستورالعمل‌هاي كاربر را نويد مي‌دهد. براساس اطلاعات منتشرشده در پلتفرم‌هاي اجتماعي مانند ايكس و خبرهاي اوپن‌اي‌آي از بهبودهايي با تمركز بر عناصر سازگار مانند نورپردازي و ظاهر سوژه در ويرايش‌ها، چت‌جي‌پي‌تي با هدف يكپارچه‌سازي گردش‌هاي كاري طراحي شده است. با وجود اين، وقتي وظيفه پردازش تصاوير آماده مانند يك صحنه شلوغ اداري يا يك منظره آرام طبيعت بر عهده چت‌جي‌پي‌تي قرار مي‌گيرد، اغلب مصنوعات يا ويژگي‌هاي سبكي را نشان مي‌دهد كه به پردازش بعدي نياز دارند. از سوي ديگر، نانوبنانا پرو براساس چارچوب هوش مصنوعي «جميناي» گوگل ساخته شده و قابليت‌هاي چندوجهي را در خود جاي داده است كه درك متن را با توليد بصري تركيب مي‌كنند. بررسي‌ها بر مهارت آن در انجام دادن ويرايش‌هاي پيچيده بدون ايجاد اختلال در يكپارچگي كلي تصوير تأكيد دارند. اين ويژگي براي ايجاد عكس‌هاي آرشيوي كه در آنها دقت كليد اصلي به شمار مي‌رود، بسيار ارزشمند است. كاربران گزارش داده‌اند كه نانوبنانا مي‌تواند صحنه‌هاي فوق‌العاده واقع‌گرايانه‌اي مانند يك محصول در پس‌زمينه خنثي را با حداقل خطاهاي هشدار ايجاد كند. مقايسه‌ها درباره سرعت و دسترسي نيز انجام شده‌اند. در حالي كه چت‌جي‌پي‌تي فناوري‌هاي تصويري را در رابط چت خود ادغام مي‌كند و آن را براي تازه‌كارها كاربرپسند مي‌سازد، نانوبنانا يك ويرايشگر اختصاصي را ارايه مي‌دهد كه براي حرفه‌اي‌ها مناسب است. يك بررسي شامل تطبيق‌هاي سريع مستقيم نشان داد نانوبنانا در سناريوهايي كه به كيفيت سينمايي نياز دارند، مانند شخصيتي در يك محيط پويا، عملكرد بهتري دارد و اين امر بر قابليت اطمينان آن براي ارايه خروجي‌هاي حرفه‌اي تأكيد مي‌كند. عكاسي آرشيوي به چيزي بيش از زيبايي‌شناسي نياز دارد. اين كار مستلزم تطبيق‌پذيري، حساسيت فرهنگي و پايبندي به استانداردهاي تجاري است. آزمايش‌هايي با درخواست‌هاي يكسان، نتايج شگفت‌انگيزي را نشان دادند. نانوبنانا به‌طور مداوم تصاويري را توليد مي‌كرد كه نه تنها واقع‌گرايانه‌تر بودند، بلكه از نظر بازنمايي نيز متنوع‌تر بودند و از تعصباتي كه گاهي اوقات در خروجي‌هاي چت‌جي‌پي‌تي رخنه مي‌كنند، دوري مي‌كردند. براي مثال، وقتي از نانوبنانا خواسته شد تصاويري را از متخصصان گوناگون در يك اتاق هيات‌مديره ايجاد كند، در نمايش حالت‌ها و لباس‌هاي طبيعي عالي عمل كرد و صحنه‌ها را باورپذير و فراگير ساخت. براساس آزمايش‌هاي عملي گزارش‌شده در وبلاگ‌هاي گوناگون فناوري، اگرچه چت‌جي‌پي‌تي توانمند بود، اما گاهي اوقات ناهنجاري‌هايي را مانند نورپردازي نامناسب يا ژست‌هاي غيرطبيعي نشان مي‌داد. اين امر، نانوبنانا را براي آژانس‌هايي كه به خروجي سريع و بدون تعصب نياز دارند، در اولويت قرار مي‌دهد. علاوه بر اين، گردش كار ويرايش به‌طور قابل توجهي متفاوت است. چت‌جي‌پي‌تي امكان تغييرات تكراري را از طريق گفت‌وگو فراهم مي‌كند كه نوآورانه است، اما اگر مدل دستورالعمل‌ها را اشتباه تفسير كند، مي‌تواند به بروز خطا منجر شود. رابط كاربري نانوبنانا از اصلاحات دقيق پشتيباني مي‌كند و جزييات را در نسخه‌هاي گوناگون حفظ مي‌كند. اين قابليت براي تكرار عكس‌هايي كه در آنها ثبات بسيار مهم است، يك مزيت به شمار مي‌رود. عرصه رقابت در حال داغ شدن است و محصولات اوپن‌اي‌آي مستقيماً تسلط گوگل را به چالش مي‌كشند. اگرچه گزارش شده كه مدل جديد چت‌جي‌پي‌تي سريع‌تر است، اما سرعت به تنهايي تضمين‌كننده برتري در كيفيت عكس‌ نيست. به‌روزرساني‌هاي «جميناي ۳» گوگل نشان‌دهنده پيشرفت‌هاي گسترده‌تري هستند كه مي‌توانند برتري نانوبنانا را بيشتر تثبيت كنند. با گسترش فناوري‌هاي هوش مصنوعي، ملاحظات اخلاقي اهميت پيدا مي‌كنند. توليد عكس‌هاي آرشيوي بايد مسائل مربوط به حق چاپ و اصالت را در نظر بگيرد؛ يعني حوزه‌هايي كه هر دو پلتفرم در حال پيشبرد حفاظت از آنها هستند. با وجود اين، واقع‌گرايي برتر نانوبنانا نياز به مداخله انساني را كاهش مي‌دهد و ممكن است آژانس‌هاي سنتي آرشيو عكس را مختل ‌كند. پست‌هاي اوپن‌اي‌آي در پلتفرم ايكس، بهبودهايي را در پايبندي به نيت آن نشان مي‌دهند، اما بازخورد جامعه نشان مي‌دهند كه نانوبنانا در چالش‌هاي بيش از حد واقع‌گرايانه پيروز است. ادغام اين فناوري‌ها در اكوسيستم‌هاي گسترده‌تر نيز اهميت دارد. رويكرد مبتني بر گفت‌وگو چت‌جي‌پي‌تي براي توفان فكري مناسب است؛ در حالي كه ويرايشگر مستقل نانوبنانا براي كاربران تخصصي جذابيت دارد. براي عكس‌هاي آرشيوي، دقت ويرايشگر دومي برنده است. اخبار جديد حاكي از آن است كه همكاري‌ها و به‌روزرساني‌ها مي‌توانند پويايي را تغيير دهند. با وجود اين، تاكنون كه به اواخر سال ۲۰۲۵ رسيده‌ايم، نانوبنانا تاج و تخت را در حوزه توليد تصاوير كاربردي در اختيار دارد. در نهايت، اين رقابت به نفع كاربران است و نوآوري‌هايي را پيش مي‌برد كه نقش هوش مصنوعي را در زمينه‌هاي خلاقانه اصلاح مي‌كنند. متخصصان بايد هر دو را آزمايش كنند اما در حال حاضر نانوبنانا در ارايه تصاوير آماده كه به‌طور يكپارچه با تلاش‌هاي تجاري تركيب مي‌شوند، پيشتاز است.

بیمه ملت