«يوتيوب» كلاس درس لب‌خواني براي يك ربات شد

۱۴۰۴/۱۰/۲۸ - ۰۳:۰۲:۱۷
کد خبر: ۳۷۴۰۵۲

پژوهشگران يك ربات انسان‌نما را با روش يادگيري ديداري-شنيداري خودنظارتي آموزش دادند. به گزارش ايسنا، پژوهشگران در دانشكده مهندسي كلمبيا يك ربات انسان‌نما به نام «اِمو» را آموزش داده‌اند تا گفتار و آواز را با بررسي و يادگيري از روي ويديوهاي آنلاين لب‌خواني كند. اين نشان مي‌دهد كه ماشين‌ها اكنون مي‌توانند رفتار پيچيده انساني را تنها با مشاهده ياد بگيرند.

پژوهشگران يك ربات انسان‌نما را با روش يادگيري ديداري-شنيداري خودنظارتي آموزش دادند. به گزارش ايسنا، پژوهشگران در دانشكده مهندسي كلمبيا يك ربات انسان‌نما به نام «اِمو» را آموزش داده‌اند تا گفتار و آواز را با بررسي و يادگيري از روي ويديوهاي آنلاين لب‌خواني كند. اين نشان مي‌دهد كه ماشين‌ها اكنون مي‌توانند رفتار پيچيده انساني را تنها با مشاهده ياد بگيرند.

به نقل از ديجيتال‌ترندز، اِمو يك ربات با بدن كاملا انسان‌نما نيست بلكه يك چهره رباتيك است كه بسيار واقعي ساخته شده و براي بررسي چگونگي ارتباط انسان‌ها به كار مي‌رود. اين چهره رباتيك با پوست سيليكوني پوشيده شده و توسط ۲۶ موتور مستقل صورت كنترل مي‌شود كه لب‌ها، فك و گونه‌ها را حركت مي‌دهند.

اين موتورها به اِمو اجازه مي‌دهند شكل‌هاي دقيق دهان را بسازد كه ۲۴ حرف صامت و ۱۶ مصوت را پوشش مي‌دهند كه براي گفتار و آواز خواندن طبيعي، حياتي است. هدف كاهش اثر «دره‌ وهم‌انگيز» بود. اين اصطلاح براي توصيف حالتي به كار مي‌رود كه در آن ربات‌ها تقريبا شبيه انسان به نظر مي‌رسند اما از آنجا كه هنوز حركات صورتشان با صدايشان مطابقت ندارد، حالتي وهم‌انگيز پيدا مي‌كنند. فرآيند يادگيري در چند مرحله اتفاق افتاد. ابتدا اِمو چهره خودش را با حركت دادن موتورها در حالي كه خودش را در آينه نگاه مي‌كرد، بررسي كرد.

اين به سامانه كمك كرد بفهمد فرمان‌هاي موتوري چگونه شكل‌هاي صورت را تغيير مي‌دهند. سپس پژوهشگران يك خط لوله يادگيري معرفي كردند كه صدا را به حركت وصل مي‌كند. اِمو ساعت‌ها ويديوهاي يوتيوب از افراد در حال صحبت و آواز خواندن را تماشا كرد، در حالي كه يك مدل هوش مصنوعي رابطه بين صدا و حركت قابل مشاهده لب را تحليل مي‌كرد. به جاي تمركز بر زبان يا معنا، سامانه صداهاي خام گفتار را مطالعه كرد. يك «مبدل كنش چهره» آن الگوهاي يادگرفته‌شده را به فرمان‌هايي در لحظه تبديل كرد.

اين رويكرد به اِمو اجازه داد نه تنها در انگليسي بلكه در زبان‌هايي كه هرگز آموزش نديده بود لب‌خواني كند، از جمله فرانسوي، عربي و چيني. همان روش براي آواز هم كار كرد، كه به خاطر كشيده شدن مصوت‌ها و تغييرات ريتم سخت‌تر است.

پژوهشگران مي‌گويند اين مطالعات اهميت دارند زيرا ربات‌هاي آينده اگر قرار است در كنار مردم كار كنند بايد طبيعي ارتباط برقرار كنند. افزودن مواردي مانند پوست مصنوعي كه به ربات‌ها حساسيت شبيه انسان مي‌دهد و همراه با لب‌خواني واقعي، به راحتي نشان مي‌دهد كه ربات‌ها شروع كرده‌اند كمتر شبيه ماشين و بيشتر شبيه همراهان اجتماعي ما شوند. اِمو هنوز يك پروژه پژوهشي است، اما نشان مي‌دهد كه ربات‌ها ممكن است روزي مهارت‌هاي انساني را همانطور كه ما ياد مي‌گيريم، با تماشا و گوش دادن، بياموزند.