«يوتيوب» كلاس درس لبخواني براي يك ربات شد
پژوهشگران يك ربات انساننما را با روش يادگيري ديداري-شنيداري خودنظارتي آموزش دادند. به گزارش ايسنا، پژوهشگران در دانشكده مهندسي كلمبيا يك ربات انساننما به نام «اِمو» را آموزش دادهاند تا گفتار و آواز را با بررسي و يادگيري از روي ويديوهاي آنلاين لبخواني كند. اين نشان ميدهد كه ماشينها اكنون ميتوانند رفتار پيچيده انساني را تنها با مشاهده ياد بگيرند.
پژوهشگران يك ربات انساننما را با روش يادگيري ديداري-شنيداري خودنظارتي آموزش دادند. به گزارش ايسنا، پژوهشگران در دانشكده مهندسي كلمبيا يك ربات انساننما به نام «اِمو» را آموزش دادهاند تا گفتار و آواز را با بررسي و يادگيري از روي ويديوهاي آنلاين لبخواني كند. اين نشان ميدهد كه ماشينها اكنون ميتوانند رفتار پيچيده انساني را تنها با مشاهده ياد بگيرند.
به نقل از ديجيتالترندز، اِمو يك ربات با بدن كاملا انساننما نيست بلكه يك چهره رباتيك است كه بسيار واقعي ساخته شده و براي بررسي چگونگي ارتباط انسانها به كار ميرود. اين چهره رباتيك با پوست سيليكوني پوشيده شده و توسط ۲۶ موتور مستقل صورت كنترل ميشود كه لبها، فك و گونهها را حركت ميدهند.
اين موتورها به اِمو اجازه ميدهند شكلهاي دقيق دهان را بسازد كه ۲۴ حرف صامت و ۱۶ مصوت را پوشش ميدهند كه براي گفتار و آواز خواندن طبيعي، حياتي است. هدف كاهش اثر «دره وهمانگيز» بود. اين اصطلاح براي توصيف حالتي به كار ميرود كه در آن رباتها تقريبا شبيه انسان به نظر ميرسند اما از آنجا كه هنوز حركات صورتشان با صدايشان مطابقت ندارد، حالتي وهمانگيز پيدا ميكنند. فرآيند يادگيري در چند مرحله اتفاق افتاد. ابتدا اِمو چهره خودش را با حركت دادن موتورها در حالي كه خودش را در آينه نگاه ميكرد، بررسي كرد.
اين به سامانه كمك كرد بفهمد فرمانهاي موتوري چگونه شكلهاي صورت را تغيير ميدهند. سپس پژوهشگران يك خط لوله يادگيري معرفي كردند كه صدا را به حركت وصل ميكند. اِمو ساعتها ويديوهاي يوتيوب از افراد در حال صحبت و آواز خواندن را تماشا كرد، در حالي كه يك مدل هوش مصنوعي رابطه بين صدا و حركت قابل مشاهده لب را تحليل ميكرد. به جاي تمركز بر زبان يا معنا، سامانه صداهاي خام گفتار را مطالعه كرد. يك «مبدل كنش چهره» آن الگوهاي يادگرفتهشده را به فرمانهايي در لحظه تبديل كرد.
اين رويكرد به اِمو اجازه داد نه تنها در انگليسي بلكه در زبانهايي كه هرگز آموزش نديده بود لبخواني كند، از جمله فرانسوي، عربي و چيني. همان روش براي آواز هم كار كرد، كه به خاطر كشيده شدن مصوتها و تغييرات ريتم سختتر است.
پژوهشگران ميگويند اين مطالعات اهميت دارند زيرا رباتهاي آينده اگر قرار است در كنار مردم كار كنند بايد طبيعي ارتباط برقرار كنند. افزودن مواردي مانند پوست مصنوعي كه به رباتها حساسيت شبيه انسان ميدهد و همراه با لبخواني واقعي، به راحتي نشان ميدهد كه رباتها شروع كردهاند كمتر شبيه ماشين و بيشتر شبيه همراهان اجتماعي ما شوند. اِمو هنوز يك پروژه پژوهشي است، اما نشان ميدهد كه رباتها ممكن است روزي مهارتهاي انساني را همانطور كه ما ياد ميگيريم، با تماشا و گوش دادن، بياموزند.
