سخنان احساسی حاصل از بازی های رایانه ای

چکیده:

در این مقاله پتانسیل بازی های رایانه ای و شبیه سازی ها در قالب عاملی در برانگیختن سخنان عاطفی به ویژه در تکنولوژیهای سخنرانی با استفاده از کامپیوترComputer based speech technologies  بررسی شده است. نتایج اولیه تحلیل شنوایی 30 نمونه که بازیهای رایانه ای تعاملی انجام می‌دادند، ارائه شده است. این بازی تغییر پیدا کرد تا دو مورد از ابزارهای ارزیابی محرک ها ( رضایت درونی و هدف مداری) که طبق گفته Schere مقدمه ای برای احساسات است، را اجرا کنند.

مقدمه:

پیشرفت های تکنیکی در فرآیند های سیگنالی موجب پیشبرد تکنولوژی های کلامی می‌شود، که بسیاری از آنها کاربردی و تجاری است. صداشناسی اتوماتیک، تشخیص صدا و سیستم های ترکیب گفتار نمونه هایی از چنین تکنولوژی هایی بوده که می‌توانند به طور کاملاً مفیدی در قسمت هایی همچون، تلفن بانک و فعالیتهای اطلاعات کامپیوتری به کار روند. علی رغم سیستم های جاری، پیچیدگی های سیستم‌ها، اعتبارات و سودمندی آنها به عواملی همچون تأثیری که بر گفتار دارد، حالات گذرا، تغییراتی که بر گوینده دارد، ازقبیل استرس فیزیولوژیکی، حالات حسی و نگرش گوینده محدود می‌شود. تحقیق های قبلی  نشان میدهند که این تغییرات در حالات گوینده سیگنالهای کلامی شنیداری را به روش های خاص و پایداری تغییر می‌دهد. چنین دانشی در تغییرحالات گوینده و تکنولوژی تشخیص صدا منجر به سیستم های قدرتمندی می‌شود که حاصل انتخاب پارامترها و الگوریتم های پردازشی و نیز توسعه تکنیک های تولید کلام است که حالات گذرا را  در گوینده کم می‌کند. سیستم ترکیب گفتار، که در حال حاضر محدود به صداهای غیرطبیعی است، از اطلاعات نگرشی و احساسی در شکل پارامترهای سوپراسگمنتال Suprasegmental  و عروضیprosodic  موجود است. همانطور که "مورای و آروت" می‌گویند، تولیدات بیشتر با کیفیت بالا در سیستم ترکیب گفتارهای احساسی نیازمند یک مدل کامل از فرآیند احساسی شامل اثرات سیستم های عصبی و تغییرات شنوایی است که البته چنین مدلی هنوز موجود نیست.  

2. یک رویکرد علمی

بر اساس یکی از مدل هایی که توسط Scherer  ارائه شده است، احساس مجموعه ای از فرآیندهای تعاملی ذهنی و فیزیولوژیکی است. در این مدل که بر اساس نظرات روانشناسی ارائه شده است، احساسات نتیجه ارگانیزمی است که مداوماً محیط را بر حسب اهمیت آن برای اهداف، نقشه ها و رفاه و خوشی این ارگانیزم، مورد بررسی قرار می‌دهد. موقعیت هایی که در آن اتفاقات در محیط مرتبط با ارگانیزیمی ارزیابی می‌شوند، منجر به یک اپیزود احساسی شده که در آن زیر مجموعه هایی وجود دارد که از نظر کاربردی تطبیق داده شده تا خطرات را کم کرده و فواید را افزایش دهد. Scherer پیشنهاد می‌دهد که پنج زیر مجموعه وجود دارد که مسئول فعالیتهای ذهنی، عکس العمل های پر معنی و فیزیولوژیک بوده که مطابق اپیزود های احساسی است. عنصر مدل پردازش در پیش بینی های خاص تغییرات فیزیولوژی که ممکن است انواع احساسات را موجب شود، گسترده می‌شود. این پیش بینی های فیزیولوژیکی با دانش تعامل بین فیزیولوژی صوتی، کیفیت صدا و توصیفات صوتی گفتار ادغام شده تا به پیش بینی های صوتی و آوایی تعدادی از حالات احساسی برسند.

اگرچه این پیش بینی‌ها ساختاری از ابراز احساسات کلامی را ارائه می‌دهد این مطالعات می‌تواند در آزمودن فرضیه ها ی خاص به کار گرفته شود. بدین ترتیب باعث می‌شود که تعبیر و تفسیر فرضیه ها آسان گردد. پیش بینی های Scherer این است که آنها بر اساس لغات احساسی زبان عمومی که اغلب نامفهوم بوده، نیستند. در عوض، حالت گوینده بر حسب ارزیابی او در محیط موردارزیابی قرار می‌گیرد. با استفاده از این رویکرد نظری می‌توان تغییرات کلامی گوینده را در جوانب احساسی مرتبط با موقعیت تفسیر کرد. فواید این این نمونه هنگام بررسی کاربردهای دانش به دست آمده از سناریوهای دنیای واقعی با تکنولوژی های کلامی مدرن کاملاً مشهود است.

3. احساست  آنی و برانگیخته شده

Scherer  پیشنهاد داده است که اطلاعات صوتی که مرتبط با حالات گوینده هستند، نه تنها به احساسات بستگی ندارد، تغییرات فیزیولوژیکی سیستم تولید گفتار کلامی با تطبیق کنترل شده تولید کلام نیز مرتبط است. هدف در ترکیب گفتار، تغییر بازده سیستم های گفتاری در تولید گفتاری است که احساسی طبیعی به نظر می‌رسد.  گفتار احساسی که از اکترها به دست میآید، برای استفاده در تحقیقات که هدفش افزودن عبارات احساسی در ترکیب گفتار است، مناسب و مطلوب به نظر می‌رسد.

با تشخیص صدا و سیستم های تأیید گوینده، مشکلی که با احساسات باقی می‌ماند، تغییراتی است که در سخنان گوینده ایجاد می‌شود و گوینده نمی‌تواند آن را کنترل کند. حالات احساسی تأثیرگذار منجر به تغییر در سیگنالهای کلامی می‌شود، که هیچ هدفی را در سیستم های فیزیولوژیکی دنبال نمی کنند. به منظور درک تغییر پذیری سخن با هدف بهبود سخن و سیستم های تشخیص گوینده، لازم است تا سخنرانی های احساسی و نیز سخنانی که در شرایط احساسی واقعی انجام می‌شود، را آزمایش کرد.

متأسفانه، این نوع تحقیق به دلیل مشکلات اجرایی،  بسیار کم انجام می‌شود. مطالعات میدانی درباره احساسات زندگی واقعی به دلیل اینکه با بسیاری از عواملی که حالات احساسی گوینده را مشخص می‌کند، مشکل کم انجام می‌شود. "مارتین" انواع تکنیک هایی که در تجربیات  ایجاد احساس مورد استفاده قرار می‌گیرد را ارائه کرده است. این موارد به طور نمونه شامل تکنیک های ذهنی، ارائه فیلم ها و داستان های احساسی و تکنیک هایی که بر اساس یادآوری تجربیات گذشته است. لزوماً مشکلی که با این تکنیک ها وجود دارد، این است که قیود اخلاقی باعث می‌شود که تعدادی از احساسات را نتوان ارائه داد.

4. ایجاد احساس با کامپیوتر

اخیراً استفاده از بازیهای رایانه‌ای و شبیه سازی در ایجاد احساسات واقعی نشان داده شده است. توانایی شبیه سازی های رایانه ای به علت نزدیک بودن با زندگی واقعی احساسات متفاوتی را برای فرد به ارمغان میآورد. بازیها و شبیه سازی ها دارای مدل های احساسی بوده که می‌تواند در شرایط واقعی به کار گرفته شوند. به علاوه بازیها به بازیکن این اختیار را می‌دهند تا در شرایطی قرار بگیرند که در زندگی واقعی امکان پذیر نیست. تعامل بالا در بازیهای رایانه‌ای احساسات بیشتری را موجب می‌شوند که در فعالیتهای غیر پویا از قبیل تماشای فیلم نمی‌توان یافت. بازیهای رایانه‌ای مدرن با گرافیک و صدای واقعی به این واقعیت افزوده و بازیکن را درگیرتر می‌کنند. برای یک نقطه نظر تجربی، بازیهای رایانه ای این مزیت را دارند که در محیط‌های آزمایشگاه های کنترل شده قابل بازی کردن بوده و قابلیت ضبط سخن را باکیفیت بالا دارند. همچنین یک فایده بازیهای رایانه‌ای این است که میتوان مطابق با فرضیه های تئوریک یک سری حالات احساسی را تغییر داد. به علاوه، بسیاری از عوامل دخیل در زندگی واقعی غیر قابل کنترل بوده که می‌توان در بازی های رایانه‌ای کنترل کرد.

گروه تحقیقاتی ما در ژنوا گام های اولیه ای را در استفاده از بازیهای رایانه ای و شبیه سازی ها در ایجاد یک سری از احساسات برداشته است. امید است که سنجش های صوتی به درک حالات فیزیولوژیکی ، روانشناسی و سخن کمک کند. به طور ویژه این مطالعات با هدف کشف اثرات آنی و داوطلبانه احساسات سخنی انجام می‌شود.

5. طراحی تحقیق

یک سری از مطالعات در حال اجرا است تا تفاوت های صوتی در پاسخ های کلامی تحت کامپیوتر از (بررسی ارزیابی محرک های SECs ) را نتیجه گیری کند. برای این منظور بازی XQuest ) ) انتخاب شد.

در طول بازی، بازیکن با انواع مختلف مشکلات و موانع (کشت های فضایی دشمن)، موانع غیر پویا (معادن دشمنان) و ابزارهای مفید در جهت توانایی ها و قدرتهای خود مواجه می‌شود. گیمر با استفاده از موس کشتی فضایی را کنترل می‌کند. بازی برای اهداف مشخص اش (تکمیل هر مرحله ) و نیز امکان استفاده از عناصر بازی مطابق با نتایج  SEC  انتخاب شده است. تعدادی ویرایشات نیز در بازی انجام شده است. تعدادی از ارزیابی ها در این بازی آورده شده است.

در هر جلسه بازیکن از یک هدفون استفاده کرده و یک ساعت بازی می‌کند. او باید یک سری گزارشاتی را شفاهاً اعلام کند. گزارشات باید بر اساس یک سری عبارات و کلمات باشد. تعامل با اعضای گروه یک سری سخنان فی البداهه را موجب می‌شود.

جدول 1: استفاده از SECs  در بازیهای رایانه ای

1. تازگی:     بالا. اشیائ بازی که قبلاً با آنها روبرو نشده اند، ظاهر می‌شود.

                  پایین اشیائ بازی که قبلاً با آنها روبرو شده اند، ظاهر می‌شود.

2. رضایت درونی:     بالا: صداهای خوشایند به همراه حوادث

                             پایین: صداهای نا خوشایند به همراه حوادث

3.  اهمیت هدف/ نیاز:    

الف) ارتباط         بالا: اشیایی که برای خوب بودن بازیکن حیاتی هستند.

                       پایین: اشیایی که هیچ ربطی به بازیکن ندارد، ظاهر می‌شود.

ب) کمک کنندگی:     بالا: موضوعات دوستانه و با ارزشند.

                             پایین: مورد دشمن و مخرب است.

پ) ضرورت:     بالا: اغلب سریع پاسخ داده تا در برابر دشمن دفاع و به دوستان کمک کنند.

4. توانایی در کنار آمدن

الف) علت: بررسی بر حسب ارزیابی های صوتی توسط موضوعاتی است که علت یک حادثه است. بنابراین در موارد خاص، موضوع ارزیابی این است که آیا علت حادثه درونی (خود) و یا بیرونی (دیگران) و یا از روی شانس اتفاق افتاده است.

ب) کنترل:     بالا: بازیکن کشتی را کاملاً کنترل میکند.

                  پایین: کنترل سفینه در اثر اختلالاتی با مشکل مواجه می‌شود.

ج) تعدیل:     بالا: بازیکن در صورت آسیب دیدن کشی دیگری نیز دارد.

                  پایین: بازیکن کشتی دیگری ندارد.

5. سازش پذیری به خود:

الف) استانداردهای بیرونی:     بالا. بازیکن یک شی دوست داشتی را نجات می‌بخشد.

                                          پایین: بازیکن به یک شی دوست داشتی آسیب می‌رساند.

ب) استانداردهای درونی:        بالا. بازیکن در مقابل دشمنان سرسخت به پیروزی می‌رسد.

                                          پایین: بازیکن دز مقابل دشمنان ضعیف شکست می‌خورد.

نتایج اولیه:

از ارزیابی نتایج رضایت درونی و هدف‌ مداری مطالعه‌ای گرفته تا تفاوت های صوتی در پاسخ های صوتی بررسی شود. رضایت درونی با استفاده از صداهای خوشایند و غیر خوشایند مورد ارزیابی قرار گرفت. هدف مداری نیز با استفاده از نقاطی در بازی که موجب رسیدن به هدف می‌شدند (بازیکن به مراحل بالاتر میرود) و یا کاملاً بازیکن را از رسیدن به هدفش باز میدارد (کشتی بازیکن خراب می‌شود)ارزیابی می‌شود. همزمان با رسیدن بازیکن به مراحل بالاتر و یا از دست دادن زندگی اش، صداهای خوشایند و غیر خوشایندی به گوش او می‌رسد. گفتار با استفاده از گزارشات صوتی که در صفحه نمایش نشان داده می‌شود، ایجاد می‌شود. از بازیکن خواسته می‌شود تا اتفاقات را گزارش دهد. این صفحه نمایش میخواهد که حروف و عبارات تلفظ شوند.

نتایج در جدول 1 نشان داده شده است و با جزئیات توضیح داده خواهد شد. قبل از تعمیم دادن کلی این یافته ها باید با جریانات بازی بیشتری مورد آزمایش قرار گیرد. اطلاعات همچنین حاکی از ان است که بازیهای رایانه ای در حالات روانی اثر گذاشته و در نهایت بر گفتار نیز تأثیر گذار هستند. وقفه ای که بین حادثه ایجاد میشد تا بازیکن چیزی را بگوید، خود فاصله ای بود بین حالتی که بازیکن و گفتار او ایجاد می‌کند. امید آن است که در آینده بتوان با  ترکیب گفتار و بازیهای رایانه ای به اهداف بالاتری برسیم.

نمودار در مقاله انگلیسی آمده است..

7. خلاصه تحقیق

این مقاله اهمیت تحقیق در گفتار موثر در تلاش جهت بهبود قدرت تشخیص گفتار و تکنولوژی صداشناسی انجام شده است. ملزومات مطالعه در جهت گفتارهای واقعی، موثر و آنی و نیز مشکلاتی که در اینگونه مطالعات وجود دارد، آورده شده است. برای غلبه بر این مشکلات یک طرح تجربی که درآن از بازیهای رایانه‌ای استفاده میشود تا بر اساس دانش روان شناسی، احساسات برانگیخته شده و در نتیجه گفتار موثر حاصل شود. نتایج اولیه نشان میدهد که میتوان از چنین رویکردی استفاده کرد. امید ان است که این تحقیق دانش بیشتری را در زمینه تاثیر احساس بر گفتار ارائه داده باشد و در مشکلاتی که در اعتبار و سختی تکنولوژی های گفتاری وجود دارد، به کار گرفته شود.    

نویسنده: تام جانسون

دانشگاه ژنوا      

 سال انتشار: 1996