コミュニケーションを円滑化する技術
はじめに
インターネットは時間や場所の制約をなくして、コミュニケーションの幅を大きく拡張したと言われている。確かに、その通りであるが、従来の、所謂、フェイス・トゥ・フェイスのコミュニケーションと比べて、見劣りしないか、と言えば、そうではない。我々が、面と向かって、言葉を使いコミュニケーションする場合、コンピュータ上においてテキストで扱われる情報以外に様々な情報が飛び交っている。また、言葉に関しても、その理解は複雑である。ここでは、「会話の理解」という部分と、「テキスト情報以外の伝達」という二つの技術について、可能性を検討する。
1.会話の理解
音声認識技術は非常に進化してきており、音声入力ソフトも市場に出回っている昨今、会話の認識は非常に容易なような気がするが、実際にはそれ程簡単ではない。コンピュータが会話を認識するためにはいくつかの問題が存在する。
例えば、我々は、会話を交わす上で度々、主語や述語を省略したりする。我々は、前後の文脈や相手のジェスチャー等で、主語や述語を補完して、頭で理解することができるが、定型的な文法を基本として処理するようなコンピュータでは、このような省略を処理することが難しくなる。
また、程度の理解も難しい。「もう少し」と言った場合に、それがどの程度の量を表すのか、言葉からだけでは理解が難しい。我々は実際の分量等を目にしたり、これまでの記憶から標準的な分量と照らしたりして、「もう少し」を的確にイメージできる。これは位置関係に関しても言えることである。「あっち」、「こっち」という言葉を我々は使うが、これらは相対的な位置関係を把握した上で意味を為す言葉である。したがって、コンピュータで処理する場合、対話者との位置関係の把握が前提条件となる。
それ以外に、我々の会話の中には、間接発話行為というものが存在する。すなわち、発話した文章が持つ意味と異なる意味がそこに加えられている場合がある。例えば、私が友達と一緒に自動車に乗っており、「今日は暑いなあ?」と言葉を発した場面を想像してもらいたい。おそらく、友達は「はい」や「いいえ」と返事するのではなく、クーラーのスイッチを入れるであろう。このような間接発話行為をコンピュータで処理することも難しい課題である。
このような課題に対応し、コンピュータで会話がスムーズに処理できるよう、様々な研究が進められている。例えば、発生された各文章から中間的な意味を生成し、内容の理解を高めたり、話者の発音の微妙な変化から、感情の変化や強調等を読み取るような研究が行われている。また、位置関係の理解という面では、カメラによって、会話相手の目線の動きを捉え、そこから会話に出てくる目的物の場所を理解するような実験も試されている。
会話の理解は非常に複雑であり、コンピュータが人間と同じように会話できるに到るまでは、まだまだ時間を要すると予想される。
2.テキスト情報以外の伝達
テレビ電話を利用する場面も以前と比較して増えてきたようにも思われるが、やはりインターネットを介したコミュニケーションのほとんどはテキストデータを介して行われている。テキストデータの重大な欠点は、コンテキストというものが伝達できないところにある。我々が対面で会話をしていれば、相手の表情から、話している内容が相手にとって嫌なことか、あるいはそうでないのかが分かるが、テキスト上ではそれは分からない。ついつい、乱暴な言葉使いになって、電子掲示版上で罵詈雑言の応酬になることも少なくない。したがって、このようなテキストによる不完全なコミュニケーションを代替するような仕組みが必要となる。
もっとも、我々に馴染みが深いのは顔文字(Emoticon or Smiley)である。我々は、顔文字で感情表現を強調することによって、自分の感情をより的確に相手に伝えるように努力している。ある、研究によると、日本の顔文字は欧米と比較しても、種類が非常に豊富であるらしい。
また、テキストマイニングの技術を活用し、テキストの中から感情に関する意味表現を抽出し、各テキスト(例えば電子メール)がどのような感情で書かれているかを判定するようなソフトウェアの開発も行われている。
変わり種と言うと、怒られるかも知れないが、光や臭いの情報を、合わせて伝達することで、感情を共有、あるいは伝えようとする研究も行われている。面白いとは思うが、普通に会話するときに嗅覚をどれだけ使っているかと考えると、その効果には疑問も残る。
テキストにおける意味表現の不足部分を補うための方法としてオントロジー(対象とする世界に存在するものごとを体系的に分類し、その関係を記述するもの)の活用が注目されており、オントロジーを用いたセマンティックWebの構築が目標となっている。しかしながら、オントロジーデータベースの生成そのものの労力が膨大であることと、オントロジーデータベース自体が普遍ではなく、常に変化するものであるため、その実現は容易ではない。
おわりに
ヒューマーノイドの開発が進み、人間と同じような動きができるようなロボットが近い将来出てくるかもしれないが、アトムと同じように人間と変わらずに会話できるようなロボットができるまでにはまだまだ時間がかかるような気がする。会話、あるいはコミュニケーションというものは、私が以前思っていたよりも、ずっと複雑であり、それをすべてコンピュータ上に乗せることは簡単ではないのである。
参考文献
Hozumi Tanaka (1999), "Understanding Natural Language and Controling Robot Actions", IPSJ SIG Notes 1999(108), 234-235, Information Processing Society of Japan
SHINYAMA,YUSUKE; TOKUNAGA,TAKENOBU; TANAKA,HOZUMI(2001), ""Kairai"-Software Robots Understanding Natural Language", Transactions of Information Processing Society of Japan, Information Processing Society of Japan
Nick Campbell (2005), "Expressive Speech Processing ", JST/CREST
Masayuki Nakazawa, Takuya Nishimoto, Shigeki Sagayama (2005), "Gaze Modeling for Spoken Dialog Systems with Anthropomorphic Agents", The 19th Annual Conference of the Japanese Society for Artificial Intelligence, 2005
MOHD HANAFIAH,Zaliyana; YAMAZAKI,Chizu; NAKAMURA,Akio; KUNO,Yoshinori (2005), "Understanding Inexplicit Utterances for Helper Robots Using Vision", The transactions of the Institute of Electronics, Information and Communication Engineers. D-II(ISSN 09151923)
Phillip A. Thompsen (1996), "Effects of Pictographs and Quoting on Flaming in Computer-Mediated Communication." Computers and Human Behavior, Summer 1996, pp. 225-243.
Daantje Derks, Arjan E.R. Bos and Jasper von Grumbkow (2004), "Emoticons and social interaction on the Internet: the importance of social context",Computers in Human Behavior, In Press, Corrected Proof, Available online 8 December 2004
HARADA,Tomi (2004), "The Role of "Face Marks" in Promoting Smooth Communication and Expressing Consideration and Politeness in Japanese" the journal of the Institute for Language and Culture
Inoue,Mizuho; Fujimaki,Minako; Ishizaki,Shun (1997), "System for Analyzing Emotional Expression in E-mail text : collection, classification, and analysis of Emotional Expressions", Technical report of IEICE. Thought and language 96(608),1-8,19970328
NAKAYAMA,Norio; EGUCHI,Koji; KANDO,Noriko (2004), "A Proposal for Extraction of Emotional Expression",IPSJ SIG Notes 2004(108),13-18,20041
OGATA,Susumu; IKEDA,Shinji; MUTA,Takanobu; KIMOTO,Masatoshi (2005), "Evaluation Method of Person Using the Text Information on the Web", IPSJ SIG Notes 2005(1),9-14,20050111
FUJIMURA,Shigeru; TOYODA,Masashi; Kitsuregawa,Masaru (2004), "A Consideration of Extracting Reputations and Evaluative Expressions from the Web", IPSJ SIG Notes 2004(72),461-468,20040714
Ogata,Shinsuke; Tanaka,Shosaku; Tomiura,Yoichi (2004), "Estimation of the Nativeness of English Documents Based on N-Gram Model of Non-content Words", IPSJ SIG Notes 2004(23),123-128,20040304
|