[go: up one dir, main page]

JP4549703B2 - 対人ロボット及び対人ロボット制御プログラム - Google Patents

対人ロボット及び対人ロボット制御プログラム Download PDF

Info

Publication number
JP4549703B2
JP4549703B2 JP2004073603A JP2004073603A JP4549703B2 JP 4549703 B2 JP4549703 B2 JP 4549703B2 JP 2004073603 A JP2004073603 A JP 2004073603A JP 2004073603 A JP2004073603 A JP 2004073603A JP 4549703 B2 JP4549703 B2 JP 4549703B2
Authority
JP
Japan
Prior art keywords
interpersonal
robot
unit
imaging
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004073603A
Other languages
English (en)
Other versions
JP2005254433A (ja
Inventor
修司 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Corp
Original Assignee
Fujifilm Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujifilm Corp filed Critical Fujifilm Corp
Priority to JP2004073603A priority Critical patent/JP4549703B2/ja
Publication of JP2005254433A publication Critical patent/JP2005254433A/ja
Application granted granted Critical
Publication of JP4549703B2 publication Critical patent/JP4549703B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Manipulator (AREA)
  • Image Input (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Description

本発明は、対人ロボット及び対人ロボット制御プログラムに関する。特に本発明は、人とのコミュニケーションを行う対人ロボット、及び対人ロボットを制御する対人ロボット制御プログラムに関する。
近年、ロボット工学技術の発展に伴い、様々なロボットが開発されている。中でも、愛玩や接客といった用途に用いられ、人間とコミュニケーションを行う対人ロボットがマスメディア等で話題になっている。
従来の対人ロボットにおいては、利用者に話し掛けられた場合に、声が聞こえた大凡の方向を認識すると共に、身体をその方向に向けて、利用者とのコミュニケーションを行うという機能を有するものがある。
現時点で先行技術文献の存在を認識していないので、先行技術文献に関する記載を省略する。
しかしながら、従来の対人ロボットにおいて、多数の利用者から同時に話し掛けられている場合に、対人ロボットが、コミュニケーションを行う対象を切り替える毎に身体の向きを変えていると、切り替え動作に一定の時間を要することにより、コミュニケーションが円滑に行われないという問題があった。また、対人ロボットが、コミュニケーションを行う対象を切り替えても身体の向きを変えず、一定の方向を向いている場合、利用者は、対人ロボットが何れの利用者とコミュニケーションを行っているのかを判断しづらいという問題があった。
そこで本発明は、上記の課題を解決することができる対人ロボット及び対人ロボット制御プログラムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。
上記課題を解決するために、本発明の第1の形態においては、人とのコミュニケーションを行う対人ロボットであって、被写体の画像を撮像する撮像部と、撮像部の外側に設けられ、撮像部が画像を撮像するための開口部を有すると共に、開口部の位置を変化させることのできるシェル部と、シェル部が有する開口部の位置を制御することにより、撮像部が撮像する範囲を制御する撮像範囲制御部とを備える。シェル部は、撮像部に入射する光のうち、一部の光を遮ってもよい。シェル部は、当該対人ロボットの眼球の少なくとも一部として設けられていてもよい。当該対人ロボットは、撮像部により撮像された画像の中で、当該対人ロボットに話し掛けている人物が含まれる領域を選択する話者選択部を更に備え、撮像範囲制御部は、話者選択部により選択された範囲に基づいて、撮像部が撮像する範囲を制御してもよい。
また、本発明の第2の形態においては、対人ロボットを機能させる対人ロボット制御プログラムであって、当該対人ロボットを、被写体の画像を撮像する撮像部と、撮像部の外側に設けられ、撮像部が画像を撮像するための開口部を有すると共に、開口部の位置を変化させることのできるシェル部と、シェル部が有する開口部の位置を制御することにより、撮像部が撮像する範囲を制御する撮像範囲制御部とを備える対人ロボットとして機能させる。当該対人ロボットは、撮像部により撮像された画像の中で、当該対人ロボットに話し掛けている人物が含まれる領域を選択する話者選択部を更に備え、撮像範囲制御部は、話者選択部により選択された範囲に基づいて、撮像部が撮像する範囲を制御してもよい。
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた、発明となりうる。
本発明によれば、利用者と対人ロボットとが、より円滑にコミュニケーションを行うことができる。
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
図1は、本発明の実施形態に係る対人ロボット10の概要を示す。対人ロボット10は、利用者から話し掛けられた場合に、音声や文字、画像等を用いて応答するといった、双方向のコミュニケーションを行う。具体的には、対人ロボット10は、デジタルカメラ等を用いて入力した画像に基づいて利用者の動作及び表情を認識すると共に、マイクロフォン等を用いて入力した音声に基づいて利用者の話し声を認識することにより、利用者の意図を認識する。そして、対人ロボット10は、利用者の意図を認識した結果に基づいて、予め格納されている音声を選択するか、又は必要に応じて音声を合成してスピーカ等を用いて出力することにより、自律的に利用者とのコミュニケーションを行う。
ここで、対人ロボット10は、音声をスピーカから出力することにより利用者とのコミュニケーションを行うのに変えて、LCDパネル等の表示デバイスを用いて、文字及び画像を表示することにより、利用者とのコミュニケーションを行ってもよい。また、対人ロボット10は、自律的に利用者とのコミュニケーションを行うのに変えて、入力した利用者の画像及び話し声を外部の制御端末に送信すると共に、オペレータの音声を制御端末から受信してスピーカ等を用いて出力することにより、利用者とのコミュニケーションを行ってもよい。
利用者にとってより親しみ易いという点で、対人ロボット10は、本図に示したような人を模した形態であったり、又は、犬や猫等の動物を模した形態であったりすることが好ましい。本実施形態に係る対人ロボット10は、デジタルカメラ等の、利用者の画像を入力するデバイスを含む眼球15を備える。
本実施形態に係る対人ロボット10は、利用者とのコミュニケーションを行う場合に、画像の入力デバイスである眼球15を外部から見えるように制御して、対人ロボット10が何れの方向を見ているか、即ち、対人ロボット10が何れの利用者とコミュニケーションを行っているかを、当該利用者及び他の利用者に知らせることにより、利用者とのコミュニケーションをより円滑に行うことを目的とする。
図2は、本発明の実施形態に係る対人ロボット10の構成の一例を示すブロック図である。対人ロボット10は、撮像部100、1次メモリ110、撮像制御部120、集音部130、話者選択部140、シェル部150、及び撮像範囲制御部160を備える。撮像部100は、光学系102、CCD104、及び撮像信号処理部106を有し、被写体の画像を撮像する。光学系102は、例えばフォーカスレンズやズームレンズ等を含み、被写体像をCCD104の受光面上に結像する。CCD104は、複数の受光素子を含み、光学系102により受光面に結像された被写体の光学像によってそれぞれの受光素子に蓄積された電荷を、アナログの電圧信号として撮像信号処理部106に出力する。撮像信号処理部106は、CCD104から受け取った、被写体像を示すアナログの電圧信号を、R、G、及びBの各成分に分解する。そして、撮像信号処理部106は、R、G、及びBの各成分に分解されたアナログ信号をA/D変換し、その結果得られた被写体像を示すデジタルの画像データを1次メモリ110に出力する。1次メモリ110は、例えばDRAM等の揮発性メモリであり、撮像信号処理部106が出力したデジタルの画像データを格納する。撮像制御部120は、撮像部100に含まれる機構部材を駆動することにより、被写体を示す画像の撮像を制御する。例えば、撮像制御部120は、露出度、ホワイトバランス、ズーム動作、及び絞り動作等を制御する。
集音部130は、例えばマイクロフォンであり、音声を入力し、入力した音声を話者選択部140に出力する。話者選択部140は、1次メモリ110に格納された画像データが示す画像の中で、対人ロボット10に話し掛けている人物を、画像認識技術等を用いて認識し、当該人物が含まれる領域を選択する。ここで、話者選択部140は、集音部130から受け取った音声に基づいて、対人ロボット10に話し掛けている人物を認識してもよい。そして、話者選択部140は、選択した領域を示す情報を撮像範囲制御部160に出力する。
シェル部150は、撮像部100の外側に設けられ、撮像部100が画像を撮像するための開口部を有すると共に、開口部の位置を変化させることができる。撮像範囲制御部160は、シェル部150が有する開口部の位置を制御することにより、撮像部100が撮像する範囲を制御する。具体的には、撮像範囲制御部160は、話者選択部140により選択された範囲に基づいて、撮像部100が撮像する範囲を制御する。例えば、撮像範囲制御部160は、話者選択部140により選択された範囲が画像の中央に配置されて撮像されるべく、シェル部150の開口部の位置を制御してもよい。
本実施形態に係る対人ロボット10によれば、撮像部100の外部に設けられたシェル部150を用いて撮像部100における撮像範囲を制御することにより、利用者は、対人ロボット10が何れの範囲を撮像しているか、即ち、対人ロボット10が何れの利用者とコミュニケーションを行っているかを、シェル部150における開口部の位置に基づいて判断することができる。これにより、利用者は、対人ロボット10とのコミュニケーションを、より円滑に行うことができる。
また、対人ロボット10が複数の利用者に囲まれて話し掛けられており、コミュニケーションを行う対象を頻繁に切り替える場合であっても、対人ロボット10の向きを変えることなく、シェル部150における開口部の位置を変化させることによって、コミュニケーションを行う対象を利用者から判別可能に切り替えることができる。これにより、対人ロボット10は、コミュニケーションを行う対象をより短い時間で切り替えることができるので、応答性を向上させることができる。更に、コミュニケーションを行う対象を切り替える際に駆動させる部分を少なくすることができるので、対人ロボット10における消費電力を低減することができ、対人ロボット10の低コスト化や小型化を実現できる。
図3は、本発明の実施形態に係る眼球15の断面の一例を示す。眼球15は、シェル部150、光学系102、及びCCD104を含む。シェル部150は、例えば、遮光性を有する部材により、光学系102及びCCD104を覆うべく構成され、一部に穴を空けることにより設けられた開口部155を有する。そして、シェル部150は、光学系102に入射する光のうち、一部の光を遮ることにより、撮像部100における撮像範囲を制限する。具体的には、シェル部150は、開口部155を通じて入射する光のみを光学系102に入射させ、それ以外の光を遮ることにより、撮像部100における撮像範囲を制限する。ここで、開口部155の大きさは多様であってよく、本図に示した開口部155より大きくても、又は小さくてもよい。
また、シェル部150は、撮像範囲制御部160の制御に基づいて開口部155の位置を変化させることにより、撮像部100における撮像範囲を変化させる。例えば、シェル部150は、底部に開口部155となる穴の空いた、遮光性を有する椀型の部材として設けられ、撮像範囲制御部160により駆動されるアクチュエータによって、光学系102における光学中心等の周りを回転可能に制御される。また、シェル部150は、一部分が透光性を有し、他の部分が遮光性を有する部材として構成され、透光性を有する部分を開口部155として機能させてもよい。ここで、開口部155として用いる透光性部材は無色透明でなくともよく、何らかの色を有していてもよい。また、シェル部150は、全体が透光性を有する部材であり、開口部155にあたる部分と、それ以外の部分とが異なる色を有するべく構成されてもよい。
また、シェル部150は、透光性を有する電極を用いた液晶パネルにより構成され、開口部155にあたる部分において光を透過させると共に、開口部155以外の部分において光を遮るべく電極を制御することにより、撮像部100における撮像範囲を制御してもよい。
図4は、本発明の実施形態に係る開口部155の位置変化の一例を示す。図4(a)は、開口部155が利用者から見て左に位置する場合の、対人ロボット10の外観の一例を示す。この場合、撮像部100は、対人ロボット10から見て右側の被写体の画像を撮像する。図4(b)は、開口部155が利用者から見て右に位置する場合の、対人ロボット10の外観の一例を示す。この場合、撮像部100は、対人ロボット10から見て左側の被写体の画像を撮像する。
図4(a)及び図4(b)から明らかなように、利用者は、開口部155の位置に基づいて、対人ロボット10が何れの方向の画像を撮像しているかを容易に判断することができる。更に、シェル部150が眼球15の少なくとも一部として設けられていることにより、利用者は、対人ロボット10が何れの方向を撮像しているかを、人間における視線方向の判断と同様の感覚で、容易に判断することができる。そして、利用者は、対人ロボット10が自分自身を見ているか否かを判断することにより、対人ロボット10が自分自身とのコミュニケーションを行っているか否かを判断することができる。つまり、利用者は、対人ロボット10との間でアイコンタクトを交えたコミュニケーションを行うことができる。これにより、利用者は、対人ロボット10とのコミュニケーションを、より円滑に行うことができる。
また、光学系102において、例えば魚眼レンズ等の広角レンズが用いられている場合に、必要とする方向とは異なる方向から入射する光を、シェル部150を用いて遮ることにより、開口部155の位置を変更させることによって撮像可能となる範囲を広く確保しながら、所謂迷光を防止することができ、より鮮明な画像を撮像することができる。
図5は、本発明の実施形態に係る対人ロボット10における処理の流れの一例を示すフローチャートである。まず、集音部130が音声を入力する(S1000)。ここで、集音部130は、複数のマイクロフォンにより構成され、それぞれのマイクロフォンを用いて互いに異なる位置において音声を入力してもよい。続いて、話者選択部140は、集音部130により入力された音声に、利用者の話し声が含まれているか否かを判定する(S1010)。例えば、話者選択部140は、入力された音声を示す信号を、高速フーリエ変換等の公知の技術を用いて複数の周波数成分に分解し、人間の声に特有の周波数帯における成分のレベルが予め定められた基準値以上である場合に、入力された音声に話し声が含まれていると判定する。また、話者選択部140は、公知の音声認識技術を用いることにより、入力された音声から特定の単語、例えば対人ロボット10に付けられた名前等を認識した場合に、入力された音声に話し声が含まれていると判定してもよい。こうすることにより、対人ロボット10とのコミュニケーションを望んでいる利用者から話し掛けられた場合にのみ、対人ロボット10を応答させることができる。
また、ここで、話者選択部140は、入力された音声に利用者の話し声が含まれているか否かを判定するだけでなく、話し声の発生位置、又は伝播方向を検出してもよい。例えば、話者選択部140は、集音部130が複数のマイクロフォンにより構成されている場合に、マイクロフォン毎に入力された音声に対する話し声の判定を行い、最も大きな話し声が入力された位置に基づいて、話し声の発生位置又は伝播方向を検出してもよい。また、話者選択部140は、集音部130が少なくとも2つのマイクロフォンにより構成されている場合に、公知の音声定位技術を用いて、マイクロフォン毎の、同一の話し声を示す音波の入力タイミングのずれに基づいて、当該話し声の発生位置を検出してもよい。
そして、入力された音声に話し声が含まれていない場合(S1010:No)、対人ロボット10は、処理をS1000に戻し、再び音声を入力する。一方、入力された音声に話し声が含まれている場合(S1010:Yes)、撮像範囲制御部160は、撮像部100における撮像範囲を制御する(S1020)。ここで、話者選択部140により話し声の発生位置が検出されている場合、撮像範囲制御部160は、当該位置を撮像範囲に含ませるべく、撮像部100における撮像範囲を制御する。一方、話し声の発生位置が検出されていない場合、撮像範囲制御部160は、繰り返し撮像することにより周囲全体を撮像すべく、撮像範囲を、例えば右方向に順次移動させる等、予め定められた規則に基づいて変化させてもよい。
また、撮像範囲制御部160は、シェル部150が有する開口部の位置を変化させるだけでなく、対人ロボット10の向きを変更することにより、撮像部100の撮像範囲を制御してもよい。但し、その場合であっても、可能な限りシェル部150が有する開口部の位置を変化させて撮像範囲を制御することにより、撮像範囲の変更に要する時間を短縮することができるので、対人ロボット10の応答性が向上する。
続いて、撮像部100は、画像を撮像する(S1030)。ここで、後述する口の動きの検出においては、撮像部100が、動画像を撮影するか、又は時間的に連続する複数の静止画像を撮像することが好ましい。続いて、話者選択部140は、撮像部100により撮像された画像に人物が含まれているか否かを認識する(S1040)。例えば、話者選択部140は、撮像された画像における、肌色を示す領域の分布に基づいて、人物が含まれているか否かを認識する。ここで、撮像部100により、動画像が撮影された場合、又は複数の静止画像が撮像された場合、話者選択部140は、少なくとも一部のフレーム画像又は静止画像に対して認識処理を行ってよい。そして、撮像された画像に人物が含まれていない場合(S1040:No)、対人ロボット10は、処理をS1000に戻し、再び集音部130に音声を入力させる。
一方、撮像された画像に人物が含まれている場合(S1040:Yes)、話者選択部140は、認識された人物を示す画像から、例えばパターンマッチング等の公知の画像認識技術を用いて、顔部分の画像を認識すると共に、顔部分の画像における口部分の画像を抽出する(S1050)。続いて、話者選択部140は、口部分の画像が話し声に同期して変化しているか否かを判定する(S1060)。例えば、話者選択部140は、動画像における複数のフレーム画像、又は時間的に連続する複数の静止画像において認識された人物の口部分の画像が、予め定められた時間間隔以下で変化している場合に、当該人物が話をしていると認識する。そして、話者選択部140は、入力された音声に話し声が含まれている時間帯と、当該人物が話をしている時間帯とが、予め定められた基準値以上の割合で一致している場合に、口部分の画像が話し声に同期して変化している、即ち、話し声に同期して口が動いていると判定する。ここで、撮像された画像に複数の人物が含まれている場合、話者選択部140は、複数の人物のそれぞれに対して、口部分の画像の検出を行うと共に、口部分の画像が話し声に同期して変化しているか否かを判定してよい。
口部分の画像が話し声に同期して変化しているのではない場合(S1060:No)、対人ロボット10は、処理をS1000に戻し、再び集音部130に音声を入力させる。一方、口部分の画像が話し声に同期して変化している場合に(S1060:Yes)、話者選択部140は、当該画像に対応する人物を対人ロボット10に話し掛けている人物と認識し、撮像された画像の中で、当該人物の少なくとも一部が含まれる領域を選択する(S1070)。例えば、話者選択部140は、当該人物に外接する矩形を選択する。そして、撮像範囲制御部160は、撮像部100により撮像される画像の中央に話者選択部140により選択された領域が配置されるべく、シェル部150を制御して撮像範囲を変更する(S1080)。
以上のように、対人ロボット10に話し掛けた利用者を含む領域を撮像すべくシェル部150を制御することにより、対人ロボット10に話し掛けた利用者は、対人ロボット10が自分自身を見ていると認識することができるので、利用者と対人ロボット10との間にアイコンタクトを交えたコミュニケーションを成立させることができる。これにより、利用者は、対人ロボット10とより円滑にコミュニケーションを行うことができる。
本例において、対人ロボット10は、集音部130により入力した音声と、撮像部100により撮像した画像との双方を用いて、対人ロボット10に話し掛けた利用者を検出したが、音声と画像との何れか一方のみを用いて、話し掛けた利用者を検出してもよい。例えば、対人ロボット10は、複数のマイクロフォン等を用いて話し声の発生位置を検出し、検出した位置のみに基づいて撮像範囲を制御することにより、話し掛けた利用者を検出してもよい。また、例えば、対人ロボット10は、シェル部150における開口部の位置、及び対人ロボット10の方向を順次変化させて画像を撮像し、撮像された画像に対して人物認識すると共に、口部分の画像の変化を検出することにより、話し掛けた利用者を検出してもよい。
図6は、本実施形態に係るコンピュータ1500のハードウェア構成の一例を示すブロック図である。本実施形態に係るコンピュータ1500は、ホスト・コントローラ1582により相互に接続されるCPU1505、RAM1520、グラフィック・コントローラ1575、及び表示装置1580を有するCPU周辺部と、入出力コントローラ1584によりホスト・コントローラ1582に接続される通信インターフェイス1530、ハードディスクドライブ1540、及びCD−ROMドライブ1560を有する入出力部と、入出力コントローラ1584に接続されるROM1510、フレキシブルディスク・ドライブ1550、及び入出力チップ1570を有するレガシー入出力部とを備える。
ホスト・コントローラ1582は、RAM1520と、高い転送レートでRAM1520をアクセスするCPU1505及びグラフィック・コントローラ1575とを接続する。CPU1505は、ROM1510及びRAM1520に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ1575は、CPU1505等がRAM1520内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置1580上に表示させる。これに代えて、グラフィック・コントローラ1575は、CPU1505等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
入出力コントローラ1584は、ホスト・コントローラ1582と、比較的高速な入出力装置であるハードディスクドライブ1540、通信インターフェイス1530、CD−ROMドライブ1560を接続する。ハードディスクドライブ1540は、コンピュータ1500内のCPU1505が使用するプログラム及びデータを格納する。通信インターフェイス1530は、ネットワークを介して対人ロボット10と通信し、対人ロボット10にプログラム及びデータを提供する。CD−ROMドライブ1560は、CD−ROM1595からプログラム又はデータを読み取り、RAM1520を介してハードディスクドライブ1540及び通信インターフェイス1530に提供する。
また、入出力コントローラ1584には、ROM1510と、フレキシブルディスク・ドライブ1550、及び入出力チップ1570の比較的低速な入出力装置とが接続される。ROM1510は、コンピュータ1500が起動時に実行するブート・プログラムや、コンピュータ1500のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ1550は、フレキシブルディスク1590からプログラム又はデータを読み取り、RAM1520を介してハードディスクドライブ1540及び通信インターフェイス1530に提供する。入出力チップ1570は、フレキシブルディスク・ドライブ1550や、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を接続する。
RAM1520を介して通信インターフェイス1530に提供されるプログラムは、フレキシブルディスク1590、CD−ROM1595、又はICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM1520を介して通信インターフェイス1530に提供され、ネットワークを介して対人ロボット10に送信される。対人ロボット10に送信されたプログラムは、対人ロボット10においてインストールされて実行される。対人ロボット10にインストールされて実行されるプログラムは、対人ロボット10を、図1から図5にかけて説明した対人ロボット10として機能させる。
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1590、CD−ROM1595の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスク又はRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1500に提供してもよい。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
本発明の実施形態に係る対人ロボット10の概要を示す図である。 本発明の実施形態に係る対人ロボット10の構成の一例を示すブロック図である。 本発明の実施形態に係る眼球15の断面の一例を示す図である。 本発明の実施形態に係る開口部155の位置変化の一例を示す図である。 本発明の実施形態に係る対人ロボット10における処理の流れの一例を示すフローチャートである。 本発明の実施形態に係るコンピュータ1500の構成の一例を示すブロック図である。
符号の説明
10 対人ロボット、15 眼球、100 撮像部、102 光学系、104 CCD、106 撮像信号処理部、110 1次メモリ、120 撮像制御部、130 集音部、140 話者選択部、150 シェル部、155 開口部、160 撮像範囲制御部

Claims (3)

  1. 人とのコミュニケーションを行う対人ロボットであって、
    光学系およびCCDを有し、被写体の画像を撮像する撮像部と、
    前記光学系および前記CCDの外側に前記光学系および前記CCDを覆うべく構成されて当該対人ロボットの眼球の少なくとも一部として前記撮像部から独立して設けられ、前記撮像部が前記画像を撮像するための開口部を有すると共に、前記撮像部の位置を変化させることなく前記撮像部に対する前記開口部の位置を変化させることのできるシェル部であって、前記開口部を通じて入射する光のみを前記光学系に入射させ、それ以外の光を遮ることにより、前記撮像部における撮像範囲を制限するシェル部と、
    音声を入力し、入力した音声を出力する集音部と、
    前記撮像部により撮像された前記画像において認識された人物の口部分の画像が、前記集音部から入力された音声に含まれる話し声に同期して変化している人物を前記対人ロボットに話し掛けている人物と認識し、撮像された前記画像の中で、当該対人ロボットに話し掛けている人物が含まれる領域を選択する話者選択部と
    前記話者選択部により選択された領域に基づいて前記シェル部が有する前記開口部の位置を制御することにより、前記撮像部が撮像する範囲を制御する撮像範囲制御部と
    を備える対人ロボット。
  2. 前記シェル部は、前記撮像部に入射する光のうち、一部の光を遮る請求項1に記載の対人ロボット。
  3. 対人ロボットを機能させる対人ロボット制御プログラムであって、
    当該対人ロボットを、
    光学系およびCCDを有し、被写体の画像を撮像する撮像部から画像を取得する取得部と、
    前記光学系および前記CCDの外側に前記光学系および前記CCDを覆うべく構成されて当該対人ロボットの眼球の少なくとも一部として前記撮像部から独立して設けられ、前記撮像部が前記画像を撮像するための開口部を有すると共に、前記撮像部の位置を変化させることなく前記撮像部に対する前記開口部の位置を変化させることのできるシェル部であって、前記開口部を通じて入射する光のみを前記光学系に入射させ、それ以外の光を遮ることにより、前記撮像部における撮像範囲を制限するシェル部と、
    音声を入力し、入力した音声を出力する集音部と、
    前記撮像部により撮像された前記画像において認識された人物の口部分の画像が、前記集音部から入力された音声に含まれる話し声に同期して変化している人物を前記対人ロボットに話し掛けている人物と認識し、撮像された前記画像の中で、当該対人ロボットに話し掛けている人物が含まれる領域を選択する話者選択部と
    前記話者選択部により選択された領域に基づいて前記シェル部が有する前記開口部の位置を制御することにより、前記撮像部が撮像する範囲を制御する撮像範囲制御部と
    を備える対人ロボットとして機能させる対人ロボット制御プログラム。
JP2004073603A 2004-03-15 2004-03-15 対人ロボット及び対人ロボット制御プログラム Expired - Fee Related JP4549703B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004073603A JP4549703B2 (ja) 2004-03-15 2004-03-15 対人ロボット及び対人ロボット制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004073603A JP4549703B2 (ja) 2004-03-15 2004-03-15 対人ロボット及び対人ロボット制御プログラム

Publications (2)

Publication Number Publication Date
JP2005254433A JP2005254433A (ja) 2005-09-22
JP4549703B2 true JP4549703B2 (ja) 2010-09-22

Family

ID=35080657

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004073603A Expired - Fee Related JP4549703B2 (ja) 2004-03-15 2004-03-15 対人ロボット及び対人ロボット制御プログラム

Country Status (1)

Country Link
JP (1) JP4549703B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8060255B2 (en) * 2007-09-12 2011-11-15 Disney Enterprises, Inc. System and method of distributed control of an interactive animatronic show
JP6686583B2 (ja) * 2016-03-17 2020-04-22 カシオ計算機株式会社 ロボット及びプログラム
JP2019072787A (ja) * 2017-10-13 2019-05-16 シャープ株式会社 制御装置、ロボット、制御方法、および制御プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11355622A (ja) * 1998-04-06 1999-12-24 Toshiba Corp 撮像装置
JP2000338987A (ja) * 1999-05-28 2000-12-08 Mitsubishi Electric Corp 発話開始監視装置、話者同定装置、音声入力システム、および話者同定システム、並びに通信システム
JP2001157992A (ja) * 1999-11-30 2001-06-12 Rhythm Watch Co Ltd Ccdカメラ及びこれを搭載したロボット装置
JP2003200366A (ja) * 2001-12-26 2003-07-15 Sony Corp ロボット
JP2004042151A (ja) * 2002-07-09 2004-02-12 Advanced Telecommunication Research Institute International コミュニケーションロボット
JP3875659B2 (ja) * 2003-07-25 2007-01-31 株式会社東芝 カメラ装置及びロボット装置

Also Published As

Publication number Publication date
JP2005254433A (ja) 2005-09-22

Similar Documents

Publication Publication Date Title
KR101679290B1 (ko) 영상 처리 방법 및 장치
US20160147309A1 (en) Systems and Methods for Performing Multi-Touch Operations on a Head-Mountable Device
JP6551507B2 (ja) ロボット制御装置、ロボット、ロボット制御方法およびプログラム
JPH086708A (ja) 表示装置
CN111242090A (zh) 基于人工智能的人脸识别方法、装置、设备及介质
JPWO2018150831A1 (ja) 情報処理装置、情報処理方法及び記録媒体
US8400532B2 (en) Digital image capturing device providing photographing composition and method thereof
JP2016177658A (ja) 仮想入力装置、入力方法、およびプログラム
CN112000221A (zh) 自动检测肌肤的方法、自动指导护肤化妆的方法及终端
US20230188845A1 (en) Electronic device and method for controlling preview image
KR20220140221A (ko) 복수의 카메라를 포함하는 웨어러블 전자 장치
JP2008033718A (ja) 撮像装置及び部位拡大表示方法
CN118511176A (zh) 媒体处理的系统和方法
CN113225474B (zh) 语音输入设备、其控制方法及存储介质
JP4549703B2 (ja) 対人ロボット及び対人ロボット制御プログラム
CN110275620B (zh) 交互方法、交互装置、头戴设备和存储介质
JP2025036527A (ja) 画像処理装置、画像処理方法および撮像装置
JP2021124976A (ja) 音声入力装置およびその制御方法ならびにプログラム
US20180352168A1 (en) Omnidirectional camera display image changing system, omnidirectional camera display image changing method, and program
KR20220142939A (ko) 착용가능한 정보 단말기, 그 제어 방법, 및 저장 매체
CN214591630U (zh) 潜望摄像模组及移动终端
KR20240096625A (ko) Ar 디바이스 및 ar 디바이스 제어 방법
KR20220162956A (ko) 영상 통화 중 다양한 커뮤니케이션을 지원하는 전자 장치 및 그의 동작 방법
JP7518684B2 (ja) 撮像制御装置、その制御方法、プログラム及び記録媒体
JP2020194517A (ja) 翻訳システムおよび翻訳システムセット

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060413

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080107

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080722

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080828

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080930

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081030

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081205

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20081226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100614

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100707

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees