トップ :: B 処理操作 運輸 :: B25 手工具;可搬型動力工具;手工具用の柄;作業場設備;マニプレ−タ

【発明の名称】 ロボットの対話型挙動の制御
【発明者】 【氏名】ミヒャエル・ギンガー

【要約】 【課題】ロボットの対話型挙動の制御を提供すること。

【構成】挙動の目標をセレクタ・ユニットに定義し、セレクタ・ユニットが目標に到達するための複数の挙動命令をそれぞれ発生させ、各々の命令に対して、前記機械的システムの対応する結果として得られる動作を、機械的システムの一体化した部分であるコンピューティング・ユニットによって、内部的にシミュレートする。シミュレートされた結果として得られた動作の各々の適応度を、少なくとも1つの目的に関して評価し、最高の適応度値を有するシミュレートされた動作が得られた命令を、機械的システムの物理的アクチュエータに送り、知能的機械的システムの挙動を制御し、複数の自由度からなる異なる動作挙動を行うことができる。
【特許請求の範囲】
【請求項1】
それぞれ複数の自由度からなる異なる動作挙動を行うことができる、知能的機械的システムの挙動を制御するための方法であって、前記方法が、
挙動の目標をセレクタ・ユニットに定義するステップと、
前記セレクタ・ユニットが、前記定義された目標に到達するための複数の挙動命令をそれぞれ発生させるステップと、
各々の命令に対して、前記機械的システムの対応する結果として得られる動作を、前記機械的システムの一体化した部分であるコンピューティング・ユニットによって、内部的にシミュレートするステップと、
シミュレートされた結果として得られた動作の各々の適応度を、少なくとも1つの目的に関して評価するステップと、
最高の適応度値を有するシミュレートされた動作が得られた前記命令を、前記機械的システムの物理的アクチュエータに送るステップと
を含む方法。
【請求項2】
前記機械的システムが自立的ロボットである、請求項1に記載の方法。
【請求項3】
前記目標が前記機械的システムの視覚システムによって発生する、請求項1または2に記載の方法。
【請求項4】
前記シミュレーションが逆運動学または逆動力学手法を使用して行われる、請求項1から3のいずれかに記載の方法。
【請求項5】
前記適応度が費用関数を使用して計算される、請求項1から4のいずれかに記載の方法。
【請求項6】
前記内部シミュレーション処理速度が、前記下位の機械的システムの機械的な応答時間より早く設定される、請求項1から5のいずれかに記載の方法。
【請求項7】
前記処理ステップが反復方法で行われる、請求項1から6のいずれかに記載の方法。
【請求項8】
前記シミュレーションが、自己コリジョン検出、自己コリジョン回避および外部オブジェクトの回避の一方または両方を含む、請求項1から7のいずれかに記載の方法。
【請求項9】
前記シミュレーションが、動作の運動学的シミュレーションまたは前記システムの動きおよび力の対話を考慮する動力学的シミュレーションである、請求項1から8のいずれかに記載の方法。
【請求項10】
請求項1から9のいずれかに記載の方法を実施するように設計される制御器。
【請求項11】
請求項10に記載の制御器を有するロボット。
【請求項12】
コンピュータ装置で実行されるとき、請求項1から11のいずれかに記載の方法を実施する、コンピュータ・ソフトウェア製品。
【発明の詳細な説明】【技術分野】
【0001】
本発明は、動的環境に応答してロボットの反応を計算し制御する技術に関する。
【背景技術】
【0002】
この技術は、例えば動的な対話(interaction)を要する協働的な物品の引渡し、または任意の他の協働的なタスクのようなシステムと動的な対話を作り出すために、例えば使用することができる。しかしながら、本発明は、制御理論の分野に限定されず、他の機械的システムにも適用することができる。
【発明の開示】
【発明が解決しようとする課題】
【0003】
例えばロボットなどの機械的システムの、その環境との対話を改善することが本発明の目的である。
【課題を解決するための手段】
【0004】
この目的は、独立請求項の特徴を用いて達成することができる。従属請求項は、さらに本発明の中心的着想を発展させる。
【0005】
本発明の第1の態様は、それぞれ複数の自由度からなる異なる動作挙動を行うことができる、例えばロボットなどの知能的機械的システム(intelligent mechanical system)の挙動(behaviour)を制御する方法に関し、この方法は以下のステップを含む:
− 挙動のための目標をセレクタ・ユニットに定義するステップ、
− セレクタ・ユニットが、定義された目標にそれぞれ到達するようになされた複数の挙動命令を発生させるステップ、
− 各々の命令に対して、前記機械的システムの対応する結果として得られる(複数の)動作を、前記機械的システムの一体化した部分であるコンピューティング・ユニットによって、内部的(internally)にシミュレートするステップと、
− シミュレートされた結果として得られる動作の各々の適応度を、少なくとも1つの目的に関して評価するステップ、および
− 最高の適応度値を有するシミュレートされた動作が得られる命令を機械的システムの物理的アクチュエータに送るステップ。
【0006】
「内部的にシミュレートする」は、例えば一体化されたコンピューティング・ユニットを使用して機械的システムが自立的に異なる案をシミュレートすることであると理解されるべきである。
【0007】
この機械的システムは、自立的ロボットであることができる。
【0008】
目標は、この機械的システムの視覚システムによって発生させることができる。
【0009】
シミュレーションは、逆運動学(inverse kinematics)または逆動力学(inverse dynamics)手法を使用して行われる。
【0010】
適応度(fitness)は、費用関数(cost function)を使用して計算することができる。
【0011】
内部シミュレーション処理速度は、下位の機械的システムの機械的応答時間より早く設定することができる。
【0012】
処理ステップは、反復方法で行うことができる。
【0013】
シミュレーションは、自己コリジョン検出、自己コリジョン回避および/または外部オブジェクトの回避を含むことができる。
【0014】
シミュレーションは、動作の運動学的シミュレーションまたはシステムの動きおよび力の対話を考慮する動力学的シミュレーションである。
【0015】
本発明は、そのような方法を実施するように設計される制御器にも関する。
【0016】
本発明はそのような制御器を有するロボットにも関する。
【0017】
最後に本発明は、コンピュータ装置上で実行するとき、添付の請求項のいずれかに記載の方法を実施するコンピュータ・ソフトウェア製品にも関する。
【0018】
本発明の別の特徴、態様および目的は、添付の図面の図と共に行われる実施形態の添付の詳細な説明を読むとき、技術者に明らかになるであろう。
【発明を実施するための最良の形態】
【0019】
本発明は、それぞれ複数の自由度を含む、異なる動作挙動を行うことができるロボットなどの知能的機械的システムを提案する。
【0020】
「知能的(intelligent)」は、高レベルの命令を処理し、これらの命令に応答して機械的システムの物理的挙動を制御することができるコンピューティング・ユニットが装備されるシステムを意味し、(環境に関連する)高レベル命令に応答する挙動は対話型挙動(interactive behaviour)を示す。
【0021】
この機械的システムは、挙動を「切り換える(switch)」、すなわち挙動の任意選択肢の中から選択するように設計される。現実面で(かつ内部シミュレーションでのみではなく)実際に行われるこの物理的な挙動の選択は、例えば図1に示すような内部シミュレーション・アーキテクチャに基づいて行うことができる。図1に示すように、高レベルのタスクから結果として発生する高レベル命令は、選択インスタンス(セレクタ(selector))に送られる。ここで、高レベルのタスクとは、例えばロボットの視覚システムまたは他の(例えば音響的)検知システムによって処理され決められる目標などである。この目標は抽象的な形態を有することができ、必ずしもロボット特有の目標記述に対応する必要はない。
【0022】
この高レベルのタスクは、ロボット自体によって(例えば物体認識を介して)、およびロボットに外部命令を供給することによっての一方または両方によって発生させることができる。
【0023】
第2のステップで、この高レベル目標はセレクタによって処理される。この機構は抽象的な目標から異なる命令cmd1、cmd2、...を発生させる。個々の命令の各々は、高レベル目標を達成できるように発生させられる。これらの命令cmd1、cmd2、...は、下位にあるロボットまたは他の機械的システムによって多次元の自由度で物理的に制御できる制御入力に対応する。発生する命令cmd1、cmd2、...の数に関して上限はない。
【0024】
第3のステップで、各々の個々の命令は下位ロボット/システムの内部シミュレーション機構に渡される。この内部シミュレーションはこの命令を受け取り、ロボット/システムのそれぞれの動作を計算することを介してシミュレートする。ロボット制御では、これは例えば「逆運動学」または「逆動力学」の方法で行うことができる。
【0025】
さらなるステップでは次いで、この内部シミュレーションはシミュレートされた動作を評価するが、そこではそれは異なる目的(速度、消費されるリソースを最適化する、等)を示す費用関数を使用してある値を計算する。この値は、「適応度値(fitness value)」と呼ぶこともできる。
【0026】
「費用関数」および「適応度値」は、最適化の分野ではよく認知された術語である。
【0027】
この費用関数値は、所与の対話型シナリオによって変わる。どのようにそのような費用関数をもたらすことができるかの考え得る例が以下の実施例で与えられる。次のステップでは、個々の内部シミュレーション・インスタンスの各々がその費用値(cost value)を選択機構に通信して戻す。選択機構は次に、例えば適応度値に「勝者がすべてを得る(winner takes all)」戦略を適用することによって、特定の状況に対して最も適切なシミュレーションを選ぶ。次に選ばれたシミュレーション・インスタンスの命令が物理的なロボット/システムに送られる。
【0028】
以下の点が強調されるべきである。
【0029】
・ 内部シミュレーションの処理速度はリアルタイムより高い場合がある。これは、内部シミュレーション・インスタンスが、物理的なロボットがそのような状態に達してしまう前に戦略が適切か否かを決めることができることを意味する。これは「内部予測(internal prediction)」能力と命名することができる。
・ 提示された方法は、反復ステップで働くことができる。これは、セレクタ、シミュレーションおよび現実のロボット/システムの間のループが非常に短い時間間隔(例えば1ミリ秒)内でアップデートされることを意味する。これによってこの方法は、変化が現行の「高レベル命令」に反映されるであろうから、変化する環境に迅速に反応できるようになる。したがってロボットの挙動は、進行中のタスクの実行中にアップデートすることができる。
・ この内部シミュレーションはロボット制御器の完全なシミュレーションを含む。これは、自己コリジョン検出、自己コリジョン回避および外部オブジェクトの回避のための方法も含むことができる。
・ このシミュレーションは、(動作のみを考慮する)運動学的シミュレーションまたは(システムの力の対話も考慮する)動力学的シミュレーションであることができる。
【実施例】
【0030】
ロボットが人間の手から物体を取るとする。人間はその物体を保持し、かつ適宜移動させることができる。「高レベル命令」は、例えばカメラ・システムによって抽出されるその物体の座標であろう。次に選択機構は図2に示すように以下の命令分離を行うことができた。
【0031】
・ 物体の座標を左手に割り当てる、静止して立つ(選択肢1)
・ 物体の座標を右手に割り当てる、静止して立つ(選択肢2)
・ 物体の座標を左手に割り当てる、歩く(選択肢3)
・ 物体の座標を右手に割り当てる、歩く(選択肢4)
【0032】
次に各シミュレーションが評価される。最も適切な戦略の選択は多基準費用関数(multi−criteria cost function)(適応度関数も)に基づいている。これを示すために、人間の手から物体を握らなければならないロボットが想定されている。したがって、「物体を握っている」が高レベル命令である。
【0033】
この例では、費用関数が以下の発見的方法を符号化する:立っていることが歩くことより、歩くことは何もしないことより好ましい。このために、以下の判定基準が適応度関数に組み込まれる:
【0034】
・ 目標の到達可能性
目標に到達できない場合、高いペナルティが費用関数に加えられる。これは結果としてこの戦略は選択されないであろうことになる。
・ 姿勢の不快さ
関節の中心位置に対する、関節の重み付け最小二乗距離(weighted least squares)が、「不快(discomfort)」ペナルティを規定する。目標は1つの側からもう1つの側に移動するときはいつでも、このペナルティはシステムを伸ばす腕に切り換えさせる。
・ 「怠惰(Laziness)」
歩くことより立っていることの方が選ばれるように、歩く戦略の両方は一定のペナルティを受ける。
・ 目標までの時間
このペナルティは歩く戦略に加えられる。それは目標までの推測時間の尺度であり、その結果目標に最も効率的に到達することができる。このペナルティはロボットに、ロボットを最小の歩数を有する姿勢に向かわせる戦略を選択するようにさせる。
【0035】
この実施例は簡単に見えるが、一般的な考え方はより進んだ決定機構を組み込み、任意の複雑な判断基準を策定することを可能にする。この新生ロボットの挙動は非常に興味深い(進行を示す図2を参照):
【0036】
− 物体を左から右に移動させるとき、ロボットは最初(図2の最初の期間)に右手でそれに到達しようと試み、次いで動的に左手に切り換える(第2の期間)。
− 物体が到達圏外にある場合、ロボットは歩き始め物体を追跡する(図2の第3の期間)。
− 図2の第3の期間に、ロボットは歩き、同時に左手で物体に到達しようと試みる。
− 図2の第4の期間に、ロボットは歩き、同時に右手で物体に到達しようと試みる。
【0037】
図2は、最初から最後までの時間にわたる4つの費用関数の展開を示す。最低値を有する費用関数が最良であるとみなされる。それぞれの戦略が動作中である期間が時間軸の下で示されている。
【0038】
図2から、高レベル命令を実施しようと試みている間、この内部シミュレーションは、この高レベル・タスクの遂行の現行の進行状況の見地から最良の挙動案を反復して計算しつづける。
【0039】
以下の点に留意すべきである:上記で述べた方法で内部シミュレーションを使用する提案された選択機構は、他のロボットまたはシステムにも適用することができる。
【図面の簡単な説明】
【0040】
【図1】ロボットの対話型挙動を制御するための線図である。
【図2】時間に対する4つのシミュレーション・インスタンスの適応度関数の進行の図である。
【出願人】 【識別番号】503113186
【氏名又は名称】ホンダ リサーチ インスティテュート ヨーロッパ ゲーエムベーハー
【氏名又は名称原語表記】Honda Research Institute Europe GmbH
【出願日】 平成19年5月21日(2007.5.21)
【代理人】 【識別番号】110000246
【氏名又は名称】特許業務法人オカダ・フシミ・ヒラノ


【公開番号】 特開2008−883(P2008−883A)
【公開日】 平成20年1月10日(2008.1.10)
【出願番号】 特願2007−134071(P2007−134071)