Combination of Movement Primitives for Robotics Kombination von Movement Primitives in der Robotik

Probabilistic Movement Primitives (ProMPs) are a promising approach to represent movements. ProMPs can capture the variance of the movements and can be trained by immitation learning. Additionally, they enabled new operators on the primitives, such as modulation of the movement, as well as combination and blending between primitives. We modify the probabilistic structure to generate movement primitives dependent on a certain task (TaskMP), like reaching a specific position or orientation. In this work, we focus on the combination of these task dependent probabilistic movement primitives. In the first step toward our goal, we focus on the modelling of TaskMPs by Gaussian mixture models with linear experts. This approach is able to capture non-linear dependencies between a task and the movement representation, in the primitive parameters. The proposed system were trained by an Expectation Maximization (EM) algorithm. We analyse the combination of two individually trained TaskMPs for two different tasks. The combination of primitives enables us to solve the combination of two tasks by reusing trained primitives. We demonstrate that if the primitives A and B are able to solve two separate tasks, it is possible to solve all combinations of these single tasks by the combination of the two primitives A and B. We model the combination of primitives by a mixture of experts model. To further improve the results of this combination, an learning approach is derived, which trains the model-parameters of a mixture combination at once. This product of a mixture of experts is able to solve a combination of tasks with less mixture components and less training data than a single TaskMP. We compare the result with the previous combination approach and a single task dependent primitive. Abstract Probabilistic Movement Primitives (ProMPs) stellen einen vielversprechenden Ansatz zur Repräsentation von Bewegungen dar. ProMPs können durch Immitations-Lernen trainiert werden und sind fähig die Varianz von Bewegungen abzubilden. Desweiteren ermöglichen sie die Anwendungen von neuen Operatoren wie die Modulation einer Bewegung oder die Kombination und das Blenden zwischen Primitiven. Der Strukturansatz über Wahrscheinlichkeitsverteilungen wird so modifiziert, dass die Generierung von Bewegungs-Primitiven, die von bestimmten Aufgaben bzw. Parametern abhängen (TaskMPs), ermöglicht wird. Beispiele hierfür sind das Einnehmen einer bestimmten Position oder Orientierung. Diese Arbeit legt den Schwerpunkt auf die Kombination solcher aufgabenorientierten Bewegungs-Primitive. Der erste Schritt beinhaltet die Modellierung von TaskMPs, über Gaußsche Mischverteilungsmodelle mit linearen Experten. Durch diesen Ansatz ist es möglich, nicht lineare Abhängigkeiten zwischen Ziel und Bewegungsrepräsentation bzw. den Primitive-Parametern mit ein zu beziehen. Auf Basis dieser Schritte wird die Kombination zweier unabhängig (für zwei unterschiedliche Ziele) trainierten TaskMPs analysiert. Eine solche Kombination ermöglicht es, eine Zusammenstellung aus zwei Zielen durch wiederholten Einsatz bereits trainierter Primitive zu lösen. Sind die Primitve A und B fähig zwei separate Aufgaben zu lösen, ist es ebenfalls möglich, alle Kombinationen dieser einzelnen Ziele mittels einer Kombination der Primitive A und B zu lösen. Diese Kombination aus zwei Bewegungs-Primitiven wird durch ein Mischverteilungs-Experten-Modell abgebildet. Um diese Ergebnisse weiter zu verbessern, wurde ein Trainingsansatz aufgebaut, welcher alle Parameter einer Mischmodell-Kombination gleichzeitig lernt. Dieses Produkt aus Misch-Experten-Modellen ist fähig, eine ZielKombination mit weniger Modell-Komponenten und dadurch weniger Trainings-Daten zu lösen, als es ein einzelnes TaskMP im Stande wäre. Die Ergebnisse werden mit dem vorherigen Kombinations-Ansatz und einzelnen TaskMPs verglichen.Probabilistic Movement Primitives (ProMPs) stellen einen vielversprechenden Ansatz zur Repräsentation von Bewegungen dar. ProMPs können durch Immitations-Lernen trainiert werden und sind fähig die Varianz von Bewegungen abzubilden. Desweiteren ermöglichen sie die Anwendungen von neuen Operatoren wie die Modulation einer Bewegung oder die Kombination und das Blenden zwischen Primitiven. Der Strukturansatz über Wahrscheinlichkeitsverteilungen wird so modifiziert, dass die Generierung von Bewegungs-Primitiven, die von bestimmten Aufgaben bzw. Parametern abhängen (TaskMPs), ermöglicht wird. Beispiele hierfür sind das Einnehmen einer bestimmten Position oder Orientierung. Diese Arbeit legt den Schwerpunkt auf die Kombination solcher aufgabenorientierten Bewegungs-Primitive. Der erste Schritt beinhaltet die Modellierung von TaskMPs, über Gaußsche Mischverteilungsmodelle mit linearen Experten. Durch diesen Ansatz ist es möglich, nicht lineare Abhängigkeiten zwischen Ziel und Bewegungsrepräsentation bzw. den Primitive-Parametern mit ein zu beziehen. Auf Basis dieser Schritte wird die Kombination zweier unabhängig (für zwei unterschiedliche Ziele) trainierten TaskMPs analysiert. Eine solche Kombination ermöglicht es, eine Zusammenstellung aus zwei Zielen durch wiederholten Einsatz bereits trainierter Primitive zu lösen. Sind die Primitve A und B fähig zwei separate Aufgaben zu lösen, ist es ebenfalls möglich, alle Kombinationen dieser einzelnen Ziele mittels einer Kombination der Primitive A und B zu lösen. Diese Kombination aus zwei Bewegungs-Primitiven wird durch ein Mischverteilungs-Experten-Modell abgebildet. Um diese Ergebnisse weiter zu verbessern, wurde ein Trainingsansatz aufgebaut, welcher alle Parameter einer Mischmodell-Kombination gleichzeitig lernt. Dieses Produkt aus Misch-Experten-Modellen ist fähig, eine ZielKombination mit weniger Modell-Komponenten und dadurch weniger Trainings-Daten zu lösen, als es ein einzelnes TaskMP im Stande wäre. Die Ergebnisse werden mit dem vorherigen Kombinations-Ansatz und einzelnen TaskMPs verglichen.

[1]  Robert A. Jacobs,et al.  Hierarchical Mixtures of Experts and the EM Algorithm , 1993, Neural Computation.

[2]  Andrea d'Avella,et al.  Modularity in the motor system: decomposition of muscle patterns as combinations of time-varying synergies , 2001, NIPS.

[3]  Geoffrey E. Hinton Training Products of Experts by Minimizing Contrastive Divergence , 2002, Neural Computation.

[4]  Christopher M. Bishop,et al.  Bayesian Hierarchical Mixtures of Experts , 2002, UAI.

[5]  O. Khatib TASK-ORIENTED CONTROL OF HUMANOID ROBOTS THROUGH PRIORITIZATION , 2004 .

[6]  Emilio Bizzi,et al.  Shared and specific muscle synergies in natural motor behaviors. , 2005, Proceedings of the National Academy of Sciences of the United States of America.

[7]  Christopher M. Bishop,et al.  Pattern Recognition and Machine Learning (Information Science and Statistics) , 2006 .

[8]  Kaare Brandt Petersen,et al.  The Matrix Cookbook , 2006 .

[9]  Francesco Lacquaniti,et al.  Control of Fast-Reaching Movements by Muscle Synergy Combinations , 2006, The Journal of Neuroscience.

[10]  E. Bizzi,et al.  Article history: , 2005 .

[11]  Stefan Schaal,et al.  Movement reproduction and obstacle avoidance with dynamic movement primitives and potential fields , 2008, Humanoids 2008 - 8th IEEE-RAS International Conference on Humanoid Robots.

[12]  Betty J. Mohler,et al.  Learning perceptual coupling for motor primitives , 2008, 2008 IEEE/RSJ International Conference on Intelligent Robots and Systems.

[13]  G. Oriolo,et al.  Robotics: Modelling, Planning and Control , 2008 .

[14]  Emanuel Todorov,et al.  Compositionality of optimal control laws , 2009, NIPS.

[15]  Christoph H. Lampert,et al.  Movement templates for learning of hitting and batting , 2010, 2010 IEEE International Conference on Robotics and Automation.

[16]  Jun Morimoto,et al.  Task-Specific Generalization of Discrete and Periodic Dynamic Movement Primitives , 2010, IEEE Transactions on Robotics.

[17]  Ludovic Righetti,et al.  Toward simple control for complex, autonomous robotic applications: combining discrete and rhythmic motor primitives , 2011, Auton. Robots.

[18]  Jan Peters,et al.  Probabilistic Movement Primitives , 2013, NIPS.

[19]  Jun Nakanishi,et al.  Dynamical Movement Primitives: Learning Attractor Models for Motor Behaviors , 2013, Neural Computation.

[20]  Jan Peters,et al.  A Survey on Policy Search for Robotics , 2013, Found. Trends Robotics.

[21]  Jan Peters,et al.  Data-Efficient Generalization of Robot Skills with Contextual Policy Search , 2013, AAAI.

[22]  Oliver Kroemer,et al.  Learning sequential motor tasks , 2013, 2013 IEEE International Conference on Robotics and Automation.

[23]  Jan Peters,et al.  Learning modular policies for robotics , 2014, Front. Comput. Neurosci..