Delayed reward in reinforcement learning: an experiment in multi-agent control

Petri Ikonen; Silvia Coradeschi; Jacek Malec

Widok

Metadane zasobu

Tytuł	Delayed reward in reinforcement learning: an experiment in multi-agent control
Osoby	Autorzy: Petri Ikonen, Silvia Coradeschi, Jacek Malec Partner: Politechnika Wrocławska
Opis	Referat zaprezentowany w 1998 roku na VI Krajowej Konferencji Robotyki. (Polski) Opis w innym języku: The paper describes an approach to reinforcement-based multi-agent learning. Due to the domain constraints the classical immediate-reward approach is inapplicable, therefore a delayed reward technique has been introduced. The paper describes the RoboCup domain used as the testbed for a multi-agent system and summarizes the first, preliminary phase of experiments. (Angielski)
Słowa kluczowe	"robot"@pl, "Krajowa Konferencja Robotyki"@pl, "robotyka"@pl, "uczenie ze wzmocnieniem"@pl, "nagroda opóźniona"@pl, "system wieloagentowy"@pl, "RoboCup"@pl
Klasyfikacja	Typ zasobu: artykuł, rozdział Dyscyplina naukowa: dziedzina nauk technicznych / automatyka i robotyka (2011) Grupa docelowa: naukowcy, nauczyciele, studenci Szkodliwe treści: Nie
Charakterystyka	Tytuł źródła: Materiały VI Krajowej Konferencji Robotyki: tom 1 Miejsce wydania: Wrocław Wydawca: Wydawnictwo Politechniki Wrocławskiej Czas wydania: 1998 Od strony: 233 Do strony: 240 ISSN: 0324-9794 Język zasobu: Angielski
Licencja	CC BY-SA 4.0
Informacje techniczne	Deponujący: Robert Muszyński Data udostępnienia: 12-06-2019
Kolekcje	Kolekcja Politechniki Wrocławskiej, Kolekcja e-Biblio PWr

Cytowanie

Skopiowano

Petri Ikonen, Silvia Coradeschi, Jacek Malec. Delayed reward in reinforcement learning: an experiment in multi-agent control. [artykuł, rozdział] Dostępny w Atlasie Zasobów Otwartej Nauki, . Licencja: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Data dostępu: DD.MM.RRRR.

Podobne zasoby

Algebraiczny warunek automatycznego generowania planów uniwersalnych

Ireneusz Sierocki, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Koordynacja agentów mobilnych z użyciem platformy V-Rep i języka skryptowego Lua. Badanie przydatności środowiska

Artur Wąż, Elżbieta Roszkowska, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Wizyjny system lokalizacji z estymatorem prędkości i przyspieszeń dla robota mobilnego

Marcin Kiełczewski, Dariusz Pazderski, Krzysztof Kozłowski, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Optymalne konfiguracje manipulatorów drzewiastych

Krystian Turczyn, Ignacy Dulęba, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Stanowisko rozpoznawania biosygnałów oparte na komercyjnym systemie akwizycji danych

Michał Błędowski, Andrzej Wołczowski, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Protokół komunikacyjny i architektura systemu do realizacji zadań w Internecie Wszechrzeczy

Stanisław Ambroszkiewicz, Waldemar Bartyna, Kamil Skarżyński, Marcin Stępniak, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)

Zobacz więcej