ZGŁOŚ PROBLEM
ODSYŁACZE
Link do zasobu (skrót):
http://zasobynauki.pl/zasoby/41056Link do zasobu (repozytorium):
https://id.e-science.pl/records/41056Metadane zasobu
Tytuł |
Delayed reward in reinforcement learning: an experiment in multi-agent control |
---|---|
Osoby |
Autorzy:
Petri Ikonen, Silvia Coradeschi, Jacek Malec
Partner: Politechnika Wrocławska |
Opis |
Referat zaprezentowany w 1998 roku na VI Krajowej Konferencji Robotyki. (Polski) Opis w innym języku: The paper describes an approach to reinforcement-based multi-agent learning. Due to the domain constraints the classical immediate-reward approach is inapplicable, therefore a delayed reward technique has been introduced. The paper describes the RoboCup domain used as the testbed for a multi-agent system and summarizes the first, preliminary phase of experiments. (Angielski) |
Słowa kluczowe | "robot"@pl, "Krajowa Konferencja Robotyki"@pl, "robotyka"@pl, "uczenie ze wzmocnieniem"@pl, "nagroda opóźniona"@pl, "system wieloagentowy"@pl, "RoboCup"@pl |
Klasyfikacja |
Typ zasobu:
artykuł, rozdział Dyscyplina naukowa: dziedzina nauk technicznych / automatyka i robotyka (2011) Grupa docelowa: naukowcy, nauczyciele, studenci Szkodliwe treści: Nie |
Charakterystyka |
Tytuł źródła: Materiały VI Krajowej Konferencji Robotyki: tom 1
Miejsce wydania: Wrocław Wydawca: Wydawnictwo Politechniki Wrocławskiej Czas wydania: 1998 Od strony: 233 Do strony: 240 ISSN: 0324-9794 Język zasobu: Angielski |
Licencja | CC BY-SA 4.0 |
Informacje techniczne |
Deponujący: Robert Muszyński Data udostępnienia: 12-06-2019 |
Kolekcje | Kolekcja Politechniki Wrocławskiej, Kolekcja e-Biblio PWr |
Cytowanie
Petri Ikonen, Silvia Coradeschi, Jacek Malec. Delayed reward in reinforcement learning: an experiment in multi-agent control. [artykuł, rozdział] Dostępny w Atlasie Zasobów Otwartej Nauki, . Licencja: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Data dostępu: DD.MM.RRRR.
Podobne zasoby
Algebraiczny warunek automatycznego generowania planów uniwersalnych
Ireneusz Sierocki, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)
Koordynacja agentów mobilnych z użyciem platformy V-Rep i języka skryptowego Lua. Badanie przydatności środowiska
Artur Wąż, Elżbieta Roszkowska, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)
Wizyjny system lokalizacji z estymatorem prędkości i przyspieszeń dla robota mobilnego
Marcin Kiełczewski, Dariusz Pazderski, Krzysztof Kozłowski, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)
Optymalne konfiguracje manipulatorów drzewiastych
Krystian Turczyn, Ignacy Dulęba, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)
Stanowisko rozpoznawania biosygnałów oparte na komercyjnym systemie akwizycji danych
Michał Błędowski, Andrzej Wołczowski, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)
Protokół komunikacyjny i architektura systemu do realizacji zadań w Internecie Wszechrzeczy
Stanisław Ambroszkiewicz, Waldemar Bartyna, Kamil Skarżyński, Marcin Stępniak, artykuł, rozdział, Politechnika Wrocławska, dziedzina nauk technicznych / automatyka i robotyka (2011)