REPORT A PROBLEMicon

Fields marked with an asterisk are required
*
*
*
*
captcha
I hereby confirm that I have read and accept regulations and privacy policies *

LINKS

Resource link (portal)

Resource link (short)

http://zasobynauki.pl/zasoby/82864

Resource link (repository)

https://id.e-science.pl/records/82864

Resource type: thesis

Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04)

View

Resource metadata

Title Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04)
Persons Authors: Daniel Osman
Partner: Systems Research Institute Polish Academy of Sciences, Warsaw
Description Rozprawa rozpatruje zagadnienia związane z problemem sterowania na przykładzie gry w anty-warcaby, a celem jest stworzenie algorytmu uczącego się w nie grać. Wykorzystano tu znany algorytm uczenia ze wzmocnieniem -- Temporal Difference TD(λ) który można stosować w sytuacji gdy ocena pracy agenta następuje dopiero po zakończeniu rozgrywki i znany jest jej wynik. Ważnym elementem wpływającym na skuteczność algorytmu uczącego był odpowiedni dobór strategii treningowej, co zostało szczegółowo opisane. W pracy został również wykorzystany algorytm pseudo-ewolucyjny EVO, którego zastosowanie umożliwiło porównanie skuteczności algorytmu TD(λ) z odmienną metodą nauczania taktyki agenta. Algorytm został zaimplementowany i przetestowany w języku Ocaml. (Polish)
Keywords "game theory"@en, "teoria gier"@pl
Classification Resource type: thesis
Scientific discipline: Dziedzina nauk inżynieryjno-technicznych / informatyka techniczna i telekomunikacja (2018)
Destination group: pupils, students, scientists
Harmful content: No
Characteristics Place of creation: Warszawa
Creation time: 2006
Number of pages: 121
Supervisor: Jacek Mańdziuk
Resource language: Polish
License CC BY-SA 4.0
Technical information Submitter: Anna Wasilewska
Availability date: 17-01-2023
Collections Kolekcja Instytutu Badań Systemowych PAN w Warszawie

Citation

Copied

Daniel Osman. Skuteczość metod uczenia w algorytmach z rodziny Temporal Difference w zastosowaniu do dwuoosobowych gier planszowych (PD-2007-04). [thesis] Available in Atlas of Open Science Resources, . License: CC BY-SA 4.0, https://creativecommons.org/licenses/by-sa/4.0/legalcode.pl. Date of access: DD.MM.RRRR.

Similar resources

Własności rozwiązań kooperacyjnych w problemie przetargowym

Piotr Bronisz, thesis, Systems Research Institute Polish Academy of Sciences, Warsaw, dziedzina nauk technicznych / automatyka i robotyka (2011)

See more