Tugevõppele (RL) antakse preemiate ja karistuste süsteem. Tugevdatav õpe on laiem kui jälgitav või järelevalveta õpe eesmärgi saavutamiseks või lihts alt kasu saamiseks keskkonnakontaktide stiimulitest ja karistustest.
Millist tüüpi preemiaid ja karistusi tagasisidena antakse?
Esimene on hinnav tagasiside kui tugevdus, kus preemiaid ja karistusi kasutatakse õppija käitumise kujundamiseks tugevdavate õppemehhanismide kaudu.
Millised on tasu ja karistuse liigid?
Nüüd ühendame need neli mõistet: positiivne tugevdamine, negatiivne tugevdamine, positiivne karistus ja negatiivne karistus (tabel 1). Midagi lisatakse käitumise tõenäosuse suurendamiseks. Midagi lisatakse käitumise tõenäosuse vähendamiseks.
Milline õppimine põhineb tasu ja karistuse lähenemisviisil?
Kaudselt, ilma teadliku töötlemiseta saavad inimesed teada iga konteksti ja tegevuse tasu ja karistuse väärtusest. Need assotsiatiivse õppimise protsessid mõjutavad omakorda tõenäosust, et üksikisikud tegelevad uuesti selliste tegevustega või otsivad seda konteksti.
Kuidas premeerimine ja karistus mõjutavad õppimist?
Üldiselt nägime tasu vähest mõju õppimisele ega kinnipidamisele. Karistus ei mõjutanud oskuste säilitamist, kuid sellel oli märkimisväärne,ülesandest sõltuv mõju õppimisele. SRTT-karistuses parem kiirus, mis mõjutab täpsust minimaalselt. Seevastu kahjustas karistus finantstehingute maksu tulemuslikkust.