'완전기본개념강화학습' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록완전기본개념강화학습 (1)

Fintecuriosity

[강화학습] 강화학습 완전 기본개념

이번 글의 내용은 '기초부터 시작하는 강화학습 / 신경망 알고리즘(손민규 지음, 위키북스 DS 시리즈)'의 내용을 참조 및 정리 하였으며 저의 개인적인 인사이트 또한 추가된 점을 먼저 밝힙니다. 먼저 강화학습을 들었을때 직관적으로 어떠한 생각이 들까요? 저같은 경우에 처음 '강화학습'이란 들었을 때 게임에서 아이템을 강화하는 것처럼 부족한 부분을 보완하는 것이라고 직관적으로 생각했습니다. 그러면 본론으로 돌아가면 강화학습에서는 보상(Reward)과 벌칙(Punishment)를 먼저 정의해야 합니다. 직접적으로 정답을 미리주는 것이 아니라, 어떤 상태에서 취한 행동이면 보상을 주고, 잘못된 행동이라면 벌칙을 주는 것입니다. 학습대상은 시행착오(trial-and-error)를 통해서 스스로 벌칙을 최소화하고..

Artificial Intelligence/강화학습 2020. 7. 8. 00:13

이전 Prev 1 Next 다음

목록완전기본개념강화학습 (1)

Fintecuriosity

티스토리툴바