Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 통계학
- 통계적품질관리
- 일일경제공부
- 확률기반자연어처리
- 언어적지식
- 자연어처리
- 이공계를위한특허이해
- 공대생의산업공학공부
- 공대생의언어학공부
- 언어학
- 인공지능
- 지식재산경영
- 공대생의전공공부
- 영어영문학
- 경제용어
- 컴퓨터공학
- 정보시스템
- 정보시스템설계및분석
- 지적재산권
- 최적화기법
- 메타휴리스틱
- 최적화문제
- 고전방법론
- 공대생의경제공부
- 공대생의문과공부
- 특허
- 산업공학
- 품질경영
- 공대생의연구공부
- 국어국문학
Archives
- Today
- Total
목록Q-Learning (1)
Fintecuriosity

이번 글의 내용은 '기초부터 시작하는 강화학습 / 신경망 알고리즘(손민규 지음, 위키북스 DS 시리즈)'의 내용을 참조 및 정리 하였으며 저의 개인적인 인사이트 또한 추가된 점을 먼저 밝힙니다. 강화학습의 아이디어를 더 쉽게 설명을 하면 스키너 상자 실험의 예가 있습니다. 레버를 누르면 먹이가 나오는 상자 안에 비둘기를 넣은 후, 비둘기를 관찰하는 스키너 상자 실험을 한 스키너는 처음에는 레버와 먹이와의 관계를 모르던 비둘기가 지속적으로 나오는 먹이를 보면서 원리는 이해하지 못하였지만 레버를 누를 경우에 먹이가 계속 나온다는 의식이 강화되는 것을 파악하였습니다. 이 실험에서 강화란 어떤 지속적인 자극에 의한 반응 점차적으로 강해지거나 약해지는 것을 의미합니다. 스키너 상자 실험의 예는 주로 심리학에서 많..
Artificial Intelligence/강화학습
2020. 7. 8. 00:27