-
큐러닝 코드 ( off policy TD control ) => 학습정책 =! 행동정책IT&컴퓨터공학/딥러닝 2020. 12. 6. 23:49
살사는 행동정책과 학습정책이 동일해서 그리드월드에 갇히는 경우가 발생함 예를들어 전 에피소드에서 맞는 길을 가던중에 장애물로 가는 행동을 해서 현재상태의 가치함수가 낮아지면 다음 에피소드에서도 이 상태로는 다신 안감 -> 원래 맞는길인데 거기로 안가고 계속 뱅글뱅글 돔 이걸 극복한게 큐러닝 큐러닝은 학습정책과 행동정책을 따로 둔다. 벨만 최적방정식을 이용한다. environment.py 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 ..
-
살사 코드IT&컴퓨터공학/딥러닝 2020. 12. 6. 23:31
environment.py 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123..
-
가치이터레이션 코드IT&컴퓨터공학/딥러닝 2020. 12. 6. 21:01
environment.py 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123..
-
정책이터레이션 코드IT&컴퓨터공학/딥러닝 2020. 12. 6. 20:53
environment.py 9,10, 32,33,34 70,71,72 100 158 217,218,219 수정 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 ..
-
[Git] 로컬 저장소/ 원격 저장소 / 연결 / add / commit /pushIT&컴퓨터공학/GIT 2020. 7. 5. 16:42
1. Github 홈페이지에서 Repository 생성 2. 내 컴퓨터 ( 로컬 ) 에서도 로컬 저장소로 사용할 폴더를 직접 생성. 나의경우 사용자 -> git -> " abcd " 라는 폴더 생성 3. git bash 를 키고 abcd 경로안으로 들어가 준다. 4. git init 입력 // 깃 저장소 초기화. 이 명령어를 입력하기 전에는 abcd라는 폴더는 일반폴더임. 이것을 입력한 후에야 추가적인 깃 명령어들을 사용할 수 있다. 5. git remote add origin https://**************************** 입력 밑줄친 url 은 github 에 있는 레파지토리 url 이다. 1. git bash 에서 abcd 경로안에서 , touch Readme.txt 입력 ☞ Re..
-
[13] 심화 정렬 ( SORT ) - Heap SortIT&컴퓨터공학/자료구조&알고리즘 2020. 7. 5. 13:06
Heap Sort - 최악의 경우에도 시간 복잡도 O(nlog2n) - 추가 배열도 필요하지 않음 - 이진 힙 ( binary heap ) 자료구조를 사용 힙을 알려면 Tree 와 Binary Tree 를 알아야함. Tree 트리의 속성 중 가장 중요한 것이 ‘루트노드를 제외한 모든 노드는 단 하나의 부모노드만을 가진다’는 것 이 속성 때문에 트리는 다음 성질을 만족함. 임의의 노드에서 다른 노드로 가는 경로(path)는 유일하다. 회로(cycle)가 존재하지 않는다. 모든 노드는 서로 연결되어 있다. 엣지(edge)를 하나 자르면 트리가 두 개로 분리된다. 엣지(edge)의 수 |EE| 는 노드의 수 |VV|에서 1을 뺀 것과 같다. 참조 ↓ https://ratsgo.github.io/data%20s..
-
EJS 란IT&컴퓨터공학 2020. 7. 3. 17:29
EJS = Embedded JavaScript Template nodejs 진영에서 많이 사용하는 템플릿엔진이다. 문법이 단순하다. ejs 는 html 안에서 를 이용해서 서버의 데이터를 사용하거나 코드를 실행할 수 있다. 기본 문법 주석 : JS 코드 : 변수 출력(html escape 처리: >를 $gt로 변환) : 태그내부 공백 제거 : html escape안하고 변수 출력 : nodejs와 연동(= 데이터 넘겨주기) 3-1. express 없이 연동하기 const ejs = require("ejs"); ejs.render(경로, 데이터, 옵션); 3-2. express 에서 연동하기 app.js 에서 app.set('view engine', 'ejs'); 처리하는 라우터에서 아래와 같은 로직이 있..