전체 글
-
Horovod 모듈 설치하기Practical_skills/odds and ends 2020. 1. 16. 20:19
refer refer cuda 는 알아서 설치 요망 prerequisit: NCCL for Multi-GPU, gcc compllier, anaconda gxx complier, tensorflow-gpu, openmpi install nccl install gcc version 4.9 if you use anaconda virtual environment, install anaconda g++ complier install tensorflow-gpu install openmpi install horovod with tensorflow install nccl refer Download Network Installer for Ubuntu16.04 $ sudo dpkg -i nvidia-machine-lea..
-
Relay Policy Learning (RPL) 리뷰Paper/Reinforcement Learning 2019. 11. 28. 17:24
Relay Policy Learning RPL 논문 을 번역하며 요약해보았다. Introduction multi-stage, long-horizon robotic tasks 를 해결하기 위한 Relay policy Learning (RPL) 방법을 제안했고 2 phase로 되어있다. Goal conditioned hierarchical policy를 생성하는 Relay Imitation Learning(RIL) stage 생성된 Policy를 fine tuning 하는 Relay Reinforcement Fine tuning(RRF) stage 기존의HRL은 temporal abstraction을 도입하므로써 long-horizon problem을 풀 수 잇는 실마리를 제공했다. 하지만 아래와 같은 pr..
-
Attention is all you need 리뷰Paper/Learning based method 2019. 10. 29. 13:11
Attention is all you need 참조1 참조2 참조3 참조4 1. Contribution global dependency를 잡아내고 횡방향으로 병렬 연산을 가능하게 하여 학습속도를 높임 RNN 모델을 Attention으로 대체 가능하게 함 2. Background 2.1. ByteNet sequential 한 연산을 줄이자는 목표 hidden representation을 병렬처리하기 위해 CNN활용 distant position 에 있는 dependency는 많은 연산을 필요로 함 2.2. Self Attention = Transformer 이전의 RNN과 함께 사용되던 attention의 경우에는 인코더 측의 hidden variable과 디코더 측의 hidden variable간의 유사..
-
Random Variable들의 의미Study/Probability 2019. 10. 17. 13:55
여러가지 랜덤변수들에 대한 의미와 분포, 각 변수들끼리의 관계에 기반한 평균, 분산의 의미들을 분석해보겠다. 랜덤변수들 Bernoulli 변수의 의미 어떤 사건이 일어났을 때 동시에 다른 사건도 일어나는 겨우를 말하며 예를 들면 성공이 있으면 반대로 실패도 있는 경우를 말한다. 베르누이 랜덤변수는 성공했을 때 1이고 실패했을 때는 0 인 indicator function이다. parameter로는 어떤 사건이 성공할 확률 p를 말한다. PMF와 CDF $$ P_{X}(k) = p^{k}(1-p)^{1-k}, k = 0,1, ... \\ F_{X}(x) = \begin{cases} 0 & ,x i + j | X > i) = P(X > j) \text{ for } i,j \geq 1 $$ i시간 까지 계속 ..
-
Application of hybrid A starPaper/Rule based method 2019. 9. 24. 19:02
Practical Search Techniques in Path Planning for Autonomous Driving이라는 논문을 읽고 리뷰를 작성했다. 2007년 DARPA Urban challenge에서 Stanford의 레이싱 팀인 Junior가 주차 환경에서 성공적인 navigation을 한것에 대한 핵심방법으로 planning을 하는데 50-300ms 정도로 realtime으로 동작할 수 있었다고 하여 논문을 찾아보았다. 주된 공헌은 기존의 hybrid A star에서의 단점을 해결했다고 한다. 참조 hybrid A* Reeds-Shepp model Two heuristics non-holonomic without obstacles 자동차 운동의 제약사항을 고려하고 장애물이 없다는 가정하에서..
-
Modeling integrated Lane changing behaviorPaper/Rule based method 2019. 9. 10. 20:48
소개 2003년 Transportation Network Modeling 학회 논문으로써 인용수가 192회이다, 논문을 고른 이유 Rule based 방법론으로 lane change를 어떻게 modeling 했고 어느정도의 performance를 가지며 어떤 기준으로 그것을 측정하는지 한계점이 무엇인지를 알아보기 위해서 이다. 소개 차선변경 모델은 보통 2 step으로 진행된다. 차선변경을 생각할지 결정 차선변경을 실행할지 결정 대부분의 모델들은 2가지로 분류된다. MLC (Mandatory Lane Change) 현재 차선을 떠나야 할때 수행된다. DLC (Discretionary Lane Change) 현재 주행조건을 개선 하고자 할 때 수행된다 = 목표차선이 더 좋은 조건이라는 것은 알지만 차선변경..
-
file managing systemPractical_skills/practice 2019. 8. 28. 14:16
database 파일을 처리하거나 특정 파일 목록을 불러오기 등등 managing system과 관련된 모듈을 익혀보자. 데이타 베이스에서 특정 열의 정보들을 가지고 연산을 하여 새로운 열을 추가 중복되는 행 제거 **pandas 모듈** 사용하여 append merge 특정 열의 정보로 데이터 베이스 길이를 조절하여 segment단위로 자르기 시간관련 모듈을 다루는 방법 **time, datetime 모듈**특정 문자열을 갖는 파일 file write, read 방법 **os, fnmatch 모듈**config.ini 파일을 읽기 **configparser 모듈**예제코드 및 설명
-
pyqt 사용하기 (2)Practical_skills/practice 2019. 8. 28. 14:00
QmainWindow와 QWidget의 차이를 알아보고 사용방법도 알아보자. 쉽게 말하면 QmainWindow 는 Qwidget을 상속받은 클래스이다. 그래서 QmainWindow에 있는 함수가 QWidget에는 없다. 저자는 setstatus같은 것을 사용하고 싶어 사용하게 되었다. 주의해야 할 것들 QMainWinodw에서는 Widget을 배치하기 위한 framework를 제공하기 때문에 QWidget을 만들고 각위치에 배치시키면 된다. python 3.6에서는 부모 클래스의 생성자를 호출할 때 생성자에 아래의 함수를 호출하지만 super().__init__()python 2.7에서는 아래의 형식을 맞추어 주어야 한다. super({상속받는 클래스 이름}, self).__init__()연습코드