TF와 keras를 통해 supervised learning을 해보고있는 머린이입니다.

혹시 A라벨의 데이터와 B라벨의 데이터로 학습을 시킨다음 두 라벨의 데이가 아닌 C라벨의 데이터를 넣으면 A또는 B가 아님! 으로 만들수있는 방법이 존재할까요?

예를들어 개 / 고양이를 판단할 수 있게 학습된 네트워크에 개미를 집어넣으면 개/고양이가 아닌 무언가 라고 판단을 시키고싶습니다.!


헉.. 제 레포를 추천해주셔서 감사합니다!! 위에 적어주신 내용이 딱 Out-of-distribution detection 문제이며, 이 문제에 대해 자세히 정리한 글이 있는데, 이 글을 참고하시면 좋을 것 같습니다.

https://hoya012.github.io/blog/anomaly-detection-overview-2/

Posted by uniqueone
,
안녕하세요, TF-KR 여러분!

그동안 많은 좋은 정보들을 눈팅만 하다가 여러분께 의견을 구하고 싶은 것이 있어 처음으로 글을 남깁니다!

내용은 시계열 데이터들을 변화 양상에 따라 유사한 것들끼리 클러스터링 하고자 하는 것입니다.

아래 이미지는 5개 데이터 샘플의 그래프이고 총 10,000여개 정도의 데이터를 가지고 있습니다.

파생 변수를 생성하여 파생 변수를 통해 클러스터링을 진행해보기도 했는데 근본적인 데이터 흐름에 따른 클러스터링을 하고 싶습니다.

그래프 이미지를 클러스터링하는 방법도 있을 것 같은데 감을 잡기도, 방법을 찾는 것도 너무 만만치가 않네요…ㅎㅎㅎ

5개의 그래프가 그려져있는 각각의 이미지는 같은 데이터들을 grouping하는 범위만 다르게 한 것입니다.

좋은 방법이나 참고할만한 좋은 자료를 추천해주시면 너무 감사하겠습니다ㅠㅠ

가장 간단하게는 tslearn 패키지로 시작해보세요. time-series clustering method들을 함수로 정의해놓은 sklearn같은 패키지입니다. 그리고 보통 time series에 한해서는 time-dependent measure (distance-based clustering의 경우..) Dynamic Time Warping distance가 많이 거론되니 공부해보시고.... 위에 댓글 남겨주신 것처럼 deep learning으로 넘어오게 되면 autoencoder, seq2seq autoencoder로 latent representation을 학습한 후에 그것들의 클러스터를 구하는 방법도 논문에서 많이 찾아볼 수 있습니다. 기본적으로 어떤 방법들이 그동안 연구되었는지 보고 싶으시면 Survey on time-series clustering 요런 식으로 검색해보세요.

grouping 문제도 결국 feature space상에서 어떻게 cluster를 만들어 갈 것이냐 하는 문제라서 각 그래프들의 feature를 어떻게 뽑아낼 것인지를 고민하는 문제로 바꿔 생각해볼 수 있을듯합니다. 간단하게는 autoencoder부터 돌려보시고, meta learning쪽 둘러보신 후에 clustering은 전통의 knn같은 것으로 묶어보심 어떨까요



https://www.facebook.com/groups/PyTorchKR/permalink/1539376382868704/?sfnsn=mo
Posted by uniqueone
,
"Prior가 뭔지는 알잖아요?"

동의하는척 웃고 넘어간 뒤 한 없이 부끄러워져서 머신러닝 관련 기본적인 통계추론 내용을 정리를 해보았습니다. 논문 읽을 때 자주 나오는 내용인데도 생각보다 간결히 정리하기가 어려웠습니다. 대단한 내용이 있는 건 아니지만 잘 대답할 수 있나 확인해보시면 좋겠습니다.

.
.
.

1. 머신러닝 할 때 통계가 왜 필요할까?

2. PDF의 값이 1이 넘을 수 있겠는가? 예시를 들자면?

3. 아는 확률분포와 언제 사용할 수 있는지 말해보라.

4. 중심극한정리가 무엇이고 어느 맥락에서 사용되는지 설명해보아라.

5. 모수적 방법과 비모수적 방법의 차이는? 모수적 방법을 사용할 수 없는 경우는 언제인가?

6. 우도(likelihood)를 설명해 보아라.

7. 키가 측정할 때 마다 다르다면 어떻게 참값을 추정할 수 있을까?(키가 더이상 크지 않는 상황을 가정하자 ㅠㅠ)

8. MLE와 MAP차이를 수식으로 쓸 수 있겠는가? 그 의미는? 각 방법의 한계점은 뭐가 있을까? 사전확률(prior)을 설명해 보아라.

9. MLE 방법과 Mean Squared Error, Cross Entropy를 줄이는 방법이 동치인 경우를 말해보아라.

10. Log Likelihood를 쓰는 이유는 뭘까? log를 씌우면 MLE의 값이 변하지 않을까?

11. pure, semi, naive bayesian의 차이가 뭘까? 어떤 장단점이 있을까?

12. (NLP) MLE와 naive-bayesian을 사용한 Unigram Language Modeling의 학습 방법을 설명해보아라. 이 방법의 문제점은 뭘까?

블로그에 간략히 답을 달았습니다.
https://www.facebook.com/groups/modulabs/permalink/2541750722556762/?sfnsn=mo
Posted by uniqueone
,
TF로 구현을 할 때 네트워크의 특정 부분을 resue하면서 동시에 update를 안하게 할 수도 있나요? 현재는 with tf.variable_scope('P',reuse=False): 이런 식으로 감싸서 resue를 하고 있는데, 특정 forward path의 경우는 network의 학습을 안하게 하고 싶습니다.

+ 그룹에 포스팅하는 것 왜이렇게 불편해졌나요... 쓸때없는 마크다운과 글 삭제를 눌러도 안지워지는 버그랑, 점점 별로가 되어가네요.
https://www.facebook.com/groups/TensorFlowKR/permalink/1012047532469638/?sfnsn=mo
Posted by uniqueone
,
https://m.facebook.com/groups/255834461424286?view=permalink&id=475526739455056

안녕하세요, bidirectional lstm을 사용해 보려고 mnist데이터를 사용한 간단한 예제를 돌리는 중에 다음과 같은 에러가 나서 도움을 요청해 봅니다. 그전에 탠서플로우를 설치할때 소스로 부터 컴파일 하라는 warning이 뜨긴 했는데 이 문제 때문일까요? Ubuntu14.04에 GTX1080을 사용하고 있습니다.

OOM 이라함은 out of memory 라는 이야기에요. GPU 메모리가 부족하시네요

그전에 batch_size = 8 로 해보세요
8로해도 똑같은 오류가 발생한다면

cmd에서 nvidia-smi 라고 치시면
뭐라고 나오나요?

돌리고 있는 상태가 아니기 때문에 저 메모리가 반환이 되었어야 했는데 안되었네요.

ctrl + shift + esc 눌러서 python 이름 있는거 다 종료해보고
메모리 줄어들었나 확인해보세요.

Kyung Mo Kweon 우와 이제 잘 실행 됩니당!!! 너무 감사합니다!!
Posted by uniqueone
,