https://m.facebook.com/story.php?story_fbid=340227976413204&id=303538826748786
데이터과학 및 딥러닝을 위한 데이터세트
데이터 과학 기술을 배우는 대부분의 사람들은 실제 데이터를 사용하여 작업합니다. 그러나 잘못된 데이터를 사용하면 시간이 많이 걸리고 초조한 모험이 될 수 있습니다.
필자는 데이터과학 기술을 배우면서 올바른 유형의 데이터를 선택하기 위해 지켜야 할 규칙을 작성했습니다.
1. 회귀 분석
-. 자동차 mpg 데이터세트
https://archive.ics.uci.edu/ml/datasets/auto+mpg
-. UCI 머신러닝 저장소
http://archive.ics.uci.edu/ml/index.php
2. 분류
-. Kaggle
http://www.kaggle.com/
3. 시계열 분석
-. 시계열 데이터 라이브러리
https://datamarket.com/data/list/?q=provider:tsdl
-. Quandl
https://www.quandl.com/
4. 시각화
-. 데이터의 흐름
http://flowingdata.com/
-. subreddit r/dataisbeautiful
https://www.reddit.com/r/dataisbeautiful/
5. 자연어
-. Reddit 주석
https://www.reddit.com/r/datasets/comments/3bxlg7/i_have_every_publicly_available_reddit_comment/
-. 트위터 정서 분석
https://github.com/jonbruner/twitter-analysis
-. 영어 음성 데이터베이스
http://www.linguistics.ucsb.edu/research/santa-barbara-corpus
-. SNAP 데이터베이스
https://snap.stanford.edu/data/index.html
6. 대형 데이터세트
-. ImageNet
http://www.image-net.org/
-. 얼굴 인식
http://www.face-rec.org/databases/
-. 고양이, 강아지
https://www.kaggle.com/c/dogs-vs-cats-redux-kernels-edition
-. Tiny Image
http://horatio.cs.nyu.edu/mit/tiny/data/index.html
-. Indian Movie Face
http://cvit.iiit.ac.in/projects/IMFDB/
**카테고리 및 형식별
https://github.com/rasbt/pattern_classification/blob/master/resources/dataset_collections.md#dataset-repositories
**주제
https://dreamtolearn.com/ryan/1001_datasets
**위치
https://opendatainception.io/
**다양한 주제에 재한 데이터세트
https://www.reddit.com/r/datasets/
출처 :
https://medium.com/startup-data-science/data-sets-to-play-with-while-learning-data-science-and-deep-learning-43eb92f28448
데이터과학 및 딥러닝을 위한 데이터세트
데이터 과학 기술을 배우는 대부분의 사람들은 실제 데이터를 사용하여 작업합니다. 그러나 잘못된 데이터를 사용하면 시간이 많이 걸리고 초조한 모험이 될 수 있습니다.
필자는 데이터과학 기술을 배우면서 올바른 유형의 데이터를 선택하기 위해 지켜야 할 규칙을 작성했습니다.
1. 회귀 분석
-. 자동차 mpg 데이터세트
https://archive.ics.uci.edu/ml/datasets/auto+mpg
-. UCI 머신러닝 저장소
http://archive.ics.uci.edu/ml/index.php
2. 분류
-. Kaggle
http://www.kaggle.com/
3. 시계열 분석
-. 시계열 데이터 라이브러리
https://datamarket.com/data/list/?q=provider:tsdl
-. Quandl
https://www.quandl.com/
4. 시각화
-. 데이터의 흐름
http://flowingdata.com/
-. subreddit r/dataisbeautiful
https://www.reddit.com/r/dataisbeautiful/
5. 자연어
-. Reddit 주석
https://www.reddit.com/r/datasets/comments/3bxlg7/i_have_every_publicly_available_reddit_comment/
-. 트위터 정서 분석
https://github.com/jonbruner/twitter-analysis
-. 영어 음성 데이터베이스
http://www.linguistics.ucsb.edu/research/santa-barbara-corpus
-. SNAP 데이터베이스
https://snap.stanford.edu/data/index.html
6. 대형 데이터세트
-. ImageNet
http://www.image-net.org/
-. 얼굴 인식
http://www.face-rec.org/databases/
-. 고양이, 강아지
https://www.kaggle.com/c/dogs-vs-cats-redux-kernels-edition
-. Tiny Image
http://horatio.cs.nyu.edu/mit/tiny/data/index.html
-. Indian Movie Face
http://cvit.iiit.ac.in/projects/IMFDB/
**카테고리 및 형식별
https://github.com/rasbt/pattern_classification/blob/master/resources/dataset_collections.md#dataset-repositories
**주제
https://dreamtolearn.com/ryan/1001_datasets
**위치
https://opendatainception.io/
**다양한 주제에 재한 데이터세트
https://www.reddit.com/r/datasets/
출처 :
https://medium.com/startup-data-science/data-sets-to-play-with-while-learning-data-science-and-deep-learning-43eb92f28448
'Machine Learning > resources' 카테고리의 다른 글
머신러닝 용어 https://developers.google.com/machine-learning/glossary/ (0) | 2017.09.28 |
---|---|
30개의 필수 데이터과학, 머신러닝, 딥러닝 치트시트 (0) | 2017.09.26 |
Beginning Machine Learning – A few Resources [Subjective] (0) | 2017.06.20 |
SNU TF 스터디 모임 1기 때부터 쭉 모아온 발표자료들 (0) | 2017.04.14 |
List of Free Must-Read Books for Machine Learning (0) | 2017.04.06 |