https://m.facebook.com/story.php?story_fbid=340227976413204&id=303538826748786

데이터과학 및 딥러닝을 위한 데이터세트
데이터 과학 기술을 배우는 대부분의 사람들은 실제 데이터를 사용하여 작업합니다. 그러나 잘못된 데이터를 사용하면 시간이 많이 걸리고 초조한 모험이 될 수 있습니다.

필자는 데이터과학 기술을 배우면서 올바른 유형의 데이터를 선택하기 위해 지켜야 할 규칙을 작성했습니다.

1. 회귀 분석
-. 자동차 mpg 데이터세트
https://archive.ics.uci.edu/ml/datasets/auto+mpg

-. UCI 머신러닝 저장소
http://archive.ics.uci.edu/ml/index.php

2. 분류
-. Kaggle
http://www.kaggle.com/

3. 시계열 분석
-. 시계열 데이터 라이브러리
https://datamarket.com/data/list/?q=provider:tsdl

-. Quandl
https://www.quandl.com/

4. 시각화
-. 데이터의 흐름
http://flowingdata.com/

-. subreddit r/dataisbeautiful
https://www.reddit.com/r/dataisbeautiful/

5. 자연어
-. Reddit 주석
https://www.reddit.com/r/datasets/comments/3bxlg7/i_have_every_publicly_available_reddit_comment/

-. 트위터 정서 분석
https://github.com/jonbruner/twitter-analysis

-. 영어 음성 데이터베이스
http://www.linguistics.ucsb.edu/research/santa-barbara-corpus

-. SNAP 데이터베이스
https://snap.stanford.edu/data/index.html

6. 대형 데이터세트
-. ImageNet
http://www.image-net.org/

-. 얼굴 인식
http://www.face-rec.org/databases/

-. 고양이, 강아지
https://www.kaggle.com/c/dogs-vs-cats-redux-kernels-edition

-. Tiny Image
http://horatio.cs.nyu.edu/mit/tiny/data/index.html

-. Indian Movie Face
http://cvit.iiit.ac.in/projects/IMFDB/

**카테고리 및 형식별
https://github.com/rasbt/pattern_classification/blob/master/resources/dataset_collections.md#dataset-repositories

**주제
https://dreamtolearn.com/ryan/1001_datasets

**위치
https://opendatainception.io/

**다양한 주제에 재한 데이터세트
https://www.reddit.com/r/datasets/

출처 :
https://medium.com/startup-data-science/data-sets-to-play-with-while-learning-data-science-and-deep-learning-43eb92f28448
Posted by uniqueone
,