반응형
250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- YarinGal
- DATA
- 강화학습
- pytorch
- 리눅스
- 알고리즘
- 베이지안
- R
- GNN
- selenium
- 불확실성
- 파이썬
- 텍스트마이닝
- dropout
- 백준
- 논문리뷰
- pandas
- 크롤링
- Graph
- bayesian
- 빅데이터
- PYTHON
- 텍스트분석
- 우분투
- 코딩테스트
- uncertainty
- 데이터분석
- VAE
- Crawling
- AI
Archives
- Today
- Total
목록Data-engineer (1)
끄적거림

pySpark를 공부하고자 VM에 우분투까지 설치했지만, 뭔가 혼자서 책으로 공부하기에 왠지 모를 커다란 장벽이 있는 느낌이었다. 그러다가, edwith에서 제공하는 pySpark 강의가 있기에 그것을 튜토리얼 삼아 공부하기로 했다. 지금부터 시작할 내용은 edwith에서 제공하는 pySpark 강의를 그대로 따라하면서 공부해 나가는 과정을 담을 것이다. edwith: pySpark를 활용한 데이터분석 1. pySpark 환경 선택(Databricks) 기본적으로 본 강의에서는 pySpark를 실행할 수 있는 환경을 Databricks라는 클라우드 플랫폼을 선택했다. Databricks는 유로 클라우드 서비스이지만 무료버전에서도 충분히 사용할 수 있다는 설명이 적혀져 있었다.(test성으로...) Dat..
Python/PySpark
2020. 4. 2. 13:52