일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- VAE
- AI
- 크롤링
- 우분투
- DATA
- Crawling
- dropout
- 베이지안
- 논문리뷰
- 텍스트마이닝
- 데이터분석
- 텍스트분석
- 알고리즘
- uncertainty
- YarinGal
- 불확실성
- 코딩테스트
- pandas
- GNN
- 파이썬
- R
- 리눅스
- 빅데이터
- Graph
- 백준
- 강화학습
- bayesian
- pytorch
- PYTHON
- selenium
- Today
- Total
목록Python/PySpark (3)
끄적거림

pySpark를 공부하고자 VM에 우분투까지 설치했지만, 뭔가 혼자서 책으로 공부하기에 왠지 모를 커다란 장벽이 있는 느낌이었다. 그러다가, edwith에서 제공하는 pySpark 강의가 있기에 그것을 튜토리얼 삼아 공부하기로 했다. 지금부터 시작할 내용은 edwith에서 제공하는 pySpark 강의를 그대로 따라하면서 공부해 나가는 과정을 담을 것이다. edwith: pySpark를 활용한 데이터분석 1. pySpark 환경 선택(Databricks) 기본적으로 본 강의에서는 pySpark를 실행할 수 있는 환경을 Databricks라는 클라우드 플랫폼을 선택했다. Databricks는 유로 클라우드 서비스이지만 무료버전에서도 충분히 사용할 수 있다는 설명이 적혀져 있었다.(test성으로...) Dat..
보호되어 있는 글입니다.

여러 패키지(모듈)을 사용할 수 있는 아나콘다를 설치하려한다. 01. 아나콘다 .sh파일 다운로드 해당 사이트에 접속하여 리눅스 버전 중 python 3.7 64-Bit (x86) Installer 버전을 다운로드 받는다. 아나콘다 사이트 : https://www.anaconda.com/distribution/#linux Anaconda Python/R Distribution - Free Download Anaconda Distribution is the world's most popular Python data science platform. Download the free version to access over 1500 data science packages and manage libraries a..