일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Crawling
- 크롤링
- GNN
- pytorch
- 리눅스
- 우분투
- YarinGal
- DATA
- dropout
- uncertainty
- 알고리즘
- 강화학습
- VAE
- 코딩테스트
- 텍스트분석
- 백준
- 빅데이터
- 논문리뷰
- 데이터분석
- 베이지안
- R
- selenium
- 불확실성
- Graph
- AI
- 파이썬
- pandas
- 텍스트마이닝
- PYTHON
- bayesian
- Today
- Total
목록pyspark (2)
끄적거림

pySpark를 공부하고자 VM에 우분투까지 설치했지만, 뭔가 혼자서 책으로 공부하기에 왠지 모를 커다란 장벽이 있는 느낌이었다. 그러다가, edwith에서 제공하는 pySpark 강의가 있기에 그것을 튜토리얼 삼아 공부하기로 했다. 지금부터 시작할 내용은 edwith에서 제공하는 pySpark 강의를 그대로 따라하면서 공부해 나가는 과정을 담을 것이다. edwith: pySpark를 활용한 데이터분석 1. pySpark 환경 선택(Databricks) 기본적으로 본 강의에서는 pySpark를 실행할 수 있는 환경을 Databricks라는 클라우드 플랫폼을 선택했다. Databricks는 유로 클라우드 서비스이지만 무료버전에서도 충분히 사용할 수 있다는 설명이 적혀져 있었다.(test성으로...) Dat..

pySpark를 공부하기 위해 리눅스 환경을 세팅해야하는 상황에서 VirtualBox를 이용해 우분투를 설치해보았다. 참고로, 나는 이런 컴퓨터스러운? 영역에 약하기 때문에 여러 블로그와 사이트를 참고하여 설치했다. 01. VirtualBox 설치 오라클의 VirtualBox를 설치한다. 구글링해보니 VirtualBox가 가장 무난하고 괜찮은듯하다. 다운로드 사이트 : https://www.virtualbox.org/wiki/Downloads Downloads – Oracle VM VirtualBox Download VirtualBox Here you will find links to VirtualBox binaries and its source code. VirtualBox binaries By dow..