일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- AI
- 불확실성
- R
- uncertainty
- PYTHON
- pandas
- 논문리뷰
- 텍스트마이닝
- DATA
- 코딩테스트
- 백준
- bayesian
- GNN
- pytorch
- 베이지안
- YarinGal
- 우분투
- Graph
- Crawling
- 크롤링
- 알고리즘
- 텍스트분석
- 파이썬
- 데이터분석
- 리눅스
- selenium
- 강화학습
- dropout
- VAE
- 빅데이터
- Today
- Total
목록R쓸신잡 (11)
끄적거림
이전 시간들에서 RJDBC, RODBC, ROracle 세 개의 패키지를 다뤄보았다. 그렇다면 왜 굳이 DB를 연결하는 방법이 이렇게나 많은 것일까? 내 경험상 pc마다의 환경이 다르므로 각 환경에 최적화된 커넥션 패키지를 만들었다고 생각이 들고, 세 가지의 패키지를 설치해보고 설치가 잘 되는 것을 사용하면 좋을 듯하다. 그럼 단적으로 어느 것이 가장 빠르고 좋다고 볼 수 있을까? 결론은 알 수 없다. 일반적으로 Oracle 환경에서는 ROracle이 가장 빠르다고 알려져 있다. 아래의 URL을 확인해보면 알 수 있듯이 CRUD(Create, Read, Update, Delete) 모든 부분에서 ROracle이 가장 빠르고 파워풀하다고 할 수 있다. 비교 자료: https://www.r-craft.org..
실무에서 데이터분석을 하다보면 필요한 데이터를 DB에서 수시로 내려받아야할 순간이 온다. 하지만 언제까지 DB 툴에서 Excel로 내려 받을 수는 없으니 DB와 직접 연결하여 R 자체에서 데이터를 불러와보자. 본 코드와 내용은 Oracle 기준이고 Oracle DB와 연동할 수 있는 방법은 총 3가지(패키지)가 있다. 1) RJDBC 2) RODBC 3) ROracle 대망의 마지막 ROracle package!! ROracle의 경우 해당 document는 아래 url로 확인하면 된다. ROracle document: https://cran.r-project.org/web/packages/ROracle/ROracle.pdf ROracle은 설치가 굉장히 힘들고 그 과정에서 에러도 많이 발생하는 것으로 ..
실무에서 데이터분석을 하다보면 필요한 데이터를 DB에서 수시로 내려받아야할 순간이 온다. 하지만 언제까지 DB 툴에서 Excel로 내려 받을 수는 없으니 DB와 직접 연결하여 R 자체에서 데이터를 불러와보자. 본 코드와 내용은 Oracle 기준이고 Oracle DB와 연동할 수 있는 방법은 총 3가지(패키지)가 있다. 1) RJDBC 2) RODBC 3) ROracle 1. Setting DB 당연하겠지만 DB가 설치가 잘 되어있어야한다. ODBC를 이용한 DB 연결은 별다른 코딩이 없기 때문에 DB와 ODBC 설정이 잘 되어 있어야한다. 2. Install package RODBC와 DBI 패키지를 인스톨하고 임포트한다. install.packages(c("DBI", "RODBC")) library(D..
실무에서 데이터분석을 하다보면 필요한 데이터를 DB에서 수시로 내려받아야할 순간이 온다. 하지만 언제까지 DB 툴에서 Excel로 내려 받을 수는 없으니 DB와 직접 연결하여 R 자체에서 데이터를 불러와보자. 본 코드와 내용은 Oracle 기준이고 Oracle DB와 연동할 수 있는 방법은 총 3가지(패키지)가 있다. 1) RJDBC 2) RODBC 3) ROracle 1. install and download java 가장 먼저 해야할 일은 Java를 설치하는 것이다. 아마 대부분 설치가 되어있겠지만, 자바를 잘 설치하고 환경변수에 자바의 위치를 잘 설정해야지 DB와의 연동이 가능하다. 2. Set Environment variable 위에서 말했던 것처럼 환경변수를 세팅해줘야하는데 이때는 R에서 직접..

나는 원래 R 사용자였으며, 나름 학부시절 잘하는 쪽에 속한다고 생각했다. 그것이 가능했던 것이 data.table 패키지를 어느정도 잘 사용하고 나서부터라고 생각한다. 그동안 내가 알고 있던 꿀팁들을 적어볼까한다. 1. data.table 패키지 소개 여기저기 찾아보면 많은 자료들이 있으니 간단하게 소개하고 넘어가겠다. 우선 기능적으로 보았을 때, 1) 빠른 계산력을 제공한다. 가장 기본적인 매트릭스 형태로 R에서는 data.frame을 제공한다. 하지만, 사용하다보면 가독성도 떨어지고, 사용하기 불편하고, 다소 느린 단점들이 있다. 이런 부분들을 개선한 것이 data.table이다. 데이터 성격에 따라 차이가 있겠지만 대략 10~100배 정도 빠르다고 생각하면 된다. 2) 적용 범위가 넓다. data..