일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- uncertainty
- 크롤링
- 파이썬
- selenium
- DATA
- 베이지안
- YarinGal
- pandas
- AI
- 알고리즘
- PYTHON
- 우분투
- R
- 빅데이터
- GNN
- 강화학습
- pytorch
- bayesian
- 텍스트분석
- 백준
- 데이터분석
- 코딩테스트
- 리눅스
- VAE
- Graph
- 불확실성
- 텍스트마이닝
- 논문리뷰
- Crawling
- dropout
- Today
- Total
목록DATA (6)
끄적거림

이전 포스팅 [논문 소개] On Uncertainty, Tempering, and Data Augmentation in Bayesian Classification - 0.Abstract 믿음이라는 표현이 나오는데 베이지안이라고 변경해서 해석해도 될듯! 이건 확인이 필요함. 1.1. Epistemic/Aleatoric Uncertainty Epistemic Uncertainty와 Aleatoric Uncertainty에 대한 설명이 나오지만, 이전 포스팅에서 설명하였으므로 스킵한다. 1.2 그림 설명 보라색 점은 관측된 데이터이다. Gaussian Process Regression(G.P.R.)를 이용해서 모델링 한 것이다. (a)는 분산을 1로 높게 설정하여 나타낸 그림이고, 빨간색 점선은 predict..

[리뷰 크롤링] PlayStore 댓글 크롤링하기 in python 1(feat. selenium) [리뷰 크롤링] PlayStore 댓글 크롤링하기 in python 2(feat. selenium) [리뷰 크롤링] PlayStore 댓글 크롤링하기 in python 3(feat. selenium) [리뷰 크롤링] PlayStore 댓글 크롤링하기 in python 4(feat. selenium) [리뷰 크롤링] PlayStore 댓글 크롤링하기 in python 5(feat. selenium) 예전에 포스팅했던 글들인데, 많은 사람들이 찾게되면서 여러가지 문의를 남기셨다. 그중에서 가장 많은 문의를 받은 것이 총 자동화된 코드를 알고싶으시다는 요청이어서 이렇게 간단하게나마 글을 끄적여본다. 일단 내 블..

[논문 리뷰] Dropout as a Bayesian Approximation 설명 - 1.Prologue [논문 리뷰] Dropout as a Bayesian Approximation 설명 - 2.Abstract [논문 리뷰] Dropout as a Bayesian Approximation 설명 - 3.Introduce [논문 리뷰] Dropout as a Bayesian Approximation 설명 - 4.Related Research (1): Background(MC-Integration, Dropout) [논문 리뷰] Dropout as a Bayesian Approximation 설명 - 4.Related Research (2): Background(Gaussian Process) [논문 리뷰..

[데이터셋] PHD08 한글 손글씨 이미지 데이터 [데이터셋] PHD08 한글 손글씨 이미지 데이터 딥러닝, 특히 CNN에서 가장 먼저 접하는 데이터셋이 바로 MNIST일거라 생각된다. MNIST는 0~9까지의 숫자에 대한 손글씨 이미지 데이터이다. 해외에서 공인된 데이터인만큼 데이터를 얻기도 매우 수 signing.tistory.com 예전 포스팅으로 한글 손글씨 이미지 데이터인 PHD08 데이터 셋에 대한 소개를 한 적이 있다. 이 데이터 셋을 가지고 이제 대학원 과제로 하게된 한글 손글씨 인식 모델링을 진행하고자 한다. 일단 전의 포스팅을 참고하여 데이터셋을 준비해야한다. 시간이 매우 오래 걸리니 원하는 파일만 가져다가 데이터를 준비하길 바란다. 그 다음으로 데이터를 가지고 모델링을 해야하는데 내 ..

이전 글: 2020/11/10 - [논문 리뷰] What uncertainties do we need in Bayesian deep learning for computer vision? - 1.Introduction 2. Related Work 본 논문에서 말하는 불확실성은 결국 분산으로 생각할 수 있다. 우리가 어떤 분포에서 분산을 알 수 있다면, 어느정도의 확률로 예측범위안에 들어올 것이다 를 알 수 있다. 이는 곧 신뢰구간과 비슷한 의미라고 생각하면 되겠다. 논문에서는 uncertainty를 sigma, variance 등과 같은 분산 혹은 어떤 분포로 혼용하여 사용하기도 한다. 기존의 Bayesian Deep Learning(이하 BDL)에서는 epistemic과 aleatoric 둘 중 하나만 ..

나는 원래 R 사용자였으며, 나름 학부시절 잘하는 쪽에 속한다고 생각했다. 그것이 가능했던 것이 data.table 패키지를 어느정도 잘 사용하고 나서부터라고 생각한다. 그동안 내가 알고 있던 꿀팁들을 적어볼까한다. 1. data.table 패키지 소개 여기저기 찾아보면 많은 자료들이 있으니 간단하게 소개하고 넘어가겠다. 우선 기능적으로 보았을 때, 1) 빠른 계산력을 제공한다. 가장 기본적인 매트릭스 형태로 R에서는 data.frame을 제공한다. 하지만, 사용하다보면 가독성도 떨어지고, 사용하기 불편하고, 다소 느린 단점들이 있다. 이런 부분들을 개선한 것이 data.table이다. 데이터 성격에 따라 차이가 있겠지만 대략 10~100배 정도 빠르다고 생각하면 된다. 2) 적용 범위가 넓다. data..