일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 크롤링
- Crawling
- pytorch
- 백준
- 빅데이터
- YarinGal
- 파이썬
- 텍스트분석
- 알고리즘
- 베이지안
- PYTHON
- pandas
- 강화학습
- DATA
- 논문리뷰
- dropout
- 리눅스
- Graph
- 우분투
- uncertainty
- bayesian
- 불확실성
- 텍스트마이닝
- VAE
- selenium
- 데이터분석
- R
- AI
- GNN
- 코딩테스트
- Today
- Total
목록전체 글 (154)
끄적거림
어떤 폴더 안에 있는 많은 엑셀, csv 파일들을 loop를 돌려 차례대로 읽어서 row bind를 하거나, API를 여러번 호출하여 나온 결과를 순차적으로 row bind하는 경우가 더러 생긴다. 이를 완화시킬수 있는 좋은 글을 발견하여 공유하고 정리하고자 한다. 이럴 때 그 읽어들이는 dataset의 양이 많지 않으면 아래와 같은 방법으로 loop를 돌리면 되지만, 추천하지 않는 방법 1 import pandas as pd total = pd.DataFrame() for datapath in datalist: t = pd.read_csv(datapath) total = total.append(t) 추천하지 않는 방법 2 import pandas as pd total = pd.DataFrame() fo..
문자열 핸들링 중에서 특수문자를 제거하는 것을 원하는 경우가 종종 발생한다. 이 코드가 도움이 되길 바란다. 단일변수일 때 import re string = "abcdefㄱㄴㄷㄹㅁㅂ가나다라마바사12345[]{}().,!?'`~;:" re.sub('[^A-Za-z0-9가-힣]', '', string) # re.sub('[^A-Za-z0-9가-힣]', '', string) # Out[153]: 'abcdef가나다라마바사12345' DataFrame에서 변경할 때 total['TITLE2'] = [re.sub('[^A-Za-z0-9가-힣]', '', s) for s in total['제목']] 참고: data-newbie.tistory.com/206

[iPad Air 4세대] 구매 방법 및 후기(온라인 픽업 구매) [iPad Air 4세대] 픽업 방법 및 후기(가로수길 애플스토어 방문기) 아이패드 에어4를 구매하고 난 뒤 케이스와 종이필름을 구매하여 사용중에 있다. 종이필름은 willy's에 가서 직접 현장 구매했고, 케이스는 인터넷으로 주문했다. 1. 종이필름 많은 유튜브 자료나 블로그를 보면 종이 필름에 대한 이야기가 많다. 하지만, 내가 여친의 아이패드 프로를 빌려 사용할 당시 종이필름이 너무 편하고 필기감이 좋았기에 나는 단 1의 고민도 없이 바로 종이필름을 구매하였다. 본인은 아이폰을 사용하면서 액정 강화 유리 필름을 주로 사용하는 편이고, 보통은 인터넷에서 저렴하게 몇 장 구입해서 손재주가 있다고 생각하기에 스스로 갈아 붙여넣는다. 하지만..
[논문 리뷰] What uncertainties do we need in Bayesian deep learning for computer vision? - 1.Introduction [논문 리뷰] What uncertainties do we need in Bayesian deep learning for computer vision? - 2.Related Work(1) [논문 리뷰] What uncertainties do we need in Bayesian deep learning for computer vision? - 2.Related Work(2) [논문 리뷰] What uncertainties do we need in Bayesian deep learning for computer vision? -..
1번째 방법) df1.append(df2) A = pd.DataFrame({ 'a':[1,2,3,4,5], 'b':[6,7,8,9,10] }) B = pd.DataFrame({ 'a':[11,12,13,14,15], 'b':[16,17,18,19,20] }) A.append(B) 2번째 방법) pd.concat([df1, df2], axis=0) A = pd.DataFrame({ 'a':[1,2,3,4,5], 'b':[6,7,8,9,10] }) B = pd.DataFrame({ 'a':[11,12,13,14,15], 'b':[16,17,18,19,20] }) pd.concat([A,B], axis=0) # axis = 0 --> row bind / 1 --> column bind 참고 RUL : rfri..

위의 표는 혼동행렬(Confusion Matrix)이라 불리는 도수 분포표라고 보면 된다.(분류된 빈도를 가지고 나타낸 도표) 위의 상황은 Binary Classification의 경우이며, 클래스가 더 많아진다면 그 이상도 가능하다. 흔히 Binary Classification을 진행하면 softmax나 logistic function을 사용해서 0~1 사이의 값(확률값이라 부르고 싶진 않다.)으로 결과가 떨어지는데, threshold(default = 0.5)를 기준으로 분류를 하여 얻을 수 있는 대표적인 지표는 아래와 같다. Accuracy(정확도) : ( TP + TN ) / ( P + N ) Precision(정밀도) : TP / ( TP + FP ) Recall(재현도, Sensitive) :..