끄적거림

250x250

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 (154)

끄적거림

[DataFrame] 여러 DataFrame 가볍게 append하기 in python

어떤 폴더 안에 있는 많은 엑셀, csv 파일들을 loop를 돌려 차례대로 읽어서 row bind를 하거나, API를 여러번 호출하여 나온 결과를 순차적으로 row bind하는 경우가 더러 생긴다. 이를 완화시킬수 있는 좋은 글을 발견하여 공유하고 정리하고자 한다. 이럴 때 그 읽어들이는 dataset의 양이 많지 않으면 아래와 같은 방법으로 loop를 돌리면 되지만, 추천하지 않는 방법 1 import pandas as pd total = pd.DataFrame() for datapath in datalist: t = pd.read_csv(datapath) total = total.append(t) 추천하지 않는 방법 2 import pandas as pd total = pd.DataFrame() fo..

Python/Data Handling 2020. 11. 26. 14:39

[문자열 다루기] 문자(한글, 영문)와 숫자만 남기고 특수문자 제거하기 in python

문자열 핸들링 중에서 특수문자를 제거하는 것을 원하는 경우가 종종 발생한다. 이 코드가 도움이 되길 바란다. 단일변수일 때 import re string = "abcdefㄱㄴㄷㄹㅁㅂ가나다라마바사12345[]{}().,!?'`~;:" re.sub('[^A-Za-z0-9가-힣]', '', string) # re.sub('[^A-Za-z0-9가-힣]', '', string) # Out[153]: 'abcdef가나다라마바사12345' DataFrame에서 변경할 때 total['TITLE2'] = [re.sub('[^A-Za-z0-9가-힣]', '', s) for s in total['제목']] 참고: data-newbie.tistory.com/206

Python/Data Handling 2020. 11. 26. 13:18

[iPad Air 4세대] 악세사리(LabC 케이스, 종이필름) 사용 후기 및 가격

[iPad Air 4세대] 구매 방법 및 후기(온라인 픽업 구매) [iPad Air 4세대] 픽업 방법 및 후기(가로수길 애플스토어 방문기) 아이패드 에어4를 구매하고 난 뒤 케이스와 종이필름을 구매하여 사용중에 있다. 종이필름은 willy's에 가서 직접 현장 구매했고, 케이스는 인터넷으로 주문했다. 1. 종이필름 많은 유튜브 자료나 블로그를 보면 종이 필름에 대한 이야기가 많다. 하지만, 내가 여친의 아이패드 프로를 빌려 사용할 당시 종이필름이 너무 편하고 필기감이 좋았기에 나는 단 1의 고민도 없이 바로 종이필름을 구매하였다. 본인은 아이폰을 사용하면서 액정 강화 유리 필름을 주로 사용하는 편이고, 보통은 인터넷에서 저렴하게 몇 장 구입해서 손재주가 있다고 생각하기에 스스로 갈아 붙여넣는다. 하지만..

일상log 2020. 11. 23. 08:54

[논문 리뷰] What uncertainties do we need in Bayesian deep learning for computer vision? - 6.Conclusions

[논문 리뷰] What uncertainties do we need in Bayesian deep learning for computer vision? - 1.Introduction [논문 리뷰] What uncertainties do we need in Bayesian deep learning for computer vision? - 2.Related Work(1) [논문 리뷰] What uncertainties do we need in Bayesian deep learning for computer vision? - 2.Related Work(2) [논문 리뷰] What uncertainties do we need in Bayesian deep learning for computer vision? -..

카테고리 없음 2020. 11. 20. 23:16

python DataFrame 데이터 합치기

1번째 방법) df1.append(df2) A = pd.DataFrame({ 'a':[1,2,3,4,5], 'b':[6,7,8,9,10] }) B = pd.DataFrame({ 'a':[11,12,13,14,15], 'b':[16,17,18,19,20] }) A.append(B) 2번째 방법) pd.concat([df1, df2], axis=0) A = pd.DataFrame({ 'a':[1,2,3,4,5], 'b':[6,7,8,9,10] }) B = pd.DataFrame({ 'a':[11,12,13,14,15], 'b':[16,17,18,19,20] }) pd.concat([A,B], axis=0) # axis = 0 --> row bind / 1 --> column bind 참고 RUL : rfri..

Python/Data Handling 2020. 11. 20. 14:15

혼동행렬(Confusion Matrix)와 ROC, PR - curve 설명

위의 표는 혼동행렬(Confusion Matrix)이라 불리는 도수 분포표라고 보면 된다.(분류된 빈도를 가지고 나타낸 도표) 위의 상황은 Binary Classification의 경우이며, 클래스가 더 많아진다면 그 이상도 가능하다. 흔히 Binary Classification을 진행하면 softmax나 logistic function을 사용해서 0~1 사이의 값(확률값이라 부르고 싶진 않다.)으로 결과가 떨어지는데, threshold(default = 0.5)를 기준으로 분류를 하여 얻을 수 있는 대표적인 지표는 아래와 같다. Accuracy(정확도) : ( TP + TN ) / ( P + N ) Precision(정밀도) : TP / ( TP + FP ) Recall(재현도, Sensitive) :..

개인 공부 정리/ML&Statistic 2020. 11. 19. 22:01

Prev 1 ··· 12 13 14 15 16 17 18 ··· 26 Next

목록전체 글 (154)

끄적거림

티스토리툴바