반응형
250x250
Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 리눅스
- pandas
- R
- 빅데이터
- pytorch
- Crawling
- VAE
- 베이지안
- 데이터분석
- 파이썬
- 알고리즘
- 코딩테스트
- DATA
- selenium
- PYTHON
- uncertainty
- 우분투
- 백준
- AI
- 강화학습
- YarinGal
- 불확실성
- 크롤링
- bayesian
- dropout
- 논문리뷰
- 텍스트분석
- Graph
- GNN
- 텍스트마이닝
Archives
- Today
- Total
끄적거림
[문자열 다루기] 문자(한글, 영문)와 숫자만 남기고 특수문자 제거하기 in python 본문
728x90
반응형
문자열 핸들링 중에서 특수문자를 제거하는 것을 원하는 경우가 종종 발생한다.
이 코드가 도움이 되길 바란다.
단일변수일 때
import re
string = "abcdefㄱㄴㄷㄹㅁㅂ가나다라마바사12345[]{}().,!?'`~;:"
re.sub('[^A-Za-z0-9가-힣]', '', string)
# re.sub('[^A-Za-z0-9가-힣]', '', string)
# Out[153]: 'abcdef가나다라마바사12345'
DataFrame에서 변경할 때
total['TITLE2'] = [re.sub('[^A-Za-z0-9가-힣]', '', s) for s in total['제목']]
참고: data-newbie.tistory.com/206
728x90
반응형
'Python > Data Handling' 카테고리의 다른 글
[문자열 다루기] 긴 공백을 하나의 공백으로 바꾸기 in python (0) | 2020.12.07 |
---|---|
[DataFrame] 여러 DataFrame 가볍게 append하기 in python (0) | 2020.11.26 |
python DataFrame 데이터 합치기 (0) | 2020.11.20 |
[데이터셋] PHD08 한글 손글씨 이미지 데이터 (1) | 2020.10.26 |
[Pandas] 서로 길이가 다른 list/Series 합쳐서 DataFrame 만들기 in python & R (1) | 2020.08.13 |
Comments