Python/Data Handling
[문자열 다루기] 문자(한글, 영문)와 숫자만 남기고 특수문자 제거하기 in python
Signing
2020. 11. 26. 13:18
728x90
반응형
문자열 핸들링 중에서 특수문자를 제거하는 것을 원하는 경우가 종종 발생한다.
이 코드가 도움이 되길 바란다.
단일변수일 때
import re
string = "abcdefㄱㄴㄷㄹㅁㅂ가나다라마바사12345[]{}().,!?'`~;:"
re.sub('[^A-Za-z0-9가-힣]', '', string)
# re.sub('[^A-Za-z0-9가-힣]', '', string)
# Out[153]: 'abcdef가나다라마바사12345'
DataFrame에서 변경할 때
total['TITLE2'] = [re.sub('[^A-Za-z0-9가-힣]', '', s) for s in total['제목']]
참고: data-newbie.tistory.com/206
728x90
반응형