끄적거림

[문자열 다루기] 문자(한글, 영문)와 숫자만 남기고 특수문자 제거하기 in python 본문

Python/Data Handling

[문자열 다루기] 문자(한글, 영문)와 숫자만 남기고 특수문자 제거하기 in python

Signing 2020. 11. 26. 13:18
728x90
반응형

문자열 핸들링 중에서 특수문자를 제거하는 것을 원하는 경우가 종종 발생한다.

 

이 코드가 도움이 되길 바란다.

 

 

단일변수일 때

import re

string = "abcdefㄱㄴㄷㄹㅁㅂ가나다라마바사12345[]{}().,!?'`~;:"
re.sub('[^A-Za-z0-9가-힣]', '', string)

# re.sub('[^A-Za-z0-9가-힣]', '', string)
# Out[153]: 'abcdef가나다라마바사12345'

 

 

 

 

DataFrame에서 변경할 때

total['TITLE2'] = [re.sub('[^A-Za-z0-9가-힣]', '', s) for s in total['제목']]

 

 

 

 

참고: data-newbie.tistory.com/206

 

 

728x90
반응형
Comments