[Python] 정규식을 활용하여 알파벳과 숫자가 섞인 단어 제거

파이썬 기초문법

[Python] 정규식을 활용하여 알파벳과 숫자가 섞인 단어 제거

Family in August 2023. 8. 11. 09:49

숫자와 알파벳이 여러 번 섞인 단어를 구분하기 위해서는 조금 더 복잡한 정규표현식이 필요합니다. 다음은 숫자와 알파벳이 여러 번 섞인 경우를 구분하여 제거하는 예시 코드입니다:

import re

text = "단어1 단어2 ab12e45 영어문장 XYZ123 A123B456C"

# 숫자와 알파벳이 여러 번 섞인 패턴을 정규표현식으로 설정
mixed_pattern = '[a-zA-Z]+\d+[a-zA-Z\d]+|[a-zA-Z]+\d+|\d+[a-zA-Z]+'

# 정규표현식 패턴과 일치하는 부분을 빈 문자열로 치환하여 숫자와 알파벳이 여러 번 섞인 부분 제거
cleaned_text = re.sub(mixed_pattern, '', text)

print(cleaned_text)

위 코드에서 정규표현식 패턴 \b(?:[a-zA-Z]+\d+|\d+[a-zA-Z]+|[a-zA-Z]+\d+[a-zA-Z\d]+)\b은 숫자와 알파벳이 여러 번 섞인 패턴을 찾습니다. 이 패턴과 일치하는 부분을 re.sub 함수를 사용하여 빈 문자열로 치환함으로써 숫자와 알파벳이 여러 번 섞인 부분을 제거합니다.

출력 결과는 다음과 같을 것입니다:

단어1 단어2 영어문장 XYZ123

위의 예시에서는 "ab12e45", "XYZ123", "A123B456C"이 모두 제거되어 "단어1 단어2 영어문장"만 남게 되었습니다. 이제 숫자와 알파벳이 여러 번 섞인 단어도 구분하여 제거할 수 있습니다.

'파이썬 기초문법' 카테고리의 다른 글

파이썬 스네이크 게임 만들기(Code Llama) (1)	2023.10.26
파이썬 selenium을 활용한 블로그 검색 및 자동 댓글 남기기 (2)	2023.09.13
[Python 문법] groupby 고유 아이템 종류 카운트 (0)	2023.07.11
URL의 이미지 로컬에 저장 방법 (0)	2023.05.26
Pandas DataFrame에서 lambda 활용하기 (1)	2023.04.17

현재글[Python] 정규식을 활용하여 알파벳과 숫자가 섞인 단어 제거

250x250

문제풀이, Python, 알고리즘, 코딩 학습, 판다스, 게임 코딩, pandas, 게임 만들기, 데이터 분석, dataframe, 한국장애인고용공단, 실업급여, 머신러닝, 파이썬 게임, 빅데이터, 기초문법, 코테, 코딩 테스트, 연말정산, 파이썬,

Today :
Yesterday :

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Family in August