○ replace 함수란?
replace() 함수는 문자열 또는 시리즈(Series) 객체 내에서 특정 값을 원하는 값으로 바꾸는 함수입니다.
문자열(str) 객체와 판다스(pandas)의 시리즈(series) 객체 모두에서 사용할 수 있습니다.
○ 기본 문법 (문자열 기준)
문자열.replace(old, new, count)
- old: 바꿀 대상 문자열
- new: 바뀔 문자열
- count (선택): 바꿀 횟수 (기본값은 전체)
○ 문자열 예제
text = "apple banana apple"
new_text = text.replace("apple", "orange")
print(new_text)
출력 :
orange banana orange
text.replace("apple", "orange", 1)
# 'orange banana apple' (첫 번째만 변경)
○ pandas Series에서 replace()
: 판다스에서는 Series.replace() 또는 DataFrame.replace()를 사용합니다.
○ 주요 활용 상황
- 텍스트 정제 및 전처리
- 불필요한 기호 제거 (.replace(',', '') 등)
- 결측값이나 이상치 처리 (.replace(-1, np.nan) 등)
- 범주형 데이터 인코딩 전 값 변환
○ 주의할 점
- 문자열의 replace()는 원본을 수정하지 않고 새로운 문자열을 반환합니다.
- DataFrame이나 Series의 replace()는 inplace=True 옵션을 주지 않으면 역시 원본은 유지됩니다.
- 문자열 치환 시 대소문자 구분에 주의하세요. 'Cat'과 'cat'은 다릅니다.
○ 마무리
replace() 함수는 문자열 처리나 데이터 클렌징 작업에서 자주 사용되는 기본기이자 핵심 함수입니다.
문법은 간단하지만 매우 강력하므로, 자주 연습하고 익숙해지면 다양한 상황에서 활용도가 높습니다.
'Python 코드' 카테고리의 다른 글
| [Python] Keras(TensorFlow) (3) | 2025.07.17 |
|---|---|
| [Python] DataFrame.astype() (1) | 2025.07.14 |
| [Python] pandas.get_dummies() (1) | 2025.07.12 |
| [Python] DataFrame.drop() (1) | 2025.07.12 |
| [Python] Counter 함수 (from collections import Counter) (0) | 2025.07.03 |