Python 코드

[Python] DataFrame.replace()

PaperDrop 2025. 7. 13. 21:45

○ replace 함수란?

  replace() 함수문자열 또는 시리즈(Series) 객체 내에서 특정 값을 원하는 값으로 바꾸는 함수입니다.
문자열(str) 객체와 판다스(pandas)의 시리즈(series) 객체 모두에서 사용할 수 있습니다.

 

 

○ 기본 문법 (문자열 기준)

문자열.replace(old, new, count)
  • old: 바꿀 대상 문자열
  • new: 바뀔 문자열
  • count (선택): 바꿀 횟수 (기본값은 전체)

 

 

○ 문자열 예제

text = "apple banana apple"
new_text = text.replace("apple", "orange")
print(new_text)
 
출력 :
orange banana orange
 
text.replace("apple", "orange", 1)
# 'orange banana apple' (첫 번째만 변경)

 

 

○ pandas Series에서 replace()

  : 판다스에서는 Series.replace() 또는 DataFrame.replace()를 사용합니다.

 
 

 

○ 주요 활용 상황

  • 텍스트 정제 및 전처리
  • 불필요한 기호 제거 (.replace(',', '') 등)
  • 결측값이나 이상치 처리 (.replace(-1, np.nan) 등)
  • 범주형 데이터 인코딩 전 값 변환

 

 

○ 주의할 점

  • 문자열의 replace()는 원본을 수정하지 않고 새로운 문자열을 반환합니다.
  • DataFrame이나 Series의 replace()는 inplace=True 옵션을 주지 않으면 역시 원본은 유지됩니다.
  • 문자열 치환 시 대소문자 구분에 주의하세요. 'Cat'과 'cat'은 다릅니다.

 

 

○ 마무리

  replace() 함수는 문자열 처리나 데이터 클렌징 작업에서 자주 사용되는 기본기이자 핵심 함수입니다.
문법은 간단하지만 매우 강력하므로, 자주 연습하고 익숙해지면 다양한 상황에서 활용도가 높습니다.

'Python 코드' 카테고리의 다른 글

[Python] Keras(TensorFlow)  (3) 2025.07.17
[Python] DataFrame.astype()  (1) 2025.07.14
[Python] pandas.get_dummies()  (1) 2025.07.12
[Python] DataFrame.drop()  (1) 2025.07.12
[Python] Counter 함수 (from collections import Counter)  (0) 2025.07.03