반응형
pandas의 groupby 함수와 nunique 메서드를 사용하면 각 그룹에서 고유한 문자열 값의 개수를 쉽게 계산할 수 있습니다.
다음은 DataFrame을 groupby하여 문자열의 종류를 계산하는 예시 코드입니다:
import pandas as pd
# 예시 DataFrame 생성
data = {
'category': ['A', 'A', 'B', 'B', 'C', 'C'],
'value': [1, 2, 3, 4, 5, 6]
}
df = pd.DataFrame(data)
# 'category' 열을 기준으로 그룹화하고, 각 그룹에서 고유한 문자열 값의 개수를 계산
unique_counts = df.groupby('category')['value'].nunique()
print(unique_counts)
위 코드에서 groupby 함수를 사용하여 'category' 열을 기준으로 DataFrame을 그룹화하였습니다. 그룹화된 DataFrame에서 nunique 메서드를 사용하여 각 그룹에서 'value' 열의 고유한 문자열 값의 개수를 계산합니다. 결과는 Series로 반환되며, 인덱스는 그룹의 고유한 값, 값은 해당 그룹에서의 고유한 문자열 값의 개수입니다.
출력 결과는 다음과 같을 것입니다:
category
A 2
B 2
C 2
Name: category, dtype: int64
위 결과에서 'category' 열에는 각각 2개의 고유한 문자열 값만 있으므로, 문자열의 종류는 모두 2개입니다.
반응형
'파이썬 기초문법' 카테고리의 다른 글
파이썬 selenium을 활용한 블로그 검색 및 자동 댓글 남기기 (2) | 2023.09.13 |
---|---|
[Python] 정규식을 활용하여 알파벳과 숫자가 섞인 단어 제거 (0) | 2023.08.11 |
URL의 이미지 로컬에 저장 방법 (0) | 2023.05.26 |
Pandas DataFrame에서 lambda 활용하기 (1) | 2023.04.17 |
파이썬(Python) lambda 함수의 기초 활용법 (0) | 2023.04.17 |