파이썬 기초문법

[Python 문법] groupby 고유 아이템 종류 카운트

Family in August 2023. 7. 11. 11:46
반응형

pandas의 groupby 함수와 nunique 메서드를 사용하면 각 그룹에서 고유한 문자열 값의 개수를 쉽게 계산할 수 있습니다.

다음은 DataFrame을 groupby하여 문자열의 종류를 계산하는 예시 코드입니다:


import pandas as pd

# 예시 DataFrame 생성
data = {
    'category': ['A', 'A', 'B', 'B', 'C', 'C'],
    'value': [1, 2, 3, 4, 5, 6]
}

df = pd.DataFrame(data)

# 'category' 열을 기준으로 그룹화하고, 각 그룹에서 고유한 문자열 값의 개수를 계산
unique_counts = df.groupby('category')['value'].nunique()

print(unique_counts)



위 코드에서 groupby 함수를 사용하여 'category' 열을 기준으로 DataFrame을 그룹화하였습니다. 그룹화된 DataFrame에서 nunique 메서드를 사용하여 각 그룹에서 'value' 열의 고유한 문자열 값의 개수를 계산합니다. 결과는 Series로 반환되며, 인덱스는 그룹의 고유한 값, 값은 해당 그룹에서의 고유한 문자열 값의 개수입니다.

출력 결과는 다음과 같을 것입니다:

category
A    2
B    2
C    2
Name: category, dtype: int64



위 결과에서 'category' 열에는 각각 2개의 고유한 문자열 값만 있으므로, 문자열의 종류는 모두 2개입니다.

반응형