πPython/Pandas
[Python] νμ΄μ¬ νλ€μ€(Pandas) - κ³ μ ν κ° μ°Ύμ μΆλ ₯νκΈ°(unique(), nunique(), value_counts())
루리μΌγ
2023. 11. 16. 14:24
λ°μν
unique(), nunique(), value_counts()λ νλ€μ€μμ λ°μ΄ν°μ κ³ μ ν κ°λ€κ³Ό κ·Έ λΉλλ₯Ό νμΈνλ λ° μ¬μ©λλ λ©μλλ€. μ΄ μΈ κ°μ§ λ©μλλ λ°μ΄ν°νλ μμ΄λ μ리μ¦μμ κ³ μ ν κ°λ€μ λ€λ£¨λ λ° μ μ©νλ€.
μλ λ°μ΄ν°νλ μμ νμ©νμ¬ μμ보μ.
unique() λ©μλλ
- unique() λ©μλλ μ리μ¦(Series) κ°μ²΄μ μ μ©νμ¬ κ·Έ μμ μλ κ³ μ ν κ°λ€μ λ°νν©λλ€.
- μ€λ³΅μ μ κ±°ν(unique) κ°λ€μ 리μ€νΈ ννλ‘ λ°νν©λλ€.
- ν΄λΉ μ리μ¦μ μ€μ λ‘ μ‘΄μ¬νλ κ³ μ ν κ°λ€μ 보μ¬μ€λλ€.
λ λμ μ λν¬ν λ°μ΄ν°λ₯Ό νμνλ€.
>> df['Year'].unique()
array([1990, 1991, 1992])
nunique() λ©μλλ
- nunique() λ©μλλ μ리μ¦(Series) κ°μ²΄μ μ μ©νμ¬ κ·Έ μμ μλ κ³ μ ν κ°λ€μ κ°μλ₯Ό λ°νν©λλ€.
- μ€λ³΅λμ§ μλ(unique) κ°λ€μ κ°μλ₯Ό λ°νν©λλ€.
- μ¦, ν΄λΉ μ리μ¦μ μλ κ³ μ ν κ°λ€μ κ°μλ₯Ό μΈμ΄μ€λλ€.
# μ λν¬ν λ°μ΄ν°μ κ°―μλ₯Ό μΈλ λ°©λ²
# μ€λ³΅λλ λ°μ΄ν°λ₯Ό λ§ν¨. μ€λ³΅ μ κ±°νκ³ μΆλ ₯
>> df['Year'].nunique()
3
value_counts() λ©μλλ
- value_counts() λ©μλλ μ리μ¦(Series) κ°μ²΄μ μ μ©νμ¬ κ° κ°λ€μ λΉλλ₯Ό μΈμ΄ λ°νν©λλ€.
- κ° κ³ μ ν κ°μ΄ μλ¦¬μ¦ μμμ λͺ λ²μ© λνλλμ§λ₯Ό μΉ΄μ΄νΈνμ¬ Seriesλ‘ λ°νν©λλ€.
- μ΄ λ©μλλ κ°λ€μ λΉλλ₯Ό νμΈνλ λ° μ£Όλ‘ μ¬μ©λλ©°, κ°μ₯ λ§μ΄ λνλλ κ°μ μ°Ύμ λ μ μ©ν©λλ€.
>> df['Name'].value_counts()
Alice 3
Bob 3
Charlie 3
Name: Name, dtype: int64
λ°μν