관리 메뉴

ruriruriya

[Python] 파이썬 νŒλ‹€μŠ€(Pandas) - κ³ μœ ν•œ κ°’ μ°Ύμ•„ 좜λ ₯ν•˜κΈ°(unique(), nunique(), value_counts()) λ³Έλ¬Έ

🐍Python/Pandas

[Python] 파이썬 νŒλ‹€μŠ€(Pandas) - κ³ μœ ν•œ κ°’ μ°Ύμ•„ 좜λ ₯ν•˜κΈ°(unique(), nunique(), value_counts())

루리야ㅑ 2023. 11. 16. 14:24
λ°˜μ‘ν˜•

사진: Unsplash 의 Stone Wang

unique(), nunique(), value_counts()λŠ” νŒλ‹€μŠ€μ—μ„œ λ°μ΄ν„°μ˜ κ³ μœ ν•œ κ°’λ“€κ³Ό κ·Έ λΉˆλ„λ₯Ό ν™•μΈν•˜λŠ” 데 μ‚¬μš©λ˜λŠ” λ©”μ†Œλ“œλ‹€. 이 μ„Έ 가지 λ©”μ†Œλ“œλŠ” λ°μ΄ν„°ν”„λ ˆμž„μ΄λ‚˜ μ‹œλ¦¬μ¦ˆμ—μ„œ κ³ μœ ν•œ 값듀을 λ‹€λ£¨λŠ” 데 μœ μš©ν•˜λ‹€.

μ•„λž˜ λ°μ΄ν„°ν”„λ ˆμž„μ„ ν™œμš©ν•˜μ—¬ μ•Œμ•„λ³΄μž.

unique() λ©”μ†Œλ“œλž€

  • unique() λ©”μ†Œλ“œλŠ” μ‹œλ¦¬μ¦ˆ(Series) 객체에 μ μš©ν•˜μ—¬ κ·Έ μ•ˆμ— μžˆλŠ” κ³ μœ ν•œ 값듀을 λ°˜ν™˜ν•©λ‹ˆλ‹€.
  • 쀑볡을 μ œκ±°ν•œ(unique) 값듀을 리슀트 ν˜•νƒœλ‘œ λ°˜ν™˜ν•©λ‹ˆλ‹€.
  • ν•΄λ‹Ή μ‹œλ¦¬μ¦ˆμ— μ‹€μ œλ‘œ μ‘΄μž¬ν•˜λŠ” κ³ μœ ν•œ 값듀을 λ³΄μ—¬μ€λ‹ˆλ‹€.

λ…„λ„μ˜ μœ λ‹ˆν¬ν•œ 데이터λ₯Ό ν‘œμ‹œν•œλ‹€.

>> df['Year'].unique()
array([1990, 1991, 1992])

 

nunique() λ©”μ†Œλ“œλž€

  • nunique() λ©”μ†Œλ“œλŠ” μ‹œλ¦¬μ¦ˆ(Series) 객체에 μ μš©ν•˜μ—¬ κ·Έ μ•ˆμ— μžˆλŠ” κ³ μœ ν•œ κ°’λ“€μ˜ 개수λ₯Ό λ°˜ν™˜ν•©λ‹ˆλ‹€.
  • μ€‘λ³΅λ˜μ§€ μ•ŠλŠ”(unique) κ°’λ“€μ˜ 개수λ₯Ό λ°˜ν™˜ν•©λ‹ˆλ‹€.
  • 즉, ν•΄λ‹Ή μ‹œλ¦¬μ¦ˆμ— μžˆλŠ” κ³ μœ ν•œ κ°’λ“€μ˜ 개수λ₯Ό μ„Έμ–΄μ€λ‹ˆλ‹€.
# μœ λ‹ˆν¬ν•œ λ°μ΄ν„°μ˜ 갯수λ₯Ό μ„ΈλŠ” 방법
# μ€‘λ³΅λ˜λŠ” 데이터λ₯Ό 말함. 쀑볡 μ œκ±°ν•˜κ³  좜λ ₯

>> df['Year'].nunique()
3

 

value_counts() λ©”μ†Œλ“œλž€

  • value_counts() λ©”μ†Œλ“œλŠ” μ‹œλ¦¬μ¦ˆ(Series) 객체에 μ μš©ν•˜μ—¬ 각 κ°’λ“€μ˜ λΉˆλ„λ₯Ό μ„Έμ–΄ λ°˜ν™˜ν•©λ‹ˆλ‹€.
  • 각 κ³ μœ ν•œ 값이 μ‹œλ¦¬μ¦ˆ μ•ˆμ—μ„œ λͺ‡ λ²ˆμ”© λ‚˜νƒ€λ‚˜λŠ”μ§€λ₯Ό μΉ΄μš΄νŠΈν•˜μ—¬ Series둜 λ°˜ν™˜ν•©λ‹ˆλ‹€.
  • 이 λ©”μ†Œλ“œλŠ” κ°’λ“€μ˜ λΉˆλ„λ₯Ό ν™•μΈν•˜λŠ” 데 주둜 μ‚¬μš©λ˜λ©°, κ°€μž₯ 많이 λ‚˜νƒ€λ‚˜λŠ” 값을 찾을 λ•Œ μœ μš©ν•©λ‹ˆλ‹€.
>> df['Name'].value_counts()
Alice      3
Bob        3
Charlie    3
Name: Name, dtype: int64

 

λ°˜μ‘ν˜•