μΌ | μ | ν | μ | λͺ© | κΈ | ν |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- νλ€μ€κ³΅λΆ
- μλ°κ³΅λΆ
- μλ°μ€ν¬λ¦½νΈ 곡λΆ
- MySQL
- JavaScript
- Flutter
- νλ€μ€
- μΉλμ보λ μ μ
- μ€νΈλ¦Όλ¦Ώ κΈ°λ³Έ
- μ€νΈλ¦Όλ¦Ώ
- μλ°κΈ°μ΄
- μλ°νλ‘κ·Έλλ°
- java
- StreamlitκΈ°λ³Έ
- μλλ‘μ΄λ μ± κ°λ°
- Android
- serverless
- StreamlitκΈ°μ΄
- μλ°
- μΉλμ보λ κΈ°μ΄
- νμ΄μ¬κ³΅λΆ
- μλλ‘μ΄λ μ€νλμ€
- μλ°μ΄λ³΄
- streamlit
- Pandas
- db
- RESTful API
- μλ°μ€ν¬λ¦½νΈ
- λ°μ΄ν°λ² μ΄μ€
- νμ΄μ¬
- Today
- Total
ruriruriya
[Python] νμ΄μ¬ νλ€μ€(Pandas) - λ°μ΄ν°νμ νκΈ°(head, tail, describe, info, shape, columns) λ³Έλ¬Έ
[Python] νμ΄μ¬ νλ€μ€(Pandas) - λ°μ΄ν°νμ νκΈ°(head, tail, describe, info, shape, columns)
루리μΌγ 2023. 11. 16. 09:09
describe()λ©μλλ?
describe() λ©μλλ νλ€μ€μμ λ°μ΄ν°νλ μμ κ°λ¨ν ν΅κ³ μμ½ μ 보λ₯Ό μ 곡νλ λ©μλμ΄λ€. μ΄ λ©μλλ λ°μ΄ν°νλ μμ κ° μ΄μ λν μμ½ ν΅κ³λμ κ³μ°νμ¬ λ°ννλ€.
- κ°μ(count): κ° μ΄μ μλ λΉκ²°μΈ‘μΉ(non-null) νλͺ©μ μλ₯Ό λνλΈλ€.
- νκ· (mean): κ° μ΄μ νκ· κ°μ 보μ¬μ€λ€.
- νμ€νΈμ°¨(std): κ° μ΄ κ°λ€μ νμ€νΈμ°¨λ₯Ό 보μ¬μ€λ€.
- μ΅μκ°(min): κ° μ΄μ μ΅μκ°μ 보μ¬μ€λ€.
- λ°±λΆμμ(25%, 50%, 75%): κ° μ΄μ λ°±λΆμμ(25%, 50%, 75%)λ₯Ό 보μ¬μ€λ€.
- μ΅λκ°(max): κ° μ΄μ μ΅λκ°μ 보μ¬μ€λ€.
νμΌμμ λΆλ¬μ¨ λ°μ΄ν°λ‘ λ©μλλ₯Ό μ¬μ©ν΄λ³΄μ :)
describe() λ©μλλ₯Ό μ¬μ©νλ©΄ μλμ κ°μ΄ κΈ°λ³Έ ν΅κ³μ 보λ€μ΄ λμ¨λ€.
>> df.describe()
νΉμ μΉΌλΌμ κΈ°μ΄ν΅κ³ λ°μ΄ν°λ§ 보μ¬μ€ μλ μλ€.
μ λ°μ΄ν°νλ μμ 'High' 컬λΌμ κΈ°μ΄ν΅κ³ μλ£λ§ 보μ.
>> df['High'].describe()
count 3313.000000
mean 383.493740
std 224.974534
min 50.541279
25% 228.394516
50% 295.433502
75% 540.000000
max 997.210022
Name: High, dtype: float64
'Open'κ³Ό 'Close' 컬λΌμ κΈ°μ΄ν΅κ³ μλ£λ§ 보μ.
>> df[['Open','Close']].describe()
κΈ°μ΄ ν΅κ³ μλ£μ μΌλΆλΆλ§ λ³Ό μλ μλ€.
'High'컬λΌμ μ΅λκ°λ§ κ°μ Έμ¨λ€.
>> df['High'].max()
997,210022
info() λ©μλλ?
info() λ©μλλ νλ€μ€μμ λ°μ΄ν°νλ μμ λν κ°λ¨ν μ 보λ₯Ό μ 곡νλ λ©μλλ€. μ΄ λ©μλλ λ°μ΄ν°νλ μμ ꡬ쑰μ κ° μ΄μ λν μ 보λ₯Ό μμ½νμ¬ λ³΄μ¬μ€λ€.
μ΄ λ λ°μ΄ν° νμ μ μ λ³Ό μ€ μμμΌ νλ€.(μ€μν λΆλΆβ )
- μΈλ±μ€ μ 보: λ°μ΄ν°νλ μμ μΈλ±μ€ μ 보μ μ΄μ μλ₯Ό 보μ¬μ€λ€.
- μ΄(column) μ 보: κ° μ΄μ μ΄λ¦, λΉκ²°μΈ‘μΉ(non-null)μΈ κ°μ κ°μ, λ°μ΄ν° νμ (dtype) λ±μ 보μ¬μ€λ€.
- λ©λͺ¨λ¦¬ μ¬μ©λ: λ°μ΄ν°νλ μμ΄ μ°¨μ§νλ λ©λͺ¨λ¦¬ μ¬μ©λμ 보μ¬μ€λ€.
>> df.info() #컬λΌμ λν μ 보λ₯Ό μλ €μ€. λ°μ΄ν°νμ
λ§€μ° μ€μ**
head() λ©μλλ?
νλ€μ€μ head() λ©μλλ λ°μ΄ν°νλ μμ μ²μ λͺ κ°μ νμ λ°ννλ κΈ°λ₯μ νλ€. κΈ°λ³Έμ μΌλ‘, head() λ©μλλ μμ 5κ°μ νμ 보μ¬μ€λ€. νμ§λ§ κ΄νΈ μμ μ«μλ₯Ό λ£μ΄ ν΄λΉ μ«μλ§νΌμ νμ νμν μλ μλ€. μ΄λ₯Ό ν΅ν΄ λ°μ΄ν°νλ μμ 첫 λΆλΆμ λΉ λ₯΄κ² μ΄ν΄λ³Ό μ μμ΄ λ°μ΄ν° ꡬ쑰μ λ΄μ©μ λΉ λ₯΄κ² νμ νλ λ° λμμ΄ λλ€.
맀κ°λ³μ μμ΄ head() λ©μλλ₯Ό μ¬μ©ν΄ 보μ.
μλ 5κ° νκΉμ§λ§ νμ λλ κ²μ λ³Ό μ μλ€.
>> df.head() #defaltλ‘ 5κ°λ§ 보μ¬μ€
맀κ°λ³μλ₯Ό λ£μ΄μ head() λ©μλ μ¬μ©ν΄λ³΄μ.
μλμ 맀κ°λ³μλ§νΌμ νλ§ μΆλ ₯λλ κ²μ λ³Ό μ μλ€.
>> df.head(3) #μ 맀κ°λ³μμ μ°λ©΄ μλ§νΌ
tail()λ©μλλ
νλ€μ€μ tail() λ©μλλ λ°μ΄ν°νλ μμ λ§μ§λ§ λͺ κ°μ νμ λ°ννλ€. κΈ°λ³Έμ μΌλ‘, tail() λ©μλλ νμ 5κ°μ νμ 보μ¬μ€λ€. νμ§λ§ κ΄νΈ μμ μ«μλ₯Ό λ£μ΄ ν΄λΉ μ«μλ§νΌμ νμ νμν μλ μλ€. λ°μ΄ν°νλ μμ λ§μ§λ§ λΆλΆμ μ΄ν΄λ³΄λ©° λ°μ΄ν°μ λμ νμΈνλ λ° μ¬μ©λλ€. μ΄λ₯Ό ν΅ν΄ λ°μ΄ν°μ λ λΆλΆμ λΉ λ₯΄κ² μ΄ν΄λ³΄κ³ μ 보λ₯Ό νμΈν μ μλ€.
맀κ°λ³μ μλ tail λ©μλλ₯Ό μ¨λ³΄μ.
>> df.tail()
맀κ°λ³μ μλ tail λ©μλλ₯Ό μ¨λ³΄μ
μλμ κ°μ΄ λ§μ§λ§μμ 맀κ°λ³μ λ§νΌλ§ νμ΄ μΆλ ₯λλ€.
>> df.tail(3)
shape() λ©μλλ
νλ€μ€μ shape λ©μλλ λ°μ΄ν°νλ μμ μ°¨μμ νμΈνλ λ° μ¬μ©λλ€. μ΄ λ©μλλ₯Ό νΈμΆνλ©΄ λ°μ΄ν°νλ μμ νκ³Ό μ΄μ μλ₯Ό ννλ‘ λ°ννλ€. μλ₯Ό λ€μ΄, (νμ μ, μ΄μ μ) νμμΌλ‘ λ°νλλ€.
columns() λ©μλλ
νλ€μ€μ columns() λ©μλλ λ°μ΄ν°νλ μμ μ΄ λ μ΄λΈ(μ»¬λΌ μ΄λ¦)μ λ°ννλ λ©μλλ€. μ΄ λ©μλλ₯Ό μ¬μ©νλ©΄ λ°μ΄ν°νλ μμ μ΄ μ΄λ¦λ€μ 리μ€νΈλ‘ μ»μ μ μλ€.
>> df.columns
Index(['Bob', 'Alice'], dtype='object')