일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Android
- java
- RESTful API
- 파이썬공부
- streamlit
- 웹대시보드 제작
- 스트림릿
- 데이터베이스
- 자바스크립트
- 자바프로그래밍
- 자바초보
- Flutter
- 스트림릿 기본
- 자바
- 판다스
- 자바스크립트 공부
- serverless
- 자바기초
- Streamlit기본
- 안드로이드 스튜디오
- 판다스공부
- JavaScript
- 웹대시보드 기초
- MySQL
- 자바공부
- Streamlit기초
- 파이썬
- Pandas
- db
- 안드로이드 앱 개발
- Today
- Total
목록판다스 (9)
ruriruriya
비밀번호를 입력받는 것은 사용자의 개인 정보를 보호하는 데 중요한 부분이다. Streamlit에서 비밀번호를 안전하게 입력받으려면 text_input을 사용하여 입력을 받고, st.secrets를 활용하여 비밀번호를 숨기는 방법을 사용할 수 있다. 다음과 같이 비밀번호를 입력받고 이를 st.secrets를 통해 안전하게 저장할 수 있다. 그러면 입력한 비밀번호는 화면에 표시되지 않는다. 비밀번호를 저장할 때는 암호화된 형태로 저장되어 보안이 강화된다. import streamlit as st def main(): password =st.text_input('비밀번호 입력', type='password') if password: st.secrets["user_password"] = password st.s..
matplotlib를 사용하여 히스토그램을 생성하는 것은 데이터의 분포를 시각화하는 데 효과적이다. 히스토그램은 주어진 데이터셋에서 각 구간(bin)에 속하는 데이터의 빈도를 막대로 나타낸다. 히스토그램을 생성하기 위해선 plt.hist() 함수를 사용한다. 이 함수는 데이터를 히입력으로 받아 데이터셋의 분포를 표현한다. 히스토그램을 이용하면 데이터의 분포를 눈으로 파악이 가능하다. 구간이 여러개 이면 bins라고 부른다. 히스토그램은, 똑같은 데이터를 가지고서 차트 모양이 전혀 다르게 나타낼 수 있으므로, 해석을 잘 해야한다. 아래 데이터로 히스토그램을 만들어보자. >> df = pd.read_csv('../data/pokemon.csv') >> df plt.hist() 함수 speed 컬럼의 정보를 ..
Matplotlib를 사용하여 파이 차트를 만드는 것은 간단하다. 파이 차트는 범주별 값의 상대적인 비율을 보여주는데 유용하다. 먼저 필요한 라이브러리들을 임포트(import) 하고 데이터프레임을 csv파일로 불러온다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb >> df = pd.read_csv('../data/pokemon.csv') >> df Matplot 라이브러리의 Pie() 함수 데이터를, 퍼센테이지로 비교해서 보고 싶을 때 사용한다. generation_id 별로, 데이터의 갯수를 퍼센테이지로 비교할 수 있도록, 파이차트로 나타내보자! 우선 generation_id 별로,..
판다스에서 데이터프레임을 정렬하는 데에는 sort_values()와 sort_index()라는 두 가지 메소드가 있다. 각각의 메소드는 다양한 정렬 옵션을 제공해 데이터를 원하는 대로 정렬할 수 있다. 아래의 데이터로 두 가지 메소드를 확인해보자. >> df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) >> df sort_values() 사용하기 이 메소드는 데이터프레임을 특정 열(column)의 값을 기준으로 정렬할 때 사용된다. 주로 ..
describe()메소드란? describe() 메소드는 판다스에서 데이터프레임의 간단한 통계 요약 정보를 제공하는 메소드이다. 이 메소드는 데이터프레임의 각 열에 대한 요약 통계량을 계산하여 반환한다. 개수(count): 각 열에 있는 비결측치(non-null) 항목의 수를 나타낸다. 평균(mean): 각 열의 평균 값을 보여준다. 표준편차(std): 각 열 값들의 표준편차를 보여준다. 최솟값(min): 각 열의 최솟값을 보여준다. 백분위수(25%, 50%, 75%): 각 열의 백분위수(25%, 50%, 75%)를 보여준다. 최댓값(max): 각 열의 최댓값을 보여준다. 파일에서 불러온 데이터로 메소드를 사용해보자 :) describe() 메소드를 사용하면 아래와 같이 기본 통계정보들이 나온다. >> ..
데이터프레임에 파일을 로드하는 방법은 다양한 파일 형식에 따라 다르다. 주로 사용되는 파일 형식으로는 CSV, Excel, JSON, SQL, HTML 등이 있다. 각 형식에 맞게 적절한 판다스 함수를 사용하여 데이터를 로드할 수 있다. CSV(Comma Separated Values)파일 읽는 방법 CSV 파일은 데이터프레임의 요소가 콤마로 구분되어 있는 것을 말한다. CSV 파일을 read_csv() 메소드로 로드하면 콤마 기준으로 데이터프레임이 출력된다. 구글 코랩에서 실행하면 데이터가 많을 땐 아래 행과 열이 표시되며 중간이 생략된다. >> df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/데이터분석/data/GOOG.csv') >>..
NaN이란? NaN은 "Not a Number"의 약자로, 결측치(missing value)를 나타내는 데 사용되는 특수한 값이다. 주로 파이썬의 판다스와 같은 데이터 분석 도구에서 사용된다. NaN은 데이터셋에서 값이 존재하지 않거나 수학적으로 정의할 수 없는 상태를 나타낸다. 이것은 데이터의 부재, 누락, 또는 특정 연산 결과가 정의되지 않는 경우에 해당한다. 먼제 데이터프레임을 통해 NaN 데이터를 알아보자. >> items2 = [{'bikes': 20, 'pants': 30, 'watches': 35, 'shirts': 15, 'shoes':8, 'suits':45}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5, 'shirts': 2, 'sh..
판다스 데이터프레임(Pandas DataFrame)이란? 데이터프레임(DataFrame)은 판다스의 핵심 자료구조 중 하나로, 테이블 형태의 데이터를 다루는 데 사용된다. 데이터프레임은 행과 열로 구성된 2차원 테이블로, 각 열은 다른 데이터 타입을 가질 수 있다. 이를 통해 데이터를 쉽게 조작하고 분석할 수 있다. 데이터프레임은 CSV, Excel, 데이터베이스 등 다양한 소스로부터 데이터를 가져와 처리할 수 있다. 판다스의 다양한 함수와 메서드를 사용하여 데이터프레임을 조작하고 필터링하며, 분석 및 시각화를 수행할 수 있다. 판다스 데이터프레임 생성하기 먼저 파이썬의 dict를 판다스 1차원 데이터 Series 사용해 2차원 데이터를 생성하여 변수에 할당한다. import pandas as pd it..