일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 자바
- 자바기초
- MySQL
- Streamlit기본
- Flutter
- 웹대시보드 기초
- Streamlit기초
- RESTful API
- 스트림릿 기본
- db
- 자바스크립트
- 자바스크립트 공부
- 데이터베이스
- 안드로이드 스튜디오
- streamlit
- Pandas
- 판다스
- 파이썬공부
- 웹대시보드 제작
- 자바초보
- java
- 안드로이드 앱 개발
- serverless
- JavaScript
- 스트림릿
- Android
- 파이썬
- 자바공부
- 자바프로그래밍
- 판다스공부
- Today
- Total
목록전체 글 (240)
ruriruriya
스트림릿(Streamlit)은 데이터 과학자들에게 인기 많은 오픈 소스 파이썬 라이브러리이다. 손 쉽게 적은 코딩으로 웹 대시보드를 만들 수 있는 장점이 있다. 스트림릿(Streamlit) 프레임워크는 main 함수가 항상 있어야 하며 main 함수에서 프로그래밍을 해야 웹 화면에 표시가 된다. import streamlit as st # 스트림릿 프레임워크는, main 함수가 있어야 한다. def main(): # st는 웹 화면에 표시하는 역할을 한다. st.title('헬로우 World') if __name__ == '__main__' : print(__name__) main() [출력 웹 브라우저]
matplotlib를 사용하여 히스토그램을 생성하는 것은 데이터의 분포를 시각화하는 데 효과적이다. 히스토그램은 주어진 데이터셋에서 각 구간(bin)에 속하는 데이터의 빈도를 막대로 나타낸다. 히스토그램을 생성하기 위해선 plt.hist() 함수를 사용한다. 이 함수는 데이터를 히입력으로 받아 데이터셋의 분포를 표현한다. 히스토그램을 이용하면 데이터의 분포를 눈으로 파악이 가능하다. 구간이 여러개 이면 bins라고 부른다. 히스토그램은, 똑같은 데이터를 가지고서 차트 모양이 전혀 다르게 나타낼 수 있으므로, 해석을 잘 해야한다. 아래 데이터로 히스토그램을 만들어보자. >> df = pd.read_csv('../data/pokemon.csv') >> df plt.hist() 함수 speed 컬럼의 정보를 ..
Matplotlib를 사용하여 파이 차트를 만드는 것은 간단하다. 파이 차트는 범주별 값의 상대적인 비율을 보여주는데 유용하다. 먼저 필요한 라이브러리들을 임포트(import) 하고 데이터프레임을 csv파일로 불러온다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb >> df = pd.read_csv('../data/pokemon.csv') >> df Matplot 라이브러리의 Pie() 함수 데이터를, 퍼센테이지로 비교해서 보고 싶을 때 사용한다. generation_id 별로, 데이터의 갯수를 퍼센테이지로 비교할 수 있도록, 파이차트로 나타내보자! 우선 generation_id 별로,..
Matplotlib를 사용하여 막대 차트(Bar Chart)를 간단하게 만들 수 있다. 주로 plt.bar() 함수를 사용하며, 데이터를 막대로 시각화할 수 있다. 우선 라이브러리들을 임포트(import) 해준다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb 이번엔 csv 실제 포켓몬 데이터를 가져와서 데이터프레임을 만들어 활용해본다. >> df = pd.read_csv('../data/pokemon.csv') >> df 데이터 프레임 describe() 함수로 정보를 확인해보니 generation_id는 데이터 값이 중복되는 걸 확인해볼 수 있다. 이 처럼 중복되는 데이터 값이 있는 ..
Matplotlib를 사용하여 간단한 라인 차트를 만드는 방법은 간단하다. 먼저, 필요한 데이터를 정의하고 plt.plot() 함수를 사용하여 그래프를 생성하면 된다. 예를 들어, x와 y 값이 다음과 같은 경우를 생각해보자. 먼저 Matplotlib 라이브러리를 import 한다. 그리고 numpy 라이브러리도 import 해준다. 아래 예제에 활용될 x와 y의 값을 numpy의 arange 함수로 array 형태로 생성한다. >> import matplotlib.pyplot as plt >> import numpy as np >> x = np.arange(0,10+1) >> x array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) >> y = np.arange(0,10+1) >..
Matplotlib은 파이썬에서 데이터 시각화를 위한 라이브러리 중 하나이다. 데이터를 그래픽 형태로 시각화하거나 차트, 플롯, 히스토그램 등을 생성하는 데 사용된다. 이 라이브러리는 2D 그래픽을 생성하는 데 주로 사용되며, 3D 그래픽도 일부 지원한다. Matplotlib은 사용하기 쉬우면서도 다양한 그래프 유형을 생성할 수 있는 강력한 기능을 제공한다. 간단한 라인 플롯부터 복잡한 subplot, heatmap, 3D 그래픽까지 다양한 그래픽 요소를 구현할 수 있다. 또한, Matplotlib 은 다른 라이브러리와도 호환성이 높아 데이터 분석 라이브러리인 판다스와 함께 자주 사용된다.. 맷플롯립은 주로 pyplot 인터페이스를 통해 사용된다. 이를 통해 그래프를 그리고 그에 관련된 여러 속성을 조정..
판다스에서 데이터프레임을 정렬하는 데에는 sort_values()와 sort_index()라는 두 가지 메소드가 있다. 각각의 메소드는 다양한 정렬 옵션을 제공해 데이터를 원하는 대로 정렬할 수 있다. 아래의 데이터로 두 가지 메소드를 확인해보자. >> df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) >> df sort_values() 사용하기 이 메소드는 데이터프레임을 특정 열(column)의 값을 기준으로 정렬할 때 사용된다. 주로 ..
apply()는 판다스에서 Series나 DataFrame에 함수를 적용하기 위해 사용되는 메소드이다. 이를 통해 사용자가 정의한 함수를 각 행이나 열에 적용하여 데이터를 처리하거나 변환할 수 있다. 아래 데이터로 apply() 메소드를 적용해보자. >> df 첫번 째, 함수만들기 #### 함수를 만드는 순서 꼭 기억하자! 이렇게 기억하면 함수 만드는 것이 좀더 쉬워진다. 1. 함수의 호출부분을 먼저 작성한다. 2. 호출부분을 참고하여 함수를 정의한다. # 시급이 30 이상이면, 'A' 그룹이라 하고,시급이 30보다 작으면, 'B' 그룹이라고 하겠다.새로운 컬럼 group을 만들어서 저장하시오. 먼저 호출할 함수명과 매개변수를 써서 출력 내용을 예측해본다. grouping(35) # 'A' 출력 grou..