일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 스트림릿 기본
- 자바스크립트
- 자바공부
- Matplotlib 기초
- 파이썬
- 자바
- serverless
- RESTful API
- 자바기초
- 안드로이드 앱 개발
- MySQL
- 안드로이드 스튜디오
- Streamlit기본
- Android
- 웹대시보드 기초
- 웹대시보드 제작
- Streamlit기초
- db
- 자바스크립트 공부
- Pandas
- 데이터베이스
- 자바초보
- JavaScript
- java
- 파이썬공부
- 자바프로그래밍
- 판다스공부
- streamlit
- 스트림릿
- 판다스
- Today
- Total
목록분류 전체보기 (229)
ruriruriya
Matplotlib를 사용하여 막대 차트(Bar Chart)를 간단하게 만들 수 있다. 주로 plt.bar() 함수를 사용하며, 데이터를 막대로 시각화할 수 있다. 우선 라이브러리들을 임포트(import) 해준다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sb 이번엔 csv 실제 포켓몬 데이터를 가져와서 데이터프레임을 만들어 활용해본다. >> df = pd.read_csv('../data/pokemon.csv') >> df 데이터 프레임 describe() 함수로 정보를 확인해보니 generation_id는 데이터 값이 중복되는 걸 확인해볼 수 있다. 이 처럼 중복되는 데이터 값이 있는 ..
Matplotlib를 사용하여 간단한 라인 차트를 만드는 방법은 간단하다. 먼저, 필요한 데이터를 정의하고 plt.plot() 함수를 사용하여 그래프를 생성하면 된다. 예를 들어, x와 y 값이 다음과 같은 경우를 생각해보자. 먼저 Matplotlib 라이브러리를 import 한다. 그리고 numpy 라이브러리도 import 해준다. 아래 예제에 활용될 x와 y의 값을 numpy의 arange 함수로 array 형태로 생성한다. >> import matplotlib.pyplot as plt >> import numpy as np >> x = np.arange(0,10+1) >> x array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) >> y = np.arange(0,10+1) >..
Matplotlib은 파이썬에서 데이터 시각화를 위한 라이브러리 중 하나이다. 데이터를 그래픽 형태로 시각화하거나 차트, 플롯, 히스토그램 등을 생성하는 데 사용된다. 이 라이브러리는 2D 그래픽을 생성하는 데 주로 사용되며, 3D 그래픽도 일부 지원한다. Matplotlib은 사용하기 쉬우면서도 다양한 그래프 유형을 생성할 수 있는 강력한 기능을 제공한다. 간단한 라인 플롯부터 복잡한 subplot, heatmap, 3D 그래픽까지 다양한 그래픽 요소를 구현할 수 있다. 또한, Matplotlib 은 다른 라이브러리와도 호환성이 높아 데이터 분석 라이브러리인 판다스와 함께 자주 사용된다.. 맷플롯립은 주로 pyplot 인터페이스를 통해 사용된다. 이를 통해 그래프를 그리고 그에 관련된 여러 속성을 조정..
판다스에서 데이터프레임을 정렬하는 데에는 sort_values()와 sort_index()라는 두 가지 메소드가 있다. 각각의 메소드는 다양한 정렬 옵션을 제공해 데이터를 원하는 대로 정렬할 수 있다. 아래의 데이터로 두 가지 메소드를 확인해보자. >> df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) >> df sort_values() 사용하기 이 메소드는 데이터프레임을 특정 열(column)의 값을 기준으로 정렬할 때 사용된다. 주로 ..
apply()는 판다스에서 Series나 DataFrame에 함수를 적용하기 위해 사용되는 메소드이다. 이를 통해 사용자가 정의한 함수를 각 행이나 열에 적용하여 데이터를 처리하거나 변환할 수 있다. 아래 데이터로 apply() 메소드를 적용해보자. >> df 첫번 째, 함수만들기 #### 함수를 만드는 순서 꼭 기억하자! 이렇게 기억하면 함수 만드는 것이 좀더 쉬워진다. 1. 함수의 호출부분을 먼저 작성한다. 2. 호출부분을 참고하여 함수를 정의한다. # 시급이 30 이상이면, 'A' 그룹이라 하고,시급이 30보다 작으면, 'B' 그룹이라고 하겠다.새로운 컬럼 group을 만들어서 저장하시오. 먼저 호출할 함수명과 매개변수를 써서 출력 내용을 예측해본다. grouping(35) # 'A' 출력 grou..
판다스에서 다중 조건으로 데이터 값을 필터링하고 원하는 행을 선택하는 방법은 여러 가지가 있다. 가장 흔한 방법 중 하나는 loc 또는 iloc를 사용하여 특정 조건을 충족하는 행을 선택하는 것이다. 아래의 데이터 프레임으로 다중조건 필터링을 해보자. >> df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) >> df 판다스의 비교연산자 우선 판다스는 파이썬 기반으로 만들어진 라이브러리인데 비교연산자는 조금 다른 점을 인지하고 사용해야 한다..
unique(), nunique(), value_counts()는 판다스에서 데이터의 고유한 값들과 그 빈도를 확인하는 데 사용되는 메소드다. 이 세 가지 메소드는 데이터프레임이나 시리즈에서 고유한 값들을 다루는 데 유용하다. 아래 데이터프레임을 활용하여 알아보자. unique() 메소드란 unique() 메소드는 시리즈(Series) 객체에 적용하여 그 안에 있는 고유한 값들을 반환합니다. 중복을 제거한(unique) 값들을 리스트 형태로 반환합니다. 해당 시리즈에 실제로 존재하는 고유한 값들을 보여줍니다. 년도의 유니크한 데이터를 표시한다. >> df['Year'].unique() array([1990, 1991, 1992]) nunique() 메소드란 nunique() 메소드는 시리즈(Series)..
describe()메소드란? describe() 메소드는 판다스에서 데이터프레임의 간단한 통계 요약 정보를 제공하는 메소드이다. 이 메소드는 데이터프레임의 각 열에 대한 요약 통계량을 계산하여 반환한다. 개수(count): 각 열에 있는 비결측치(non-null) 항목의 수를 나타낸다. 평균(mean): 각 열의 평균 값을 보여준다. 표준편차(std): 각 열 값들의 표준편차를 보여준다. 최솟값(min): 각 열의 최솟값을 보여준다. 백분위수(25%, 50%, 75%): 각 열의 백분위수(25%, 50%, 75%)를 보여준다. 최댓값(max): 각 열의 최댓값을 보여준다. 파일에서 불러온 데이터로 메소드를 사용해보자 :) describe() 메소드를 사용하면 아래와 같이 기본 통계정보들이 나온다. >> ..