일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 웹대시보드 기초
- 스트림릿 기본
- 자바공부
- java
- 자바스크립트
- 안드로이드 앱 개발
- Streamlit기초
- Pandas
- db
- JavaScript
- 파이썬
- 데이터베이스
- Android
- 판다스
- RESTful API
- streamlit
- 파이썬공부
- serverless
- 안드로이드 스튜디오
- Flutter
- 스트림릿
- 웹대시보드 제작
- Streamlit기본
- 자바초보
- 자바기초
- 자바프로그래밍
- MySQL
- 자바스크립트 공부
- 자바
- 판다스공부
- Today
- Total
목록파이썬공부 (12)
ruriruriya
Matplotlib를 사용하여 간단한 라인 차트를 만드는 방법은 간단하다. 먼저, 필요한 데이터를 정의하고 plt.plot() 함수를 사용하여 그래프를 생성하면 된다. 예를 들어, x와 y 값이 다음과 같은 경우를 생각해보자. 먼저 Matplotlib 라이브러리를 import 한다. 그리고 numpy 라이브러리도 import 해준다. 아래 예제에 활용될 x와 y의 값을 numpy의 arange 함수로 array 형태로 생성한다. >> import matplotlib.pyplot as plt >> import numpy as np >> x = np.arange(0,10+1) >> x array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) >> y = np.arange(0,10+1) >..
Matplotlib은 파이썬에서 데이터 시각화를 위한 라이브러리 중 하나이다. 데이터를 그래픽 형태로 시각화하거나 차트, 플롯, 히스토그램 등을 생성하는 데 사용된다. 이 라이브러리는 2D 그래픽을 생성하는 데 주로 사용되며, 3D 그래픽도 일부 지원한다. Matplotlib은 사용하기 쉬우면서도 다양한 그래프 유형을 생성할 수 있는 강력한 기능을 제공한다. 간단한 라인 플롯부터 복잡한 subplot, heatmap, 3D 그래픽까지 다양한 그래픽 요소를 구현할 수 있다. 또한, Matplotlib 은 다른 라이브러리와도 호환성이 높아 데이터 분석 라이브러리인 판다스와 함께 자주 사용된다.. 맷플롯립은 주로 pyplot 인터페이스를 통해 사용된다. 이를 통해 그래프를 그리고 그에 관련된 여러 속성을 조정..
판다스에서 다중 조건으로 데이터 값을 필터링하고 원하는 행을 선택하는 방법은 여러 가지가 있다. 가장 흔한 방법 중 하나는 loc 또는 iloc를 사용하여 특정 조건을 충족하는 행을 선택하는 것이다. 아래의 데이터 프레임으로 다중조건 필터링을 해보자. >> df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) >> df 판다스의 비교연산자 우선 판다스는 파이썬 기반으로 만들어진 라이브러리인데 비교연산자는 조금 다른 점을 인지하고 사용해야 한다..
unique(), nunique(), value_counts()는 판다스에서 데이터의 고유한 값들과 그 빈도를 확인하는 데 사용되는 메소드다. 이 세 가지 메소드는 데이터프레임이나 시리즈에서 고유한 값들을 다루는 데 유용하다. 아래 데이터프레임을 활용하여 알아보자. unique() 메소드란 unique() 메소드는 시리즈(Series) 객체에 적용하여 그 안에 있는 고유한 값들을 반환합니다. 중복을 제거한(unique) 값들을 리스트 형태로 반환합니다. 해당 시리즈에 실제로 존재하는 고유한 값들을 보여줍니다. 년도의 유니크한 데이터를 표시한다. >> df['Year'].unique() array([1990, 1991, 1992]) nunique() 메소드란 nunique() 메소드는 시리즈(Series)..
describe()메소드란? describe() 메소드는 판다스에서 데이터프레임의 간단한 통계 요약 정보를 제공하는 메소드이다. 이 메소드는 데이터프레임의 각 열에 대한 요약 통계량을 계산하여 반환한다. 개수(count): 각 열에 있는 비결측치(non-null) 항목의 수를 나타낸다. 평균(mean): 각 열의 평균 값을 보여준다. 표준편차(std): 각 열 값들의 표준편차를 보여준다. 최솟값(min): 각 열의 최솟값을 보여준다. 백분위수(25%, 50%, 75%): 각 열의 백분위수(25%, 50%, 75%)를 보여준다. 최댓값(max): 각 열의 최댓값을 보여준다. 파일에서 불러온 데이터로 메소드를 사용해보자 :) describe() 메소드를 사용하면 아래와 같이 기본 통계정보들이 나온다. >> ..
데이터프레임에 파일을 로드하는 방법은 다양한 파일 형식에 따라 다르다. 주로 사용되는 파일 형식으로는 CSV, Excel, JSON, SQL, HTML 등이 있다. 각 형식에 맞게 적절한 판다스 함수를 사용하여 데이터를 로드할 수 있다. CSV(Comma Separated Values)파일 읽는 방법 CSV 파일은 데이터프레임의 요소가 콤마로 구분되어 있는 것을 말한다. CSV 파일을 read_csv() 메소드로 로드하면 콤마 기준으로 데이터프레임이 출력된다. 구글 코랩에서 실행하면 데이터가 많을 땐 아래 행과 열이 표시되며 중간이 생략된다. >> df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/데이터분석/data/GOOG.csv') >>..
NaN이란? NaN은 "Not a Number"의 약자로, 결측치(missing value)를 나타내는 데 사용되는 특수한 값이다. 주로 파이썬의 판다스와 같은 데이터 분석 도구에서 사용된다. NaN은 데이터셋에서 값이 존재하지 않거나 수학적으로 정의할 수 없는 상태를 나타낸다. 이것은 데이터의 부재, 누락, 또는 특정 연산 결과가 정의되지 않는 경우에 해당한다. 먼제 데이터프레임을 통해 NaN 데이터를 알아보자. >> items2 = [{'bikes': 20, 'pants': 30, 'watches': 35, 'shirts': 15, 'shoes':8, 'suits':45}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5, 'shirts': 2, 'sh..
판다스 데이터프레임(Pandas DataFrame)이란? 데이터프레임(DataFrame)은 판다스의 핵심 자료구조 중 하나로, 테이블 형태의 데이터를 다루는 데 사용된다. 데이터프레임은 행과 열로 구성된 2차원 테이블로, 각 열은 다른 데이터 타입을 가질 수 있다. 이를 통해 데이터를 쉽게 조작하고 분석할 수 있다. 데이터프레임은 CSV, Excel, 데이터베이스 등 다양한 소스로부터 데이터를 가져와 처리할 수 있다. 판다스의 다양한 함수와 메서드를 사용하여 데이터프레임을 조작하고 필터링하며, 분석 및 시각화를 수행할 수 있다. 판다스 데이터프레임 생성하기 먼저 파이썬의 dict를 판다스 1차원 데이터 Series 사용해 2차원 데이터를 생성하여 변수에 할당한다. import pandas as pd it..