일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 자바초보
- 자바공부
- 자바기초
- 웹대시보드 제작
- 판다스공부
- Pandas
- Streamlit기초
- 스트림릿 기본
- Android
- 자바스크립트 공부
- 스트림릿
- Streamlit기본
- 파이썬공부
- streamlit
- 파이썬
- 자바
- db
- JavaScript
- 자바프로그래밍
- java
- MySQL
- 자바스크립트
- 판다스
- serverless
- Flutter
- 데이터베이스
- 안드로이드 앱 개발
- 안드로이드 스튜디오
- 웹대시보드 기초
- RESTful API
- Today
- Total
목록전체 글 (240)
ruriruriya
판다스에서 다중 조건으로 데이터 값을 필터링하고 원하는 행을 선택하는 방법은 여러 가지가 있다. 가장 흔한 방법 중 하나는 loc 또는 iloc를 사용하여 특정 조건을 충족하는 행을 선택하는 것이다. 아래의 데이터 프레임으로 다중조건 필터링을 해보자. >> df = pd.DataFrame({'Employee ID':[111, 222, 333, 444], 'Employee Name':['Chanel', 'Steve', 'Mitch', 'Bird'], 'Salary [$/h]':[35, 29, 38, 20], 'Years of Experience':[3, 4 ,9, 1]}) >> df 판다스의 비교연산자 우선 판다스는 파이썬 기반으로 만들어진 라이브러리인데 비교연산자는 조금 다른 점을 인지하고 사용해야 한다..
unique(), nunique(), value_counts()는 판다스에서 데이터의 고유한 값들과 그 빈도를 확인하는 데 사용되는 메소드다. 이 세 가지 메소드는 데이터프레임이나 시리즈에서 고유한 값들을 다루는 데 유용하다. 아래 데이터프레임을 활용하여 알아보자. unique() 메소드란 unique() 메소드는 시리즈(Series) 객체에 적용하여 그 안에 있는 고유한 값들을 반환합니다. 중복을 제거한(unique) 값들을 리스트 형태로 반환합니다. 해당 시리즈에 실제로 존재하는 고유한 값들을 보여줍니다. 년도의 유니크한 데이터를 표시한다. >> df['Year'].unique() array([1990, 1991, 1992]) nunique() 메소드란 nunique() 메소드는 시리즈(Series)..
describe()메소드란? describe() 메소드는 판다스에서 데이터프레임의 간단한 통계 요약 정보를 제공하는 메소드이다. 이 메소드는 데이터프레임의 각 열에 대한 요약 통계량을 계산하여 반환한다. 개수(count): 각 열에 있는 비결측치(non-null) 항목의 수를 나타낸다. 평균(mean): 각 열의 평균 값을 보여준다. 표준편차(std): 각 열 값들의 표준편차를 보여준다. 최솟값(min): 각 열의 최솟값을 보여준다. 백분위수(25%, 50%, 75%): 각 열의 백분위수(25%, 50%, 75%)를 보여준다. 최댓값(max): 각 열의 최댓값을 보여준다. 파일에서 불러온 데이터로 메소드를 사용해보자 :) describe() 메소드를 사용하면 아래와 같이 기본 통계정보들이 나온다. >> ..
데이터프레임에 파일을 로드하는 방법은 다양한 파일 형식에 따라 다르다. 주로 사용되는 파일 형식으로는 CSV, Excel, JSON, SQL, HTML 등이 있다. 각 형식에 맞게 적절한 판다스 함수를 사용하여 데이터를 로드할 수 있다. CSV(Comma Separated Values)파일 읽는 방법 CSV 파일은 데이터프레임의 요소가 콤마로 구분되어 있는 것을 말한다. CSV 파일을 read_csv() 메소드로 로드하면 콤마 기준으로 데이터프레임이 출력된다. 구글 코랩에서 실행하면 데이터가 많을 땐 아래 행과 열이 표시되며 중간이 생략된다. >> df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/데이터분석/data/GOOG.csv') >>..
NaN이란? NaN은 "Not a Number"의 약자로, 결측치(missing value)를 나타내는 데 사용되는 특수한 값이다. 주로 파이썬의 판다스와 같은 데이터 분석 도구에서 사용된다. NaN은 데이터셋에서 값이 존재하지 않거나 수학적으로 정의할 수 없는 상태를 나타낸다. 이것은 데이터의 부재, 누락, 또는 특정 연산 결과가 정의되지 않는 경우에 해당한다. 먼제 데이터프레임을 통해 NaN 데이터를 알아보자. >> items2 = [{'bikes': 20, 'pants': 30, 'watches': 35, 'shirts': 15, 'shoes':8, 'suits':45}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5, 'shirts': 2, 'sh..
판다스 데이터프레임(Pandas DataFrame)이란? 데이터프레임(DataFrame)은 판다스의 핵심 자료구조 중 하나로, 테이블 형태의 데이터를 다루는 데 사용된다. 데이터프레임은 행과 열로 구성된 2차원 테이블로, 각 열은 다른 데이터 타입을 가질 수 있다. 이를 통해 데이터를 쉽게 조작하고 분석할 수 있다. 데이터프레임은 CSV, Excel, 데이터베이스 등 다양한 소스로부터 데이터를 가져와 처리할 수 있다. 판다스의 다양한 함수와 메서드를 사용하여 데이터프레임을 조작하고 필터링하며, 분석 및 시각화를 수행할 수 있다. 판다스 데이터프레임 생성하기 먼저 파이썬의 dict를 판다스 1차원 데이터 Series 사용해 2차원 데이터를 생성하여 변수에 할당한다. import pandas as pd it..
판다스(Pandas)는 파이썬에서 데이터 조작과 분석을 위한 라이브러리다. 주로 표 형식의 데이터나 시계열 데이터를 다루는 데에 사용한다. 판다스는 데이터를 처리하고 정리하는 데 유용한 다양한 기능을 제공한다. 판다스(Pandas)의 장점 - 행과 열에 레이블을 사용할 수 있다. - 기본적인 통계데이터를 제공한다. - NaN 값을 알아서 처리할 수 있는 메소드가 있다. - 숫자 문자열을 알아서 불러온다. - 데이터셋들을 병합할 수 있다. - Numpy와 Matplotlib와 통합된다. 판다스(Pandas) 라이브러리 불러오기 판다스 라이브러리를 불러오는 가장 첫번 째 방법이다. 다른 라이브러리도 동일한 방법으로 불러온다. import pandas as pd 판다스 시리즈(Pandas Series) 데이터..
자바 리스트(List)는 배열과 비슷하지만 배열보다 더 많이 쓰이는 자료형이다. 배열은 크기가 정해져 있지만 리스트는 크기가 계속 변한다. 그래서 리스트는 크기가 정해져 있지 않아서 원하는 만큼 값을 넣을 수 있다. 크기가 정해져 있는 것이 아니라면 배열보다 리스트 사용을 추천한다. ArrayList 리스트에서 가장 많이 사용되는 ArrayList에는 add, get, size, contains, remove 메소드가 있다. add 메소드 ArrayList에서 add 메소드를 사용하면 요소값을 추가할 수 있다. 수학점수를 예시로 들어 1학기 중간고사, 1학기 기말고사, 2학기 중간고사 점수를 추가했다. import java.util.ArrayList; public class Main { public st..