일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
- Matplotlib 기초
- 웹대시보드 기초
- JavaScript
- RESTful API
- 자바프로그래밍
- 데이터베이스
- 자바초보
- Pandas
- streamlit
- Streamlit기본
- 파이썬
- 자바공부
- 판다스
- 판다스데이터프레임
- java
- 파이썬공부
- MySQL
- serverless
- 자바
- 스트림릿
- 웹대시보드 제작
- 자바스크립트
- db
- 자바스크립트 공부
- 안드로이드 스튜디오
- 판다스공부
- 스트림릿 기본
- Streamlit기초
- 자바초보공부
- 자바기초
- Today
- Total
목록전체 글 (221)
ruriruriya
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/JEr6m/btsAkrCeeD8/TKmYzTwgrsP8sYpWANSeHk/img.jpg)
데이터프레임에 파일을 로드하는 방법은 다양한 파일 형식에 따라 다르다. 주로 사용되는 파일 형식으로는 CSV, Excel, JSON, SQL, HTML 등이 있다. 각 형식에 맞게 적절한 판다스 함수를 사용하여 데이터를 로드할 수 있다. CSV(Comma Separated Values)파일 읽는 방법 CSV 파일은 데이터프레임의 요소가 콤마로 구분되어 있는 것을 말한다. CSV 파일을 read_csv() 메소드로 로드하면 콤마 기준으로 데이터프레임이 출력된다. 구글 코랩에서 실행하면 데이터가 많을 땐 아래 행과 열이 표시되며 중간이 생략된다. >> df = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/데이터분석/data/GOOG.csv') >>..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/qKCdv/btsAm5kWfyJ/BPGhWYSwKuvjYAkKISkwek/img.jpg)
NaN이란? NaN은 "Not a Number"의 약자로, 결측치(missing value)를 나타내는 데 사용되는 특수한 값이다. 주로 파이썬의 판다스와 같은 데이터 분석 도구에서 사용된다. NaN은 데이터셋에서 값이 존재하지 않거나 수학적으로 정의할 수 없는 상태를 나타낸다. 이것은 데이터의 부재, 누락, 또는 특정 연산 결과가 정의되지 않는 경우에 해당한다. 먼제 데이터프레임을 통해 NaN 데이터를 알아보자. >> items2 = [{'bikes': 20, 'pants': 30, 'watches': 35, 'shirts': 15, 'shoes':8, 'suits':45}, {'watches': 10, 'glasses': 50, 'bikes': 15, 'pants':5, 'shirts': 2, 'sh..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/brLoqA/btsAkjjFDtn/kQELW8BRe9CcvWlG3TUmVk/img.jpg)
판다스 데이터프레임(Pandas DataFrame)이란? 데이터프레임(DataFrame)은 판다스의 핵심 자료구조 중 하나로, 테이블 형태의 데이터를 다루는 데 사용된다. 데이터프레임은 행과 열로 구성된 2차원 테이블로, 각 열은 다른 데이터 타입을 가질 수 있다. 이를 통해 데이터를 쉽게 조작하고 분석할 수 있다. 데이터프레임은 CSV, Excel, 데이터베이스 등 다양한 소스로부터 데이터를 가져와 처리할 수 있다. 판다스의 다양한 함수와 메서드를 사용하여 데이터프레임을 조작하고 필터링하며, 분석 및 시각화를 수행할 수 있다. 판다스 데이터프레임 생성하기 먼저 파이썬의 dict를 판다스 1차원 데이터 Series 사용해 2차원 데이터를 생성하여 변수에 할당한다. import pandas as pd it..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cgiBAQ/btsAhdEva0v/iaFxC7TYUYrYcwkgkkZb81/img.jpg)
판다스(Pandas)는 파이썬에서 데이터 조작과 분석을 위한 라이브러리다. 주로 표 형식의 데이터나 시계열 데이터를 다루는 데에 사용한다. 판다스는 데이터를 처리하고 정리하는 데 유용한 다양한 기능을 제공한다. 판다스(Pandas)의 장점 - 행과 열에 레이블을 사용할 수 있다. - 기본적인 통계데이터를 제공한다. - NaN 값을 알아서 처리할 수 있는 메소드가 있다. - 숫자 문자열을 알아서 불러온다. - 데이터셋들을 병합할 수 있다. - Numpy와 Matplotlib와 통합된다. 판다스(Pandas) 라이브러리 불러오기 판다스 라이브러리를 불러오는 가장 첫번 째 방법이다. 다른 라이브러리도 동일한 방법으로 불러온다. import pandas as pd 판다스 시리즈(Pandas Series) 데이터..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bymQrE/btsAajkNjrU/aHK3ebBFP3DqKKyd5TFbjk/img.jpg)
자바 리스트(List)는 배열과 비슷하지만 배열보다 더 많이 쓰이는 자료형이다. 배열은 크기가 정해져 있지만 리스트는 크기가 계속 변한다. 그래서 리스트는 크기가 정해져 있지 않아서 원하는 만큼 값을 넣을 수 있다. 크기가 정해져 있는 것이 아니라면 배열보다 리스트 사용을 추천한다. ArrayList 리스트에서 가장 많이 사용되는 ArrayList에는 add, get, size, contains, remove 메소드가 있다. add 메소드 ArrayList에서 add 메소드를 사용하면 요소값을 추가할 수 있다. 수학점수를 예시로 들어 1학기 중간고사, 1학기 기말고사, 2학기 중간고사 점수를 추가했다. import java.util.ArrayList; public class Main { public st..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/cCmwTZ/btsAbpkrRhR/QuEmi6AaKapOL6rDBao5Q1/img.jpg)
자바 StringBuffer는 문자열을 추가하거나 변경할 때 쓰는 자료형으로 다양한 메소드를 활용할 수 있다. append 메소드 append 메소드는 문자열을 추가해주는 역할을 한다. String 자료형으로 출력하고 싶다면 toString() 메소드를 사용해서 변경해야 한다. String 자료형은 값이 한번 생성되면 바꿀 수 없지만 StringBuffer 자료형은 값을 변경이 가능해 이미 생성된 값을 언제든지 수정할 수 있다는 장점이 있다. * 이뮤터블(immutable)하다 : 값을 변경할 수 없음. * 뮤터블(mutable)하다 : 변경할 수 있음. StringBuffer sb = new StringBuffer(); sb.append("Hello"); sb.append(" I"); sb.append..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/AAFpr/btsyQqjkxkL/ijOdhC5la8dLEEsTCEQfSK/img.jpg)
파이썬의 변수 파이썬에서의 변수는 자바와 달리 모두 참조자 변수이다. 즉 데이터형으로 따로 나뉘어 변수를 만들지 않는다. 변수는 쉽게 데이터의 이름이라고 생각하면 된다. 변수를 만들고 나중에 새로운 데이터를 대입하면 마지막에 대입한 데이터를 가리키게 된다. 변수를 만들 때는 등호(=)를 사용해서 변수와 데이터를 연결한다. 변수 만드는 방법 # 변수 이름 = 변수에 저장할 데이터 coffee = "latte" # 값이 "latte"인 coffee 라는 이름의 변수 생성 print(coffee)# coffee 변수 출력 파이썬 변수 이름의 규칙과 관례 파이썬에서 변수 이름을 지을 때 지켜야 하는 규칙과 관례가 있다. 규칙은 있지만 사용가능하더라도 관례에 따라 안 쓰기도 하는 케이스가 있다. 네이밍 룰(규칙)..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/4pdWT/btsyMdFEg1g/vkjtusv8onztYKA9zExCt1/img.jpg)
파이썬 숫자 데이터 파이썬에서 사용하는 숫자 데이터는 크게 정수와 부동 소수점 수로 나뉜다. 부동 소수점 수는 실수라고 표현하기도 한다. 정수 정수는 소수점이 없는 수이다. 대부분의 프로그래밍 언어에서는 소수점이 없는 수를 정수라고 부른다. 하지만 큰따옴표("..."),작은따옴표('...')로 쌓여져 있다면 문자 데이터로 인지한다. 그리고 일상에서 쓰이는 돈의 단위의 콤마(,)는 프로그래밍에서 숫자데이터에 쓰일 수 없다. 또한 정수의 덧셈은 정확한 정숫값이 표시된다. print(1+2) # 3 print(3*4) # 12 print(4/2) # 2 부동 소수점 수 실수라고도 부르는 부동 소수점 수는 소수점 있는 수를 말한다. 부동 소수점 수의 덧셈은 예상한 값과 약간의 오차가 생길 수 있다. 아래 소스 ..