Part 3 데이터 살펴보기
- 데이터프레임 크기(행, 열) .shape
- 데이터프레임의 행과 열의 수는 속성을 사용하여 확인할 수 있습니다.
- 데이터프레임 기본정보 .info()
- 데이터프레임의 기본 정보를 확인할 수 있습니다.
이 메소드는 각 열의 데이터 타입, 비어 있지 않은 값의 개수 등을 보여줍니다.
판다스 자료형 설명:
int64 | int | 정수형 |
float64 | float | 실수형 |
object | string | 문자열 |
datetime64, timedelta64 | 없음 ( datetime 라이브러리 활용) | 날짜와 시간 관련 데이터 |
3. 데이터프레임의 기술통계 정보 요약 .describe()
- 숫자형 열에 대한 기술통계 정보(평균, 표준편차, 최소값, 최대값 등)를 요약하여 보여줍니다.
4. 각 열의 데이터 개수 .count()
- 각 열에 대한 데이터 개수(비결측치 수)를 확인할 수 있습니다.
5. 각 열의 고유값 개수 .nunique()
- 각 열의 고유값 개수를 확인할 수 있습니다.
통계함수
1. 평균 , 중위수 , 최대/최대값, 표준편차
2. 상관계수 .corr()
- 숫자형 열 간의 상관계수를 계산할 수 있습니다.
[판다스 내장 그래프 도구 활용]
판다스 내장 plot(kind = '종류') 매소드 - 그래프 종류
ex - df.plot(kind='scatter', x='Age', y='Cost')
kind 옵션 | 설명 | kind 옵션 | 설명 |
line | 선 그래프 | kde | 커널 밀도 그래프 |
bar | 수직 막대 그래프 | area | 면적 그래프 |
bath | 수평 막대 그래프 | pie | 파이 그래프 |
his | 히스토그램 | scatter | 산밀도 그래프 |
box | 박스플롯 | hexbin | 고밀도 산점도 그래프 |
'데이터 공부 > 파이썬 기초공부' 카테고리의 다른 글
Matplotlib에서 한글 오류 해결 방법 (0) | 2024.05.14 |
---|---|
Pandas 판다스 내용 정리 - ① 자료구조 및 입출력 (0) | 2024.05.13 |