본문 바로가기
데이터 공부/파이썬 기초공부

Pandas 판다스 내용 정리 - ② 데이터 살펴보기 , 시각화

by 스터디마형 2024. 5. 14.

Part 3 데이터 살펴보기


- 데이터프레임 크기(행, 열) .shape

- 데이터프레임의 행과 열의 수는  속성을 사용하여 확인할 수 있습니다.


- 데이터프레임 기본정보 .info()

- 데이터프레임의 기본 정보를 확인할 수 있습니다.

이 메소드는 각 열의 데이터 타입, 비어 있지 않은 값의 개수 등을 보여줍니다.



판다스 자료형 설명:

int64 int 정수형
float64 float 실수형
object string 문자열
datetime64, timedelta64 없음 ( datetime 라이브러리 활용) 날짜와 시간 관련 데이터


3. 데이터프레임의 기술통계 정보 요약 .describe()

- 숫자형 열에 대한 기술통계 정보(평균, 표준편차, 최소값, 최대값 등)를 요약하여 보여줍니다.

 

4. 각 열의 데이터 개수 .count() 

- 각 열에 대한 데이터 개수(비결측치 수)를 확인할 수 있습니다.

5. 각 열의 고유값 개수  .nunique() 

- 각 열의 고유값 개수를 확인할 수 있습니다.


통계함수

1. 평균 , 중위수 , 최대/최대값, 표준편차


2. 상관계수 .corr() 

- 숫자형 열 간의 상관계수를 계산할 수 있습니다.

 

[판다스 내장 그래프 도구 활용]

판다스 내장 plot(kind = '종류') 매소드 - 그래프 종류

ex - df.plot(kind='scatter', x='Age', y='Cost')

kind 옵션 설명 kind 옵션 설명
line 선 그래프 kde 커널 밀도 그래프
bar 수직 막대 그래프 area 면적 그래프
bath 수평 막대 그래프 pie 파이 그래프
his 히스토그램 scatter 산밀도 그래프
box 박스플롯 hexbin 고밀도 산점도 그래프