카테고리 없음

[9일차] 부트 캠프 테크노트

evangeline1245 2024. 7. 17. 12:53

 

9일차 테크노트

 

변수와 값으로 새로운 데이터 프레임 비슷한 피벗 테이블을 형성하는 방식이다.

columns로 열 속성을 특정해주면, 그러면 이제 4가지 지역명을 열값들 4가지 들이 열 속성으로 할당된다.

idex로 행 데이터를 지정해주면 sex  남성여성으로 나뉘어 2열을 만들어준다.

그리고 데이터 값은 charges를 가져오면 집계처리는 'mean'으로 평균 값으로 기입해준다.

 

그러면 피벗 테이블이 이렇게 나올 것이다.

 

 

위 피벗 테이블을 기반한 히트맵 함수이다.

 

pandas의 기능으로 새로운 dataframe을 만들 수 있다.

디셕너리 형태로 키 위치에 속성값을 설정해주고 값 위치에 데이터를 리스트형태로 보내준다.

열 값은 0,1,2,3,4로 할당된다.

 

 생성 및 수정이 가능한 함수이다.

[' '] 의 값이 기존 데이터 프레임에 속하지 않는다면 새로운 열변수로 만들어 진 후 0의 데이터들을 할당해준다.

 

만약 기존 데이터 프레임 열의 같은 열 값이 있다면 대체하여 0 값을 기입해준다.

 

weekday 함수는

1주일의 기간에 맞춰 7일의 등간격시킨다,

## 0~6 (총 7일) 월~일

[월, 화, 수, 목, 금, 토, 일]

[0, 1, 2, 3, 4, 5, 6.]

 

요일 배정 해주는 def 함수 이다

조건을 활용한 일부 관측치 선택이고

선택한 관측만 수정하는 방식이다.

 

 

drop을 이용한 변수 제거이다

inplace= True 값을 기입하면 복제하여 출력이 아닌 원본데이터에 수정을 가하니 상황에 맞게 사용하자.

 

위는 이제 관측치 제거이다 열을 제거함으로 부분 소거가 가능하며 원본데이터에는 영향이 끼치질 않음을 확인하자.

INPLACE 여부#

 

위는 속성 명을 바꾸는 기능이다. 여기서 주의할점은 변경하는 컬럼 리스트 변수 갯수가 기존 데이터 프레임 열 수와 맞지 않으면 오류가 발생한다. 그러니 숫자를 맞춰 변수이름을 바꿔주자,

위는 좀더 세세하게 변수명을 수정 / 제거/  추가하 방법이다.

 

앞으로 데이터 전처리하는 과정에서 수많은 결측치를 맞닿뜨릴거다.

결측치 필터에 관한 함수이다.

먼저  결측치를 찾아 준다.

결측치면 TRUE,  아니면 FALSE값 할당

이제 ~ 리버스하여 역순으로 하면 결측치 일떄 FALSE값이 될테다.

이제 T/  F 값의 할당이 마쳤으면 ISIN 함수로 결측치를 필터링할 수 있을테다.