9일차 테크노트
변수와 값으로 새로운 데이터 프레임 비슷한 피벗 테이블을 형성하는 방식이다.
columns로 열 속성을 특정해주면, 그러면 이제 4가지 지역명을 열값들 4가지 들이 열 속성으로 할당된다.
idex로 행 데이터를 지정해주면 sex 남성여성으로 나뉘어 2열을 만들어준다.
그리고 데이터 값은 charges를 가져오면 집계처리는 'mean'으로 평균 값으로 기입해준다.
그러면 피벗 테이블이 이렇게 나올 것이다.
위 피벗 테이블을 기반한 히트맵 함수이다.
pandas의 기능으로 새로운 dataframe을 만들 수 있다.
디셕너리 형태로 키 위치에 속성값을 설정해주고 값 위치에 데이터를 리스트형태로 보내준다.
열 값은 0,1,2,3,4로 할당된다.
생성 및 수정이 가능한 함수이다.
[' '] 의 값이 기존 데이터 프레임에 속하지 않는다면 새로운 열변수로 만들어 진 후 0의 데이터들을 할당해준다.
만약 기존 데이터 프레임 열의 같은 열 값이 있다면 대체하여 0 값을 기입해준다.
weekday 함수는
1주일의 기간에 맞춰 7일의 등간격시킨다,
## 0~6 (총 7일) 월~일
[월, 화, 수, 목, 금, 토, 일]
[0, 1, 2, 3, 4, 5, 6.]
요일 배정 해주는 def 함수 이다
조건을 활용한 일부 관측치 선택이고
선택한 관측만 수정하는 방식이다.
drop을 이용한 변수 제거이다
inplace= True 값을 기입하면 복제하여 출력이 아닌 원본데이터에 수정을 가하니 상황에 맞게 사용하자.
위는 이제 관측치 제거이다 열을 제거함으로 부분 소거가 가능하며 원본데이터에는 영향이 끼치질 않음을 확인하자.
INPLACE 여부#
위는 속성 명을 바꾸는 기능이다. 여기서 주의할점은 변경하는 컬럼 리스트 변수 갯수가 기존 데이터 프레임 열 수와 맞지 않으면 오류가 발생한다. 그러니 숫자를 맞춰 변수이름을 바꿔주자,
위는 좀더 세세하게 변수명을 수정 / 제거/ 추가하 방법이다.
앞으로 데이터 전처리하는 과정에서 수많은 결측치를 맞닿뜨릴거다.
결측치 필터에 관한 함수이다.
먼저 결측치를 찾아 준다.
결측치면 TRUE, 아니면 FALSE값 할당
이제 ~ 리버스하여 역순으로 하면 결측치 일떄 FALSE값이 될테다.
이제 T/ F 값의 할당이 마쳤으면 ISIN 함수로 결측치를 필터링할 수 있을테다.