2024/07/17 2

[10일차] 부트캠프 테크노트

데이터 전처리 마지막 과정.미니 프로젝트를 진행했다.   가장 먼저 데이터 불러오기여기서 중요한점은 skiprows와 encoding이다가져올 csv파일에는 한글변수가 존재하기에 올바르게 읽어 오려면 encoding=cp949를 넣어줘야하고가져와야 할 데이터는 17행부터 시작하기에 skiprows로 불필요한 16개의 행을 날린 후 읽어왔다.  올바르게 읽어온 데이터 파일이다.    다음 문제 결측값과 파생변수 생성이다.먼저  해제사유발생일에 결측값이 나타난다는 것은 해제사유발생일이 아직 발생하지 않았다는 의미이기에계약이 가결된 것을 의미한다. 반대로 값이 존재한다면 그 계약은 해제 됐음을 의미한다.우리는 가결된 아파트 실거래가을 가져오고 싶은 것임을 명심하자먼저 isnull함수를 이용해 해제사유발생일에 ..

카테고리 없음 2024.07.17

[9일차] 부트 캠프 테크노트

9일차 테크노트 변수와 값으로 새로운 데이터 프레임 비슷한 피벗 테이블을 형성하는 방식이다.columns로 열 속성을 특정해주면, 그러면 이제 4가지 지역명을 열값들 4가지 들이 열 속성으로 할당된다.idex로 행 데이터를 지정해주면 sex  남성여성으로 나뉘어 2열을 만들어준다.그리고 데이터 값은 charges를 가져오면 집계처리는 'mean'으로 평균 값으로 기입해준다. 그러면 피벗 테이블이 이렇게 나올 것이다.  위 피벗 테이블을 기반한 히트맵 함수이다. pandas의 기능으로 새로운 dataframe을 만들 수 있다.디셕너리 형태로 키 위치에 속성값을 설정해주고 값 위치에 데이터를 리스트형태로 보내준다.열 값은 0,1,2,3,4로 할당된다.  생성 및 수정이 가능한 함수이다.[' '] 의 값이 기..

카테고리 없음 2024.07.17