위는 csv로 저장된 파일 형식을 읽어오는 기능이다. 주로 저장되는 파일형태는 csv, xlsx, txt 등이 있으며 대체적으로 csv
임으로 위 3가지 형태 파일 형식을 읽어오는 기능은 알고있으면 유용할 거다.
csv파일을 읽을 시 주의할 점 enconding 형식을 붙여야 한다. 저장 형태가 한글일 경우 받아오는 과정에 있어서 컴퓨터가 읽질 못하므로 enconding 설정을 조심해주자
위는 head함수로 써 앞 (n)개의 관측치를 보여주는 기능이다.
n=5의 기본값을 가진다.
위는 끝으로부터 n개의 관측치를 표현하는 함수이다. 이 역시 n=5의 기본값을 가진다.
위는 파일의 여러 형태중 csv파일이 아닌 엑셀 파일을 읽어오는 기능이다.
엑셀은 행열 이 있는 2차원 구조로 형태가 같지 않음이 있음에 유의하자
위는 엑셀의 시트별로도 읽어올수 방법이다. 중요한점은 원하는 시트를 sheet_name= 에 원하는 시트 숫자들을 기입하면 된다. 뒤 head=는 위부터 원하는 행을 넘기는 기능이다. 만약 한줄 공란 인 형태인 파일은 받으면 header= 1을 기입해 공란없이 파일을 받을 수있다.
불러오는 데이터를 원하는 속성별만 따로 추출할 수 있는 기능이다.
읽어온 여러 데이터들을 하나의 형태로 합치는 기능의 함수이다.
df_apt1, df_apt2, df_apt3 3가지의 각각 기간이 다른 데이터들을 df_apt 변수에 하나로 합쳐서 보냈다.
여기서 axis= 은 합치는 방향을 정한다고 생각하자
#행 방향 =0(세로) 열 방향 =1(가로)
merge 함수 역시 데이터를 합치는 기능을 수행하는 함수이다.
하지만 concat함수와 무엇이 다를까
바로 유연성에 차이가 있다.
concat 함수는 방향에 맞게만 데이터를 합칠 수 있다.
하지만 merge함수는 원하는 변수를 기준으로 데이터를 합칠 수 있다.
loc는 행열 변수를 원하는 만큼 가져올수 있으며 열에 해당하는 부분은 인덱스가 아닌 변수명으로써 첨부가 가능하다.
iloc는 ioc와 같이 원하는 행열 변수를 원하는 만큼 가져올수 있으며 또한 변수 명이 아닌 인덱스 위치로 열변수 추출이 가능하다.