-
pandas 인덱스 다루기Machine Learning/pandas 2023. 8. 19. 21:30반응형
pandas에서 불러온 데이터프레임에 인덱스를 설정하고 제거하는 방법을 알아보자
오늘도 역시 cars데이터를 가지고 조작을 해볼 예정입니다
지금 우리가 불러온 cars 데이터 프레임의 index는 rangeIndex형태입니다.
line 7에서 set_index함수로 car의 name에 해당하는 열을 인덱스값으로 설정해주고 inplace로 원본에 덮어씌어줍니다.
is_unique함수는 중복이 있는지 없는지를 묻는 함수인데 False이므로 index에 중복된 값이 있음을 알 수 있습니다.
그리고 value_counts함수로 중복된 값이 무엇이고 몇 개인지 알아보았습니다.
인덱스에 이름을 붙여줄 수도 있습니다.
이름을 붙여주면 조회할 때 상단에 인덱스 이름이 표기됩니다.
설정한 인덱스를 초기화하고 싶다면 reset_index를 활용하면 됩니다.
inplace를 True로 설정하여 원본에 덮어씌어주면 원본에 인덱스로 사용하던 car_model이 열로 추가됩니다.
만약 추가되는걸 막고싶다면 reset_index안에 파라미터인 drop 파라미터를 True로 설정해주면 됩니다.
마지막으로 열의 이름을 바꾸는 방법입니다.
rename함수를 사용하여 columns파라미터에 dict형태로 값을 넣어주면 됩니다.
dict의 key에 해당하는 값은 기존에 열 이름이고, value에 해당하는 값은 바꾸고싶은 이름을 넣어주면 됩니다.
반응형'Machine Learning > pandas' 카테고리의 다른 글
pandas 데이터 프레임 열 추가 삭제 필터링 하기 (0) 2023.08.23 pandas 데이터 소계 및 합계, 정보, 요약, 정렬 알아보기 (0) 2023.08.18 pandas iloc,loc을 이용한 데이터에 접근하기 (0) 2023.08.17 pandas 데이터프레임 함수 살펴보기 (0) 2023.08.16 pandas에서 유용한 jupyter 단축키 모음 (0) 2023.08.15