데이터사이언스
-
pandas 데이터 소계 및 합계, 정보, 요약, 정렬 알아보기Machine Learning/pandas 2023. 8. 18. 21:14
오늘은 describe, sort, value_counts등 다양한 함수를 사용하여 내가 불러온 데이터에서 어떤 정보를 얻을 수 있는지 알아봅시다. 오늘 공부를 위해 사용할 cars data입니다. cars에 .으로 mpg열에 접근하여 copy함수로 복사한 뒤 mpg라는 변수에 할당해줍니다. 이를 출력해보면 mpg는 rangeIndex로 정렬되어있는 형태임을 알 수 있습니다. describe함수를 출력하면 전체 갯수를 의미하는 count, 평균값인 mean, 최소값 등 다양한 값을 알 수 있습니다. max()함수로 최대값을 출력할 수 있습니다. 이게 된다면 min, std, mean등 다 된다는 말이겠죠? 그리고 우리가 추출한 열에 중복된 값의 갯수를 각각 구하고 싶을 때 value_counts를 사용하..
-
pandas iloc,loc을 이용한 데이터에 접근하기Machine Learning/pandas 2023. 8. 17. 19:47
pandas는 파이썬 기반 프로그램이기에 dot(.)을 사용하거나 loc 또는 iloc을 사용해서 행 또는 열에 접근할 수 있다. 방법을 차근차근 알아보자. 오늘 사용할 데이터는 car에 관한 데이터이다. mpg, cylinders 등 9개의 칼럼과 398개의 행을 가진 데이터프레임이다. 먼저 열에 접근하는 방법이다. 점을 이용해서 해당 열에 접근하거나 대괄호 안에 따옴표로 열의 이름을 입력하여 접근하는 방법이다. 데이터는 series형대로 반환한다. .iloc은 위치기반 접근법이다. 괄호 안에 숫자를 넣어주면 해당 인덱스에 위치한 데이터가 가진 값을 반환한다. 괄호 안에 ,를 통해서 열에도 접근할 수 있다. 이 방법을 보면 .iloc[행,열]같은 형태임을 알 수 있다. cars.iloc[200,8]은 ..