머신러닝
-
pandas 데이터 프레임 열 추가 삭제 필터링 하기Machine Learning/pandas 2023. 8. 23. 01:52
오늘은 데이터프레임의 열을 조건으로 필터링하고 값을 바꿔보는 등 여러 문법을 적용해볼겁니다. 오늘도 우리에게 도움을 줄 cars.csv파일을 불러옵니다. 처음으로 해볼 것은 cars의 origin속성에서 europe에 해당하는 값을 필터링해볼겁니다. 이를 위한 조건을 mask1에 할당하고 불러오면 bool형태로 출력되는 것을 알 수 있습니다. mask2는 나중에 사용해볼건데 mpg속성의 값이 20보다 작은 조건을 나타내고 있습니다. 그리고 europe라는 변수에 원본 데이터인 cars에다가 대괄호 안에 mask1조건을 집어넣으면 우리가 원하는 조건에 맞는 데이터가 필터링되었음을 알 수 있습니다. 다중조건을 거는 방법도 쉽습니다. 우리가 앞서 설정한 mask1조건과 mask2 조건을 동시에 만족하는 데이터..
-
pandas 데이터 소계 및 합계, 정보, 요약, 정렬 알아보기Machine Learning/pandas 2023. 8. 18. 21:14
오늘은 describe, sort, value_counts등 다양한 함수를 사용하여 내가 불러온 데이터에서 어떤 정보를 얻을 수 있는지 알아봅시다. 오늘 공부를 위해 사용할 cars data입니다. cars에 .으로 mpg열에 접근하여 copy함수로 복사한 뒤 mpg라는 변수에 할당해줍니다. 이를 출력해보면 mpg는 rangeIndex로 정렬되어있는 형태임을 알 수 있습니다. describe함수를 출력하면 전체 갯수를 의미하는 count, 평균값인 mean, 최소값 등 다양한 값을 알 수 있습니다. max()함수로 최대값을 출력할 수 있습니다. 이게 된다면 min, std, mean등 다 된다는 말이겠죠? 그리고 우리가 추출한 열에 중복된 값의 갯수를 각각 구하고 싶을 때 value_counts를 사용하..
-
pandas iloc,loc을 이용한 데이터에 접근하기Machine Learning/pandas 2023. 8. 17. 19:47
pandas는 파이썬 기반 프로그램이기에 dot(.)을 사용하거나 loc 또는 iloc을 사용해서 행 또는 열에 접근할 수 있다. 방법을 차근차근 알아보자. 오늘 사용할 데이터는 car에 관한 데이터이다. mpg, cylinders 등 9개의 칼럼과 398개의 행을 가진 데이터프레임이다. 먼저 열에 접근하는 방법이다. 점을 이용해서 해당 열에 접근하거나 대괄호 안에 따옴표로 열의 이름을 입력하여 접근하는 방법이다. 데이터는 series형대로 반환한다. .iloc은 위치기반 접근법이다. 괄호 안에 숫자를 넣어주면 해당 인덱스에 위치한 데이터가 가진 값을 반환한다. 괄호 안에 ,를 통해서 열에도 접근할 수 있다. 이 방법을 보면 .iloc[행,열]같은 형태임을 알 수 있다. cars.iloc[200,8]은 ..