ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • pandas iloc,loc을 이용한 데이터에 접근하기
    Machine Learning/pandas 2023. 8. 17. 19:47
    반응형

    pandas는 파이썬 기반 프로그램이기에 dot(.)을 사용하거나 loc 또는 iloc을 사용해서

    행 또는 열에 접근할 수 있다. 방법을 차근차근 알아보자.

    오늘 사용할 데이터는 car에 관한 데이터이다.

    mpg, cylinders 등 9개의 칼럼과 398개의 행을 가진 데이터프레임이다.

     

    먼저 열에 접근하는 방법이다.

    점을 이용해서 해당 열에 접근하거나 대괄호 안에 따옴표로 열의 이름을 입력하여 접근하는 방법이다.

    데이터는 series형대로 반환한다.

     

    .iloc은 위치기반 접근법이다. 괄호 안에 숫자를 넣어주면 해당 인덱스에 위치한 데이터가 가진 값을 반환한다.

    괄호 안에 ,를 통해서 열에도 접근할 수 있다. 이 방법을 보면 .iloc[행,열]같은 형태임을 알 수 있다.

    cars.iloc[200,8]은 index200에 해당하는 데이터의 8번째 칼럼값인 name, 즉 ford granada ghia를 반환한다.

    파이썬에 기반으로 동작하기 때문에 -10과같이 아래에서부터 해당하는 값을 추출할 수도 있고 슬라이싱도 가능하다.

    그리고 열에 해당하는 곳에 위처럼 원하는 칼럼의 인덱스를 넣어주면 적절하게 반환해준다.

     

    이번엔 cars를 불러오는데 index로 사용할 칼럼을 지정해주었다.

    이는 read_csv의 파라미터인 index_col을 이용해서 인덱스로 사용할 칼럼의 이름을 넣어주면 된다.

     

    cars.index를 호출하면 Index에 해당하는 값들을 오브젝트로 반환해준다.

    그리고 여기서 loc을 사용하는데 name을 index로 쓰고 있으므로 loc과 우리가 접근할 인덱스의 name에 해당하는 값을

    넣어주면 그 데이터가 반환된다.

    원하는 열만 추출하고 싶을 땐 ,뒤에 원하는 열만 가진 배열을 넣어주면 된다.

    위 식에서 loc도 iloc과 마찬가지로 loc[행,열]임을 알 수 있다.

     

    반응형

    댓글

Designed by Tistory.