pandas 3

Pandas : 데이터 집계 - 범위로 그룹화 하기

Pandas 에서 데이터를 집계할 때, 범위 (0~10까지, 10~100까지, 100~1000까지... 등등) 로 데이터를 그룹화 하여 집계하는 방법을 정리해본다. 일단 간단한 더미데이터를 준비한다. import random data = [random.randint(0, 10000) for e in range(1000)] 위 데이터로 프레임을 만들어준다. import pandas as pd df = pd.DataFrame(data, columns=['value']) df.head() 이 데이터를 groupby 로 집계하려면, 집계의 기준이 될 column이 필요하다. 나는 위 프레임에 column 하나를 추가하여 "태그" 라 부르려 한다. # groupby용 태그 컬럼 추가 df['tag'] = 0 # ..

Python 2021.08.30

Pandas : 데이터 필터링하기 #2 (열 단위 데이터 추출)

데이터 프레임에서 특정 열만 골라 새로운 프레임으로 만들고 싶을 땐 다음과 같이 대괄호를 사용하면 된다. 먼저 다음과 같은 데이터가 있다고 가정한다. import pandas # 테스트 데이터 data = [(0, 'a', '서울'), (1, 'b', '부산'), (2, 'c', '대구'), (3, 'a', '서울'), (4, 'a', '인천'), (5, 'b', '여수'), (6, 'c', '대전')] df = pd.DataFrame(data, columns=['id', 'name', 'location']) df.head() 먼저 한 개의 열만 추출해보자. 하나의 열을 추출하면, 시리즈가 리턴된다. series = df["location"] series.head() 두 개 이상의 열을 추출하려면, 대괄..

Python 2021.01.29

Pandas : 데이터 필터링하기 #1 (행 단위 데이터 추출)

프레임 속에 있는 수많은 데이터 중에, 내가 원하는 대상의 데이터만 골라 새로운 프레임으로 만들고 싶다. (마치 DB에서 where 절을 지정하여 쿼리를 날리듯) 위와 같은 동작은 판다스에서는 loc 프로퍼티로 수행할 수 있다. pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.loc.html pandas.DataFrame.loc — pandas 1.2.1 documentation A slice object with labels, e.g. 'a':'f'. Warning Note that contrary to usual python slices, both the start and the stop are included pandas.py..

Python 2021.01.29