-
Pytrends 사용방법스타트업 2024. 2. 11. 14:42
Pytrends는 Python을 사용해 Google Trends 데이터를 프로그래밍 방식으로 추출할 수 있게 해주는 라이브러리입니다. 이 라이브러리를 사용하려면 먼저 Python 환경에 설치해야 합니다. 다음은 Pytrends를 사용하는 방법에 대한 기본적인 단계입니다:
Pytrends 설치
Pytrends는 pip를 사용하여 설치할 수 있습니다. 콘솔이나 터미널에서 다음 명령어를 입력하여 설치할 수 있습니다:
pip install pytrends
Pytrends 사용을 위한 기본적인 단계
TrendReq 객체 생성: Google Trends에 접근하기 위해
TrendReq
클래스의 인스턴스를 생성합니다. 이때,hl
파라미터로 언어 설정을,tz
로 시간대를 설정할 수 있습니다.검색어 설정:
build_payload
메소드를 사용하여 검색하려는 키워드 리스트를 설정합니다. 여기서cat
은 카테고리,timeframe
은 검색 기간,geo
는 지역 설정,gprop
는 Google 속성(예: 이미지, 뉴스 등)을 설정할 수 있습니다.데이터 추출: 설정한 키워드와 기타 파라미터에 따라
interest_over_time
,interest_by_region
,related_topics
,related_queries
등의 메소드를 사용하여 다양한 형태의 데이터를 추출합니다.데이터 처리: 추출한 데이터는 pandas DataFrame 형태로 반환되므로, pandas 라이브러리의 다양한 기능을 이용하여 데이터를 처리할 수 있습니다.
예시 코드
다음은
pytrends
를 사용하여 특정 키워드의 시간에 따른 인기도를 추출하는 간단한 예시 코드입니다:from pytrends.request import TrendReq pytrends = TrendReq(hl='en-US', tz=360) # build_payload 메소드로 검색어, 시간 범위 등을 설정 pytrends.build_payload(kw_list=['Bitcoin'], timeframe='today 12-m') # interest_over_time 메소드로 시간에 따른 인기도 데이터를 DataFrame으로 받음 interest_over_time_df = pytrends.interest_over_time() # 데이터 확인 print(interest_over_time_df)
위 코드에서
kw_list
에 검색하고자 하는 키워드를 리스트 형태로 입력하고,timeframe
에 원하는 시간 범위를 설정하여 Google Trends의 검색 인기도를 시간에 따라 확인할 수 있습니다.참고 사항
- Google Trends 데이터는 실시간으로 변경될 수 있으므로, 동일한 검색어에 대해서도 시간이 지나면 다른 결과를 얻을 수 있습니다.
- API 요청에는 한계가 있을 수 있으므로 과도한 요청을 보내지 않도록 주의해야 합니다.
- Pytrends는 비공식 API이므로 Google의 정책 변경에 따라 사용 가능 여부가 변경될 수 있습니다.
이 라이브러리를 사용하여 구글 트렌드 데이터를 효과적으로 분석하고 활용할 수 있으며, 마케팅, 시장 조사, 경제 연구 등 다양한 분야에서 유용하게 쓰일 수 있습니다.