NOTICE!! 현재 블로그로 게시글 이전 작업 진행중입니다.
[TabPy] 태블로 흐름에 Python 스크립트 사용하기
이번 포스팅은 “태블로 프랩(tableau prep)”의 흐름에서 파이썬 스크립트를 통해 데이터를 Transform하는 것을 해보려고 한다.
이때 TabPy라는 것을 다운로드 해주어야 하는데 TabPy는 Tableau + Python이라고 보면된다.
1. TabPy설치하기
먼저 아래와 같이 tabpy를 install 받아준다.
# In conda venv
pip install tabpy
2. TabPy 실행
CLI환경에서 아래 코드를 쳐서 tabpy를 실행해 준다.
# In conda venv
tabpy
tabpy를 쳤으면 localhost를 통해 창을 열어주면 된다 . 포트는 기본 9004를 쓴다.
포트를 타고 들어오면 다음과 같이 TabPy서버가 열리는것을 확인할 수 있다.
3. Tableau 연결
프랩을 열고 아래와 같은 과정을 진행해 준다.
[도움말] -> [설정 및 성능] -> [Analytics 확장 프로그램 관리]
이렇게 따라오면 아래와 같은 창이 나타난다.
여기서 서버 를 localhost 그리고 포트 는 9004를 입력하고 로그인을 누르면 연결이 되면서, 준비가 모두 끝나게 된다.
4. 스크립트 파이썬 파일 준비하기
이제는 우리가 테이블을 Transform할 파이썬 파일을 준비하고, 거기에 변형함수를 만들어 주면된다.
나는 전국 지역정보에서 “서울시 강남구” 데이터를 필터걸어주는 함수를 간단하게 만들어 봤다.
# script.py
import pandas as pd
def test(object):
object = object[object["sigunguName"]=='서울시 강남구'].reset_index(drop=True)
return object
5. 테스트할 데이터 연결하기
나는 GCP에 있는 데이터를 활용했고, 각자의 환경에 맞는 데이터를 연결해서 가져와보자
6. 파이썬 스크립트 삽입
- 흐름에 스크립트를 추가해준다.
- 연결유형에 TabPy서버를 선택해준다.
- 4번에서 작성한 파이썬 스크립트 파일 을 찾아서 선택한다.
- 스크립트 안에 있는 사용할 함수를 선택한다.
7. 결과 확인
아래 사진에 보이는 것 처럼 원래는 서울시 전체의 시군구가 존재했지만, 강남구만 남게 되는 모습을 볼 수 있다.
Leave a comment