ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 2. 'Select'를 알아보자
    빅데이터 분석/Alteryx 2018. 12. 19. 22:45

    안녕하세요. 


    오늘은 알트릭스에서 '필자가 생각하기에' 가장 편리한 기능을 담당하고 있는 'Select'에 대해서 설명해볼까 합니다.




    Select는 2가지의 기능을 가지고 있습니다.


    1. 뜻 그대로 '선택'의 기능


    우리의 데이터가 300개 이상의 열로 이루어진 데이터라고 가정해봅시다.


    데이터의 크기가 큰 것도 문제지만 한 눈에 데이터를 살펴볼 수 없을 뿐더러


    실제 분석에 있어서 필요한 데이터 항목(열)의 수는 몇가지 안될 것입니다.


    이러한 문제를 해결하기 위해 R, SAS과 같은 분석도구들 역시 특정 열이나 행을 추출하는 함수가 있지만


    Code로 작성해야하며 일일이 열의 이름을 입력해줘야합니다.


    300개가 넘는 열을 일일이 찾아가면서 입력한다는 것이


    얼마나 비효율적인 것인지 잘 아시리라 생각합니다.


    하지만 알트릭스의 'Select'는 다릅니다.


    입력된 데이터에 연결해주고, 데이터 항목 목록을 체크박스로 통해 선택/선택해제만 하면 됩니다.


    그러면 선택한 데이터 항목만 다룰 수 있게 됩니다.



    위의 화면은 통계청에서 제공 중인 시군구별 외국인 현황입니다.


    총 57개의 열로 이루어져있습니다. 너무 많다보니 한 눈에 데이터가 들어오지 않습니다.



    화면 좌측을 보시면 데이터의 열(필드)들이 목록으로 나타나며


    이를 체크박스를 통해 선택 또는 선택해제를 할 수 있습니다.


    2016과 2017만 선택하고 실행하니


    화면 하단과 같이 2016과 2017의 데이터만 나오게 됩니다.


    굉장히 단순해보이지만 사실 코드 기반 분석프로그램에서는 가장 어렵고


    가장 많이 사용하는 기능입니다.


    알트릭스에서는 매우 간단합니다.


    2. 데이터 형변환 기능


    데이터 분석가라면, 혹은 데이터를 다룬다면

    데이터를 입력하고 보면 꼭 원치 않는 데이터형으로 입력된 데이터들을 본 적이 있을 것입니다.

    정수형으로 입력되어 있어야할 데이터가, 실수형으로 입력되어 있거나

    문자형으로 입력되어 있어야할 데이터가, 숫자형으로 입력되어 있는 경우들이 대표적입니다.

    이러한 데이터들은 일일이 형변환을 해줘야하고, 형변환 과정에서 데이터가 망가지기도 합니다.

    대부분 code로 작업하는 데이터분석의 경우 형변환 과정에서 많은 시간이 소요됩니다.


    분석을 진행하다가 중간에 데이터 형이 맞지 않아 앞으로 돌아오기도 하기 때문이죠.


    하지만 Select는 그저 입력된 데이터에 연결을 해주는 것 만으로


    입력된 모든 데이터의 데이터형을 마우스만으로도 자유롭게 변경할 수 있습니다.





    위에 화면을 보면 2016과 2017은 인구수를 나타내는 데이터이므로 숫자형으로 입력되어야 합니다.


    하지만 좌측화면을 보면 알 수 있듯이 모든 데이터가 String, 즉 문자열로 들어가 있습니다.



    화면 좌측을 보면 각 열(필드) 옆에 데이터 형을 고를 수 있는 박스가 존재합니다.


    아래로 내려보니 다양한 데이터 형를 제공하고 있습니다.


    여기서 Double을 선택하고, 작업을 실행시키는 것으로 데이터 형태를 실수형으로 변경할 수 있습니다.


    데이터 형을 고른 뒤 'Browse' 도구를 사용하면 문제 없이 변환되었는지


    확인할 수 있겠죠.



    오늘은 Select에 대해서 간략하게 설명드렸습니다.


    질문은 댓글로 남겨주시면 답변드리겠습니다.

    '빅데이터 분석 > Alteryx' 카테고리의 다른 글

    1. 'Input data'와 'Browse'를 알아보자  (0) 2018.12.18
    0. Alteryx란 무엇인가?  (0) 2018.12.18

    댓글

Designed by Tistory.