RapidMiner로 Decision Tree 분석하기

이 블로그에서 꾸준하게 조회수가 많이 나오는 글 중 하나가 RapidMiner의 사용법을 간단하게 정리해 놓은 글이다. 그래서 RaidMiner의 구체적인 사용법을 포스팅해야지해야지 하면서 한 번도 하지 않았기 때문에 ㅎㅎ 이렇게 코로나19로 인한 강제 외출금지 + 게임도 질림 + 책 읽으면 잠 옴의 콤보로 RapidMiner 포스팅을 시작하게 되었다. 대구에 살고 있다고 안부 물어준 여러 사람들에게 감사합니다..!

이번 포스팅에서는 RapidMiner로 Decision Tree를 분석하는 방법에 대해 알아보겠다. 이 포스팅은 RapidMiner의 기본적인 사용법에 대한 이해가 있다고 가정한다.

1. Decision Tree operator를 검색해서 클릭한다.

좌측 하단 operator 부분에서 decision tree를 검색해 선택한 모습

2. training dataset을 선택한다.

decision tree operator의 input 부분(좌측)을 보면 tra라는 이름으로 training dataset을 input으로 넣어야함을 알 수 있다. 그러므로 원하는 데이터셋을 업로드하기 위해, Retrieve operator를 선택한다. (이 포스팅에서는 RapidMiner 자체의 Samples 폴더 내의 Titanic 데이터를 사용했다.)

Retrieve operator에서 원하는 데이터 파일을 선택한다. (이 글의 경우, Samples-data-Titanic 데이터를 선택했다.)

3. label attribute (target attribute)를 지정한다.

Decision Tree의 target 컬럼을 설정하기 위해서 Set Role operator를 선택한다.

Set Role Operator의 Parameters - attribute name에서 원하는 target attribute를 지정하고, Parameters - target role을 label로 지정한다. (이 글의 경우, Survived 컬럼을 target value로 지정했다.)

4. operator들을 연결해주고, 실행한다.

이제 operator들을 적절하게 연결해준다. Retrieve의 out을 Set Role의 exa와, Set Role의 exa를 Decision Tree의 tra와, 그리고 Decision Tree의 mod를 res(output)과 연결한다. 그리고 왼쪽 위의 재생 버튼을 눌러준다.

5. Decision Tree가 완성되었다.

이제 Decision Tree가 완성되었다.

이번 포스팅에서는 RapidMiner로 Decision Tree를 만드는 방법에 대해 알아보았다. RapidMiner가 처음 시작할 때는 이게 뭔가.. 싶지만 좀 익숙해지면 그 안에서 데이터 업로드부터 전처리, 모델링까지 모두 진행할 수 있기 때문에 편리하다. 독일에서의 나는 굉장히 성실한 친구였는데 대구에서의 나는 그렇지 못하다. ㅠㅠ 이제부터는 좀 힘내서 RapidMiner로 하는 process mining 오픈소스인 RapidProM까지 다루어보도록 하겠다.

저작자표시 비영리 변경금지 (새창열림)

RapidMiner로 Decision Tree 분석하기

전체 카테고리

블로그 인기글

전체 방문자

티스토리툴바

전체 카테고리

블로그 인기글

최근 글

최근댓글

전체 방문자

티스토리툴바