728x90

 이 블로그에서 꾸준하게 조회수가 많이 나오는 글 중 하나가 RapidMiner의 사용법을 간단하게 정리해 놓은 글이다. 그래서 RaidMiner의 구체적인 사용법을 포스팅해야지해야지 하면서 한 번도 하지 않았기 때문에 ㅎㅎ 이렇게 코로나19로 인한 강제 외출금지 + 게임도 질림 + 책 읽으면 잠 옴의 콤보로 RapidMiner 포스팅을 시작하게 되었다. 대구에 살고 있다고 안부 물어준 여러 사람들에게 감사합니다..!

 

 이번 포스팅에서는 RapidMiner로 Decision Tree를 분석하는 방법에 대해 알아보겠다. 이 포스팅은 RapidMiner의 기본적인 사용법에 대한 이해가 있다고 가정한다.

 

1. Decision Tree operator를 검색해서 클릭한다.

좌측 하단 operator 부분에서 decision tree를 검색해 선택한 모습

2. training dataset을 선택한다. 

 decision tree operator의 input 부분(좌측)을 보면 tra라는 이름으로 training dataset을 input으로 넣어야함을 알 수 있다. 그러므로 원하는 데이터셋을 업로드하기 위해, Retrieve operator를 선택한다. (이 포스팅에서는 RapidMiner 자체의 Samples 폴더 내의 Titanic 데이터를 사용했다.)

Retrieve Operator를 선택한 모습

Retrieve operator에서 원하는 데이터 파일을 선택한다. (이 글의 경우, Samples-data-Titanic 데이터를 선택했다.)

우측의 Parameters에서 원하는 파일을 선택한다.

3. label attribute (target attribute)를 지정한다.

 Decision Tree의 target 컬럼을 설정하기 위해서 Set Role operator를 선택한다.

Set Role Operator를 추가한 모습

Set Role Operator의 Parameters - attribute name에서 원하는 target attribute를 지정하고, Parameters - target role을 label로 지정한다. (이 글의 경우, Survived 컬럼을 target value로 지정했다.)

우측 상단에서 parameer를 지정해준다.

4. operator들을 연결해주고, 실행한다.

 이제 operator들을 적절하게 연결해준다. Retrieve의 out을 Set Role의 exa와, Set Role의 exa를 Decision Tree의 tra와, 그리고 Decision Tree의 mod를 res(output)과 연결한다. 그리고 왼쪽 위의 재생 버튼을 눌러준다.

Operator들을 적절하게 연결해준다.

5. Decision Tree가 완성되었다.

 이제 Decision Tree가 완성되었다. 

완성된 Decision Tree

 

 이번 포스팅에서는 RapidMiner로 Decision Tree를 만드는 방법에 대해 알아보았다. RapidMiner가 처음 시작할 때는 이게 뭔가.. 싶지만 좀 익숙해지면 그 안에서 데이터 업로드부터 전처리, 모델링까지 모두 진행할 수 있기 때문에 편리하다. 독일에서의 나는 굉장히 성실한 친구였는데 대구에서의 나는 그렇지 못하다. ㅠㅠ 이제부터는 좀 힘내서 RapidMiner로 하는 process mining 오픈소스인 RapidProM까지 다루어보도록 하겠다.

300x250
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기