728x90

RapidMiner 소개

 RapidMiner는 데이터 분석을 쉽게 하게 해 주는 데이터 분석 툴로써, 데이터 전처리, 머신 러닝, 데이터 모델링 등 데이터 분석에 필요한 모든 단계를 하나의 툴 안에서 할 수 있도록 해 주는 것을 목표로 한다.

 RapidMiner에서 제공하는 툴은 총 다섯 가지로, RapidMiner Studio, RapidMiner Auto Model, RapidMiner Turbo Prep, RapidMiner Server, Rapid Miner Radoop이 있다. RapidMiner 생태 환경 내에서 RapidMiner Studio를 이용하여 workflow를 디자인하여 데이터를 분석하고, RapidMiner Server를 이용해서 분석한 데이터를 활용하여 모델링을 하고 이를 바탕으로 조직 내에서 의사소통을 하고, RapidMiner Radoop을 이용하여 빅 데이터 처리를 위한 Hadoop과 Spark를 쉽게 하는 등 모든 빅 데이터에 관련된 일들이 가능한 것이다.

 

 이 중에서도 RapidMiner라고 하면 가장 먼저 떠오르는 것이 바로 데이터 분석을 쉽게 해주는 RapidMiner Studio이고, 실제로 RapidMiner Studio를 그냥 RapidMiner라고 부르는 경우도 많다. 이번 포스팅에서는, RapidMiner Studio에 대해 더 자세히 알아보고, 이를 설치하는 방법을 알아볼 것이다.

RapidMiner Studio 소개

 데이터 분석을 할 때에는 데이터 전처리부터 간단한 통계적인 데이터 분석, 머신 러닝 알고리즘을 적용한 모델 도출 등 많은 단계가 필요하다. 이러한 일을 조직 내에서 해야 한다면 일의 정확한 분담도 힘들고, 어떤 단계를 거쳐 데이터 분석이 행해졌는지 한 눈에 파악하기도 힘들다. 이를 쉽게 해주는 것이 바로 RapidMiner Studio이다. 한 마디로, Visual Workflow Designer라고 할 수 있다.

 

 RapidMiner Studio는 많은 기능들을 제공하는데, 핵심적인 기능만 소개하자면 다음과 같다.

 

Data Sources & In-database Processing

- local PC에 있는 파일에서부터 Database에 연결하여 해당 DB에 있는 파일까지 모든 데이터 파일을 import할 수 있다. 뿐만 아니라 MySQL, PostgreSQL, Google BigQuery와의 연동이 가능하여 DB 내의 데이터에 직접 접근해서 데이터전처리까지 바로 할 수 있다.

 

Explore and Visualize Data

간단한 수치의 통계적인 정보나 이를 바탕으로 한 scatter plot, line chart, box plot 등 간단한 visualization을 제공하여 한 눈에 데이터를 파악할 수 있게 해 준다.

 

Data Prep and Blending

- 데이터의 join, extract, filter가 모두 가능하기 때문에 rapidminer 내에서 전처리를 쉽게 할 수 있다. 또한 missing value를 어떤 값으로 대체한다거나 하는 전처리까지 모두 가능하다. 

 

Machine Learning

- 클러스터링, 회귀 분석, 시계열 분석, 딥러닝 등 다양한 supervised learning과 unsupervised learning 알고리즘을 제공하기 때문에 데이터셋에 쉽게 머신러닝 알고리즘을 적용할 수 있다. 

 

Model Validation

- 데이터를 바탕으로 하여 도출해 낸 모델의 퍼포먼스까지도 rapidminer 내에서 분석할 수 있다. 

 

데이터 분석에 필요한 모든 기능들이 갖추어져 있다고 하더라도 과언이 아니라고 할 수 있다.

RapidMIner Studio 설치 (Windows)

0. RapidMiner Studio 홈페이지에 접속한다.

https://rapidminer.com/products/studio/
 

Visual Workflow for Predictive Analytics | RapidMiner© Studio

Visual workflow designer for predictive analytics that brings data science and machine learning to everyone on the analytics team

rapidminer.com

0-1. Get RapidMiner 버튼을 누른다.

 

0-2. 이메일과 Job Function, Industry (Prefer Not to Say를 선택해도 무방하다.)를 입력하고 Remind Me to Download 버튼을 누른다.

 

0-3. 자신의 이메일을 확인하면 다운로드 링크가 와 있을 것이다. 다운로드 버튼을 누르고, 자신의 PC에 맞는 환경을 선택한다.

 

1. rapidminer-studio.exe 파일을 실행하여 설치를 완료한다.

 

1-1. Next 버튼을 누른다.

 

1-2. I Agree 버튼을 누른다.

 

1-3. 원하는 설치 경로를 설정하고 Install 버튼을 누른다.

 

1-4. 설치가 완료되었다.

 

 

2. 실행을 해 본다.

 

 

2-1. 주황색 창이 뜨고 나서 수십 초를 기다리고 나면 이런 창이 뜨는데, 설치가 제대로 된 것이다. 자신의 계정 타입과 이름, 이메일 주소를 입력하면 본인의 RapidMiner 계정이 만들어진다. 이제 데이터 분석을 위해 RapidMiner를 사용할 수 있다!

 

RapidMiner를 성공적으로 설치했다면, 이를 시작하기 위해서 다음 포스팅을 참고한다.

2019/05/15 - [Process Mining - Tools/RapidMiner] - RapidMiner 시작하기

 

RapidMiner 시작하기

앞선 글에서 RapidMiner를 성공적으로 설치했다면, 이제 그것을 어떻게 활용할지 알아 볼 차례이다. 우선, 각 기능들에 대해서 하나하나 살펴보기 전에 간단하게 모든 단계를 경험해 보려고 한다. RapidMiner를 이..

process-mining.tistory.com

References

1. RapidMiner 공식 페이지: https://rapidminer.com/

300x250
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기