728x90

 프로세스 마이닝의 가장 중요한 포인트 중 하나는 이벤트 로그와 프로세스 모델을 연관지어 이들 사이의 적절한 관계를 찾는 것이다. 이들 사이의 관계를 찾는 데에는 Play-In, Play-Out, Replay의 세 가지 방식이 있다. 오늘은 이 세가지 방식에 대해 알아보겠다.

Play-In, Play-Out, Replay

Play-In (Inference)

 Play-In이벤트 로그로부터 프로세스 모델을 도출하는 것을 말한다. 즉, input으로 이벤트 로그를 사용하고 output으로 프로세스 모델을 도출한다. 알파 알고리즘, Inductive Mining 등 다양한 process discovery 알고리즘들이 이에 해당한다. 

Play-In

Play-Out

 Play-Out은 Play-In과 반대되는 개념으로, 프로세스 모델로부터 이벤트 로그를 만들어내는 것을 말한다. 즉, input으로 프로세스 모델을 사용하고 output으로 이벤트 로그를 도출한다. 프로세스 모델로부터 이벤트 로그를 만들어냄으로써 프로세스 모델이 원하는 결과를 만들어내는지 실험할 수도 있고, 결과를 통계냄으로써 모델을 평가할 수도 있다. 

Play-Out

Replay

 Replay프로세스 모델과 이벤트 로그 모두를 input으로 사용한다. 이벤트 로그는 프로세스 모델 위를 움직이고(re-play) 이를 바탕으로 하여 이벤트 로그에 프로세스 모델이 얼마나 부합하는지를 분석하거나(Conformance Checking) 모델에 없었던 데이터(수행시간, 대기 시간 등)를 추가(Extending the model)하여 모델을 발전시키기도 한다. 또한 프로세스 모델에서 많은 이벤트 로그를 학습함으로써 대기 시간 등을 예측하는 predictive model을 만들 수도 있고, 현재 진행되고 있는 프로세스가 어떻게 진행될 것인지를 예측하거나 적절한 행동을 추천할 수도(operational support) 있다. 

 

 프로세스 마이닝을 할 때 Play-In, Play-Out, Replay를 적절하게 배합하여 이벤트 로그로부터 좋은 프로세스 모델을 도출하고, 이벤트 로그를 이용하여 이 프로세스 모델의 성능을 파악하고, 프로세스 모델로부터 이벤트 로그를 만들어내어 프로세스 모델이 원하는 결과를 만들어내는지를 실험하는 등 다양한 접근이 가능하다. 

 

References

1. Section 2.4. of  Wil van der Aalst. Process Mining: Data Science in Action (Second Edition) : Springer, 2016.

 

300x250
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기