Process Discovery, Conformance checking, Enhancement로 이루어진 전통적인 프로세스 마이닝은 주로 이미 일어난 일에 대한 데이터를 분석하여 모델을 만들거나 이 모델의 성능을 평가하거나 향상시키는 것을 목적으로 했다. 하지만 프로세스 마이닝은 이렇게 과거의 데이터만을 분석하는 것 뿐만 아니라, 현재 완료되지 않은 데이터에 대해서 방향성을 추천해주고 예측하는 것까지 가능하게 한다. 이번 포스팅에서는 이를 가능하게 하는 pre mortem 데이터와 post mortem 데이터가 무엇인지, 그리고 de jure model과 de facto model이 무엇인지에 대해 알아보겠다.
Post mortem 데이터와 Pre mortem 데이터
우선, 이벤트 로그 내의 데이터는 post mortem 데이터와 pre mortem 데이터로 이루어져 있다.
Post mortem 데이터
Post mortem 데이터(historic data)는 이미 완료된 케이스의 데이터를 말한다. 이 데이터들은 프로세스 모델을 도출하거나 프로세스 모델의 성능을 향상시키는 데에는 도움을 줄 수 있지만, 이미 케이스가 끝났기 때문에 그 케이스에 대해 예측하거나 다음 액티비티를 추천하는 등의 변화를 주지는 못한다. 여태까지 많은 포스팅들에서 다루었던 다양한 process discovery, conformance checking 등에 사용되는 것이 post mortem 데이터이다.
Post mortem 데이터는 주로 off-line 프로세스 마이닝과 연관되어 있다. 즉, 지난 1년 간의 프로세스가 어떻게 흘러갔는지를 파악하는 문제, 저번 달의 데이터에서 어떤 액티비티 이후 고객이 가장 많이 이탈하였는지의 문제 등 이미 쌓인 데이터에 대한 분석을 할 때 이용되는 것이다.
Pre mortem 데이터
Pre mortem 데이터(current data)는 post mortem 데이터와 반대되는 개념으로, 아직 완료되지 않은(alive) 케이스의 데이터를 말한다. 케이스가 아직 완료되지 않았기 때문에 이 케이스에 대한 추천이나 예측이 가능하고, 케이스에 변화를 줄 수 있다.
Pre mortem 데이터는 post mortem 데이터와 함께 on-line 프로세스 마이닝에 활용된다. 예를 들어, post mortem 데이터를 이용하여 프로세스 모델을 도출하면, pre mortem 데이터를 이용하여 다음 액티비티가 무엇일지 예측하는 식이다.
de jure model과 de facto model
프로세스 모델은 de jure model과 de facto model로 이루어져 있다.
de jure model
de jure model (normative model)은 목표로 하는, 이상적인 프로세스 모델을 말한다. 즉, 프로세스 모델이 나아가야 할 방향을 표현하는 모델이다.
de facto model
de facto model (descriptive model)은 실제 일어나고 있는 프로세스를 표현하는 모델을 말한다. 즉, 현재 프로세스가 어떻게 일어나고 있는지를 정확하게 표현하는 것을 목표로 하는 것이다.
이번 포스팅에서는 이벤트 로그 내 데이터의 종류인 pre mortem 데이터와 post mortem 데이터, 프로세스 모델의 종류인 de jure model과 de facto model에 대해 알아보았다. 전통적인 프로세스 마이닝의 프레임워크로부터 데이터를 pre mortem과 post mortem으로, 모델을 de jure model과 de facto model과 분류함으로써 우리는 새로운 프로세스 마이닝 프레임워크를 정의할 수 있게 되었다. 다음 포스팅에서는 이 새로운 프로세스 마이닝 프레임워크에 대해 알아보겠다.
References
1. Section 10.1. of Wil van der Aalst. Process Mining: Data Science in Action (Second Edition) : Springer, 2016.
최근댓글