728x90

 Social Network란, 사회를 이루는 구성 요소들 간의 관계를 나타낸 네트워크를 말한다. 이번 포스팅에서는 소셜 네트워크가 무엇이고, 그것의 구성요소가 무엇인지에 대해 알아보겠다.

Social Network의 구성 요소

 Social Network는 node와 arc로 구성된다. 간단한 예시를 통해 살펴 보자.

social network의 예시

Node

 Nodesocial network 내의 구성 요소(사람, 부서 등)를 말한다. 위 그림에서는 타원으로 표현된 x, y, z가 node이다. 타원의 크기는 보통 그 구성 요소(entity)의 weight를 말한다. 이 weight는 해당 구성 요소가 나타난 빈도일 수도 있고, 다른 요소로 정의할 수도 있다. 이는 타원의 색깔로 표현되기도 한다.

Arc

 Arcsocial network 내 구성 요소들 간의 관계를 나타낸다. 위 그림에서는 화살표로 표현되었다. 화살표의 굵기는 그 관계의 weight를 말한다. 이 weight 또한 node와 같이 해당 관계가 나타난 빈도일 수도 있고, 다른 요소로 정의할 수도 있다. 이 Arc는 우리의 예시에서는 방향성을 가져서 화살표로 표현되었지만, 방향성을 가지지 않는 선으로 표현될 수도 있다. 

Node의 중요성을 나타내는 척도 (Centrality의 종류)

 Node의 중요성을 나타내는 척도에는 다양한 종류가 있다. 이번 포스팅에서는 degree of centrality, closeness centrality, betweenness centrality의 3가지 척도에 대해서만 다루도록 하겠다.

Degree Centrality

 Degree Centrality해당 노드가 가지는 다른 노드와의 연결 개수를 말한다. 즉, 다른 노드와 많이 연결되어 있을수록 중요도가 높다고 생각하는 것이다.

붉을수록 degree of centrality가 높다.

Closeness Centrality

 Closeness Centrality1 / 해당 노드에 대한 모든 노드의 가장 짧은 경로(shortest path)의 길이의 합으로 정의한다. 다시 말해, 1을 다른 모든 노드에서 해당 노드로 가는 가장 짧은 경로를 구하고, 이들의 길이를 모두 구해 더한 값으로 나눈 것을 중요도로 정의한다. 이는 중요한 노드일수록 다른 노드로 가는 경로가 짧을 것이라고 생각하는 것이다.

붉을수록 closeness centrality가 높다.

Betweenness Centrality

Betweenness Centrality모든 두 노드 사이의 가장 짧은 경로(shortest path)가 해당 노드를 지나가는 수를 의미한다. 즉, 모든 shortest path 위에 해당 노드가 많이 있을수록 중요한 노드라고 생각하는 것이다. 

붉을수록 betweeness centrality가 높다.

소셜 네트워크와 프로세스 마이닝

  소셜 네트워크 분석은 한 조직 내에서 구성원들이 어떤 관계로 연결되어 있는지, 이 관계가 어떻게 흘러가는지를 파악함으로써 데이터 내에서 의미를 찾는 분석을 말한다. 프로세스 마이닝에서도 조직 내의 구성원(resource)에 대한 분석은 필수적이다. 프로세스를 진행할 때 특정 프로세스에서 병목이 일어난다면, 그 프로세스를 맡고 있는 resource가 문제를 가지고 있거나 해당 프로세스를 담당하는 resource의 수가 너무 적다는 것 등이 원인이 될 수 있기 때문이다. 그렇기 때문에 resource 간의 관계를 분석하는 소셜 네트워크 분석은 프로세스 마이닝과 뗄래야 뗄 수 없는 관계를 가진다. 

300x250
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기