경영학

불확실성 하에서 의사결정, 의사결정론(Decision Theory), 전략적 의사결정

Jobs 9 2024. 4. 9. 16:39
반응형

불확실성 하에서 의사결정, 의사결정론(Decision Theory)

 

실무자들의 의사결정 대부분은 확실성 하의 정형적인 의사결정인 반면, 경영층의 전략적 의사결정은 비정형적 의사결정으로 대부분이 조직화된 복잡성이나 동태적 복잡의 해결이 관건이 되는 불확실성 하의 의사결정임.

1. 의사결정 도구

주어진 상황
사용 도구
불확실성 하 미래예측
의사결정론, 의사 결정 나무, 몬테카를로 시뮬레이션, 마코프 체인 분석
여러 가지 대안 평가
손익분기점 평가, 선호도 행렬, 선형계획법/비선형 계획법, AHP
상호 영향
게임이론

■ 의사 결정론

(1) 확실성 하에서의 의사결정

 

⦁ 완전한 정보의 기대치(EPPI, Expected Payoff with Perfect Information)를 확보할 수 있고 주어진 상황을 최대한 활용할 수 있는 경우에는 어떠한 사건이 일어날지를 확실하게 알고 있으므로 보상이 가장 좋은 대안을 선정함.

(예제)

각 대안의 상황별 보상은 확실하게 알고 있으며 아래와 같은 보상 행렬일 때 설비를 대형으로 지을지 소형으로 지을지를 결정 필요

미래 수요
대안
낮음
높음
소형 설비
200
270
대형 설비
160
800
현상 유지
0
0

☞ 수요를 확실히 알 수 있다면, 수요가 작으면 소형 설비를 짓고 수요가 크면 대형 설비를 짓는다.

수요가 불확실하다면 다른 의사결정 규칙을 사용하여야 함.


(2) 불확실성 하에서의 의사결정

 

어떠한 사건에 대해 과거의 경험이 전무하여 발생 가능 확률이 알려져 있지 않거나 미래에 대해 확실한 근거를 가지고 예측하기조차 매우 어려운 경우에 이루어지는 의사결정으로 경영활동 상 대부분의 경우에 해당됨.

1) 의사결정론 (Decision Theory)

⦁ 의사결정이란 무엇을 어떻게 결정해야 하느냐는 물음에 대답하는 것으로 의사결정자가 선택할 행위가 복수이어야 함.

⦁ 관리 불가능 변수란 의사 결정권자 결정과는 전연 관계없이 의사결정 결과에 영향을 주는 요소를 의미함.

 

① 실행 가능한 대안 나열

② 선택 결과에 영향을 미치지만 의사결정자 영향력 밖에 있는 사건(event)들을 나열

③ 선택의 결과에 영향을 미치지만 의사결정자의 영향력 밖에 있는 각 대안별 각 사건에 대한 보상(profit)을 계산 → 보상 행렬

④ 과거 자료, 전문가의 견해, 기타 다른 예측 기법 등을 이용하여 각 사건의 발생 가능성을 추정, 확률의 형태로 표현

⑤ 비용의 기대치가 가장 적은 대안을 선택하는 등의 의사결정 규칙을 정함.

즉, 불확실한 상황 하에서의 의사결정은 선택 가능한 대안, 발생 가능성, 여러 상황에 있어 각 대안들의 수익성 그리고 알려지지 않은 여러 상황들의 발생 확률 속에서 의사결정자의 성향이나 의사결정 상황에 따라 하기 4가지 기준을 적용해 의사결정이 이루어짐.

가) 최대 최소기준 (Maximin), Wald 기준 : 비관적인 관점에서 미래 수요가 낮은 것을 선택, “비관주의”

⦁ 미래에 대해 비관적인 예측에 준해 의사결정한 최악의 대안들 중 가장 좋은 결과를 보상해 주는 대안을 선택

- 안전제일 주장으로 각 상황별로 손실이 가장 작은 경우를 의사결정의 기준으로 삼음.

대안
최악의 보상
소형 설비
200
대형 설비
160

나) 최대 최대기준 (Maximax) : 최대로 낙관적인 수익을 예상하여 미래 수요 높은 것을 선택, “낙관주의”

⦁ 미래에 대해 낙관적인 예측에 준해 의사결정한 대안들 중 가장 좋은 결과를 보상해 주는 대안을 최종 선택

대안
최선의 보상
소형 설비
270
대형 설비
800

다) Laplace, 라플라스 기준(Equal Likelihood 기준) : 가중평균 보상이 가장 좋은 것을 선택, “현실주의”

미래를 정확히 예측할 수가 없기 때문에 모든 상황이 동일한 확률로 발생한다는 가정(사건이 n 가지이면 각 사건의 비중은 1/n임.)하에 각 대안별로 기댓값을 계산하여 가장 좋은 값을 갖는 대안을 선택

- “불충분 이유의 원칙”이라고 하며 각 상황의 평균을 의사결정의 기준으로 삼음.

대안
수요 낮음
수요 높음
가중 평균 보상
소형 설비
200
270
(200 + 270) / 2 = 235
대형 설비
160
800
(160 + 800) / 2 = 480

라) 최소 최대후회기준 (Minimax Regret), Savage(세비지) 기준 : 최악의 후회(최소 투자를 하였는데 수요가 많은 경우)가 가장 작은 대안을 선택

최대 후회의 최소화(minimax 혹은 Savage) 원칙은 의사결정자가 자기의 행동 결과를 후회하지 않으려 하며 적어도 의사결정에서 오는 최대 후회를 최소화하려고 한다는 가정에 근거함.

만약 어느 한 대안을 선택했을 때 다른 상황이 발생하여 차라리 다른 대안을 선택했더라면 좀 더 나았을 수도 있는 경우 의사결정자는 원래의 선택에 대해서 후회를 하게 된다.

이 후회는 미래를 완전히 안다고 가정했을 때 획득할 수 있는 보상과 실지로 선택한 대안으로부터 받은 보상과의 차이다.

결과표를 후회 표(주어진 사건 하에서 최선의 대안인 최대치에서 해당 값을 빼주어 얼마나 손해 보는가를 나타냄)로 전환하여 그중 가장 작은 값을 가지는 대안을 선택

대안
수요 낮음
수요 높음
최대 후회
소형 설비
200 - 200 = 0
800 - 270 = 530
530
대형 설비
200 - 160 = 40
800 - 800 = 0
40

■ 후르비츠(Huwicz) 기준 : 최대 최대원칙과 최대 최소원칙의 가중평균

불확실성 하의 의사결정을 해결해 주는 적합한 맞춤형 모형이 없었으나, 1980년대에 비정형화된 휴리스틱 추리(Heuristic Reasoning)을 기반으로 하는 인지 모형 기반적 접근법인 지능적 추리 시스템을 이용하는 접근법이 도입되고 있음.

대부분의 의사결정자들은 현실적으로 극단적으로 비관적 기준 또는 낙관적 기준이 아닌 중간 어느 지점을 선택함.

비관주의와 낙관주의를 절충하기 위해서 의사결정자가 어느 정도 미래에 대해 낙관적인 견해를 가지고 있는 정도를 나타내는 낙관지수(α)를 가중치로 사용하며 이 지수는 0 ~1 사이의 값을 가지고 낙관지수(α)가 0일 때는 의사결정자가 자연의 결과에 대해 비관적(최대 최소 원칙)이며, 반면 1일 때는 자연에 대해 낙관적(최대 최대)이라는 것을 의미함.

- 성과가 이익으로 나타나는 경우 최대 예상 수익에 α를 곱하고 최소 예상 수익에는 (1-α)를 곱한 결과의 합을 비교해서 가장 큰 수익을 보이는 대안을 최종 대안으로 선택하는 방법

휴리스틱 접근법은 모든 변수와 조건을 검토할 수 없기 때문에 가장 이상적인 방법을 구하는 것이 아니라, 현실적으로 만족할 만한 수준의 해답을 찾는 것이다.

휴리스틱은 정형적이며 포괄적으로 일정한 규칙과 지침을 갖고 판단과 의사결정이 이뤄진다고 전체 상황·가정·전제조건 등을 모두 고려한다.

일반적으로 사용되는 휴리스틱 접근법은 분석의 초기 단계에서는 모든 변수를 고려하지 않고 중요 변수만을 분석하고 점차 변수의 범위를 넓혀 가며 문제 상황을 여러 부문으로 구분하고 이를 각각 분석해 가장 이상적인 방법을 구한 후 전체적인 관점에서 종합한다.

네이버 지식백과


(예제)

고객의 예약이 너무 적으므로 수요가 적을지(25다스), 보통일지(60다스), 많을지(130다스)를 알 수 없음.

장미 한 다스의 구매 가격은 15달러이고 판매 가격은 40달러인 경우 보상 행렬을 작성하고 각 기준별 최선의 선택을 정하라.

 

1) 보상 행렬 : 판매가 - 구입가

대안
수 요
(25 다스)
(60 다스)
(130 다스)
25다스 주문
625 = (25 X (40-15))
625
625
60다스 주문
100
= (25 X 40) - (60 X 15)
1,500
= (60 X 40) - (60 X 15)
1,500
130다스 주문
- 950
= (25 X 40) - (130 X 15)
450
= (60 X 40) - (130 X 15)
3,250
= (130 X 40) - (130 X 15)
주문 안 함
0
0
0

① 최대 최소기준 - 보상 행렬 각 행에서 가장 작은 수치인 최악의 경우 중 최선의 선택

- 950이 있는 25다스 수요 중 최선의 선택인 625달러의 보상을 주는 대안인 25다스 주문을 선택

 

② 최대 최대기준 - 보상 행렬 각 행에서 가장 큰 치수인 최선의 경우 중 최선의 선택

가장 보상이 큰 3,250이 있는 130다스 수요 중에서 최선의 선택인 3,250달러의 보상을 주는 대안인 130다스 주문을 선택

 

③ 라플라스 기준 - 보상 행렬 각 행에서 가중평균 보상이 가장 좋은 것을 선택

각 수요 수준의 발생 가능성이 1/3로 같다는 가정하에 각 대안의 기대보상은 아래 표와 같으며 이 중 60다스의 기대 보상이 가장 크므로 60다스 주문을 선택

25다스 주문
625 = (625 + 625 + 625) / 3
60다스 주문
1,033 = (100 + 1,500 + 1,500) / 3
130다스 주문
917 = (- 950 + 450 + 3,250) / 3

④ 최소 최대후회기준 - 최악의 후회가 최소화하도록 최악의 후회표를 작성하여 각 대안별 가장 큰 후회값 중 가장 작은 대안을 선택

대안
(25 다스)
(60 다스)
고(130 다스)
가장 큰 후회값
25다스 주문
625-625 = 0
1,500-625 = 875
2625 = 3250 - 625
2,625
60다스 주문
625–100 = 525
1,500-1,500 = 0
1750
= 3250- 1,500
1,750
130다스 주문
625-(-950) = 1,575
1,500–450 = 1,050
0 = 3,250 - 3,250
1,575
주문 안함
625-0 = 625
1,500-0 = 1,500
3,250 = 3,250 - 0
3,250
반응형