Data Science Issue

부도예측모형 2

뉴욕킴 2023. 4. 17. 21:46

[인공신경망을 이용한 부도예측모형의 구축]

 

                                                                                                    232DSN02 김나윤

 

1. Data & Variables

1) 여러 변수 중 어떤 변수를 입력변수와 출력변수로 사용하였는지 설명하시오.

- 기업의 재무, 비재무정보를 입력변수로 사용하였고, 기업의 부도여부를 종속변수로 설정해 모형을 구축해보았습니다. 

 

2) 변수 선정 기준

- 재무제표 분석시 많이 사용하는 항목들을 찾아보고 Y에 영향을 미칠 것 같은 변수들을 선택했으며 독립변수끼리 서로 겹치지 않도록 노력했습니다. 

 

- x35 순운전자본/총자산 → 유동성

- x10 운전자산구성비율1 → 안정성

- x14 이익잉여금구성비율1 → 안정성

- x11 유동부채/자기자본  → 안정성

- x16 총차입금/매출액1 → 안정성

- x39 경영자본회전율1 → 활동성 

- x19 기업경상이익률 →  수익성

- x23 매출액경상이익률 → 수익성

- x24 매출액순이익율 → 수익성

- x28 이자비용/총부채2 → 수익성

- x46 총영업활동CF/총부채4 → 현금흐름

 

2. Model Development 모형 구죽 과정 

1) 모형구축을 위해 training set과 test set, validation set을 어떤 비율로 구성했는지 설명하시오.

- 학습용 데이터 50%, 검증용 데이터 50% 비율로 구성하였습니다.

 




2) 네트워크 아키텍쳐, layer의 수, input node, hidden node, output node 설명

- 다층 퍼셉트론 모형을 선택하였고 은닉층은 1개만 사용하였습니다.

 

3) 학습조건 명시

- 인공신경망을 통해 복잡하고 비선형적이며 관계성을 갖는 다변량을 분석해본다. 

 

3. Result & Analysis

1) 모형 적중률 분석을 통해 통계기법과 인공신경망 기법의 성과 비교(어느 기법이 우수한가)

- 인공신경망은 독립변수와 종속변수 간의 관계를 통해 분류, 예측, 패턴 인식 등의 기능을 수행하는 모형을 구축하는 것으로 기존 통계적 기법에 비해 예측력이 우수하다.



 

 

2) 두 모형을 예측용 기업에 대해 부실여부 예측(각 va, vd별로 예측결과 제시)

- 기존의 통계적 기법에 비해 인공신경망을 사용할 시에는 입력변수군을 달리하는 모형을 구축하며 모형의 예측력 향상에 기여한다.

 

4. Concluding Remarks

1) 실험을 통해 얻은 점, 자신이 개발한 모델의 한계점이나 문제점 서술

- 다변량 통계기법과는 다르게, 인공신경망 모형 구축 시 최적의 입력 변수들을 선정하는데 있어 다소 어려웠던 점들이 있었습니다. 제 기준에서는 이러한 변수들이 중요하다라고 생각을 해서 넣어보고 조합해봤지만 여러번 실패하는 과정을 통해 실무를 모르면 모델을 만들기 어렵구나 라는 것을 느꼈습니다. 또한 모형을 구축하고 개발하며 가장 중요한 것은 입력 변수간의 연관된 관계를 찾고 표현하는 것이라는 것을 알게 되었습니다. 무엇을 분석하고 개발하던지 실무를 파악한 후에 비로소 개발을 할 수 있다는 점을 많이 느꼈고 실무를 모르면 개발하는데 한계가 있다는 것을 알게 되어서 현업과의 중요성을 많이 느꼈습니다. 

 

13-9-1.pdf (evehost.co.kr)