Data Science Issue 21

부도예측모형

1번쨰 도전------------ X6 순부채/총자산 X7 순자산배율 X11 유동부채/자기자본 X15 재고자산/유동자산 X21 총자산순이익률 X22 매출액영업이익율 X23 매출액경상이익률 X24 매출액순이익률 X25 이자보상비율 X33 현금성자산비율1 X35 순운전자본/총자산 X38 재고자산회전기간1 X47 현금이자보상배율 은닉층 20 -> 88.8% 2번쨰 도전------------ 금융비용대매출액 매출액순이익율 X24 매출액영업이익율 X22 총자산경상이익율 X20 유동부채대총자산 X11 유형자산증가율 X13 경영자산회전율 X18 순금융비용 순운전자본대총자산 유동자산증가율 자기자본경상이익율 X45 3번째 도전--------------- x23 매출액경상이익율 x24 매출액순이익율 x25 이자보상비율 x..

Data Science Issue 2023.04.17

[초청세미나] AI를 활용한 치료 예측 모델 개발 및 프로세스 개선 사례들

[1] 주제: 접근성 향상을 위한 퇴행성 관절염 예측 진단 시스템 고도화 1) 선행연구 - azura kinect(애저키넥트) 카메라를 통한 퇴행성 관절염 에측 진단 - 무릎 각도 및 패턴분석, 고개숙임, 팔, -> 상/하체 보행 특성 - 자료: 한의원 내원객 자료 사용 2) 시스템연구 - 머신러닝 모델 종류별로 4개 돌려보기 -> 빠르고 정확한 모델로 선택 - 특성별 병적 판단 알고리즘: 보행속도, 무릎 벌어진 거리, 발목간 거리, 고개 숙임 정도, 허리 숙임 정도, 팔 구부러짐 정도 등 → 추후 진료시 도움이 될 수 있도록 연구 3) 시스템 상용화 - 스마트폰을 활용한 퇴행성 관절염 예측 진단 [참고자료] 스마트폰 카메라를 활용한 AI 기반 퇴행성 관절염 예측 진단 보조 시스템 - earticle 스..

Data Science Issue 2023.04.15

빅데이터 기본 개념zip

1. 빅 데이터란 무엇인가? 기존의 데이터 분석과는 어떻게 다른가? 주요 특징은? 1) 빅데이터란? 조직의 내외부에 존재하는 다양한 형태의 데이터를 수집, 처리, 저장하여 목적에 맞게 분석하여 조직의 전략적 의사결정 또는 시스템화 하여 생산성 향상에 활용하거나 새로운 비즈니스 모델을 창출하는 패러다임 2) 데이터 분석과 빅데이터 분석의 차이? 데이터 분석 자체의 역사는 오래되었다. 과거에 비해 분석하는 대상의 데이터가 대규모화 되고, 이에 따라 정형데이터 분석 중심에서 비정형 데이터, 외부 데이터 활용하기까지의 범위가 확대가 되고 있다. 빅데이터가 제공하는 기회 의사결정이 질 제고(의사결정 효과성 및 적시성 향상) 운영효율 제고(데이터분석을 통해 도출된 지식을 시스템화하여 업무에 적용) 새로운 가치 창출..

Data Science Issue 2023.04.15

[07] 빅데이터 분석기획

1) 빅데이터 중요한 요소 - 데이터 확보, 저장, 처리, 분석 → 기획능력 2) 데이터 기획 능력 - 문제점 파악 및 문제해결을 위한 분석 기획 중요 → 분석 시나리오 - 필요한 점: 관련 기술, 분석을 통해 얻을 수 있는 가치에 대한 인식, 국내외 성공사례 공부 ex. 성공사례 -sns를 활용한 영화 흥행 수익 예측 1) sns상의 비정형 텍스트 데이터 2) 텍스트 마이닝(감성 분석, 의견 분석 → 긍,부정) 3) 가치 제공: 경영자 및 투자자의 의사결정시 참고자료 - 심야버스 노선 정책 지원 1) 데이터 분석을 통한 심야버스 노선 최적화 → 비용절감 - 고객 민원 분석을 통한 서비스 개선 1) 콜센터 민원 데이터 활용 3) 제약조건 - 분석대상의 발굴 및 구체화 - 데이터 원천의 확보 역량 - 분석..

Data Science Issue 2023.04.13

[06] 딥러닝의 개념 및 발전

# 딥러닝: 수많은 데이터에서 특징을 추출하고, 특징의 패턴을 학습하는 기계학습 기법 # 인공신경망: 중요한 특징들을 제공해서 학습 AI > 머신러닝 > 딥러닝 [1] 딥러닝 배경 및 활성화 요인 - 데이터의 폭발적 증가 - 하드웨어(CPU 속도 빨라지고 개발 및 투자 증가) - imagenet 안경잡이개발자 :: 이미지넷(ImageNet) 데이터셋 소개 및 다운로드하는 방법 (tistory.com) 이미지넷(ImageNet) 데이터셋 소개 및 다운로드하는 방법 이미지넷(ImageNet) 데이터셋은 MNIST, CIFAR 데이터셋과 더불어 굉장히 유명한 데이터셋이다. 일반적으로 MNIST나 CIFAR는 아이디어에 대한 검증 목적으로 사용한다. 최신 컴퓨팅 장치를 기준으로 보았 ndb796.tistory...

Data Science Issue 2023.04.08

[05] 데이터분석의 종류

데이터분석: 사실파악, #원인파악, #미래예측, 해결방안 도출 1) 기술통계 분석: 기술통계 분석에 기반하여 해당 데이터의 속성을 요약하여 파악하는 것 - 막대그래프, 파이그래프, 대시보드 2) 군집화: 유사한 속성들을 갖는 객체들을 묶어 전체의 객체들을 몇개의 그룹 또는 군집으로 나누는 것 - 유사한 고객 묶기 3) 연관규칙: 데이터에 숨어 있는 항목간 관계 탐색 - 비오는 날 파전을 많이 먹는다, 치킨을 사는 사람이 맥주를 많이 산다 4) 예측모형: 과거의 데이터를 바탕으로 미래의 값을 예측하는 것 -기계학습: 머신러닝, 선형회귀, 인공신경망

Data Science Issue 2023.03.24

[공모전 준비] 데이터 분석 수상작 한 눈에 볼 수 있는 사이트 공유

1. 공공데이터 활용 BI 공모전 수상작 확인 가능 https://datacontest.kr/board/97533073지난 수상작 > 수상내역datacontest.kr 2. 2019 & 2020 공공 빅데이터 분석 공모전 발표 자료집 https://www.data.go.kr/bbs/rcr/selectRecsroom.do?pageIndex=1&originId=PDS_0000000000738+++&atchFileId=FILE_000000002358349&searchCondition3=&searchCondition2=2&cndCtgryLaword=Y&cndCtgryEdc=Y&cndCtgryBigdata=Y&cndCtgryStd=Y&cndCtgryNews=Y&cndCtgryEtc=Y&bindCndCtgry=PD..

Data Science Issue 2023.03.22

[04] 데이터 저장 및 처리 방법

1. 데이터웨어하우스(DW) - 데이터를 추출하고 조합해 정보, 지식으로 바꾸는 기술/ 다양한 주제에 대한 전사적 데이터 포함 → "의사결정 지원"을 위한 데이터베이스(요약된 읽기 전용 데이터베이스) -구성요소 1) 데이터 부르기(업무자료, 내부 보관자료 등) 2) 데이터 추출 및 변환 3) 데이터 저장(데이터웨어하우스) 4) 데이터 마트에 저장 5) 자료조회 및 분석 1-1. 데이터마트: 특정 주제와 밀접하게 관련된 정보를 저장 2. OLAP - online analytical processing / 온라인분석처리 -다차원 데이터 구조를 이용하여 다차원 복잡한 질의를 고속으로 처리하는 데이터 분석 기술 ex. 지역별/분기별/상품별 → 판매액 비교 홈쇼핑/온라인판매/오프라인판매 → 매출액 비교(월별/분기..

Data Science Issue 2023.03.22

[03] 데이터의 종류

1) 빅데이터 종류 - 정형데이터: 고정된 필드에 저장된 데이터, 데이터베이스를 설계한 사람에 의해 수집되는 형태 - 비정형데이터: 문서, 그림, 영상 등 정해지지 않은 데이터 - 분석대상 데이터 예시: 쿠팡 → 긍/부정, 주요 토픽 및 이슈, 리뷰에 많이 나오는 단어들 - 로그데이터: 사용자가 처음 사이트를 방문하는 순간부터 기록되는 데이터 → 사용자가 어떤 것들에 대해 관심이 많은지 분석 - 센서데이터: 부착된 센서로 정보 수집: cctv, 고속도로 통행 등 - 이미지 및 동영상: 딥러닝을 이용해 이미지 안에 어떤 상황이 있는지 읽어냄 2) 빅데이터의 수집 - 부정확한 데이터는 잘못된 데이터 분석 결과를 초래하므로 수집이 중요함 → 내부데이터(회사 내부)/ 외부데이터(인터넷)로 나뉨 - 내부데이터 수..

Data Science Issue 2023.03.22

[02] 빅데이터란 무엇인가?

빅데이터란? 1) 조직의 내외부에 존재하는 다양한 형태의 데이터를 수집, 처리, 저장하여 목적에 맞게 분석하여 조직의 전략적 의사결정 또는 시스템화 하여 생산성 향상에 활용하거나 새로운 비즈니스 모델을 창출하는 패러다임 빅데이터의 역사 빅데이터 자체의 개념은 비교적 새로운 것이지만, 대규모 데이터 세트의 기원은 최초의 데이터 센터가 등장하고 관계형 데이터베이스가 개발되는 등 데이터 세상이 막 시작되었던 1960년대와 70년대로 거슬러 올라갑니다. 2005년 무렵 사람들은 Facebook, YouTube 및 기타 온라인 서비스를 통해 사용자가 얼마나 많은 양의 데이터를 생성하고 있는지 깨닫기 시작했습니다. 같은 해에 Hadoop(빅 데이터 세트를 저장하고 분석하기 위해 특별히 개발된 오픈 소스 프레임워크)..

Data Science Issue 2023.03.21
728x90