Data Science Issue 21

AI 시대 DATA SCIENTIST의 역할

AI 시대 DATA SCIENTIST의 역할_이혜주 롯데멤버스 대표님(이화여대 통계학과 출신) AI의 의미: 삶과 일하는 방식을 변화시키는 핵심적인 드라이브     1990년대:  인터넷      2000년대 : 모바일      2010년대: 스마트폰, 클라우드      2020년대: 생성형 AI AI로 인한 비즈니스 변화 1) 일하는 방식 변화: 업무 + AI 2) 서비스 제공 방식 변화: 제품서비스+AI 3) 고객경험 변화: UX+AI  생성형 AI 한계 1) 실제로 존재하지 않는 정보 제공 2) 최신 정보 재학습 불충분 3) 모델이 왜 그런 결과를 만들어냈는지 설명하기 어려움 생성형 AI시대 데이터가 더 중요한 이유 1) 혁신적인 데이터 생성 및 증강 2) 데이터 보안 및 프라이버시 강화 3) 데이..

Data Science Issue 2024.10.12

융합적 IT 시대, Domain Knowledge를 기반으로 IT 기술을 포용한 커리어 스토리

연사: 김은희 상무주제: 융합적 IT 시대, Domain Knowledge를 기반으로 IT 기술을 포용한 커리어 스토리 Vector Search벡터 검색은 무엇인가요? ML로 향상되는 검색 | Elastic 벡터 검색은 무엇인가요? ML로 향상되는 검색벡터 검색은 무엇인가요? 벡터 검색은 비정형 데이터의 의미와 컨텍스트를 파악합니다. 벡터 검색을 사용하면 검색 속도가 빨라지고 결과의 정확도가 높아집니다. ...www.elastic.co  검색 증강 생성(Retrieval Augmented Generation, RAG)검색 증강 생성(Retrieval Augmented Generation, RAG)은 맞춤형 데이터를 활용하여 대규모 언어 모델(LLM) 애플리케이션의 효율성을 개선할 수 있는 아키텍처 접근 ..

Data Science Issue 2024.06.01

What is A/B TESTING? (실무에서의 A/B 테스트)

A/B 테스트란? A안과 B안을 가지고 사람들의 반응이 어떻게 달라지는지 확인하는 작업 ex. A화면 일 때 구매력 vs B화면 일 때 구매력 고객 분석을 위한 테스트 고객분석 1) 종단적 연구 - 코호트 분석(특정 기간 동안 공통된 특성이나 경험을 갖는 사용자 집단을 의미합니다. 첫방문, 캠페인 유입 등 특정 조건에 해당되는 사용자들을 그룹화하고 시간 흐름에 따른 행동 패턴을 추적합니다.) 2) 횡단적 연구 - A/B 테스트 - 다변량 분석 A/B 테스트 수행 과정 1. 실제 대상자를 반으로 나눈 후 2. 두가지 포맷의 테스트 자료(버튼, 이미지 등을 바꿈)를 만들어서 3. 이를 A,B 그룹 각각에 제공 4. 이에 따라 각 그룹이 얼마나 반응했는지를 판단 5. 결과가 우수한 내용을 실전에 반영 A/B ..

Data Science Issue 2024.03.16

[특강] 데이터 분석 프로젝트 예시

LG CNS 김진수 전문위원/ D&A 사업부 D&A 플랫폼 기술담당 - 석유화학 사업부 공통모델 개발 및 확산 - 설비 모니터링 시스템 개발 - 디스플레이 패널 품질검사 자동화 - 스마트제어 자세판정 시스템 개발 - 식수예측 - 전략 강화를 위한 빅데이터 분석 1. 데이터 분석 프로젝트 사례 MLOps란? MLOps란 머신 러닝(Machine Learning)과 운영(Operations)을 합친 용어로 프로덕션 환경에서 머신 러닝(ML) 모델이 지속적이고 안정적으로 배포되도록 유지, 관리, 모니터링 해주는 것입니다. MLOps는 머신러닝 모델 개발과 운영을 통합해 ML 시스템을 자동으로 유지, 관리, 운영합니다. MLOps의 대상은 머신 러닝 모델을 개발하는 것뿐만 아니라 데이터를 수집하고 분석하는 단계..

Data Science Issue 2023.10.28

[Threads] 스레드 회원가입부터 꿀팁까지!

두둠, 트위터를 대체할 SNS가 나왔다고 한다. 나는 인스타그램도 계정만 있고 활동을 안하지만 신문물에는 도전해보고 싶어서 가입을 해보았다. 1. 스레드 어플 다운로드 - threads로 검색 후 다운로드 2. 인스타그램에서 계정 생성 후 연동 진행 - 기존의 인스타그램으로 연동을 하면 쓰레드 탈퇴 진행 시, 인스타그램도 같이 탈퇴 됨으로 주의! - 개인적으로 나는 인스타그램을 탈출하고 싶어서 새로 팜 3. 공개 범위 설정 4. 개인 프로필 수정 5. 게시글 작성하기(인물태그만 가능, 다른 해시태그 불가) 6. 꿀팁 1) 사진은 10장까지 업로드 가능 2) 영상은 5분까지 업로드 가능 3) 게시글 편집과 수정은 불가능 4) 게시글 복사 가능 5) 해시태그 불가능 6) 사람태그만 가능 7) 계정전환 불가능..

Data Science Issue 2023.07.07

[이대 인재개발원 행사] 방구석 진로 콘서트_데이터 분석가(비전공자)

[데이터 분석가 편] 이화여대_방구석 진로 콘서트 문헌정보학과 박효진님 / 기아 데이터분석가 1) 전 세계 법인이 빅데이터 센터를 구축하고 데이터 기반으로 업무 효율화 할 수 있도록 도와주는 업무 2) 차량 데이터 분석 관련 업무 팀과 협업 업무 1) 빅데이터 센터 구축 계획 설명 2) 본사 프로젝트 현황 공유 3) 파일럿 분석 목표 설정 취업 시 준비 한 내용 1) 글로벌 업무(영어) 2) 자격증(adsp) 3) 공모전(수상이 아니여도 참여 내역) 추천하는 역량 1) 알고리즘 공부: 코딩 테스트, 데이터 전처리 & 분석 테스트 2) 나의 데이터 관련 연구 또는 경험과 모빌리티 산업 연결 지어 보기 3) 석사 논문 작성: 설명(한/영) 참고 자료: 데이터분석가 해외출장 브이로그 대기업 데이터 분석가의 해..

Data Science Issue 2023.05.27

[초청세미나] Microsoft AI MVP 전미정님 특강

연사: 전미정 (Microsoft AI MVP) 일시: 5/20일 오후 3:30 ECC B142호 제목: 모든 경험이 데이터가 되는 자유로운 IT 커리어 이야기 1) 메모 앱 출시: 블링크 메모 앱을 출시한 이유는 메모를 많이 하는데 리스트 형식으로 한 줄에 하나씩 메모가 되면서 쌓이는 게 일반적임 메모 아이템이 짧으면 뒷부분이 다 여백으로 남게 되고 그러다 보니까 스크롤을 한참 해야 되는 불편함이 생김 메모를 잊어버리지 않게 하는 기능을 추가해서 출시함 베어 포커스 타이머는 집중을 더 효율적으로 할 수 있게 도와주는 그런 툴임 2) 애플 워치용 앱 개발 25분 집중하는 것도 요즘은 쉽지 않음, 25분 동안 핸드폰을 보지 않고 다른 거에 집중을 하겠다는 의미가 담긴 앱을 개발함 애플 워치용으로도 출시해줬..

Data Science Issue 2023.05.21

기초통계 R 실습

표본추출과 표본분포 (week 6) 데이터분석을 위한 통계 랜덤 표본 (random sample) 추출 :알려진 확률 분포로부터 임의로 데이터를 생성 예를 들어, 지난 몇년간 통계학 입문 강좌를 수강하는 학생들의 기말시험성적이 평균 50점, 표준편차 20점의 정규분포를 따른다는 사실을 알고 있다고 하자. 이 분포를 따르는 성적자료 100개를 임의로 생성해보자. n=100, mean=50, sd=20, rnorm() : 정규분포 rnorm(n, mean=0, sd=1) sample.data

Data Science Issue 2023.05.02

부도예측모형 2

[인공신경망을 이용한 부도예측모형의 구축] 232DSN02 김나윤 1. Data & Variables 1) 여러 변수 중 어떤 변수를 입력변수와 출력변수로 사용하였는지 설명하시오. - 기업의 재무, 비재무정보를 입력변수로 사용하였고, 기업의 부도여부를 종속변수로 설정해 모형을 구축해보았습니다. 2) 변수 선정 기준 - 재무제표 분석시 많이 사용하는 항목들을 찾아보고 Y에 영향을 미칠 것 같은 변수들을 선택했으며 독립변수끼리 서로 겹치지 않도록 노력했습니다. - x35 순운전자본/총자산 → 유동성 - x10 운전자산구성비율1 → 안정성 - x14 이익잉여금구성비율1 → 안정성 - x11 유동부채/자기자본 → 안정성 - x16 총차입금/매출액1 → 안정성 - x39 경영자본회전율1 → 활동성 - x19 기업..

Data Science Issue 2023.04.17
728x90