빅데이터 공모전

[꿀팁zip] 이화여대 데이터사이언스 대학원_데이터 분석 공모전 시작하기

뉴욕킴 2023. 5. 14. 19:32

 

교내 행사: 데이터분석 공모전 시작하기

 

 
 
1. 데이터분석 공모전 종류
1) 수시: DAYCON, AI FACTORY, COMPAS
2) 정기적(1년에 한 번): BIGCONTEST, 날씨 빅데이터 콘테스트, fsi data challenge, 롯데엠버스 빅데이터 경진대회

대회, 콘테스트, 공모전, 대외활동, 서포터즈 - 콘테스트코리아 (contestkorea.com)
 
2. 발표 자료 순서 참고
예시 주제: 앱 사용성 데이터를 활용한 ~~예측 분석
 
1) 데이터 전처리
2) 결측치 처리(mice) 
 
[머신러닝/ML] 결측치 처리하는 7가지 방법 (Seven Ways to Make up Data) (tistory.com)

 

 

대회, 콘테스트, 공모전, 대외활동, 서포터즈 - 콘테스트코리아

대회, 콘테스트, 공모전, 대외활동, 서포터즈, 기자단, 체험, 봉사, 전시회, 문학, 네이밍, 아이디어, IT, 웹툰, 디자인, UCC, 블로거, 이벤트

www.contestkorea.com

 

[머신러닝/ML] 결측치 처리하는 7가지 방법 (Seven Ways to Make up Data)

정형 데이터를 다루다 보면, 각 칼럼 당 비어 있는 값들이 존재하는 경우가 빈번하다. (없는 것 찾기가 힘듦) 파이썬 머신러닝 완벽 가이드 책 실습을 진행하던 중, 데이터 결측치를 채우는 방법(

daebaq27.tistory.com

[부록]결측치 처리하기(개념잡고가기) : 네이버 블로그 (naver.com)

 

[부록]결측치 처리하기(개념잡고가기)

이전 포스팅에서 mice를 이용한 결측치 처리 방법에 대해 알아보았다. 이외에도 많은 방법들을 추후 설명할...

blog.naver.com

 
3) 파생 변수 생성(내부 변수를 활용)
→ ~~를 통한 등수, ~~금액 등수
 
4) 모델링 진행 및 모델 평가
- light gbm
- gradient boosting classifier
- catboost
- DNN
→ 여러가지 모델에 대한 모델링 진행 후 결과를 비교(머신러닝이 딥러닝보다 성능이 좋을 떄가 많다)
 
5) 적절한 가중치를 찾아 성능을 비교
 
6) 모델에 따른 accuracy, precision, recall, f1 score, ratio 비교
 
7) 최종 모델 선정 이유(짧은 수행시간, 해석 가능한 효율적 모형 선택)
 
 
3. 공모전 준비 전 학습해야 되는 것들
1) 관련 서적 추천: 점프투파이썬, 파이썬 머신러닝 완벽가이드
 
2) 입문 공모전 추천: 데이콘(베이스 라인 코드를 주최측에서 공유해줌)
 
3) 팀별 공모전 준비 꿀팁
- 끊임없는 소통
- 전체적인 과정을 함께 진행(다양한 의견 제시 굿)
- 백그라운드 eda를 공부하고 각자 진행해봄. 각자 2~3개씩 방법론 정해서 해보고 비교하는 작업 진행
- 팀별 3~4명 인원 추천

 

4) 공모전 수상 후기 확인

대외활동 공모전 인턴 - 대학생 커뮤니티 | 링커리어 (linkareer.com)
 

 

대외활동 공모전 인턴 링커리어 커뮤니티 - 대학생 커뮤니티

대학생 커뮤니티 링커리어에서 대외활동 공모전 동아리 인턴 합격자료 그리고 서포터즈 기자단 봉사활동 정보를 공유 받으세요

community.linkareer.com

[제 2회 빅데이터 기반 시각화 아이디어 공모전] 2021 우수상 수상 후기 - 대외활동 공모전 인턴 링커리어 커뮤니티 (linkareer.com)

 

[제 2회 빅데이터 기반 시각화 아이디어 공모전] 2021 우수상 수상 후기 - 대외활동 공모전 인턴

🖱️기획/아이디어 공모전 찾으러 가기 🖱️현재 모집중인 공모전 보러가기 🖱️역대 수상작 보러 가기 🖱️공모전 팀원 구하러 가기 안녕하세요 여러분 ! ​ 한국기업데이터(KED)에서 주최

community.linkareer.com

 

이대 데이터사이언스 동기들과 함께 캐글 스터디 진행

 
1) 교재: 파이썬 머신러닝 완벽가이드
 
2) 진행 방법: 매주 학습 후 티스토리, 깃북, 블로그 등 내용 정리 후 가위바위보로 발표자 2명 선정
* 1주차: 1장
* 2주차: 2장 1~4파트
* 3주차: ~2장
* 4주차: 3장 1~3파트
* 5주차: ~3장
* 6주차: 4장 ~앙상블까지 
~~현재 진행 중(여름 방학까지 한권 돌리기 목표)
 

교내 초청세미나 강의 활용

 
* 3/18 (KAIST 교수) - Growth Hacking

* 4/8 (한화시스템 수석연구원) - 국방, 육군
* 4/15 (인하대학교 교수) - 제조 및 공공 AI, 데이터 분석
* 4/29 (Naver) - 네이버, 메쓰프레소(콴다), 쏘카 데이터분석가
* 5/6 (연합뉴스 컨텐츠인큐베이팅팀) - 언론 빅데이터 분석
* 5/20 (IDEAMP CTO) - 모바일 개발, Keras 코리아

'빅데이터 공모전' 카테고리의 다른 글

빅데이터 공모전 준비 방법  (0) 2023.07.09