전체 글 196

데이터 베이스란?

데이터 베이스란? 관련 있는 데이터를 최소한의 중복으로 통합해 놓은 데이터의 집합체 사용자 데이터와 데이터베이스의 설계를 나타내는 스키마로 모두 데이터베이스에 저장 DBMS란? 데이터베이스를 생성하고 관리하는 프로그램 : ex. Oracle, SQL DBMS 기능은? 데이터 저장 관리(데이터 저장에 필요한 데이터의 물리적 구조를 생성하고 관리하는 기능) 데이터 무결성 관리(데이터베이스 스키마를 정의하는 과정에서 사용자에 의해 정의되어 데이터 사전에 저장되고 관리됨) 데이터 사전 관리(사용자 데이터와 마찬가지로 스키마도 시간이 지남에 따라 변화함, 변경사항은 DBMS에 의해 기록, 관리됨) 다중 사용자 접근 통제(다수의 사용자가 동시에 동일한 데이터에 접근하여 데이터 무결성과 일관성을 손상시키는 것 방지)..

Database 2023.09.09

Basic-grammar-in-R

1. R Studio 열고 R Markdown 클릭 2. 추출 방법: HTML, WORD 사용/ PDF는 한글 추출X 3. 저장 경로 확인 4. 저장 경로 새로 생성(한글 있으면 안됨) -> 워드로 추출 5. R Markdown 함수 확인 rmarkdown-cheatsheet (studylib.net) rmarkdown-cheatsheet Free essays, homework help, flashcards, research papers, book reports, term papers, history, science, politics studylib.net 기본 문법 1. R에서 다음의 결과가 나오는 명령문을 만들고 결과를 보이시오. 1) [1] "E" "F" "E" "F" "E" "F" "E" "F" ..

What is Machine Learning?

회귀와 분류 회귀 회귀는 연속적인 값을 예측하고 예측 변수와 목표 변수 간의 관계를 모델링하는 작업 주어진 입력 데이터와 목표 변수(또는 출력) 간의 관계를 학습하고, 이 관계를 사용하여 새로운 입력에 대한 연속적인 값을 예측 예를 들어, 주택 가격 예측, 주식 가격 예측, 온도 예측 등이 회귀 문제의 예 일반적인 회귀 알고리즘에는 선형 회귀, 다항 회귀, 결정 트리 회귀, 랜덤 포레스트 회귀가 있음 분류 분류는 데이터를 여러 범주 중 하나로 분류하는 작업 주어진 입력 데이터를 학습하여, 해당 입력이 어떤 범주에 속하는지 예측하는 모델을 만듭니다. 예를 들어, 이메일 스팸 여부 판단, 질병 진단, 손글씨 숫자 인식 등이 분류 문제의 예 분류 알고리즘에는 로지스틱 회귀, 결정 트리 분류, 랜덤 포레스트 분..

Machine Learning 2023.09.04

데이터시각화 R_ggplot2_tips

tips data : 웨이터가 자신이 일하는 레스토랑에서 수개월 동안 일을 하면서 tip 관련하여 모은 자료 1. 라이브러리 설치 install.packages("reshape2") 2. 라이브러리 불러오기 library(reshape2) 3. 데이터 확인 head(tips) total_bill tip sex smoker day time size 1 16.99 1.01 Female No Sun Dinner 2 2 10.34 1.66 Male No Sun Dinner 3 3 21.01 3.50 Male No Sun Dinner 3 4 23.68 3.31 Male No Sun Dinner 2 5 24.59 3.61 Female No Sun Dinner 4 6 25.29 4.71 Male No Sun Dinn..

데이터시각화 R_ggplot2_mpg data

mpg data: 1999년부터 2008년까지 인기 차종의 연비에 대한 자료 분석 1. 패키지 설치 install.packages("tidyverse") 2. 라이브러리 불러오기 library(tidyverse) 3. 데이터 불러오기 mpg # A tibble: 234 × 11 manufacturer model displ year cyl trans drv cty hwy fl 1 audi a4 1.8 1999 4 auto… f 18 29 p 2 audi a4 1.8 1999 4 manu… f 21 29 p 3 audi a4 2 2008 4 manu… f 20 31 p 4 audi a4 2 2008 4 auto… f 21 30 p 5 audi a4 2.8 1999 6 auto… f 16 26 p 6 audi..

데이터 시각화를 위한 R 기본 문법

R이란? 통계 계산과 그래픽을 위한 언어/ 작업 환경 최신의 통계 방법들이 구축되어 있음 훌륭한 그래픽이 가능하며 자료를 다루기가 비교적 쉬움 하지만, console을 이용하여 명령어를 입력해야 되므로 GUI 환경에 익숙해져 있는 사용자들은 어려움이 있음 R 기본 문법 > a a a > a=1 > a a 2*1:10 [1] 2 4 6 8 10 12 14 16 18 20 > matrix(c(1.1,1.2,1.3,1.4), nrow=2) [,1] [,2] [1,] 1.1 1.3 [2,] 1.2 1.4 ls() [1] "a" "abs.r" "abs.r0" "abs.r1" [5] "b" "bc" "beta" "cov.beta" [9] "Dx" "esti.95" "EY" "fi05" [13] "fi05.lm" "..

카지노 데이터 수집 목적 및 활용 방안

데이터를 수집하는 목적과 그 활용 방안에 대한 명확한 단계 만들기 1. 질문 설정하기 어떤 게임을 했나? 얼마짜리 게임을 했나? 한 번 배팅 시 금액은? 사용한 총 액수가 얼마인가? 얼마나 돈을 따고 잃었나? 카지노에 얼마나 자주 출입하나, 한 번 방문 시 머무는 시간은? ex. 평균 1시간 게임을 즐기는 고객에게는 55분이 지나면 무료 게임 쿠폰 제시하여 머무는 시간 늘려보기 고객 등급은 어떻게 나눌 것인가? - 거리, 금액 어떤 식사를 주로 하는가? - 식사, 호텔, 리무진, 공연 티켓 서비스 등 적절한 것 추천 카지노도 빅데이터 시대 - 아시아경제 (asiae.co.kr) 카지노도 빅데이터 시대 - 아시아경제 [아시아경제 조목인 기자]최근 정보통신(IT) 업계의 가장 큰 화두 중 하나는 빅데이터다...

텍스트 마이닝_필수 라이브러리 설치

1. 텐서플로우 설치 머신러닝과 딥러닝을 직관적이고 손쉽게 할 수 있도록 설계되어 있음 pip install tensorflow 2. 케라스 설치 딥러닝 프레임워크인 텐서플로우에 대한 추상화 된 API 제공 pip install keras 3. 젠심 머신러닝을 사용하여 토픽 모델링과 자연어 처리 등을 수행할 수 있게 해주는 오픈 소스 라이브러리 pip install gensim 4. 사이킷런 파이썬 머신러닝 라이브러리 pip install scikit-learn 5. 자연어 처리_NLTK, NLTK DATA 설치 pip install nltk import nltk nltk.download() 설치 확인 6. 자연어 처리_KoNLPy 설치 한국어 자연어 처리를 위한 형태소 분석기 패키지 pip instal..

Tableau_KPI 대시보드 작성3

매출 증감율 대시보드 구성 1. 계산된 필드 만들기 - 기간을 주 단위로 나누기 IF [Order Date] >= ({MAX([Order Date])}-7) then "Last 7 days" ELSEIF [Order Date] >= ({MAX([Order Date])}-15) then "Previous 7 days" END 2. 만든 Period를 열에 넣기(보기 싫은 항목들 숨기기 처리) 3. 보고 싶은 값인 Sales를 텍스트에 드래그 4. 텍스트 편집 5. Sales를 세부정보에 드래그 → 퀵 테이블 계산 → 비율 차이 → 왼쪽 아이콘 클릭 텍스트로 바꾸기 (텍스트 2개이면 충돌남) 6. 숫자 사용자수식 → ▲0%; ▼0% 7. 매개변수 만들기 → 이름, 속성 변경 → 텍스트로 드래그 8. Sale..

카테고리 없음 2023.08.19

Tableau_KPI 대시보드 작성2

매월 매출액 표시 하이라이트 만들기 1. 열에 [Order date의 년도] 드래그 2. 행에 [Order date의 월] 드래그 3. Sales의 합계를 색상에 넣고, 레이블에 추가로 넣기 4. 원하는 색상을 지정 5. Sales 우클릭 → 기본 속성 → 숫자형식 들어가서 통화(사용자 지정으로 변경) 후 $로 변환 6. 레이블 → 맞춤 → 가운데로 숫자 정렬 가운데로 진행 7. 서식 → 통합문서 → 전체 시트의 글꼴 변경 * 만약 글꼴 크기, 색상 수정하고 싶으면 아래에서 진행

728x90