2024/05/05 2

2. basics of statistics

모집단과 표본:모집단(population)은 조사하고자 하는 전체 대상이나 개체들을 의미합니다. 예를 들어, 대통령 선거에 대한 대중 의견 조사의 경우, 대한민국의 성인 유권자가 모집단이 될 수 있습니다.표본(sample)은 모집단의 일부분을 나타냅니다. 무작위로 선택된 표본은 모집단을 대표할 수 있어야 합니다.모집단은 유한하거나(특정 비행기에 탑승한 모든 승객) 무한할 수 있습니다(지속적인 병행 공정에서 생산된 모든 콜라).모수와 통계량:모수(parameter)는 모집단에서 수집된 수치 정보를 나타냅니다. 모집단의 특성을 반영합니다. 예를 들어, 모집단의 평균 연령이나 인구 수 등이 모수가 될 수 있습니다.통계량(statistic)은 표본에서 얻은 수치 값입니다. 이 통계량은 모집단의 특성을 반영합니다..

Business statistics 2024.05.05

[머신러닝 기법] Decision Tree, AdaBoost, Gradient Boosting, XGBoost, LightGBM의 주요 차이점

머신러닝 기법들인 Decision Tree, AdaBoost, Gradient Boosting, XGBoost, LightGBM은 모두 트리 기반의 앙상블 학습 방법을 사용하지만, 각각의 특징과 동작 방식에는 몇 가지 차이가 있습니다. 1. Decision Tree (의사 결정 트리):단일 트리 모델로, 데이터를 특성에 따라 분할하여 의사 결정을 내리는 방식입니다.각 노드에서의 최적의 분할을 찾기 위해 정보 이득이나 지니 불순도 등의 지표를 사용합니다.해석이 용이하고 설명력이 뛰어나지만, 과적합(overfitting)되기 쉬운 경향이 있습니다.model = DecisionTreeRegressor(random_state=random_state) #결정 트리 회귀 모델을 초기화# Define the hype..

Machine Learning 2024.05.05
728x90