그럼에도 불구하고

  • 홈
  • 태그
  • 방명록

stratified sampling 1

머신러닝 프로젝트 - 계층적 샘플링(stratified sampling)

들어가며 지난 글에서는 최종적으로 해쉬를 이용해서 테스트 세트를 추출하는 방법을 알아보았습니다. 훈련이 잘 진행되기 위해서는 샘플링(추출)된 데이터의 분포가 기존의 데이터 분포와 유사해야 합니다. 이를 위해 계층적 샘플링을 사용할 수 있습니다. 계층이란? 계층은 전체모수를 동질의 그룹으로 나누는 기준입니다. 계층적 샘플링이 필요한 이유? 모델을 학습시키거나 테스트를 할 때 사용되는 데이터가 편향적으로 전체 모수에서 추출된 경우 학습의 일반화가 제대로 진행되지 않기 때문에 전체 모수를 계층에 따라 나누고 추출된 데이터가 각 계층을 대표하도록 하여 편향을 방지하기 위해서입니다. 예시 기존의 설루션을 담당하는 전문가가 주택 중간 가격은 중간 수입과의 관계가 중요하다고 합니다. 중간수입과의 관계에 대해서 잘 학..

Machine Learning 2020.02.29
이전
1
다음
프로필사진

그럼에도 불구하고

  • 전체보기
    • Computer Science
      • Algorithm
      • Data Structure
      • Project Management
      • Operating System
      • Network
      • Database
    • Web
      • Dive in Java
    • Android
      • Kotlin
    • Machine Learning
      • Keras
    • Docker
    • Etc
    • 교양공부
      • 주식
    • 책을 읽고

Tag

Docker, Spring, Github Project, object detection, aws, TensorFlow, Project Management, 비등방성 함수, RMSE, 쿠버네틱스, Extension Function, kotlin, overfiting, Kubernetes, Android, 확률적 경사 하강법, Server, 케라스, TensorFlow Lite, sgd,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

  2025. 05  
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.