이산확률분포와 연속확률분포의 차이는 뭘까? 확률분포確 率 分 布 / probability distribution 시행에서 확률변수 (random variable)namu.wiki이산확률분포: 확률변수가 취하는 값들의 집합이 자연수의 부분 집합과 일대일 대응 됨연속확률분포: 확률변수가 취하는 값들의 집합이 실수의 구간을 이룸위 나무위키의 설명은 직관적으로 이해하기 어려워서 예시를 들어 설명해보겠다!대한민국 대학생의 몸무게를 확률변수 X라고 가정해보자. 여기서 확률변수 X는 60.5kg, 60.55kg, 60.555kg, 60.55555555 등 무수히 많은 몸무게를 가질 수 있다.↑ 이렇게 연속적으로 확률변수를 많이 가진 확률의 분포를 연속확률분포라고 한다. (키, 발사이즈 등도 마찬가지) 반대로 동전..
퍼널분석(Funnel Analysis)이란?퍼널(Funnel)은 '깔때기'를 의미한다. 아래로 갈수록 폭이 좁아지는 깔때기 모양처럼 처음 방문한 유저들이 최종 목적지까지 도달하는 모습과 비슷해서 '퍼널분석'이라고 불린다. 예를 들어 내가 신발을 판매하는 웹 페이지를 운영 중이라면 어떤 상품에 고객들에게 호응이 높고 낮은지 궁금할 것이다. 이런 경우에 퍼널분석을 통해 유입 고객들이 어디서 많이 이탈하는지, 어떤 페이지에서 구매 전환에 기여도가 가장 높은지 등 원인을 파악하고 대응할 수 있는 마케팅 전략을 세울 수 있다. 이러한 퍼널분석의 특성 때문에 이커머스에서 필수적이라고 할 수 있다. 퍼널 분석은 어떻게 할까?분석하기 전에퍼널분석은 간단해보이지만 세세하게 들어가면 쉽지 않은 문제들이 많다. 그 중 고..
상관분석이란?상관분석 이해하기두 변수간에 어떤 선형적 관계를 갖고 있는 지 분석하는 방법이다. 상관분석을 통해 두 변수간의 연관된 정도를 상관계수(correlation coefficient)로 나타낸다. 이 때 상관계수는 연관된 정도만 나타낼 뿐, 인과관계(원인과 결과)의 의미를 갖지 않는다. (※ 인과관계는 보통 회귀분석을 통해 확인하는 경우가 많다.)상관분석은 보통 연속형 자료끼리 비교할 때, 많이 찾는 분석 방법이지만 연속형vs연속형, 범주형vs범주형, 연속형vs범주형 자료에서도 상관분석을 사용할 수 있고 이 글에서 크게 이 세 가지 유형의 상관분석에 대해 다뤄볼 예정이다. (with 파이썬 코드) 상관계수와 유의확률(P-value) 해석하기상관계수는 -1부터 1사이의 값을 가진다. +1 에 가까..
빙고 게임 파이썬으로 만들기빙고 게임 만들기 조건함수를 실행하면 자동으로 1부터 25까지 5x5 격자 형태의 빙고판을 생성한다.호출자는 1부터 25까지의 숫자를 랜덤하게 숫자를 입력할 수 있다.호출 된 숫자는 이 후 0으로 간주되며, 이미 한 번 호출한 숫자라면 "이미 부른 숫자"라는 오류가 호출된다.가로, 세로, 대각선 방향으로 5개의 숫자를 연속해서 체크하고 3줄이면 '빙고'로 게임이 종료된다.빙고 파이썬 함수 작성 코드 1. 빙고판을 생성하고, 빙고의 조건 함수를 만들기# 빙고판 자동 생성def gen_bingo(): numbers = list(range(1,26)) import random as rnd rows = [] for _ in range(5): row =..
정규성 검정(Nomality Test)이란?데이터 셋의 분포가 정규분포를 따르는지 검정하는 것이다.정규분포 형태아래 이미지와 같이 종 모양의 형태를 띄운 데이터가 정규분포의 형태다.정규성 검정을 하는 이유가 뭘까?정규성 검정을 하는 이유의 대부분은 특정 데이터를 분석하기 전에 모수적인 방법을 선택할지 혹은비모수적인 방법의 분석을 실시할지 정규성 검정을 통해 결정하고 검정 결과의 신뢰도를 높이기 위해서다. 통계에서는 데이터의 정규분포를 가정해야 가능한 분석 기법들이 많다. 예를 들어 T-TEST, 선형회귀 분석 등 모두 정규성이 만족해야 분석할 수 있는 기법이다. 만족하지 않는다면 비모수적 분석 기법을 사용해야 한다. 정규성 검정의 종류검정 방법아래 검정들은 가설검정 모두 귀무가설(h0)을 채택할 때, 정..
AARRR이란?AARRR은 획득(Acquisition), 활성화(Activation), 유지(Retention), 추천(Referral), 수익(Revenue)의 앞글자를 따서 만든 프레임워크다. 고객을 얼마나 잘 데려오는지, 제품설명은 잘 하는지, 고객유지가 되는지, 제품이 만족되는지, 구매가 잘 이루어지는지 이러한 부분을 데이터를 통해 접근하여 개선점을 찾고자 하는 이야기다.이미 인터넷에 너무나 많이 설명이 잘 되있어서 간략히 설명하겠다.AARRR 단계별 측정 지표 및 DA가 해야할 일 예시Acquisition (획득) - 고객들이 우리 서비스를 처음 접하게 됨측정 지표: 신규방문자 수, DAU, MAU, 신규방문자 유입 경로 등해야할 일: 사용자의 유입 경로(ex. utm파라미터, 유입 채널)를 ..