In my U.S. experience, every person asks me, "Oh, this is a little bit spicy, but you came from South Korea; I'm sure you are OK. " Sure, I like spicy food really much. However, we have yet to learn about every South Korean people's taste type. In Yummirific data, we collected 3,397 people's taste preference data with 40 survey questions. Fortunately, we covered that "SPICY." Our question number 8 aligns with "SPICY." "I like spicy food." So, I analyzed 3,397 people's responded data related to basic tasty preferences, Sour, Bitter, Salty, Sweety, and "SPICY. Here are some fun facts about it.
시립대학교 대학원 시절 통계수업 내용과 약 5년에 걸친 데이터 분석 실무 지식을 나름 섞어서 써볼 예정입니다. (2017.02.17. 작성 시작 – 현재 작성중)
I. 과학적 방법과 통계
1. 과학적 연구의 종류
1. 1 양적 연구 (Extensive Research)
- 연구 대상을 정의할 때 적은 속성(Property)을 부여 : 연구 대상이 광범위하고 수가 많음
- 대표성/유사성을 찾는 연구
- 묘사적 연구, 이론에 대한 증명적 연구
- 연구방법은 Formal & Rigid
COMMENT
일반적으로 실무에서는 양적 연구와 가까운 데이터 처리가 많습니다. 정보통신 기술(IT)의 발달로 어마어마한 양의 정보를 수집할 수 있게 되면서, 과거의 실무 통계는 전통적 통계학과 비슷하게 “어떠한 표본을 대표성 있게 추출할 것인가?”와 이러한 표본을 통해 어떻게 하면 보다 정확하게 모집단을 추론할 수 있는지가 주된 관심사 였습니다. 하지만, 소위 Big Data 시대가 열린 후로는 정말 어마어마한 양의 데이터가 생성되기 시작합니다.
특히 실무적 관점에서 가장 먼저 접하게 되는 데이터는 결국 매출 정보라고 할 수 있습니다. 우리 회사 제품이 얼마나 팔렸는가? 라는 질문에 과거에는 이번달 매출은 얼마, 하루 매상은 얼마와 같이 관측의 기준이 기간과 같이 넓게 보는 것도 힘들었죠. 매출 전표의 매출액을 계산기로 합산하는 것도 힘들었으니까요. 하지만 이제는 그러한 매출이 누구로부터 어디서 언제 어떻게 나왔는지에 대한 정보를 비교적 쉽게 수집할 수 있습니다. POS 전산 등을 통해서 판매 제품에 대한 정보와 판매 시각, 금액 등을 관측 데이터(Row)화 할 수 있고 이러한 데이터를 통해 다양한 분석을 해볼 수 있게 되었습니다.
1.2 질적 연구(Intensive Research)
- 연구대상을 정의할 때 많은 속성(Property)을 통해 상세하게 정의 : 연구 대상이 협소하고 수가 적음
- 구체적인 대상들의 인과관계 혹은 Connection들에 대해 추정
- 연구자는 연구대상과 친밀도가 높음 : Interview 방식이 많이 사용
- 연구방법은 Informal & Flexible
구분 | Intensive Research | Extensive Research |
Research Question | Process가 어떻게 작용하는가? (어떤 특별한 경우)
-> 적은 연구대상으로 일반화를 하려 함
(but 성급한 일반화의 오류 가능성) | 어떠한 규칙이 있는가? 규칙성, 공통성, 패턴 등을 조사해 모집단을 추론함 |
Relations | 실질적인 관계 (Connection 등에 관심 大) | 유사성의 Formal Relation |
Type of group study | Causal Group (인과적 집단) | Taxonomical Group (분류된 집단) |
Type of Account | 인과적 설명력 높음 대표성이 결여됨 | 대표성이 잘 기술됨 설명력이 부족함 |
Type of methods | Interview 문화인류학적 설명
상호간의 Connection
| 대표성(설문)조사(Formal한 양식) 표준화된 인터뷰 통계적 연구 |
Limitation | 대표성이 결여되어 일반화가 어려움 | 개인에 대한 설명력이 약함 |
Test | 확인 Corroboration 확증적 | Replication 복제 가능성 |
1.3 연구 예시
EX) 빈곤문제 연구사례
- Extensive Research : 표본에 대해 대규모 조사 by 고용, 소득, 부양가족 수, 점유유형, 방 수, 인종, 교육 수준 등
- Intensive Research : 적은 가구수에 대해서 복지, 고용, 교육 등의 경험적 지식, 역사 등을 조사 또는 Storytelling 방식 등
Comments
Post a Comment