Skip to main content

Posts

Showing posts with the label 통계학(Statistic)

Do South Korean people really like “SPICY”?

In my U.S. experience, every person asks me, "Oh, this is a little bit spicy, but you came from South Korea; I'm sure you are OK. " Sure, I like spicy food really much. However, we have yet to learn about every South Korean people's taste type. In Yummirific data, we collected 3,397 people's taste preference data with 40 survey questions. Fortunately, we covered that "SPICY." Our question number 8 aligns with "SPICY." "I like spicy food." So, I analyzed 3,397 people's responded data related to basic tasty preferences, Sour, Bitter, Salty, Sweety, and "SPICY. Here are some fun facts about it.

[통계학] 나름 데이터과학자 정군의 강의노트

시립대학교 대학원 시절 통계수업 내용과 약 5년에 걸친 데이터 분석 실무 지식을 나름 섞어서 써볼 예정입니다. (2017.02.17. 작성 시작 – 현재 작성중) I. 과학적 방법과 통계 1. 과학적 연구의 종류 1. 1 양적 연구 (Extensive Research) 연구 대상을 정의할 때 적은 속성(Property)을 부여 : 연구 대상이 광범위하고 수가 많음 대표성/유사성을 찾는 연구 묘사적 연구, 이론에 대한 증명적 연구 연구방법은 Formal & Rigid COMMENT 일반적으로 실무에서는 양적 연구와 가까운 데이터 처리가 많습니다.  정보통신 기술(IT)의 발달로 어마어마한 양의 정보를 수집할 수 있게 되면서, 과거의 실무 통계는 전통적 통계학과 비슷하게 “어떠한 표본을 대표성 있게 추출할 것인가?”와 이러한 표본을 통해 어떻게 하면 보다 정확하게 모집단을 추론할 수 있는지가 주된 관심사 였습니다. 하지만, 소위 Big Data 시대가 열린 후로는 정말 어마어마한 양의 데이터가 생성되기 시작합니다. 특히 실무적 관점에서 가장 먼저 접하게 되는 데이터는 결국 매출 정보라고 할 수 있습니다. 우리 회사 제품이 얼마나 팔렸는가? 라는 질문에 과거에는 이번달 매출은 얼마, 하루 매상은 얼마와 같이 관측의 기준이 기간과 같이 넓게 보는 것도 힘들었죠. 매출 전표의 매출액을 계산기로 합산하는 것도 힘들었으니까요. 하지만 이제는 그러한 매출이 누구로부터 어디서 언제 어떻게 나왔는지에 대한 정보를 비교적 쉽게 수집할 수 있습니다. POS 전산 등을 통해서 판매 제품에 대한 정보와 판매 시각, 금액 등을 관측 데이터(Row)화 할 수 있고 이러한 데이터를 통해 다양한 분석을 해볼 수 있게 되었습니다. 1.2 질적 연구(Intensive Research) 연구대상을 정의할 때 많은 속성(Property)을 통해 상세하게 정의 : 연구 대상이 협소하고 수가 적음 구체적인 대상들의 인