반응형 Software/Data Science Introduction10 [데이터사이언스개론] Fitting Model to data 수업 출처) 숙명여자대학교 소프트웨어학부 수업 "데이터사이언스개론", 박동철 교수님 1. Predictive Modeling - 다른 속성들을 통해서 타겟 속성의 값의 모형을 찾는 것이다. - Nonparametric modeling - 모델 모양이 정해져 있지 않은 모델이다 - 모델의 구조는 데이터로부터 결정된다. - (ex) classificaiton 'tree' - 가지의 수, 모양 등은 데이터를 통해서 알 수 있다. - Parametric modeling - 모델이 정해져 있다. - 모델의 구조는 데이터 분석가에 의해 지정된다. - (ex) linear classify - y = ax + b의 모양으로, 모양은 정해져 있으며 데이터로부터 파라미터인 a, b만 찾아낸다. 2. Nonparametri.. 2021. 4. 22. [데이터사이언스개론] Predictive Modeling 수업 출처) 숙명여자대학교 소프트웨어학부 수업 "데이터사이언스개론", 박동철 교수님 1. Predictive Modeling 예측 모델 - 일반적인 절차 - training data를 가장 잘 표현하는 모델 설정 - 새로운 데이터에 모델 적용하여 결과 예측 - 아마 처음으로 classification을 생각할 것이다. - 새로운 데이터가 어느 클래스에 속할지 training dataset을 기반으로 확인한다. - (ex) 이 고객이 회사를 금방 떠날 것 같은가? → YES / NO 2. Model - 현실을 목적에 맞는 것만 남도록 간략하게 표현한 것이다. - 중요한 것과 중요하지 않은 것을 기반으로 간략화한다. - 부적절한 정보는 날리고 관련이 있는 데이터들만 남긴다. - (ex) 지도, 청사진 2-1.. 2021. 4. 21. [데이터사이언스개론] 비즈니스 문제와 데이터 사이언스 솔루션 수업 출처) 숙명여자대학교 소프트웨어학부 수업 "데이터사이언스개론", 박동철 교수님 1. Data Science Process 데이터 사이언스의 기본 원리는 데이터 마이닝이다. 데이터 마이닝은 상당히 잘 이해된 단계를 가진 process이다. 데이터 사이언티스트는 실생활의 문제를 하위 작업으로 분리한다. 하위 작업들의 솔루션들이 모여서 전체적인 문제를 해결할 수 있다. 문제의 기저가 되는 공통적인 데이터 마이닝 작업이 존재한다. (ex) classification, regression, clustering, association rule discovery 좋은 데이터 과학자가 되기 위해서는 다양한 공통적인 데이터 마이닝 작업을 해결하는 방법을 알아야 하고, 문제를 이렇게 공통적인 작업들로 나눌 수 있어야.. 2021. 4. 15. [데이터사이언스개론] Data Science 수업 출처) 숙명여자대학교 소프트웨어학부 수업 "데이터사이언스개론", 박동철 교수님 1. Intro 데이터 사이언스는 다양한 형태로부터 얻은 데이터로 지식이나 인사이트를 도출하는 융합적인 학문이다. 크게 컴퓨터 사이언스, 수학과 통계학, 경영학적 지식이 요구된다. 데이터 엔지니어는 데이터를 다루기 위한 소프트웨어와 시스템을 디자인하고 개발한다. 프로그래밍과 데이터베이스 지식을 필요로 한다. 가장 중요한 것은 데이터를 분석하기 전 전처리하는 과정을 맡는다는 것이다. 통계학자는 통계학적 이론과 방법을 실생활에 적용하여 문제를 해결한다. 통계학과 수학적 지식을 필요로 한다. 데이터 사이언티스트는 쉽게 말해서 둘 다 하는 사람이다. 분석적이고 기술적인 능력을 통해서 데이터로부터 인사이트를 도출한다. 위에서 말했.. 2021. 4. 15. 이전 1 2 다음 반응형