본문 바로가기
반응형

전체 글83

[행렬] 직교성과 정사영 수업 출처) 숙명여자대학교 통계학과 "통계수학"수업, 윤재은 교수님 1. 직교벡터두 n차원 벡터 x, y에 대해서 x · y = 0일 때, x와 y는 서로 수직이다. 단위벡터는 벡터를 벡터의 노음(길이)으로 나눔으로써 만들 수 있다. norm = ||x|| = √(x ·x) 단위벡터 z = 1/||x|| x * 직교집합 : n차원 벡터 집합 S = {x₁, x₂, ..., xₚ} 에 속해있는 임의의 두 벡터가 서로 직교일 때,즉 모든 𝑖, 𝑗에 대해서 x𝑖' x𝑗 = 0 일 때, S를 직교집합이라고 한다. * 정규직교집합 : 직교집합 S에 속하는 모든 벡터가 단위벡터일 대,즉 ||x𝑖|| = 1일 때 S를 정규직교집합이라고 한다.- (ex) S = {(1 0 0)T, (0 1 0)T, (0 0 .. 2021. 4. 24.
[행렬] 벡터의 선형독립과 내적 수업출처) 숙명여자대학교 통계학과 '통계수학' 수업, 윤재은 교수님 1. n차원 벡터, 벡터합, 내적 - 스칼라 : 크기만 있고 방향을 가지지 않는 양- 벡터 : 크기와 방향 모두 가지고 있는 양 ** ℝⁿ 의 두 벡터 x = (x1, x2, ..., xn)' 과 y = (y1, y2, ..., yn)' 의 내적은x · y = Σ x𝑖 y𝑖 = x1y1 + ... + xnyn = xTy = yTx ** 벡터 x = (x1, x2, ..., xn)'의 길이 (노음, norm)은 ||x||로 표시하고, ||x|| = √(x · x) = √(Σx𝑖²) 이다. ** 두 벡터 x = (x1, x2, ..., xn)' 과 y = (y1, y2, ..., yn)' 사이의 거리d(x, y) = ||x - y|| .. 2021. 4. 24.
[데이터사이언스개론] Overfitting and Avoidance 수업 출처) 숙명여자대학교 소프트웨어학부 수업 "데이터사이언스개론", 박동철 교수님 1. Overfitting - 데이터 사이언스에서 가장 중요한 근본 개념 중 하나이다. - 모델을 만들 때 너무 flexible하게 만들면 모델이 특정한 데이터셋(훈련 데이터셋)에 너무 적합해진다. - 모델이 훈련 데이터셋을 넘어선 일반적인 데이터셋에는 잘 적용되지 않는 경우이다. - 모델은 새로운 데이터 개체도 잘 예측해야 한다. 2. 근본적인 부작용 - 더 복잡한 모델을 사용하면 정확도는 높아지겠지만, outfitting의 가능성 또한 높아진다. - 한번에 overfitting을 제거할 방법은 없다. - 가장 좋은 전략은 overfitting을 인지하고, 원칙적인 방법으로 복잡도를 조절하는 것이다. - fitting .. 2021. 4. 22.
[데이터사이언스개론] Fitting Model to data 수업 출처) 숙명여자대학교 소프트웨어학부 수업 "데이터사이언스개론", 박동철 교수님 1. Predictive Modeling - 다른 속성들을 통해서 타겟 속성의 값의 모형을 찾는 것이다. - Nonparametric modeling - 모델 모양이 정해져 있지 않은 모델이다 - 모델의 구조는 데이터로부터 결정된다. - (ex) classificaiton 'tree' - 가지의 수, 모양 등은 데이터를 통해서 알 수 있다. - Parametric modeling - 모델이 정해져 있다. - 모델의 구조는 데이터 분석가에 의해 지정된다. - (ex) linear classify - y = ax + b의 모양으로, 모양은 정해져 있으며 데이터로부터 파라미터인 a, b만 찾아낸다. 2. Nonparametri.. 2021. 4. 22.
[데이터사이언스개론] Predictive Modeling 수업 출처) 숙명여자대학교 소프트웨어학부 수업 "데이터사이언스개론", 박동철 교수님 1. Predictive Modeling 예측 모델 - 일반적인 절차 - training data를 가장 잘 표현하는 모델 설정 - 새로운 데이터에 모델 적용하여 결과 예측 - 아마 처음으로 classification을 생각할 것이다. - 새로운 데이터가 어느 클래스에 속할지 training dataset을 기반으로 확인한다. - (ex) 이 고객이 회사를 금방 떠날 것 같은가? → YES / NO 2. Model - 현실을 목적에 맞는 것만 남도록 간략하게 표현한 것이다. - 중요한 것과 중요하지 않은 것을 기반으로 간략화한다. - 부적절한 정보는 날리고 관련이 있는 데이터들만 남긴다. - (ex) 지도, 청사진 2-1.. 2021. 4. 21.
[자료구조] 탐색 수업 출처) 숙명여자대학교 소프트웨어학부 수업 "자료구조", 유석종 교수님 1. 탐색 - 다수의 레코드 집합에서 특정 키 값과 일치하는 레코드를 찾는 작업이다. - 레코드는 객체의 속성에 해당하는 필드들의 집합으로 표현된다. 2. 순차 탐색 - 정렬되지 않은 레코드들에 대해 조건에 맞는 목표 키를 찾을 때까지 순차적으로 비교를 반복하는 작업이다. - 정렬과 같은 요구 조건이 없어서 알고리즘은 단순하지만, 최상의 경우(1)와 최악의 경우(n) 탐색 성능에 큰 편차가 발생할 수 있다. - 레코드 수(n)가 클수록 탐색 시간이 많이 걸린다 - 순차 탐색 알고리즘의 평균 비교 횟수 : (n + 1) / 2 #include int seq_search(int num[], int key, int n); void ma.. 2021. 4. 20.
반응형