본문 바로가기
728x90

전체 글133

[기계학습] 6. 군집화의 이해 군집화의 이해 (1)군집화는 기계학습에서 비지도 학습의 한 유형으로, 데이터 포인트들을 비슷한 특성을 가진 그룹으로 나누는 작업입니다. 이번 글에서는 군집화의 개요, 계층적 군집화와 분리형 군집화, K-평균 군집화에 대해 알아보겠습니다.군집화의 개요군집화(Clustering) : 군집화는 주어진 데이터 세트를 유사한 데이터 포인트의 그룹(군집)으로 분할하는 과정입니다. 각 군집은 데이터 포인트의 집합으로, 군집 내의 데이터는 서로 유사하고, 다른 군집의 데이터와는 상이한 특징을 가집니다. 목적데이터 구조 발견 : 데이터의 자연스러운 그룹을 식별하여 데이터의 구조를 이해합니다.차원 축소 : 고차원 데이터를 요약하여 간결한 표현을 제공합니다.이상 탐지 : 비정상적이거나 이상한 데이터 포인트를 식별합니다.적용.. 2024. 8. 6.
[기계학습] 5. KNN 알고리즘과 로지스틱 회귀모델 KNN 알고리즘KNN(K-Nearest Neighbors, K-최근접 이웃)은 가장 간단하면서도 효과적인 비모수(non-parametric) 분류 알고리즘 중 하나입니다. 이번 글에서는 Decision Theory의 이해, Non-parametric 모델의 이해, KNN 알고리즘의 이해에 대해 알아보겠습니다.Decision Theory의 이해Decision Theory : Decision Theory는 주어진 정보와 불확실성을 바탕으로 최적의 결정을 내리는 이론입니다. 이 이론은 다양한 분야에서 의사결정 문제를 해결하는 데 사용됩니다. 기본 개념결정 공간 : 가능한 모든 결정의 집합.손실 함수 : 특정 결정을 내렸을 때 발생하는 손실을 측정하는 함수.위험 함수 : 손실 함수의 기대값으로, 가능한 모든 결.. 2024. 8. 5.
[기계학습] 4. 분류의 이해, Naïve Bayes 분류의 이해분류는 기계학습의 중요한 분야로, 데이터를 미리 정의된 범주(클래스) 중 하나로 분류하는 작업입니다. 이번 글에서는 분류의 개요, 분류 모델링, 비선형 분류의 이해에 대해 알아보고, Naïve Bayes 분류기에 대해 자세히 살펴보겠습니다.분류의 개요분류 : 분류는 주어진 입력 데이터가 어느 클래스에 속하는지를 예측하는 작업입니다. 분류 문제의 목표는 미리 정의된 여러 클래스 중 하나를 예측하는 것입니다. 예제스팸 필터링 : 이메일이 스팸인지 아닌지 분류질병 진단 : 환자의 증상 데이터를 기반으로 질병을 진단 분류 문제는 크게 두 가지로 나눌 수 있습니다이진 분류 : 두 개의 클래스로 분류 (예 : 스팸/비스팸)다중 클래스 분류 : 세 개 이상의 클래스로 분류 (예 : 붓꽃 품종 분류)분류 모.. 2024. 8. 1.
[기계학습] 3. 회귀분석의 이해, 선형회귀모델 회귀분석의 이해회귀분석은 기계학습에서 가장 기본적이고 중요한 기법 중 하나로, 연속적인 변수를 예측하는 데 사용됩니다. 이번 글에서는 회귀분석의 개요, 선형회귀분석의 기본 이해, 경사하강법, 그리고 선형회귀모델의 파라미터 추정과 최소제곱법, 파라미터 구간추정과 가설 검정, 정규화 모델에 대해 알아보겠습니다.회귀분석의 개요회귀분석 : 회귀분석은 독립 변수와 종속 변수 사이의 관계를 모델링하는 기법입니다. 주로 예측 모델을 만들거나 변수들 간의 관계를 이해하는 데 사용됩니다. 회귀분석의 주요 목표는 데이터로부터 함수의 형태를 추정하여 새로운 데이터를 예측하는 것입니다. 종류단순 회귀분석 : 하나의 독립 변수와 하나의 종속 변수 간의 관계를 모델링합니다.다중 회귀분석 : 여러 독립 변수와 하나의 종속 변수 간.. 2024. 7. 31.
[기계학습] 2. 기계학습의 수학적 기초 기계학습의 수학적 기초 (1)기계학습은 데이터를 통해 학습하고 예측하는 과정을 수학적으로 모델링하는 기술입니다. 기계학습의 수학적 기초는 데이터의 표현, 선형대수, 확률과 통계, 최적화 이론 등을 포함합니다. 이번 글에서는 기계학습과 수학, 데이터의 표현, 선형대수에 대해 알아보겠습니다.기계학습과 수학기계학습의 핵심은 데이터를 수학적으로 분석하고, 이를 바탕으로 예측 모델을 만드는 것입니다. 이를 위해 다양한 수학적 기초가 필요합니다.선형대수 : 데이터의 표현과 변환을 이해하고, 기계학습 알고리즘을 구현하는 데 사용됩니다.확률과 통계 : 데이터의 분포와 불확실성을 이해하고, 모델의 성능을 평가하는 데 사용됩니다.최적화 이론 : 모델의 성능을 최적화하기 위해 비용 함수(cost function)를 최소화하.. 2024. 7. 30.
[기계학습] 1. 기계학습의 개요와 주요 유형 기계학습 개요기계학습은 인공지능(AI)의 하위 분야로, 컴퓨터가 명시적인 프로그래밍 없이도 데이터를 통해 학습할 수 있도록 하는 기술입니다. 이번 글에서는 인공지능, 기계학습, 딥러닝의 개요와 함께 기계학습의 주요 유형인 지도 학습, 비지도 학습, 강화 학습, 준지도 학습에 대해 알아보겠습니다.인공지능의 개요인공지능(AI)는 인간의 지능을 컴퓨터를 통해 구현하는 기술입니다. AI는 문제 해결, 학습, 추론, 자연어 처리 등을 포함하는 다양한 기능을 통해 인간의 지능적 행동을 모방합니다. AI의 궁극적인 목표는 인간처럼 사고하고 행동할 수 있는 시스템을 만드는 것입니다.기계학습의 개요기계학습(Machine Learning)은 데이터로부터 패턴을 학습하고, 이를 기반으로 예측이나 결정을 내리는 알고리즘을 개.. 2024. 7. 30.
728x90