선형 회귀 (Linear Regression)
의미:
선형 회귀는 종속 변수와 하나 이상의 독립 변수 사이의 선형적인 관계를 모델링하는 가장 기본적인 회귀 분석 기법입니다. 간단히 말해, 주어진 독립 변수(들)의 값을 기반으로 종속 변수의 값을 예측하는 데 사용됩니다. 모델은 독립 변수와 종속 변수 사이의 최적의 직선(또는 고차원에서는 초평면)을 찾아 데이터를 가장 잘 설명하려고 합니다.
수식:
단순 선형 회귀 (독립 변수가 하나인 경우):
- : 종속 변수 (예측하고자 하는 값)
- : 독립 변수 (예측에 사용되는 값)
- : 가중치 (기울기), 독립 변수가 종속 변수에 미치는 영향의 크기
- : 편향 (절편), 독립 변수가 0일 때 종속 변수의 값
다중 선형 회귀 (독립 변수가 여러 개인 경우):
언제 사용:
- 변수 간의 선형적인 관계가 있다고 가정할 수 있을 때: 예를 들어, 광고 지출과 매출, 공부 시간과 시험 점수 등.
- 예측 변수와 목표 변수 간의 관계를 이해하고 싶을 때: 각 독립 변수가 종속 변수에 얼마나 영향을 미치는지 파악할 수 있습니다.
- 비교적 간단한 문제: 데이터의 복잡성이 낮고, 비선형적인 패턴이 뚜렷하지 않은 경우 효과적입니다.
- 빠른 모델링 및 해석이 필요할 때: 모델이 단순하여 학습 속도가 빠르고, 결과를 직관적으로 해석하기 쉽습니다.
- 기준 모델(Baseline Model)로 사용할 때: 더 복잡한 모델의 성능을 비교하는 기준으로 활용될 수 있습니다.
심층 신경망 (Deep Neural Network, DNN)
의미:
심층 신경망은 인간의 신경망에서 영감을 받은 **여러 계층(layer)**으로 구성된 인공 신경망입니다. 각 계층은 여러 개의 **노드(node) 또는 뉴런(neuron)**으로 이루어져 있으며, 각 노드는 이전 계층의 노드로부터 입력을 받아 비선형 함수(활성화 함수)를 거쳐 다음 계층으로 출력을 전달합니다. "심층(deep)"이라는 용어는 여러 개의 숨겨진 계층을 가지고 있다는 것을 의미합니다. 이러한 다층 구조와 비선형 활성화 함수를 통해 DNN은 매우 복잡하고 비선형적인 관계를 학습할 수 있습니다.
구조:
일반적인 DNN 구조는 다음과 같습니다.
- 입력층 (Input Layer): 입력 데이터를 받아들이는 계층입니다.
- 숨겨진 층 (Hidden Layers): 입력층과 출력층 사이에 위치하는 여러 개의 계층입니다. 각 계층은 이전 계층으로부터 특징(feature)을 추출하고 변환하는 역할을 합니다. DNN의 "깊이"는 이러한 숨겨진 층의 개수로 결정됩니다.
- 출력층 (Output Layer): 최종 예측 결과를 출력하는 계층입니다. 회귀 문제에서는 연속적인 값을, 분류 문제에서는 클래스 확률 등을 출력합니다.
언제 사용:
- 변수 간의 복잡하고 비선형적인 관계가 존재할 때: 이미지 인식, 음성 인식, 자연어 처리 등과 같이 데이터에 복잡한 패턴이 숨겨져 있는 경우에 강력한 성능을 발휘합니다.
- 대규모 데이터셋을 이용할 수 있을 때: DNN은 많은 양의 데이터를 통해 복잡한 패턴을 효과적으로 학습할 수 있습니다.
- 자동 특징 추출(Automatic Feature Extraction)이 필요할 때: DNN은 데이터로부터 유용한 특징을 스스로 학습하므로, 사람이 직접 특징을 설계하는 수고를 덜 수 있습니다.
- 높은 예측 성능이 요구될 때: 복잡한 문제를 모델링하는 능력 덕분에 선형 회귀보다 훨씬 높은 예측 정확도를 달성할 수 있습니다.
- 다양한 유형의 데이터 처리: 이미지, 텍스트, 음성, 시계열 데이터 등 다양한 형태의 데이터를 처리하는 데 적합한 다양한 구조(CNN, RNN 등)를 가지고 있습니다.
간단 요약:
특징선형 회귀 (Linear Regression)심층 신경망 (Deep Neural Network, DNN)
| 관계 | 선형적 (직선) | 비선형적 (매우 복잡한 패턴) |
| 복잡성 | 낮음 | 높음 |
| 데이터 요구량 | 비교적 적음 | 많음 |
| 특징 추출 | 수동 설계 | 자동 학습 |
| 해석력 | 높음 (가중치의 의미가 직관적) | 낮음 (블랙박스 모델) |
| 학습 속도 | 빠름 | 느림 (특히 깊고 큰 모델) |
| 사용 시기 | 선형적 관계, 간단한 문제, 빠른 모델링 | 비선형적 관계, 복잡한 문제, 대규모 데이터, 높은 성능 |
'공부 > Google AI' 카테고리의 다른 글
| Hyperparameter (0) | 2025.04.14 |
|---|---|
| 6.5 Gemini와 BigQuery로 데이터 잠재력을 깨우고 AI 여정을 시작하세요! (0) | 2025.04.13 |
| 6.4 데이터 캔버스: 시각적 워크플로우로 데이터 프로젝트를 디자인하고 협업하기 (0) | 2025.04.13 |
| 6.3 Gemini와 BigQuery로 더욱 스마트하게 코딩하기: 개발, 설명, 디버깅 마스터 (1) | 2025.04.12 |
| 6.2 Gemini와 BigQuery로 데이터 탐색 및 준비 마스터하기 (0) | 2025.04.12 |