대학교 수업/AI 실무 특강 (방학특강)

2.1 ANN의 이해 _ 인공 신경망 이해하기

kicdor 2024. 9. 6. 01:47
반응형

1.0 학습 목표, 키워드

1) 학습 목표

: 인공 신경망을 이용한 딥러닝 기초 지식

 

 

2) 키워드

- 퍼셉트론 (인공 뉴런) (ANN, Artifitial Neural Network)

: 입력값, 가중치, 편향을 이용하여 출력값을 내는 수학적 모델 ( = 함수)

(직선의 방정식을 다차원으로 확장한 수학적 모델)

 

- 활성화 함수 (activation function)

: 뉴런의 출력을 다음 뉴런으로 넘길지 정하는 함수

 

- 손실 함수 (loss function = error function)

 : 신경망의 예측과 정답의 차이를 나타내는 함수 ( = (y hat - y)^2 = |y hat = y| )

 

 


2.1 퍼셉트론

1) 사람 뇌 vs 컴퓨터

(1) 사람 뉴런의 구성

: 사람 뇌는 10^11개 가량의 뉴런이 있음. 각 뉴런마다 1000개 가량의 연결을 함. (고도의 병렬 처리기)

(가지 돌기에 입력 >> 세포체에서 연산 및 처리 >> 축삭돌기로 처리된 정보 전달 >> 축삭말단에서 출력 >> 다른 가지돌기)

출처 - 네이버 지식백과(뉴런)

- 뉴런 (neuron) 

: 뇌의 정보처리 단위. 

 

- 세포체 (soma = cell body)

: 연산을 수행.

 

- 축삭 (axon) 

: 처리한 정보를 다른 뉴런에 전달.

 

- 수상돌기 ( = 가지돌기) (dendrite)

 : 다른 뉴런으로부터 정보를 받음.

 

 

(2) 폰 노이만 컴퓨터

: 아주 빠른 순차 명령어 처리기

(메모리 데이터 읽음>> 버스 데이터 전달 >> CPU 연산처리 >> 버스 데이터 전송 >> 메모리 쓰기 실행)   

출처 - 네이버 지식백과 (폰 노이만 컴퓨터)

 

- 중앙처리장치 (CPU)

: 제어장치 + 산술논리 장치.  연산을 함. 

 

- 메모리 (memory)

: 데이터를 읽고 (read), 씀 (write).

 

- 버스 (bus)
: 속도가 비교적 느린 통로. 버스를 통해 데이터 전달.

 

 

2) 퍼셉트론 (Perceptron) (perception + electron)

(1) 퍼셉트론 동작원리

출처 - ≪텐초의 파이토치 딥러닝 특강≫

- 입력층 (input)

: node (x1, x2) 입력. 보통 벡터로 표현됨. 

 

- 가중치 (weight)
: 얼마만큼 연결성이 강한지.

 

- 시그마

: w1x1 +w2x2 + b  를 계산.

 

+) b (bias)

: 편향.  y 절편.

 

- 활성화 함수 F (activation function)

 : 출력값을 다음 퍼셉트론으로 넘길지 / 얼마만큼 넘길지에 대한 여부를 결정하는 함수.  (결정경계, decision boundary)

입력값에 따라 임곗값(0,1)을 기준으로 출력값을 결정하는 함수. (보다 작으면 0으로, 1보다 크면 1로 출력).

출처 - 유튜브 - 신박Ai (https://www.youtube.com/@phdshinAI)

 

출처 - 블로그(https://velog.io/@chlwlsgh93) (인공신경망 ANN 이해하기)

(분류에 사용할 수 있다)

(일단은 이렇게만 이해) 

+) 원하는 형태에 맞춰서 전체적으로 큰 변화 (찌그러뜨린다)를 주기 위해 사용. >> 층을 이루게 해줌. 

+) 시그마로 연산된 가중합 (x1*w1 + x2*w2 + b )을 받아서 처리. >>  F(x1*w1 + x2*w2 + b) 

 

+) 직선의방정식 ( y = ax + b )

:  시그마 연산값 ( y = w1x1 + b )과 동일

 

 

(2) 퍼셉트론, 인공 뉴런, 인공 신경망

- 인공 뉴런 (ANN)

: 퍼셉트론 = 인공 뉴런. 인간의 뇌세포를 수학적으로 표현한 알고리즘.

 

- 인공 신경망

: 퍼셉트론을 이용해 만든 모든 구조물.

 

- 단층 신경망

: 퍼셉트론 하나 사용. (1958,   로젠 블랫이 제시) 

 

- 다층 신경망 

: 퍼셉트론 여러 개 사용


2.2 다층 신경망으로 단층 신경망 한계 극복하기

: 단층 퍼셉트론이 선형이기 때문에, XOR연산 불가능.

(선형 >> 직선을 하나 그어야함 >> XOR은 2차원에서 직선 하나로 표현 불가능)

(인공지능의 1차 겨울이 온 결정적인 계기가 됨)

(직선이 안 그어짐) 출처-기상기후강의노트-(https://aeir.tistory.com/)

 

+) XOR 연산 (exclusive)

: 다음과 같이 입출력 되는 연산.  (x1과 x2가 같으면 0, 다르면1).

트렌지스터를 가장 적게 사용해서 만들 수 있는 논리구조.

출처 - 기상기후의강의노트 - (https://aeir.tistory.com)

반응형