AI – 비현실적 개발자

★구글 머신러닝 crash course 정리 3탄(로지스틱 회귀, 분류 임계값, 신경망)★

2023-02-172022-11-10 by Developer Bo

바로 시작합니다~(2탄은 여기, 1탄은 여기에) 로지스틱 회귀, 분류 임계값 정하기 2탄에서 로지스틱 회귀를 알아봤는데 이어서 써보겠다. 로지스틱 회귀는 결과적으로 확률을 label로 내놓는다. 그리고 이 확률은 바이너리 값(참/거짓)으로 변환될 수 있다. 메일이 스팸일 확률이 0.00023이라면 그 광고가 스팸이라고 말할 수 있다. 근데 만약 메일이 스팸일 확률이 0.6이라면 어떨까? 그 메일은 스팸일까 아닐까? 그냥 쉽게 쉽게 0.5 이상이면 … Read more

★구글 머신러닝 crash course 정리 Part 2(특성 교차, L1 정규화, L2 정규화, 원-핫 인코딩)★

2023-02-172022-11-09 by Developer Bo

Part 1에 이어서 구글 머신러닝 crash course를 정리하려고 한다. 그럼 시작~~ 과적합(over fitting)의 위험성 데이터를 과적합한다면 오히려 정확도가 떨어지는 모델을 만들게 된다. 과적합에 유의하자! 학습 데이터와 테스트 데이터로 데이터 분할하기 학습데이터와 검증 데이터와 테스트 데이터로 데이터 분할하기 : 과적합 가능성을 줄입니다! Feature Engineering, feature 다듬기, 실데이터 다듬기 더 정확한 모델을 만드는데 기초가 되는 것은 feature을 다듬고 정확한 … Read more

텐서플로우 Linear Regression 예시 설명 Part 2(실데이터)

2023-02-092022-11-08 by Developer Bo

실데이터(Real Data)를 이용한 Linear Regression 저번 시간에는 합성 데이터를 이용한 Linear Regression 예시를 알아봤는데 오늘은 실데이터를 이용한 Linear Regression 예시를 알아보겠다. 머신러닝에 필요한 라이브러리 가져오기(import) + 데이터 출력 조건 설정 import pandas as pd #pandas는 데이터 분류/네이밍을 위한 라이브러리.import tensorflow as tf #tensorflow는 딥러닝을 하는데 사용하는 라이브러리.from matplotlib import pyplot as plt #matplotlib는 데이터로 그래프를 그리는데 사용되는 라이브러리.pd.options.display.max_rows = 10 #출력 시 최대 10줄까지 가능pd.options.display.float_format = “{:.1f}”.format #데이터를 소수점 한자리까지 가능하도록 설정 csv파일에 있는 … Read more

텐서플로우 Linear Regression 예시 설명 Part 1(합성 데이터)!

2023-02-092022-11-07 by Developer Bo

합성 데이터(Synthetic Data)를 이용한 Linear Regression(*합성데이터 = 실제 데이터가 아닌 컴퓨터가 만든 데이터) 머신러닝에 사용할 라이브러리 가져오기(import) import pandas as pd #pandas는 데이터 분류/네이밍을 위한 라이브러리.import tensorflow as tf #tensorflow는 딥러닝을 하는데 사용하는 라이브러리.from matplotlib import pyplot as plt #matplotlib는 데이터로 그래프를 그리는데 사용되는 라이브러리. 데이터를 학습시킬 모델 만들기 def build_model(my_learning_rate): #학습할 모델을 만드는 functionmodel = tf.keras.models.Sequential() #Sequential한 빈 모델을 만듦model.add(tf.keras.layers.Dense(units=1,input_shape=(1,))) #모델에 하나의 뉴런을 가진 hidden layer 형성model.compile(optimizer=tf.keras.optimizers.RMSprop(lr=my_learning_rate),loss=”mean_squared_error”,metrics=[tf.keras.metrics.RootMeanSquaredError()]) #모델의 학습방식 설정return model #학습한 모델 가져옴 <Keypoint> … Read more

Batch Size 정리 이걸로 끝!

2023-02-052022-11-06 by Developer Bo

Batch Size : Number of samples that will be passed through to the network at one time-> 한번에 신경망에 들어가는 데이터 양 (데이터 양이 방대하면 신경망 모델에 데이터를 다 넣기 어렵기 때문에 쪼개서 넣음) Epoch : One single pass of all the data through to the network-> 모든 데이터가 신경망에 다 들어가서 모델이 그 모든 데이터를 몇번 학습하는지 (그 … Read more