★구글 머신러닝 crash course 정리 3탄(로지스틱 회귀, 분류 임계값, 신경망)★

바로 시작합니다~(2탄은 여기, 1탄은 여기에) 로지스틱 회귀, 분류 임계값 정하기 2탄에서 로지스틱 회귀를 알아봤는데 이어서 써보겠다. 로지스틱 회귀는 결과적으로 확률을 label로 내놓는다. 그리고 이 확률은 바이너리 값(참/거짓)으로 변환될 수 있다. 메일이 스팸일 확률이 0.00023이라면 그 광고가 스팸이라고 말할 수 있다. 근데 만약 메일이 스팸일 확률이 0.6이라면 어떨까? 그 메일은 스팸일까 아닐까? 그냥 쉽게 쉽게 0.5 이상이면 … Read more

★구글 머신러닝 crash course 정리 Part 2(특성 교차, L1 정규화, L2 정규화, 원-핫 인코딩)★

Part 1에 이어서 구글 머신러닝 crash course를 정리하려고 한다. 그럼 시작~~ 과적합(over fitting)의 위험성 데이터를 과적합한다면 오히려 정확도가 떨어지는 모델을 만들게 된다. 과적합에 유의하자! 학습 데이터와 테스트 데이터로 데이터 분할하기 학습데이터와 검증 데이터와 테스트 데이터로 데이터 분할하기 : 과적합 가능성을 줄입니다! Feature Engineering, feature 다듬기, 실데이터 다듬기 더 정확한 모델을 만드는데 기초가 되는 것은 feature을 다듬고 정확한 … Read more

텐서플로우 Linear Regression 예시 설명 Part 2(실데이터)

실데이터(Real Data)를 이용한 Linear Regression 저번 시간에는 합성 데이터를 이용한 Linear Regression 예시를 알아봤는데 오늘은 실데이터를 이용한 Linear Regression 예시를 알아보겠다. 머신러닝에 필요한 라이브러리 가져오기(import) + 데이터 출력 조건 설정 import pandas as pd #pandas는 데이터 분류/네이밍을 위한 라이브러리.import tensorflow as tf #tensorflow는 딥러닝을 하는데 사용하는 라이브러리.from matplotlib import pyplot as plt #matplotlib는 데이터로 그래프를 그리는데 사용되는 라이브러리.pd.options.display.max_rows = 10 #출력 시 최대 10줄까지 가능pd.options.display.float_format = “{:.1f}”.format #데이터를 소수점 한자리까지 가능하도록 설정 csv파일에 있는 … Read more

텐서플로우 Linear Regression 예시 설명 Part 1(합성 데이터)!

합성 데이터(Synthetic Data)를 이용한 Linear Regression(*합성데이터 = 실제 데이터가 아닌 컴퓨터가 만든 데이터) 머신러닝에 사용할 라이브러리 가져오기(import) import pandas as pd #pandas는 데이터 분류/네이밍을 위한 라이브러리.import tensorflow as tf #tensorflow는 딥러닝을 하는데 사용하는 라이브러리.from matplotlib import pyplot as plt #matplotlib는 데이터로 그래프를 그리는데 사용되는 라이브러리. 데이터를 학습시킬 모델 만들기 def build_model(my_learning_rate): #학습할 모델을 만드는 functionmodel = tf.keras.models.Sequential() #Sequential한 빈 모델을 만듦model.add(tf.keras.layers.Dense(units=1,input_shape=(1,))) #모델에 하나의 뉴런을 가진 hidden layer 형성model.compile(optimizer=tf.keras.optimizers.RMSprop(lr=my_learning_rate),loss=”mean_squared_error”,metrics=[tf.keras.metrics.RootMeanSquaredError()]) #모델의 학습방식 설정return model #학습한 모델 가져옴 <Keypoint> … Read more

Batch Size 정리 이걸로 끝!

Batch Size : Number of samples that will be passed through to the network at one time-> 한번에 신경망에 들어가는 데이터 양 (데이터 양이 방대하면 신경망 모델에 데이터를 다 넣기 어렵기 때문에 쪼개서 넣음) Epoch : One single pass of all the data through to the network-> 모든 데이터가 신경망에 다 들어가서 모델이 그 모든 데이터를 몇번 학습하는지 (그 … Read more