★구글 머신러닝 crash course 정리 Part 2(특성 교차, L1 정규화, L2 정규화, 원-핫 인코딩)★

Part 1에 이어서 구글 머신러닝 crash course를 정리하려고 한다. 그럼 시작~~ 과적합(over fitting)의 위험성 데이터를 과적합한다면 오히려 정확도가 떨어지는 모델을 만들게 된다. 과적합에 유의하자! 학습 데이터와 테스트 데이터로 데이터 분할하기 학습데이터와 검증 데이터와 테스트 데이터로 데이터 분할하기 : 과적합 가능성을 줄입니다! Feature Engineering, feature 다듬기, 실데이터 다듬기 더 정확한 모델을 만드는데 기초가 되는 것은 feature을 다듬고 정확한 … Read more

‘인간은 양 떼와 같다’ 르네 지라르가 세계적 투자자인 피터 틸에게 준 영향

우리는 다른 사람들이 원하는 것을 원한다. -<르네 지라르> 피터 틸은 2022년 11월 기준 추정 6조원의 자산을 가진, 세계에서 617번째로 부유한 미국인이다. 피터 틸은 온라인 결제 서비스 회사인 페이팔(Paypal)의 공동 창업자이자 벤쳐 캐피탈 파운더즈 펀드(Founders Fund), 빅데이터 기업인 팔란티어(Palantir)를 창업했는데 그의 성공은 그의 첫 회사인 페이팔부터 시작되어 지금까지 큰 굴곡 없이 이어져왔다. 손대는 것마다 성공하는 이런 … Read more

텐서플로우 Linear Regression 예시 설명 Part 2(실데이터)

실데이터(Real Data)를 이용한 Linear Regression 저번 시간에는 합성 데이터를 이용한 Linear Regression 예시를 알아봤는데 오늘은 실데이터를 이용한 Linear Regression 예시를 알아보겠다. 머신러닝에 필요한 라이브러리 가져오기(import) + 데이터 출력 조건 설정 import pandas as pd #pandas는 데이터 분류/네이밍을 위한 라이브러리.import tensorflow as tf #tensorflow는 딥러닝을 하는데 사용하는 라이브러리.from matplotlib import pyplot as plt #matplotlib는 데이터로 그래프를 그리는데 사용되는 라이브러리.pd.options.display.max_rows = 10 #출력 시 최대 10줄까지 가능pd.options.display.float_format = “{:.1f}”.format #데이터를 소수점 한자리까지 가능하도록 설정 csv파일에 있는 … Read more

텐서플로우 Linear Regression 예시 설명 Part 1(합성 데이터)!

합성 데이터(Synthetic Data)를 이용한 Linear Regression(*합성데이터 = 실제 데이터가 아닌 컴퓨터가 만든 데이터) 머신러닝에 사용할 라이브러리 가져오기(import) import pandas as pd #pandas는 데이터 분류/네이밍을 위한 라이브러리.import tensorflow as tf #tensorflow는 딥러닝을 하는데 사용하는 라이브러리.from matplotlib import pyplot as plt #matplotlib는 데이터로 그래프를 그리는데 사용되는 라이브러리. 데이터를 학습시킬 모델 만들기 def build_model(my_learning_rate): #학습할 모델을 만드는 functionmodel = tf.keras.models.Sequential() #Sequential한 빈 모델을 만듦model.add(tf.keras.layers.Dense(units=1,input_shape=(1,))) #모델에 하나의 뉴런을 가진 hidden layer 형성model.compile(optimizer=tf.keras.optimizers.RMSprop(lr=my_learning_rate),loss=”mean_squared_error”,metrics=[tf.keras.metrics.RootMeanSquaredError()]) #모델의 학습방식 설정return model #학습한 모델 가져옴 <Keypoint> … Read more

Batch Size 정리 이걸로 끝!

Batch Size : Number of samples that will be passed through to the network at one time-> 한번에 신경망에 들어가는 데이터 양 (데이터 양이 방대하면 신경망 모델에 데이터를 다 넣기 어렵기 때문에 쪼개서 넣음) Epoch : One single pass of all the data through to the network-> 모든 데이터가 신경망에 다 들어가서 모델이 그 모든 데이터를 몇번 학습하는지 (그 … Read more