본문 바로가기

전체 글

(33)
Google ML - 3) ML 전환하기 : 학습 및 손실 모델을 학습시킨다는 것은 단순히 말하자면 라벨이 있는 데이터로부터 올바른 가중치와 편향값을 학습(결정)하는 것입니다. 지도 학습(supervised learning)에서 머신러닝 알고리즘은 다양한 예를 검토하고 손실을 최소화 하는 모델을 찾아봄으로써 모델을 만들어내는데, 이 과정을 경험적 위험 최소화라고 합니다. 손실은 잘못된 예측에 대한 벌점입니다. 즉, 손실은 한 가지 예에서 모델의 예측이 얼마나 잘못되었는지를 나타내는 수입니다. 모델의 예측이 완벽하면 손실은 0이고, 그렇지 않으면 손실은 그보다 커집니다. 모델 학습의 목표는 모든 예에서 평균적으로 작은 손실을 갖는 가중치와 편향의 집합을 찾는 것입니다. 예를 들어 그림 3에서 왼쪽은 손실이 큰 모델이고 오른쪽은 손실이 작은 모델입니다. 그림에 관해..
Google ML - 3) ML 전환하기 : 선형회귀 오랫동안 귀뚜라미는 시원한 날보다 더운 날 더 자주 우는 것으로 알려져 왔습니다. 전문가 및 아마추어 곤충 학자들이 수십 년에 걸쳐서 1분당 귀뚜라미가 우는 횟수와 온도에 관한 데이터를 목록으로 작성했습니다. 고모가 생일 선물로 두 특성의 관계를 예측하는 모델을 학습시켜 보라고 아끼던 귀뚜라미 데이터베이스를 줬다고 해 봅시다. 올바른 첫 번째 단계는 데이터를 그래프로 만들어 검토하는 것입니다. 그림 1. 1분당 우는 횟수 및 섭씨온도 예상대로 그래프를 통해 우는 횟수가 증가할수록 온도가 올라가는 것을 확인했습니다. 우는 횟수와 온도는 선형 관계일까요? 네. 이 관계를 근사치로 하는 다음과 같은 하나의 직선을 그릴 수 있습니다. 그림 2. 선형 관계 사실 선이 모든 점을 완벽하게 통과하지는 않지만, 선은 ..
Google ML - 3) ML 전환하기 선형 회귀 ☞ 점 집합에 가장 잘 맞는 직선 또는 초평면을 찾기 위한 방법 이 모듈에서는 선형 회귀를 직관적으로 탐구한 후 선형 회귀에 대한 머신러닝적 접근 방식의 기초를 다집니다. 학습목적 선형 회귀에 관한 지식을 상기합니다. 머신러닝에서의 가중치와 편향이 선형 회귀에서의 기울기 및 오프셋과 어떤 관계를 갖는 지 설명합니다. '손실'의 일반적인 개념과 그 중 특별히 제곱 손실에 대해 설명합니다. 동영상 강의 말씀드렸듯이, Google 모델은 데이터를 통해 학습시킵니다. 여기에는 복잡한 모델 유형도 많고 데이터를 학습할 수 있는 흥미로운 방식도 많죠. 하지만 일단 아주 쉽고 친숙한 방식으로 시작해서 좀 더 복잡한 방식으로 넘어가도록 하겠습니다. 첫 번째 데이터 모델을 학습시켜 볼까요? 간단한 데이터 세트..
Google ML - 2) ML 문제로 표현하기 (주요 ML 용어) ( 지도 supervised ) 머신러닝이란 무엇인가요? 간단히 말하면 다음과 같습니다. ML시스템은 입력을 결합하여 이전에 본 적이 없는 데이터를 적절히 예측하는 방법을 학습합니다. 기본적인 머신러닝 용어를 살펴보겠습니다. 1. 라벨 ( label ) 라벨은 예측하는 항목입니다(단순 선형 회귀의 y 변수). 밀의 향후 가격, 사진에 표시되는 동물의 종류, 오디오 클립의 의미 등 무엇이든지 라벨이 될 수 있습니다. 2. 특성 ( feature ) 특성은 입력 변수입니다(단순 선형 회귀의 x 변수). 간단한 머신러닝 프로젝트에서는 특성 하나를 사용하지만 복잡한 머신러닝 프로젝트에서는 다음과 같이 수백만 개의 특성을 사용할 수 있습니다. 스팸 감지 예에는 다음과 같은 특성이 포함될 수 있습니다. 이메일 텍스..
Google ML - 2) ML 문제로 표현하기 TensorFlow API를 이용한 머신러닝 단기집중과정 - D. Sculley 본격적으로 시작하기 전에 잠시 시간을 내어 이 강의에서 이야기할 기본 프레임워크를 다시 떠올려 보겠습니다. 그리고 그 기본 프레임워크는 지도 머신러닝입니다. 지도 머신러닝(supervised machine learning)에서는 입력을 결합하여 모델을 만들고 이전에 보지 못한 데이터도 적절히 예측하는 방법을 배웁니다. 이제 해당 모델을 학습시킬 때 라벨(label)을 제공합니다. 예를 들어 이메일 스팸 필터링의 경우 그 라벨은 '스팸 또는 스팸 아님' 정도가 될 수 있겠죠. 이것이 우리가 예측하려는 타겟입니다. 특성(feature)은 데이터를 표현하는 방식입니다. 따라서 특성은 예를 들면 이메일에 포함된 단어, 발신 및 수신..
Google ML - 1) ML 소개 [ Google - Peter Norvig ] 머신러닝 단기집중과정에 참여하시게 된 것을 환영합니다. 이 과정은 여러분을 숙련된 머신러닝 전문가가 되기 위한 길로 안내하기 위해 제작되었습니다. 여기에서 배운 내용을 활용하면 소프트웨어 엔지니어로서 세 가지를 더 잘할 수 있을 것입니다. 먼저 프로그래밍 시간을 줄일 수 있는 도구를 얻게 됩니다. 맞춤법 오류를 수정하는 프로그램을 설계한다고 가정해보겠습니다. 다양한 예시와 경험을 활용해서 방법을 찾을 수 있을 겁니다. 예를 들면 C 뒤에 있을 때를 제외하고 E 앞에 I가 오는 경우를 잡습니다. 그렇게 몇 주 동안 열심히 일하면 쓸만한 프로그램이 나올 겁니다. 아니면 바로 쓸 수 있는 머신러닝 도구를 사용해서 몇 가지 예를 입력하면 짧은 시간에 더 안정적인 프..
당신이 가난한 이유 : 댄 페냐 You are who you hang around with 당신이 어울리는 사람들이 바로 당신 자체입니다. Show me your friends 당신의 친구들을 보여주세요 then I will show your future 그럼 제가 당신의 미래를 보여주겠습니다. Self-esteem is the form of self-confidence 자존감은 자신감의 일종이죠. It's a form of self-awareness 또한 자기 인식의 일종이기도 합니다. So the self-esteem is the bedrock of high performance 즉, 자존감이 바로 성공을 위한 초석입니다. It's the bedrock of everything 자존감이 모든 것의 초석입니다. And it's the..
[Python] Pandas 100 Tricks 3, 4 1) 2021/01/13 - [데이터 - 분석/Python] - [Python] Pandas 100 Tricks 1, 2 Trick 3 : Add a prefix or suffix to all columns df df.add_prefix("1_") df.add_suffix("_Z") Trick 4 : Add a prefix or suffix to all columns df df.add_prefix("1_") df.add_suffix("_Z") ▶