< 개발자를 위한 필수 수학 > | 토머스 닐드 지음 | 박해선 지음
이 책은 개발자가 알아야 하는 데이타 과학에 필수적인 수학 지식을 자세히 설명하고 있다. 이농지능 관련한 기술때문에 다양한 수학적인 배경이 필요하게 되었고, 이를 수학적으로 설명하는 책이 많이 나와 있다. 하지만 머신러닝 관련한 수학 개념은 시작부터 너무 어려워 제대로 이해하기가 너무 어렵다는 느낌을 많이 받았다. 기초적인 수학 개념이 배제된, 통계 및 분석에 관련된 깊이 있는 개념 위주로 설명이 되다보니 한번에 그 개념을 이해하고 파악하는데는 무리가 있다는 느낌을 많이 받은 것 같다.
이 책은 기초수학 개념부터 시작을 한다. 간략하게 설명하고 넘어가기는 하지만 정수론과 연산, 함수 등에서 부터 출발해서 극한, 미분, 적분을 1장에서 간략하게 다룬다. 이 개념만 이해하더라도 수에 대한 기본적인 개념을 다시 파악할 수 있는 지식을 얻을 수 있다고 본다. 이 후에는 확률과 통계에 대해 구체적으로 다루며, 벡터와 행렬을 포함한 선형대수학 개념을 설명함으로써 이후 이어지는 데이타 분석을 위한 핵심 개념을 미리 파악할 수 있도록 해 놓았다.
5장부터는 데이타 분석에서 사용하는 다양한 기법을 본격적으로 설명한다. 관측된 데이터 포인트를 통과하는 직선을 그려서 두 개 이상의 변수 간의 관계를 보여주는 것이 가장 실용적인 기법 중의 하나이다. 회귀는 관측 데이터에서 어떤 함수를 훈련한 다음 새로운 데이터에 대한 예측을 만드는 방법이며, 선형 회귀는 관측 데이터에 맞는 직선을 훈련하는 것이다. 이를 통해 변수 간의 선형 관계를 보여주고 새로운 데이터에 대한 예측을 만들 수 있다. 6장에서는 하나 이상의 독립 변수가 주어졌을 때 결과의 확률을 예측하는 로지스틱 회귀에 대해 소개한다. 로지스틱 회귀는 선형 회귀처럼 실수를 예측하는 것이 아니라 범주를 예측하는 분류 알고리즘으로 이해하면 된다. 로지스틱 회귀는 구현하기 쉽고 이상치와 기타 데이터 문제에 상당히 탄력적이기 때문에 많은 머신러닝 문제를 해결할 수 있고 다른 유형의 지도 학습보다 실용성과 성능이 뛰어나다고 볼 수 있다.
마지막 7장에서는 신경망에 대해 설명한다. 신경망은 지난 10년간 르네상스를 누려온 회귀 및 분류 기법이다. 신경망은 입력 변수와 출력 변수 사이에 가중치, 편향, 비선형 함수로 이루어진 층을 쌓아 구성하며, 특히 딥러닝은 신경망의 한 종류로써 가중치의 편향을 가진 노드로 구성된 여러 개의 은닉 층을 사용하는 기법이다. 신경망을 통해 이전에 컴퓨터로 해결하기 어려웠던 문제에 대해 흥미있는 해결책을 다양하게 제시할 수 있게 되었다.
이 책을 통해 인공지능에 필요한 다양한 수학적 지식을 습득할 수 있을 뿐만 아니라 파이썬 코드와 라이브러리를 사용하여 수학 개념을 파악해 볼 수 있다. 또한 데이타 과학 경력을 쌓기 위한 방법과 진로 제언까지 포함하고 있어서 막연히 생각만 하고 있던 경력 목표를 다시 파악하고 구체화시킬 수 있는 정보를 제공하고 있다. 이런 면에서 이 책은 보다 현실적으로 도움이 되는 수학적 지식과 경력 목표를 바라볼 수 있는 유용한 정보를 제공한다고 생각한다.
"한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."
'꿈꾸는 책들의 도시' 카테고리의 다른 글
[인문] 나를 채우는 하루지식습관(2권 나아가기) (0) | 2024.06.26 |
---|---|
[인문] 나를 채우는 하루지식습관(1권 홀로서기) (0) | 2024.06.26 |
[자기계발] 뇌를 위한 최소한의 습관 (0) | 2024.05.31 |
[IT] 더 나은 프로그래머 되는 법 (0) | 2024.05.26 |
[자기계발] 카피의 격 (0) | 2024.05.17 |