도서 IT전문서/IT입문서 데이터베이스/데이터분석

확률과 통계, 어렵나요? 곰곰이 생각하면 이해할 수 있습니다!

확률과 통계를 공부한다고 하면 보통 산술적으로 어떻게 계산하는지, 활용 분야에 어떻게 사용하는지를 배웁니다. 이러한 학습 방법이 오히려 더 어렵지 않았나요? 기초 없이 응용에 도전하는 것은 겉모습만 이해하려는 것과 같습니다. 들어가는 노력 대비 효과가 적지요.

이 책은 확률과 통계를 정면으로 마주하고, 현재 확률론의 토대가 되는 본격적인 견해를 제시합니다. 이 견해에 의해 확률과 통계의 여러 가지 이야기가 매우 일목요연해집니다. 잘 따라올 수 있도록 다양한 방법으로 끈질기게 설명하므로 해당 값이 무엇을 의미하는지, 이 수식은 왜 이렇게 되는지 차근차근 이해할 수 있습니다.

 

특별하고 유일무이한 확률 통계 입문서

이 책은 확률과 통계의 기초를 탄탄히 다질 수 있는 입문서입니다. 지금까지 보지 못했던 방법으로 확률과 통계에 입문해 기초 개념을 이해하고, 다룰 수 있도록 도와줍니다.

다른 책에 없는 이 책만의 핵심은 확률은 면적이다라는 견해를 이해하고, 이를 통해 확률과 통계의 여러 가지 이야기를 깔끔하게 정리하는 것입니다.

이해하지 못한 사람에게는 복잡한 문제가 이해한 사람 눈에는 어떤 문제인지 정확하게 보입니다. 기초를 확실히 이해하고 다진 뒤에 자신의 응용 분야에서 자신 있게 확률 통계를 활용해보세요.

 

이 책을 읽기 위한 사전 지식

고등학교 이과 수준의 지식(벡터와 미적분 등의 개념과 기본 계산)이 필요합니다.

필요에 따라 대학생 수준(주로 다차원 미적분학)의 지식도 사용하지만, 배운 적 없는 사람도 따라올 수 있도록 배려했습니다.

목차

지은이의 말

옮긴이의 말

 

1부 확률 자체의 이야기

 

1장 확률이란?

__1.1 수학의 입장

__1.2 세 개의 문(몬티 홀 문제) - 비행선 시점

____1.2.1 몬티 홀 문제

____1.2.2 정답과 흔한 착각

____1.2.3 비행선 시점에서의 번역

__1.3 세 조합 (Ω, , P) - 신의 관점

__1.4 확률변수

__1.5 확률분포

__1.6 실전용 축약법

____1.6.1 확률변수의 표기법

____1.6.2 확률의 표기법

__1.7 Ω는 배후

____1.7.1 Ω의 정체에 구애되지 않는다

____1.7.2 Ω를 다루는 요령

____1.7.3 Ω 없는(신의 관점 없음) 확률론

__1.8 요약

____1.8.1 무엇을 하고 싶었나?

____1.8.2 면적이라

____1.8.3 변명

 

2장 여러 확률변수의 조합

__2.1 각 도의 토지 이용(면적 계산 연습)

____2.1.1 도별·용도별 집계(결합 확률과 주변 확률의 연습)

____2.1.2 도 내·용도 내에서의 비율(조건부 확률의 연습)

____2.1.3 비율을 역산하려면(베이즈 공식 훈련)

____2.1.4 비율이 획일적인 경우(독립성 훈련)

____2.1.5 연습 완료

__2.2 결합 확률과 주변 확률

____2.2.1 두 개의 확률변수

____2.2.2 더 많은 확률변수

__2.3 조건부 확률

____2.3.1 조건부 확률이란

____2.3.2 결합분포 · 주변분포 · 조건부분포의 관계

____2.3.3 등호 이외의 조건에서도 마찬가지

____2.3.4 세 개 이상의 확률변수

__2.4 베이즈 공식

____2.4.1 문제 설정

____2.4.2 베이즈의 그림 그리는 노래

____2.4.3 베이즈 공식

__2.5 독립성

____2.5.1 사상의 독립성(정의)

____2.5.2 사상의 독립성(말 바꾸기)

____2.5.3 확률변수의 독립성

____2.5.4 세 개 이상의 독립성(요주의)

 

3장 이산값의 확률분포

__3.1 단순한 예

__3.2 이항분포

____3.2.1 이항분포의 유도

____3.2.2 보충: 순열 nPk · 조합 nCk

__3.3 기댓값

____3.3.1 기댓값이란

____3.3.2 기댓값의 기본 성질

____3.3.3 곱셈의 기댓값은 요주의

____3.3.4 기댓값이 존재하지 않는 경우

__3.4 분산과 표준편차

____3.4.1 기댓값이 같아도

____3.4.2 분산 = ‘기댓값에서 벗어난 상태의 기댓값

____3.4.3 표준편차

____3.4.4 정수 덧셈, 곱셈과 정규화

____3.4.5 독립이라면 덧셈의 분산은 분산의 덧셈

____3.4.6 제곱 기댓값과 분산

__3.5 큰 수의 법칙

____3.5.1 독립 동일 분포i.i.d.

____3.5.2 평균값의 기댓값·평균값의 분산

____3.5.3 큰 수의 법칙

____3.5.4 큰 수의 법칙에 관한 주의 사항

__3.6 조건부 기댓값과 최소제곱 예측

____3.6.1 조건부 기댓값이란

____3.6.2 최소제곱 예측

____3.6.3 신의 관점에서

____3.6.4 조건부 분산

 

4장 연속값의 확률분포

__4.1 그러데이션 인쇄(밀도 계산 연습)

____4.1.1 소비한 잉크의 양을 그래프로(누적분포함수의 훈련)

____4.1.2 인쇄된 잉크의 농도를 그래프로(확률밀도함수의 훈련)

____4.1.3 인쇄한 것을 신축시키면 잉크의 농도는 어떻게 될까(변수 변환 훈련)

__4.2 확률 0

____4.2.1 딱 맞을 확률은 0

____4.2.2 확률 0의 무엇이 문제인가?

__4.3 확률밀도함수

____4.3.1 확률밀도함수

____4.3.2 균등분포

____4.3.3 확률밀도함수의 변수 변환

____4.4 결합분포 · 주변분포 · 조건부분포

____4.4.1 결합분포

____4.4.2 서둘러 진도를 나가고 싶다면

____4.4.3 주변분포

____4.4.4 조건부분포

____4.4.5 베이즈 공식

____4.4.6 독립성

____4.4.7 임의 영역의 확률 · 균등분포 · 변수 변환

____4.4.8 실숫값과 이산값의 혼재

__4.5 기댓값과 분산, 표준편차

____4.5.1 기댓값

____4.5.2 분산, 표준편차

__4.6 정규분포와 중심극한정리

____4.6.1 표준정규분포

____4.6.2 일반정규분포

____4.6.3 중심극한정리

 

5장 공분산행렬과 다변량 정규분포와 타원

__5.1 공분산과 상관계수

____5.1.1 공분산

____5.1.2 공분산의 성질

____5.1.3 경향이 뚜렷한 상태와 상관계수

__5.2 공분산행렬

____5.2.1 공분산행렬 = 분산과 공분산의 표

____5.2.2 벡터로 정리해서 쓰면

____5.2.3 벡터·행렬의 연산과 기댓값

____5.2.4 벡터 확률변수에 대해 좀 더 알아보자

____5.2.5 변수를 바꾸면 공분산행렬이 어떻게 달라질까?

____5.2.6 임의 방향에서의 편차

__5.3 다변량 정규분포

____5.3.1 다변량 표준정규분포

____5.3.2 일반적인 다변량 정규분포

____5.3.3 다변량 정규분포의 확률밀도함수

____5.3.4 다변량 정규분포의 성질

____5.3.5 단면과 그림자

____5.3.6 카이제곱분포

__5.4 공분산행렬을 보면 타원으로 생각하라

____5.4.1 (사례 1) 단위행렬의 경우

____5.4.2 (사례 2) 대각행렬의 경우 타원

____5.4.3 (사례 3) 일반적인 경우 기울어진 타원

____5.4.4 공분산행렬로는 측정할 수 없는 일

 

2부 확률에 도움이 될 이야기

 

6장 추정 및 검정

__6.1 추정론

____6.1.1 기술 통계와 추측 통계

____6.1.2 기술 통계

____6.1.3 추측 통계의 사물을 파악하는 방법

____6.1.4 문제 설정

____6.1.5 기대 벌금

____6.1.6 다목적 최적화

____6.1.7 (대책 가) 후보 가려내기: 최소분산불편추정

____6.1.8 (대책 나) ‘베스트의 의미를 약화시킨다: 최대우도추정

____6.1.9 (대책 다) 단일 값으로서 평가 기준을 정한다: 베이즈 추정

____6.1.10 방법의 선택과 관련해 주의할 점

__6.2 검정론

____6.2.1 검정 논법

____6.2.2 검정의 이론적 틀

____6.2.3 단순가설

____6.2.4 복합가설

 

7장 의사난수

__7.1 여러 가지 의사난수

____7.1.1 난수열

____7.1.2 의사난수열

____7.1.3 전형적인 용도: 몬테카를로 방법

____7.1.4 관련된 주제: 암호론적 의사난수열 · 저불일치수열

__7.2 원하는 분포를 따르는 난수를 만드는 방법

____7.2.1 이산값의 경우

____7.2.2 연속값의 경우

____7.2.3 정규분포를 따르는 난수를 만드는 방법

____7.2.4 삼각형 내 균등분포와 구면의 균등분포

 

8장 여러 가지 응용

__8.1 회귀분석과 다변량 분석에서

____8.1.1 최소제곱법에 의한 직선 근사

____8.1.2 주성분 분석(PCA)

__8.2 확률 과정에서

____8.2.1 랜덤워크

____8.2.2 칼만 필터

____8.2.3 마르코프 연쇄

____8.2.4 확률 과정에 대한 보충

__8.3 정보이론에서

____8.3.1 엔트로피

____8.3.2 두 변수의 엔트로피

____8.3.3 정보원 부호화

____8.3.4 통신로 부호화

 

부록 A 이 책에서 사용하는 수학의 기초 사항

부록 B 근사식과 부등식

부록 C 확률론의 보충

 

찾아보기  

더보기접기

저자&기여자

ㆍ지은이 호리겐

소개
수리공학을 전공했으며 뇌과학, 신호처리 등을 연구하고 있다. 좋아하는 언어는 Ruby, JavaScript, PostScript. 최근에는 통계적 언어 처리에도 흥미를 가지고 있다. 박사(공학).

ㆍ지은이 히라오카카즈유키

소개
수리공학을 전공했으며, 기계에 학습 능력을 부여하는 방법에 흥미를 갖고 있다. 좋아하는 언어는 Ruby, 사랑하는 언어는 Scheme. 요즘은 Common Lisp에도 매료되어 있다. 박사(공학).

ㆍ옮긴이 이창신

소개
서울대학교 수학과 학사 영국 뉴캐슬대학교 대학원 컴퓨터과학 석사

연관 프로그램

아래 프로그램은 길벗출판사가 제공하는 것이 아닙니다.
무료로 사용할 수 있는 정보를 안내해 드리니, 지원이 필요하면 해당 프로그렘 제작사로 문의해 주세요.