알라딘MGG와이드바


Python 으로 타이타닉 승객의 생존율 구하기 개발 이야기

요근래 새로 파이썬 공부하면서 알게 된 문제. 찾아보니까 Kaggle 관련해서 이미 유명한 문제인 거 같다.

타이타닉 승객 데이터 csv 데이터는 여기에서 찾을 수 있다.
https://raw.githubusercontent.com/TeamLab/machine_learning_from_scratch_with_python/master/code/ch12/titanic/train.csv

1, 2, 3 등석에 탑승한 남, 여 승객은 각각 몇 % 생존했는가를 구하는 코드다.

import numpy as np
import pandas as pd
df = pd.read_csv('https://raw.githubusercontent.com/TeamLab/machine_learning_from_scratch_with_python/master/code/ch12/titanic/train.csv')
print(df.pivot_table(index='Sex', columns='Pclass', values='Survived', aggfunc=np.mean), "\n")

# Pclass 1 2 3
# Sex
# female 0.968085 0.921053 0.500000
# male 0.368852 0.157407 0.135447


생존률이 여성은 96%, 92%, 50%, 남성은 36%, 15%, 13% 라고 한다.
처음 타이타닉 영화 봤을 때는(그게 1997년이었네. 아련하다.) 어떤 기분이었는지는 기억이 안 나는데
지금은 세월호 때문에 이 영상을 보고 있기가 힘들다.
죽음을 눈앞에 두고도 의연한 모습을 보인 그 시대 사람들에게 존경을 보낸다.

덧글

댓글 입력 영역


Yes24위대한게임의탄생3

위대한 게임의 탄생 3
예스24 | 애드온2