요근래 새로 파이썬 공부하면서 알게 된 문제. 찾아보니까 Kaggle 관련해서 이미 유명한 문제인 거 같다.
타이타닉 승객 데이터 csv 데이터는 여기에서 찾을 수 있다.
https://raw.githubusercontent.com/TeamLab/machine_learning_from_scratch_with_python/master/code/ch12/titanic/train.csv
1, 2, 3 등석에 탑승한 남, 여 승객은 각각 몇 % 생존했는가를 구하는 코드다.
import numpy as np
import pandas as pd
df = pd.read_csv('https://raw.githubusercontent.com/TeamLab/machine_learning_from_scratch_with_python/master/code/ch12/titanic/train.csv')
print(df.pivot_table(index='Sex', columns='Pclass', values='Survived', aggfunc=np.mean), "\n")
# Pclass 1 2 3
# Sex
# female 0.968085 0.921053 0.500000
# male 0.368852 0.157407 0.135447
생존률이 여성은 96%, 92%, 50%, 남성은 36%, 15%, 13% 라고 한다.
처음 타이타닉 영화 봤을 때는(그게 1997년이었네. 아련하다.) 어떤 기분이었는지는 기억이 안 나는데
지금은 세월호 때문에 이 영상을 보고 있기가 힘들다.
죽음을 눈앞에 두고도 의연한 모습을 보인 그 시대 사람들에게 존경을 보낸다.
덧글