欧美亚洲综合在线一区,優質无码专区中文字幕无码,最新午夜不卡无码Av免费,国产成人影院一区二区三区

  • 產(chǎn)品|
  • 采購|
  • 企業(yè)|
  • 資訊|
  • 展會|

客服QQ:544721284

您所在的位置:首頁 > 資訊 > 分析預(yù)測 > KaggleTitanic數(shù)據(jù)分析和預(yù)測

KaggleTitanic數(shù)據(jù)分析和預(yù)測

日期: 2021-03-30 瀏覽人數(shù): 151 來源: 編輯:

分享到:
核心提示:  本文對Kaggle中的Titanic事故中乘客遇難情況進行了相應(yīng)的分析和可視化采用邏輯回歸對他們的遇難情況進行了預(yù)測。最后得到的

  本文對Kaggle中的Titanic事故中乘客遇難情況進行了相應(yīng)的分析和可視化采用邏輯回歸對他們的遇難情況進行了預(yù)測。最后得到的預(yù)測結(jié)果不算很好但是本文大致是一個較為完整的數(shù)據(jù)分析和預(yù)測流程。

  建立模型時我們需要的特征往往都是數(shù)值型因此我們需要將對相應(yīng)屬性轉(zhuǎn)換為one-hot編碼表示首先我們打印出數(shù)據(jù)集的前5行看看哪些特征需要進行轉(zhuǎn)換

  將模型中每個特征的系數(shù)打印出來分析可以看到頭等艙可以很好的提升獲救率而三等艙與獲救率則有著明顯的負相關(guān)女性與獲救率之間則有著明顯的正相關(guān)等。

  之前我們直接在測試集上進行了預(yù)測為了優(yōu)化模型我們可以首先在一部分訓練集上進行預(yù)測與真實的情況進行對比采用sklearn里的交叉預(yù)測模塊進行分析

  在這之后為了提高預(yù)測準確率還需要進行更進一步的特征工程的工作并且采用多模型融合也可能可以提高預(yù)測的準確率。本文在補全未知數(shù)據(jù)時采用了較為簡單的方法尤其時對年齡的補全采用了所有數(shù)據(jù)的平均值作為缺失年齡的補全值這樣的做法可能并不科學另外對于PassengerId、Name和Ticket的信息沒有進行有效的利用在這些方面進一步深挖也許可以提高預(yù)測的準確率。

免責聲明:
本網(wǎng)站部分內(nèi)容來源于合作媒體、企業(yè)機構(gòu)、網(wǎng)友提供和互聯(lián)網(wǎng)的公開資料等,僅供參考。本網(wǎng)站對站內(nèi)所有資訊的內(nèi)容、觀點保持中立,不對內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。如果有侵權(quán)等問題,請及時聯(lián)系我們,我們將在收到通知后第一時間妥善處理該部分內(nèi)容。

微信

關(guān)注地攤庫官方微信賬號:“ditanku”,每日獲得互聯(lián)網(wǎng)最前沿資訊,熱點產(chǎn)品深度分析!
0條 [查看全部]  相關(guān)評論