日韩高清亚洲日韩精品一区二区三区,成熟人妻av无码专区,国产又A又黄又潮娇喘视频,男女猛烈无遮挡免费视频在线观看

到底要不要參加Kaggle競(jìng)賽

【編者按】數(shù)據(jù)科學(xué)家Reshama Shaikh分享了參加Kaggle的理由,并簡(jiǎn)要介紹了如何入門(mén)Kaggle。

關(guān)于Kaggle

Kaggle是最著名的預(yù)測(cè)建模分析競(jìng)賽平臺(tái)。Kaggle公司于2010年在澳大利亞的墨爾本成立,在收到硅谷的投資之后遷往舊金山。2017年被Google收購(gòu)。如果想了解更多關(guān)于Kaggle的歷史和未來(lái),可以看AMA with Anthony Goldbloom(Kaggle CEO的訪(fǎng)談)。

在過(guò)去十年來(lái),英文語(yǔ)境中的“數(shù)據(jù)科學(xué)”(data science)一詞的含義逐漸發(fā)生了變化。同樣,“數(shù)據(jù)科學(xué)”和“kaggle”也逐漸變得密不可分,與此同時(shí),數(shù)據(jù)科學(xué)社區(qū)中的很多人在探究和爭(zhēng)辯這一平臺(tái)的用途:

Kaggle……有用嗎?

我對(duì)Kaggle最初的想法

和很多人一樣,我對(duì)Kaggle競(jìng)賽抱有一些成見(jiàn)。我聽(tīng)說(shuō)Kaggle有好幾年了,也從數(shù)據(jù)科學(xué)領(lǐng)域的其他人那里獲得了一些對(duì)Kaggle的認(rèn)識(shí):

  • 我聽(tīng)說(shuō)過(guò)擁有數(shù)十年經(jīng)驗(yàn)的退休博士成為Kaggle競(jìng)賽贏(yíng)家的傳奇(我過(guò)去常常好奇這些天才是在沙灘上參賽的,享受著碧水藍(lán)天和流暢的wifi,還是呆在昏暗、滿(mǎn)是灰塵的、亂糟糟的辦公室里參賽的……)
  • 我獲勝的概率為零。
  • 我真的能學(xué)到有價(jià)值的東西嗎?
  • 投入時(shí)間提升精確度0.01有何意義?
  • 這真的是使用我的時(shí)間的最好方式嗎?還是說(shuō)我應(yīng)該花時(shí)間學(xué)習(xí)另一項(xiàng)更有價(jià)值的數(shù)據(jù)科學(xué)技能?
  • 贏(yíng)家需要使用復(fù)雜的集成方法。
  • 數(shù)據(jù)很干凈,人為地干凈,一點(diǎn)也不現(xiàn)實(shí)。
  • 參加一項(xiàng)Kaggle競(jìng)賽并不能讓我成為一個(gè)合格的數(shù)據(jù)科學(xué)家,所以何必呢?
  • 我不知道從何開(kāi)始……

我的第一項(xiàng)Kaggle競(jìng)賽

在抗拒了幾年之后,我最近第一次參加了Kaggle競(jìng)賽,Is it a Ship or Iceberg。我寫(xiě)了一篇文章,分享了初次參加Kaggle競(jìng)賽的體驗(yàn)。

到底要不要參加Kaggle競(jìng)賽

Kaggle競(jìng)賽和紐約馬拉松

我發(fā)現(xiàn)Kaggle競(jìng)賽和紐約馬拉松很像。大部分參賽者是為了享受過(guò)程,而不是贏(yíng)得第一。

結(jié)論:參加吧

要不要參加Kaggle?我的答案:“是”。不管是數(shù)據(jù)科學(xué)的初學(xué)者,還是資深的數(shù)據(jù)科學(xué)家,參加Kaggle競(jìng)賽都是有價(jià)值的。下面是一些理由。

評(píng)測(cè)

獲取你自己的數(shù)據(jù)集或從網(wǎng)站抓取數(shù)據(jù)能讓你學(xué)到很多,但這么做的缺點(diǎn)是沒(méi)有評(píng)測(cè)標(biāo)準(zhǔn),無(wú)法比較你的發(fā)現(xiàn)。有可能你犯了大錯(cuò),但無(wú)人知曉,因?yàn)闆](méi)有經(jīng)過(guò)驗(yàn)證。Kaggle競(jìng)賽則提供了一個(gè)“檢查你的作品”的平臺(tái)。

不同水平的人都能從中學(xué)到東西

初學(xué)者有很多可以學(xué)的:

  • 熟悉Kaggle平臺(tái)
  • 如何使用命令行或API從Kaggle獲取數(shù)據(jù)
  • 結(jié)構(gòu)化的生態(tài)系統(tǒng)讓高級(jí)統(tǒng)計(jì)學(xué)技能不足的人集中全力解決問(wèn)題
  • 理解評(píng)估指標(biāo)
  • 開(kāi)發(fā)、運(yùn)維技能:Git、云計(jì)算
  • 練習(xí)
  • Kaggle提供了一些免費(fèi)的交互式教程

有經(jīng)驗(yàn)的從業(yè)人員,仍有許多東西可以學(xué)習(xí):

  • 結(jié)構(gòu)化的生態(tài)系統(tǒng)讓具備高級(jí)統(tǒng)計(jì)學(xué)技能的人集中全力解決問(wèn)題
  • 更深入地探索超參數(shù)
  • 聚焦當(dāng)前最先進(jìn)的新方法
  • 賽后分析贏(yíng)家的做法
  • 管理大規(guī)模數(shù)據(jù)集(超過(guò)一百萬(wàn)項(xiàng)記錄)
  • 配置GPU機(jī)器進(jìn)行深度學(xué)習(xí)
  • 使用深度學(xué)習(xí)并與傳統(tǒng)算法比較結(jié)果

數(shù)據(jù)

整個(gè)數(shù)據(jù)科學(xué)社區(qū)都在談?wù)撜摂?shù)據(jù)集。你能在Kaggle上熟悉其他學(xué)習(xí)平臺(tái)以及會(huì)議發(fā)言人提到的流行的數(shù)據(jù)集。

盡管Kaggle提供了數(shù)據(jù)集,你仍然需要理解數(shù)據(jù)和評(píng)估指標(biāo)。和流行的觀(guān)點(diǎn)不同,仍有需要進(jìn)一步檢查的“臟數(shù)據(jù)”。深入分析錯(cuò)誤標(biāo)記項(xiàng)將帶來(lái)算法方面的調(diào)整。

作品集的組成部分

沒(méi)錯(cuò),參加Kaggle競(jìng)賽并不能證明你勝任數(shù)據(jù)科學(xué)家的工作。參加一門(mén)課程、出席一次會(huì)議、分析一個(gè)數(shù)據(jù)集、閱讀一本數(shù)據(jù)科學(xué)的書(shū)也不能。參加競(jìng)賽增加了你的經(jīng)驗(yàn),增強(qiáng)了你的作品集。它是你其他項(xiàng)目的補(bǔ)充,而不是數(shù)據(jù)科學(xué)技能集的唯一證明。

獲得樂(lè)趣

人們經(jīng)常不確定是否要追尋一個(gè)數(shù)據(jù)科學(xué)的職位。參加競(jìng)賽是一種測(cè)量你的能力和興奮點(diǎn)的非正式方法。如果你確實(shí)很享受參加Kaggle的過(guò)程,那說(shuō)明你的方向沒(méi)錯(cuò)。如果你選擇把時(shí)間花在其他事情上面,那也很好;這是一種找到答案的方法。

Kaggle入門(mén)

入門(mén)指南

EliteDataScience上的The Beginner’s Guide to Kaggle提供了關(guān)于Kaggle的詳盡信息,以及上手Kaggle的一些技巧。

核(kernel)是Kaggle用戶(hù)分享的代碼(Jupyter Notebook形式,R或Python)。參加競(jìng)賽時(shí),你可以復(fù)制、使用這些代碼。

討論區(qū)

每項(xiàng)競(jìng)賽都有一個(gè)討論區(qū),可以交流問(wèn)題,給核、主題投票。

Slack

Kaggle有一個(gè)Slack小組:KaggleNoobs,擁有近四千成員,另外還有一個(gè)AMA(Ask Me Anything,問(wèn)我任何事)頻道,經(jīng)常訪(fǎng)談Kaggle參賽者和贏(yíng)家。

選擇

  • 你可以參加已經(jīng)結(jié)束的競(jìng)賽。記住,參加Kaggle是為了學(xué)習(xí),而不是最終結(jié)果。
  • 有各種各樣的主題(隨機(jī)森林、多元分類(lèi)、神經(jīng)網(wǎng)絡(luò)、NLP)和各種各樣的數(shù)據(jù)集(圖像、結(jié)構(gòu)化數(shù)據(jù)、文本、大數(shù)據(jù))

組隊(duì)

  • 不管你是初學(xué)者還是有經(jīng)驗(yàn)的數(shù)據(jù)科學(xué)家,都可以組隊(duì)。
  • 剛開(kāi)始可以作為獨(dú)立的小組參賽,以最大化每日的結(jié)果提交數(shù)量,在競(jìng)賽快結(jié)束時(shí)再合并小組。

結(jié)論

我覺(jué)得很有必要參加至少一次競(jìng)賽。對(duì)沒(méi)試過(guò)的東西的看法,和已經(jīng)嘗試過(guò)的東西的看法,是不一樣的。和一切事物一樣,Kaggle在不斷演化,特別是Google收購(gòu)以后。過(guò)段時(shí)間可以回去看看,有沒(méi)有什么新東西。

不必局限于Kaggle

盡管Kaggle是最出名的平臺(tái),參加競(jìng)賽的機(jī)會(huì)還有很多:

  • 許多大學(xué)的數(shù)據(jù)分析部門(mén)舉辦年度競(jìng)賽
  • 會(huì)議經(jīng)常會(huì)辦一些競(jìng)賽(有時(shí)稱(chēng)為“任務(wù)”)
  • 私營(yíng)公司會(huì)贊助自己的競(jìng)賽

相關(guān)新聞

聯(lián)系我們
聯(lián)系我們
公眾號(hào)
公眾號(hào)
在線(xiàn)咨詢(xún)
分享本頁(yè)
返回頂部