国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

成為靠譜的數(shù)據(jù)科學(xué)家——從提出正確的問題開始

dendoink / 3140人閱讀

摘要:我認(rèn)為提出正確的問題和定義問題陳述是許多數(shù)據(jù)科學(xué)初學(xué)者包括我面臨的一項挑戰(zhàn)。在本文中,我將與你分享作為數(shù)據(jù)科學(xué)家,該如何提出正確問題并定義問題陳述。我們的任務(wù)是幫助他們將問題構(gòu)建成數(shù)據(jù)科學(xué)問題,從他們的角度看問題。


作者 | Admond Lee
翻譯 | Mika
CDA 數(shù)據(jù)分析研究院原創(chuàng)作品,轉(zhuǎn)載需授權(quán)

作為一名數(shù)據(jù)科學(xué)家,在我們討論如何通過正確的提問對問題進(jìn)行定義前,讓我們首先看到為什么提出正確的問題是如此重要。

在我的第一份數(shù)據(jù)科學(xué)實習(xí)中,我對這個項目非常興奮,只是想盡快動手,而沒有弄清楚全局情況。

我首先試著弄清楚我要解決的問題,但卻沒有深入細(xì)節(jié)確定具體的目標(biāo)。更糟糕的是,我沒有質(zhì)疑所要分析和預(yù)測的數(shù)據(jù)集。最終經(jīng)過兩周的數(shù)據(jù)清理和分析,我才意識到我對數(shù)據(jù)做出了錯誤的假設(shè)。所有這些都是因為我對問題和數(shù)據(jù)缺乏了解。

這就是我的故事。

我認(rèn)為提出正確的問題和定義問題陳述是許多數(shù)據(jù)科學(xué)初學(xué)者(包括我)面臨的一項挑戰(zhàn)。

提問很容易,每個人都會提問。但是提出正確的問題就不容易了,因為我們不知道哪些問題才是正確的。

在本文中,我將與你分享作為數(shù)據(jù)科學(xué)家,該如何提出正確問題并定義問題陳述。希望能夠幫助你應(yīng)對數(shù)據(jù)科學(xué)生涯中的這些挑戰(zhàn)。

讓我們開始吧!

如何通過提出正確的問題來定義問題陳述?

不管你是否承認(rèn),定義問題陳述(或數(shù)據(jù)科學(xué)問題)是數(shù)據(jù)科學(xué)管道中最重要的步驟之一。

在下面的部分中,我們將通過四個步驟來定義問題陳述。

1.理解需要解決的問題

需要確定的機會是什么?你的受眾所面臨的痛點是什么?

通常情況下,Kaggle競賽中的問題陳述都是明確定義的。我們可以放心使用給出的數(shù)據(jù)集,而不必?fù)?dān)心問題陳述給其他人帶來的問題,或如何獲取數(shù)據(jù)等。

但是,實際工作環(huán)境中的問題并沒有被定義,有些問題很曖昧,很模糊。

大多數(shù)時候,公司領(lǐng)導(dǎo)層只會給我們一個問題:我有這個“問題”,你能幫我解決這個問題嗎?僅此而已。

我們的任務(wù)是幫助他們將問題構(gòu)建成數(shù)據(jù)科學(xué)問題,從他們的角度看問題。

換句話說,我們需要有同理心。

這時我們需要從領(lǐng)導(dǎo)層的角度,將我們的技術(shù)知識與數(shù)據(jù)結(jié)合起來,提出一個促進(jìn)商業(yè)價值的解決方案。

2.根據(jù)問題評估情況

在構(gòu)建了數(shù)據(jù)科學(xué)問題之后,接下來就需要根據(jù)問題對形勢進(jìn)行評估。

這意味著我們需要謹(jǐn)慎分析風(fēng)險、成本、收益、突發(fā)事項、法規(guī)、資源和需求。

為了進(jìn)一步說明,這里可以大致分為以下幾個問題:

這個問題有什么要求?

有哪些假設(shè)和約束條件?

有哪些資源?這里指的是人員和資金,計算機系統(tǒng)(GPU,可用的CPU),儀器等。

3.了解項目的潛在風(fēng)險和收益

這個步驟是可選的,具體取決于項目的大小和規(guī)模。

有些項目可能只處于探索階段,因此如果項目投入生產(chǎn),潛在風(fēng)險可能會降低,且未來收益會更大。

這個項目相關(guān)的主要成本是多少?

有哪些潛在的收益?

有哪些潛在的風(fēng)險?

潛在風(fēng)險中會有哪些突發(fā)情況?

回答這些問題有助于更好地了解情況,并了解項目涉及的內(nèi)容。對項目有深入的了解有助于評估之前定義問題陳述的有效性。

4.定義評估項目成功的指標(biāo)

這個很重要。你不能只有需要解決的問題,而沒有任何指標(biāo)來評估項目是否成功。

這歸結(jié)為一個簡單的問題:你希望在項目結(jié)束時實現(xiàn)什么目標(biāo)?

成果應(yīng)該是可衡量的,而不是無法量化的。某些指標(biāo)可能無法立即使用,因此還需要進(jìn)行數(shù)據(jù)收集和預(yù)處理。

你必須與領(lǐng)導(dǎo)層討論要使用的指標(biāo),并且在提出正確問題的早期就應(yīng)該進(jìn)行討論。

定義成功標(biāo)準(zhǔn)非常重要,因為這有助于你在項目整個生命周期內(nèi)對其進(jìn)行評估。

結(jié)語

我們的最終目標(biāo)是提出更好的問題和定義明確的問題陳述,從而用數(shù)據(jù)科學(xué)方法進(jìn)行解決,并生成業(yè)務(wù)見解和可操作的計劃。

謝謝你的閱讀。希望本文能夠讓你理解提出正確問題以及如何構(gòu)建問題陳述的重要性。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://specialneedsforspecialkids.com/yun/19913.html

相關(guān)文章

  • 一名JavaScript程序員應(yīng)備素質(zhì)

    摘要:當(dāng)我嘗試為招一個程序員時,我發(fā)現(xiàn)這項任務(wù)相當(dāng)艱巨。我承諾給其中一位侯選人一輛凱迪拉克,但最終沒有打動他。你會得到一輛年的凱迪拉克作為簽約的報酬。大神是一名還不存在的產(chǎn)品的前端工程師。 周五,2010年8月13號, 作者:anutron 編者注: 這篇文章寫于2010年作者工作在Cloudera期間,當(dāng)時node.js還沒有流行,很多人還瞧不上javascript這門簡陋的腳本,文章提...

    pf_miles 評論0 收藏0
  • SegmentFault 獨家專訪美團(tuán)云:穩(wěn)定云計算平臺

    摘要:約半年前,美團(tuán)悄然上線了美團(tuán)云,簡稱,這是美團(tuán)網(wǎng)根據(jù)自身虛擬化平臺開發(fā)和運維經(jīng)驗開放的云計算服務(wù),類似。美團(tuán)云的客服都由工程師擔(dān)任,這是一個很大的優(yōu)勢。鍵盤和顯示器不錯啊,想要的話,就加盟美團(tuán)吧參見美團(tuán)云穩(wěn)定靠譜的云計算平臺 約半年前,美團(tuán)悄然上線了美團(tuán)云(Meituan Open Services,簡稱MOS),這是美團(tuán)網(wǎng)根據(jù)自身虛擬化平臺開發(fā)和運維經(jīng)驗開放的云計算服務(wù),類似AWS。...

    peixn 評論0 收藏0
  • 美團(tuán)云:穩(wěn)定云計算平臺

    摘要:約半年前,美團(tuán)悄然上線了美團(tuán)云,簡稱,這是美團(tuán)網(wǎng)根據(jù)自身虛擬化平臺開發(fā)和運維經(jīng)驗開放的云計算服務(wù),類似。恐怕沒有人會想到美團(tuán)會涉足云計算服務(wù),但在王興看來,美團(tuán)云的推出是一件自然而然的事情。 約半年前,美團(tuán)悄然上線了美團(tuán)云(Meituan Open Services,簡稱MOS),這是美團(tuán)網(wǎng)根據(jù)自身虛擬化平臺開發(fā)和運維經(jīng)驗開放的云計算服務(wù),類似AWS。 showImg(http://...

    toddmark 評論0 收藏0
  • Coursera數(shù)據(jù)工程師董飛:硅谷大數(shù)據(jù)過去與未來

    摘要:創(chuàng)新萌芽期望最頂點下調(diào)預(yù)期至低點回歸理想生產(chǎn)率平臺。而大數(shù)據(jù)已從頂峰滑落,和云計算接近谷底。對于迅速成長的中國市場,大公司也意味著大數(shù)據(jù)。三家對大數(shù)據(jù)的投入都是不惜余力的。 非商業(yè)轉(zhuǎn)載請注明作譯者、出處,并保留本文的原始鏈接:http://www.ituring.com.cn/article/177529 董飛,Coursera數(shù)據(jù)工程師。曾先后在創(chuàng)業(yè)公司酷迅,百度基礎(chǔ)架構(gòu)組...

    sevi_stuo 評論0 收藏0

發(fā)表評論

0條評論

dendoink

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<