像数据科学家一样思考:12步指南(下)
第三階段-完成
一旦產品構建完成,你仍然需要做一些事情來使項目更加成功并使你的未來生活更輕松。那么我們如何完成數(shù)據(jù)科學項目呢?
10-交付產品
完成階段的第一步是產品交付。為了創(chuàng)建可以交付給客戶的有效產品,首先必須了解客戶的觀點。其次,你需要選擇最佳的方式將項目成果反饋給客戶。最后,你必須選擇要包含在產品中的信息和結果以及要放棄的內容。在產品創(chuàng)建和交付過程中做出好的選擇可以大大提高項目的成功機會。
溝通媒介可以采取多種形式。在數(shù)據(jù)科學中,產品最重要的一個方面是客戶是否積極參與產品并且能夠使用產品來回答多種可能的問題。具體的溝通媒介有很多方式:
·???????向客戶提交結果可能是最簡單的選項,其中包括文本、表格、圖表和其他信息,這些信息可以解決你的項目要回答的部分或全部問題。
·???????在一些數(shù)據(jù)科學項目中,數(shù)據(jù)集的分析和結果也可用項目原始數(shù)據(jù)范圍之外的數(shù)據(jù),其中可能包括原始數(shù)據(jù)生成的數(shù)據(jù)、其他不同來源的類似數(shù)據(jù)、或由于某種原因尚未分析的其他數(shù)據(jù)。在這種情況下,如果你可以為客戶創(chuàng)建可以執(zhí)行分析新數(shù)據(jù)集并生成結果的分析工具,對客戶有所幫助。同時客戶可以有效地使用此分析工具,并繼續(xù)在將來和各種(但類似的)數(shù)據(jù)集中回答他們的主要問題,這是最好的情況。
·???????如果你想提供比分析工具更好的產品,你可能需要構建某種類型的完整的應用程序。如果你正在考慮提供交互式圖形應用程序,那么你必須設計,構建和部署它。通常,這些都不是一項小任務。如果你希望應用程序具有許多功能并且具有靈活性,那么設計它并構建它將變得更加困難。
除了決定提供結果的媒介外,你還必須決定它將包含哪些結果。有些結果和內容可能是包含的明顯選擇,但對于其他信息位,可能不那么明顯。通常,你希望包含盡可能多的有用信息和盡可能多的結果,但你希望避免客戶可能誤解或誤用你選擇包含的結果。在許多情況下,這可以是微妙的平衡,并且它在很大程度上取決于具體項目以及客戶和其他人對結果的知識和經驗。
11-進行修訂
產品交付后,我們會在初步反饋后繼續(xù)修改產品。一旦客戶開始使用該產品,就有可能出現(xiàn)一系列全新的問題。盡管你付出了最大努力,但你可能沒有預料到客戶使用產品的方式的各個方面。即使產品完成了它應該做的事情,你的客戶和用戶也可能不會做這些事情并且有效地完成這些工作。
通常很難從客戶、用戶或其他任何人那里獲得建設性的反饋。因此一些數(shù)據(jù)科學家提供完產品后就會忘記它們,一些數(shù)據(jù)科學家提供產品后會選擇等待客戶提供反饋。進行產品修訂可能會非常棘手,找到合適的解決方案和實施策略取決于你遇到的問題類型以及你需要更改以解決問題的方法。如果在整個項目過程中,你始終保持對不確定性和許多可能結果的認識,那么你發(fā)現(xiàn)自己現(xiàn)在面臨的結果與你之前預期的結果不同可能就不足為奇了。但是,如果你一直勤奮,問題很小,修復相對容易。
一旦你發(fā)現(xiàn)產品出現(xiàn)問題并弄清楚如何修復產品,仍然需要決定是否修復產品。一些人最初的傾向是每個問題都需要解決,這不一定是真的。如果有理由可以說服你不想進行修復問題,那就需要慎重考慮了,因為如果選擇盲目地修復發(fā)現(xiàn)的每個問題,那一定會花費大量的時間和精力。
12-結束項目
數(shù)據(jù)科學過程的最后一步是將其包裝起來。隨著數(shù)據(jù)科學項目的結束,似乎所有的工作都已完成,剩下的就是修復任何剩余的錯誤,然后才能完全停止思考并繼續(xù)下一個。但在完成項目調試之前,你可以采取一些措施來增加未來成功的機會,無論是擴展同一個項目還是完全不同的項目。
現(xiàn)在有兩種方法可以增加你未來成功的機會。一種方法是確保在將來的任何時候你都可以輕松地再次獲取該項目并重做、擴展或修改它。通過這樣做,你將增加在后續(xù)項目中獲得成功的機會,所以,你需要從現(xiàn)在開始開始挖掘項目材料和代碼并記下你用什么做的或者你是怎么做到的。最實用的方法是通過文檔和存儲。
提高未來項目成功率的第二種方法是盡可能多地從這個項目中學習,并將這些知識帶到每個未來的項目中。通過進行項目分解,你可以從中梳理出有用的知識,這包括審查舊目標、舊計劃、技術選擇、團隊協(xié)作等。是否可以應用于未來項目,通過項目回溯在事后進行思考,可以幫助發(fā)現(xiàn)有用的知識,使你能夠以不同的方式做事,并在下次更好。
不確定性充斥在我們每個人工作的方方面面,記住過去給你帶來問題的所有不確定因素,可以防止類似的事情再次發(fā)生。從數(shù)據(jù)到分析再到項目目標,幾乎任何事情都可能在短時間內發(fā)生變化。了解所有可能性不僅是一項艱巨的挑戰(zhàn),而且?guī)缀跏遣豢赡艿摹A己玫臄?shù)據(jù)科學家和偉大的數(shù)據(jù)科學家之間的區(qū)別在于能夠預見可能出現(xiàn)的問題并做好準備。
結論
數(shù)據(jù)科學仍然具有新領域的光環(huán)。它的大多數(shù)組成部分:統(tǒng)計學、軟件開發(fā)、基于證據(jù)的問題解決等等,這些可能是屬于舊領域的知識,但數(shù)據(jù)科學似乎是這些部分的新組合成新的東西。數(shù)據(jù)科學的核心并不關心特定的數(shù)據(jù)庫實現(xiàn)或編程語言,即使這些對于從業(yè)者來說是必不可少的,其核心應該是數(shù)據(jù)內容,給定項目的目標以及用于實現(xiàn)這些目標的數(shù)據(jù)分析方法之間的相互作用。
原文鏈接
本文為云棲社區(qū)原創(chuàng)內容,未經允許不得轉載。
總結
以上是生活随笔為你收集整理的像数据科学家一样思考:12步指南(下)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 可应用于实际的14个NLP突破性研究成果
- 下一篇: 为拯救爸妈朋友圈,达摩院造了“谣言粉碎机