網(wǎng)站性能檢測評分
注:本網(wǎng)站頁面html檢測工具掃描網(wǎng)站中存在的基本問題,僅供參考。
如何組建一個公司
互聯(lián)網(wǎng)公司如何組建一個數(shù)據(jù)科學團隊? 互聯(lián)網(wǎng)視頻課程
數(shù)據(jù)科學團隊眼下已經(jīng)成了很多數(shù)據(jù)驅(qū)動型公司的標準配置,數(shù)據(jù)科學家也成了最“性感”的職業(yè)。不少公司都在想辦法建立或擴展自己的數(shù)據(jù)科學團隊,而究竟需要什么樣的數(shù)據(jù)科學團隊,成了很多公司在發(fā)展過程中都會遇到的棘手問題。
在目前的職業(yè)市場上,有各種背景、各種經(jīng)歷的人都自稱為“數(shù)據(jù)科學家”。那么,如何從這個蓬勃發(fā)展,卻魚龍混雜的人才市場中找到合適的團隊成員呢?今天我就來和你聊一聊作為一個工程團隊的負責人,或者一家公司的 CEO,該如何招聘并打造自己的數(shù)據(jù)科學團隊。
數(shù)據(jù)分析還是算法模型
目前人才市場上大致有兩類數(shù)據(jù)科學家,一類偏數(shù)據(jù)分析,一類偏算法模型。因為這兩類人才的區(qū)別,不同公司乃至同一公司的不同數(shù)據(jù)科學團隊就有了差別。在招聘之前你必須明白,這兩類數(shù)據(jù)科學家的特質(zhì)很難在同一個人身上體現(xiàn)出來。也就是說,你必須根據(jù)當前公司和團隊的需求,來決定目前應(yīng)該招聘更偏重數(shù)據(jù)分析,還是偏重算法模型的數(shù)據(jù)科學家。
先來說說偏重數(shù)據(jù)分析的數(shù)據(jù)科學家,他們可能來自于統(tǒng)計、數(shù)據(jù)分析等學科,也可能來自于很多需要數(shù)據(jù)分析的自然科學學科,比如實驗物理、生物、計算化學等。作為團隊的負責人,你需要重點考察候選人是否系統(tǒng)學習過數(shù)據(jù)分析的相關(guān)課程,是否具備數(shù)據(jù)分析的基本能力。下面我從理論知識和實際應(yīng)用操作兩個角度來和你介紹下考察要點。
從理論知識的角度來說,你需要考察候選人:
是否對概率統(tǒng)計有基本的認知;
是否能夠使用基本的假設(shè)檢驗對數(shù)據(jù)進行分析;
是否對高級的假設(shè)檢驗方法,比如非參數(shù)假設(shè)檢驗(Nonparametric Hypothesis Testing)有所了解,能否快速學習和查詢到相關(guān)的方法;
是否了解 A/B 實驗,并基本了解實驗設(shè)計;
是否了解高級的因果推論(Causal Inference)工具,并能夠使用簡單的因果推論工具對實驗數(shù)據(jù)進行分析;
是否了解如何對時間序列下的數(shù)據(jù)進行合理分析。
當然這些技能只是作為數(shù)據(jù)分析候選人的一些基本素質(zhì),具體還需要和領(lǐng)域知識相結(jié)合。
從實際應(yīng)用操作的角度來說,你還需要考察候選人:
是否熟悉一些基本的數(shù)據(jù)分析工具語言,比如 R 或者 Python;
是否對 SQL 有所了解;
是否對 Hadoop 等大數(shù)據(jù)處理工具有所涉獵;
是否了解一些基本的計算機算法。
同樣的,這些也是基礎(chǔ)素質(zhì),還需要和具體的職位相結(jié)合,你才能考察候選人的綜合情況。
接著我們來看偏重算法模型的數(shù)據(jù)科學家,他們主要來自于計算機科學、計算機工程、電氣工程等工程方向。你需要重點考慮他們是否有基本的算法建模能力;是否系統(tǒng)地學習過算法、機器學習、統(tǒng)計分析等課程;是否在實際工作中,有系統(tǒng)的相關(guān)開發(fā)經(jīng)歷;對數(shù)據(jù)的認識,特別是對數(shù)據(jù)驅(qū)動型產(chǎn)品是否有基本的了解。下面我依次從理論知識和實際應(yīng)用操作兩個角度來談?wù)劸唧w的考察內(nèi)容。
從理論知識的角度來說,你需要考察候選人:
是否對概率統(tǒng)計有基本的認識;
是否對傳統(tǒng)的機器學習算法模型有所了解,包括分類、回歸、聚類等;
是否對概率圖模型有所了解;
是否對深度學習模型有所了解;
是否對優(yōu)化算法有所了解;
是否有基本的計算機算法、數(shù)據(jù)結(jié)構(gòu)、數(shù)據(jù)庫、操作系統(tǒng)的知識;
是否對某一些特定領(lǐng)域內(nèi)的模型有所了解,包括但不限于信息檢索、推薦系統(tǒng)、計算廣告系統(tǒng)、計算機視覺、文本挖掘和分析、自然語言處理。
這些,特別是第 1 項到第 6 項是候選人的基本素質(zhì)。第 7 項是針對某一個具體的職位所需要的背景知識。
從實際應(yīng)用操作角度來說,你需要考察候選人:
是否可以使用某種計算機語言(比如 Python、C 、Java、Scala)來實現(xiàn)一些機器學習算法;
是否可以使用和擴展現(xiàn)有的機器學習工具(比如 Scikit Learn、XGBoost、Vowpal Wabbit 等);
是否可以使用以 Hadoop 為基礎(chǔ)的大數(shù)據(jù)工具(比如 Hive、Pig、Spark 等)來構(gòu)建生產(chǎn)環(huán)境;
是否對深度學習框架(比如 TensorFlow、Caffe、MxNet、Torch 等)有所了解。
這里列出的也是一些基礎(chǔ)素質(zhì),還需要和具體的職位相結(jié)合,來考察候選人的綜合情況。
總體說來,如果你希望招聘的職位更偏重于理解現(xiàn)有數(shù)據(jù),通過數(shù)據(jù)來對公司或團隊的下一步?jīng)Q策有所幫助,那么這個職位就更偏向于數(shù)據(jù)分析。如果你希望通過算法和模型來改進你的產(chǎn)品,無疑你需要招聘一個算法模型方向的數(shù)據(jù)科學家。
小團隊、大團隊
不同的團隊往往需要不同的數(shù)據(jù)科學家配置。即便是同一團隊,在不同時期其實也需要不太一樣的設(shè)置。我這里講的是一些基本的團隊設(shè)置理念,具體的團隊還需要根據(jù)不同的領(lǐng)域有所調(diào)整。
總體說來,在團隊比較小的時候,甚至是初創(chuàng)公司的團隊,你需要具有“通才”性質(zhì)的數(shù)據(jù)科學家,而在團隊擴大、公司穩(wěn)定以后,你需要各類“專才”性質(zhì)的數(shù)據(jù)科學家。
團隊比較小的時候,我們可能只需要招聘一兩位數(shù)據(jù)科學家。這個時候的數(shù)據(jù)科學家必須同時承擔數(shù)據(jù)分析和算法建模兩個角色。有些情況下,這時候的數(shù)據(jù)科學家其實更偏向于“數(shù)據(jù)工程師”(Data Engineer)的角色,那就是和其他工程師一起搭建公司的數(shù)據(jù)平臺,對數(shù)據(jù)的引入、整合、清理提供支持。
早期時候,因為公司內(nèi)部基礎(chǔ)設(shè)施的限制,數(shù)據(jù)科學家往往需要花費大部分時間在數(shù)據(jù)平臺和通路的構(gòu)建上。這時候,其實很難形成有效的數(shù)據(jù)分析和算法建模工作。從另外一個角度來說,在公司非常早期,也就是在數(shù)據(jù)平臺還沒有一個基本雛形的時候,招聘和建立數(shù)據(jù)科學團隊是不現(xiàn)實的。當有了基礎(chǔ)的數(shù)據(jù)平臺時,和數(shù)據(jù)有關(guān)的工作一般就是計算一些簡單的產(chǎn)品運行指標(Metrics)然后在儀表盤(Dashboard)里展現(xiàn)出來。能夠達到這一階段后,一個團隊或者公司才具備了建立數(shù)據(jù)科學團隊的最基本條件。
小團隊所需要的“通才”數(shù)據(jù)科學家有兩個內(nèi)涵。第一,在初期,數(shù)據(jù)分析和算法建模都同樣重要。甚至在有些情況下,數(shù)據(jù)分析有著更加急迫的需求(因為需要人為地對產(chǎn)品迭代進行決策)。這個時候,以數(shù)據(jù)分析為主導的數(shù)據(jù)科學家要能夠?qū)ΜF(xiàn)在的產(chǎn)品需求有很強的理解,能和產(chǎn)品經(jīng)理、其他工程師一起快速分析產(chǎn)品的問題,為產(chǎn)品迭代的決策提供數(shù)據(jù)支持。
第二,在初期,絕大多數(shù)產(chǎn)品所需要的算法和模型都并不復雜,甚至僅僅需要數(shù)據(jù)科學家部署最基本、最簡單的算法。因此這個時候,即便有算法建模需求,也只需要數(shù)據(jù)科學家有比較廣的知識就行,能夠快速識別和實現(xiàn)最基本的模型。在這個階段,對某一個方向有著深厚背景的“專才”往往并不能體現(xiàn)出優(yōu)勢。
當業(yè)務(wù)逐漸穩(wěn)定并且擴展以后,團隊也逐漸擴張,小團隊的“通才”模式就慢慢不太適應(yīng)組織的發(fā)展了。這個時候,我們需要針對目前的產(chǎn)品和業(yè)務(wù)招聘“專才”數(shù)據(jù)科學家。一般來說,我們需要有一部分數(shù)據(jù)科學家負責數(shù)據(jù)分析方面,需要另外一部分數(shù)據(jù)科學家負責算法和模型開發(fā)方面。這時候單個人往往已經(jīng)不能勝任兩方面的任務(wù)了。
從數(shù)據(jù)分析的方面講,“專才”的模式需要我們更細地區(qū)分開兩類數(shù)據(jù)科學家,一類是負責設(shè)計 A/B 實驗、設(shè)計和分析產(chǎn)品指標的專項數(shù)據(jù)科學家,另一類是對各個產(chǎn)品領(lǐng)域進行長時間分析數(shù)據(jù)內(nèi)涵(Insights)的數(shù)據(jù)科學家。
從算法建模的方面講,“專才”模式往往就是針對不同的業(yè)務(wù)流程線,需要招聘單獨的人才,比如針對圖像處理的人才、針對搜索系統(tǒng)的人才、針對推薦系統(tǒng)的人才。這個時候,能否招聘到稱職的領(lǐng)域?qū)<?,成了團隊和產(chǎn)品能否持續(xù)良性發(fā)展下去的根本因素。這個階段招聘需要注意的問題是,不要寄希望通過招聘“通才”來發(fā)現(xiàn)“專才”,因為從“通才”到“專才”的訓練是需要很長時間的,這里面有短時間內(nèi)不可逾越的鴻溝和難以積累起來的經(jīng)驗。所以,當公司和團隊發(fā)展到一定規(guī)模的時候,分清形式進行“專才”招聘是必須要進行的任務(wù)目標。
小結(jié)
今天我為你簡單分析了如果要組建一個數(shù)據(jù)科學團隊,你需要招聘什么樣的數(shù)據(jù)科學家。一起回顧下內(nèi)容要點:第一,偏數(shù)據(jù)分析和偏算法建模的兩類數(shù)據(jù)科學家在技能背景方面有很大區(qū)別;第二,“通才”和“專才”在公司或團隊的不同階段承擔著不同的角色。
最后,給你留一個思考題:如何在篩選候選人簡歷的時候,就能夠比較準確地了解這位候選人的經(jīng)歷和能力更偏向數(shù)據(jù)分析還是偏向算法呢?另外,如果你想成為數(shù)據(jù)科學團隊的一員,不妨對照今天我們聊的考察要點自測一下,看看接下來還需要在哪些方面繼續(xù)努力,做好積累呢?
期待你給我留言,和我一起討論!
一個創(chuàng)業(yè)公司,如何做好企業(yè)組織架構(gòu)? 企業(yè)視頻課程
現(xiàn)在很多年輕人都會選擇創(chuàng)業(yè),希望將命運掌握在自己手里?!皠?chuàng)業(yè)”有那么簡單嗎?中國每年拿到風險投資的公司至少5000家,而倒閉的大概就有百分之六十。不夸張的說,公司倒閉很大部分原因是忽視了搭建公司組織結(jié)構(gòu)重要性。創(chuàng)業(yè)公司的人力資源構(gòu)架如何搭建?如何完善公司組織結(jié)構(gòu)?這都是創(chuàng)業(yè)之初需要確定且做好的功課。
創(chuàng)業(yè)企業(yè)人力資源人力資源架構(gòu)如何搭建?
人力資源架構(gòu)的搭建是創(chuàng)業(yè)之初非常重要的一環(huán),搭建的過程可以解決和明確很多問題,需要考慮到的內(nèi)容有:公司戰(zhàn)略和目標、規(guī)定崗位職責權(quán)利、人數(shù)分配、激勵體制、薪資制度等。組織架構(gòu)是公司的骨架,架構(gòu)確保穩(wěn)妥,才能保障公司屹立不倒。
創(chuàng)業(yè)建立人力資源管理體系,要遵守前后關(guān)系原則,大體上可以分為以下十二個步驟:
逐步完善人力資源架構(gòu)
架構(gòu)搭建后,并不是一勞永逸。人力資源架構(gòu)需要根據(jù)公司情況逐步調(diào)節(jié)與完善,在人力資源管理上要充分利用每個人的特點,進行科學的劃分。規(guī)劃的內(nèi)容需要落實,不應(yīng)成為擺設(shè)。
作為一個創(chuàng)業(yè)者,真的想要創(chuàng)業(yè)的話,需要打造兩個方面:一是自己,二是團隊。這里的團隊要打造好,首先就從公司結(jié)構(gòu)的搭建開始,讓每個人都有自己該做的事情,讓團隊由一根手指頭變成一個拳頭,甚至10個拳頭。如此才能把市場這個事業(yè)做出來。
如何繪制企業(yè)組織架構(gòu)圖
現(xiàn)今互聯(lián)網(wǎng)行業(yè)飛速發(fā)展,我們繪制組織架構(gòu)圖不僅僅只有靠office三件套,還有專業(yè)組織架構(gòu)圖軟件。OrgCharting組織架構(gòu)圖軟件,一款多功能的專業(yè)組織架構(gòu)圖軟件,便能解決這個繪圖問題。支持繪制各行業(yè)的架構(gòu)圖,還能支持數(shù)據(jù)導入一鍵生成組織架構(gòu)圖等功能。從空白畫布到繪制完成,你只需要花費少量的時間。
創(chuàng)業(yè)公司如何組建團隊? 這三種方式告訴你 創(chuàng)業(yè)視頻課程
創(chuàng)業(yè)初期除了資金,最困難的當屬如何組建團隊。找資源能力互補,并有共同理念的人才加入并非易事。 今天就來聊聊通過哪些方式,才能尋找到優(yōu)秀的人才加入。
1.主動尋找
假如你開始創(chuàng)業(yè),想組建一個團隊。你第一個想到的方法,就是聯(lián)系那些以前就認識,并適合這個項目的人??赡苓@部分人正在工作,或者有自己的公司,不會輕易出來創(chuàng)業(yè)。你只能不斷地多和他們接觸,邀請他們參與進來。
如果身邊沒有這方面優(yōu)秀的人才資源,你只能通過互聯(lián)網(wǎng)的一些平臺尋找合伙人。貼吧、論壇發(fā)帖,通過緣創(chuàng)派、微鏈等平臺找合伙人,在脈脈和赤兔上聯(lián)系大公司職員。雖然這個效率低,即使找到了心儀的對象,也需要很長一段時間來磨合。不過這也是一種高效的方式。
2.朋友介紹
朋友介紹的方式比自己再網(wǎng)上找合伙人更靠譜。第一,朋友介紹過來的會有一定背書,更容易達成合作意向。第二、你朋友不僅會幫你找你所需要的人,還會找有意來進行創(chuàng)業(yè)的人。說不定那個人你很欣賞,他也對你的項目很感興趣。
你可以拜托你身邊的連續(xù)創(chuàng)業(yè)者,因為他們身邊創(chuàng)業(yè)的朋友很多。如果你身邊有科技媒體的記者朋友,或者有一定影響力的自媒體朋友,那簡直太好了。他們不僅創(chuàng)業(yè)者資源眾多,而且身邊的投資人資源也很豐富。讓他們幫忙之前,記得要好好犒勞一下他們喲。因為找合適的合伙人,他們也不容易,會費一定心思。何況,在介紹過程中他們也算是為你的項目做了背書。
3.被動尋找
主動尋找和被動尋找的缺點是,可能你心儀的合伙人對象并不買賬。你豪情萬丈地給你描述未來的宏偉藍圖,可他并不感興趣。這就尷尬了。那何不換一種方式?讓那些優(yōu)秀并對項目感興趣的人主動連聯(lián)系過來。
其實說起來容易,做起來也稍微有點困難。你可以寫文章,把你想表達的東西寫出來發(fā)表到創(chuàng)業(yè)邦、虎嗅、今日頭條、UC頭條這類平臺?;蛘吣憧梢蚤_發(fā)第一個版本,聯(lián)系獵云網(wǎng)、36k等平臺進行采訪。你的理念和項目會被廣泛的曝光,這會帶來不少優(yōu)秀的人加入。