網(wǎng)站性能檢測評分
注:本網(wǎng)站頁面html檢測工具掃描網(wǎng)站中存在的基本問題,僅供參考。
統(tǒng)計數(shù)據(jù)分析技術(shù)
大數(shù)據(jù)和統(tǒng)計學(xué)之間的關(guān)系,你怎么看? 營銷視頻課程
普遍的定義認(rèn)為,統(tǒng)計學(xué)是關(guān)于數(shù)據(jù)的科學(xué),研究如何收集數(shù)據(jù),并科學(xué)地推斷總體特征。大數(shù)據(jù)和統(tǒng)計學(xué)還是存在一定區(qū)別的,其一是數(shù)據(jù)分析時不再進行抽樣,而是采用population(n=all);其二是分析方法,側(cè)重所有變量之間的相關(guān)性,而不再根據(jù)背景學(xué)科理論篩選變量,進行假設(shè)檢驗。
現(xiàn)在社會上有一種流行的說法,認(rèn)為在大數(shù)據(jù)時代,“樣本=全體”,人們得到的不是抽樣數(shù)據(jù)而是全數(shù)據(jù),因而只需要簡單地數(shù)一數(shù)就可以下結(jié)論了,復(fù)雜的統(tǒng)計學(xué)方法可以不再需要了。
普查和抽樣調(diào)查是傳統(tǒng)的兩大數(shù)據(jù)收集方法。普查不需要統(tǒng)計學(xué)方法進行推斷估計,因為通過普查,已經(jīng)取得了所有個體數(shù)據(jù)和總體的實際分布,這也是為什么人類開始懂得計數(shù)就開始進行普查。抽樣調(diào)查是利用抽樣理論解決如何科學(xué)設(shè)計樣本,取得樣本個體數(shù)據(jù),并科學(xué)地推斷總體分布及特征。無論是普查還是抽樣調(diào)查,其核心問題之一是要取得準(zhǔn)確的“個體數(shù)據(jù)”。但在大數(shù)據(jù)時代,一切皆可量化,一切皆可記錄,如何利用更全面、更及時、更經(jīng)濟的網(wǎng)絡(luò)電子化數(shù)據(jù),以及通過對這些數(shù)據(jù)使用新的分析及挖掘技術(shù),產(chǎn)生新的見解和認(rèn)識,是我們面臨的重大機遇。
大數(shù)據(jù)的應(yīng)用可以說是在減少人類處理數(shù)據(jù)時帶入的主觀假設(shè)的影響,而完全依靠數(shù)據(jù)間的相關(guān)性來闡述。而由于消除人為因素帶入的誤差,已經(jīng)分析人員作出假設(shè)的限制(如果教育背景和保險購買額是相關(guān)的,而分析人員沒想到,那這個結(jié)論就不會被分析出來,這在實際案例中是很容易發(fā)生的,大數(shù)據(jù)的核心也就在于它能更充分的發(fā)掘數(shù)據(jù)的全部真實含義。
在大數(shù)據(jù)時代,數(shù)據(jù)分析的很多根本性問題和小數(shù)據(jù)時代并沒有本質(zhì)區(qū)別。當(dāng)然,大數(shù)據(jù)的特點,確實對數(shù)據(jù)分析提出了全新挑戰(zhàn)。例如,許多傳統(tǒng)統(tǒng)計方法應(yīng)用到大數(shù)據(jù)上,巨大計算量和存儲量往往使其難以承受;對結(jié)構(gòu)復(fù)雜、來源多樣的數(shù)據(jù),如何建立有效的統(tǒng)計學(xué)模型也需要新的探索和嘗試。對于新時代的數(shù)據(jù)科學(xué)而言,這些挑戰(zhàn)也同時意味著巨大的機遇,有可能會產(chǎn)生新的思想、方法和技術(shù)。
西線學(xué)院培訓(xùn)機構(gòu)提供良好的教學(xué)環(huán)境,良好的師資以及行業(yè)資源,使得西線學(xué)院教學(xué)永遠(yuǎn)都是跟隨行業(yè)進步的步伐。說了這么多,其實就是想讓你更加了解大數(shù)據(jù)。如此優(yōu)秀的資源和別人望眼欲穿的實習(xí)機會,再不行動就要被后來居上的技術(shù)人員拍死在沙灘上了。
數(shù)據(jù)分析:統(tǒng)計學(xué)方法在數(shù)據(jù)挖掘中的應(yīng)用探究,看完長見識了! 推廣視頻課程
統(tǒng)計學(xué)方法在數(shù)據(jù)挖掘中的應(yīng)用探究
數(shù)據(jù)挖掘就是指從眾多實際應(yīng)用數(shù)據(jù)中獲取批量大、有噪聲、且隨機性強的數(shù)據(jù),將潛在的信息與數(shù)據(jù)提取出來,就是從數(shù)據(jù)中挖掘有價值的知識,而大多數(shù)原始數(shù)據(jù)具有一定的結(jié)構(gòu)化特征,比如,關(guān)系數(shù)據(jù)庫中的數(shù)據(jù);也可以通過文本、圖形、圖像等半結(jié)構(gòu)化發(fā)掘有用知識,這些知識可以是數(shù)學(xué)的也可以是非數(shù)學(xué)形式的;數(shù)據(jù)挖掘能以歸納形式存在,能夠被廣泛應(yīng)用到信息查詢、信息管理、信息決策控制中,方便數(shù)據(jù)的維護與管理。由此可見,數(shù)據(jù)挖掘是一門交叉性強的學(xué)科,加強對其的研究非常有意義,下面將對統(tǒng)計方法在數(shù)據(jù)挖掘中的具體應(yīng)用進行分析。
一、數(shù)據(jù)挖掘與統(tǒng)計學(xué)的關(guān)系 ?。ㄒ唬?shù)據(jù)挖掘的內(nèi)涵 通常來說,數(shù)據(jù)挖掘的定義較為模糊,沒有明確界定,大部分對其的定義只是停留在其背景與觀點的內(nèi)容上。通過對不同觀點的統(tǒng)一整理,人們最終將其描述為:從大量多樣化的信息中發(fā)現(xiàn)隱晦性、規(guī)律性等潛在信息,并對這些信息進行創(chuàng)造、加工的過程。數(shù)據(jù)挖掘作為一門重要的交叉學(xué)科,能夠?qū)?shù)據(jù)庫、人工智能、機器學(xué)習(xí)、統(tǒng)計學(xué)等眾多的科學(xué)融入到一起,從而實現(xiàn)技術(shù)與理論的創(chuàng)新與發(fā)展[1]。其中,數(shù)據(jù)庫、人工智能與統(tǒng)計學(xué)是數(shù)據(jù)挖掘當(dāng)中的三大支柱理論。數(shù)據(jù)挖掘的目的是從數(shù)據(jù)庫當(dāng)中發(fā)掘各種隱含的知識與信息,此過程的方法非常多,有統(tǒng)計學(xué)知識、遺傳算法、粗集方法、決策法、模糊邏輯法等,還可以應(yīng)用向鄰近的可視技術(shù)、模式識別技術(shù)等,在以上所有技術(shù)的支持上能夠使數(shù)據(jù)挖掘更為科學(xué)、有序?! 。ǘ?shù)據(jù)挖掘與統(tǒng)計學(xué)間的關(guān)系 通常來說,統(tǒng)計學(xué)的主要功能是對統(tǒng)計原理與統(tǒng)計方法進行研究的科學(xué)。具體來說就是指對數(shù)字資料進行的收集、整理、排序、分析、利用的過程,數(shù)字資料是各種信息的歸納與總結(jié),可以將其作為特性原理的認(rèn)知、推理方法[2]。而統(tǒng)計學(xué)則表示的是使用專業(yè)的統(tǒng)計學(xué)、概率理論原理等對各種屬性關(guān)系的統(tǒng)計與分析過程,通過分析成功找到屬性間的關(guān)聯(lián)與發(fā)展的規(guī)律。在此過程中,統(tǒng)計分析方法是數(shù)據(jù)挖掘最為重要的手段之一。
在數(shù)據(jù)挖掘這一課題被提出來之前,統(tǒng)計分析技術(shù)對于人們來說更熟悉,也是人們?nèi)粘i_展工作、尋找數(shù)據(jù)間規(guī)律最常使用的收集整理方法。但是不能簡單的將數(shù)據(jù)挖掘作為統(tǒng)計學(xué)的延伸與替代工具,而是要將兩者的區(qū)別認(rèn)識到位,再結(jié)合兩者間的不同特點分析其應(yīng)用特點[3]。大部分的統(tǒng)計學(xué)分析技術(shù)都是建立在數(shù)學(xué)理論與技巧上的,預(yù)測通常較為準(zhǔn)確,效果能夠讓大部分人滿意。數(shù)據(jù)挖掘能夠充分借鑒并吸收統(tǒng)計學(xué)技術(shù),在融入到自身特點以后成為一種數(shù)據(jù)挖掘技術(shù)。 統(tǒng)計學(xué)與數(shù)據(jù)挖掘存在的目標(biāo)都是一致的,就是不斷對數(shù)據(jù)結(jié)構(gòu)進行發(fā)掘。鑒于統(tǒng)計學(xué)與數(shù)據(jù)挖掘在目標(biāo)上的一致性,致使很多研究學(xué)者與專家將數(shù)據(jù)挖掘作為了統(tǒng)計學(xué)的一個分支機構(gòu)[4]。但是這種認(rèn)知非常不正確,因為數(shù)據(jù)挖掘不僅體現(xiàn)在與統(tǒng)計學(xué)的關(guān)系上還體現(xiàn)在思想、工具與方法上,尤其是在計算機科學(xué)領(lǐng)域?qū)?shù)據(jù)挖掘起到的作用非常大。比如,通過借助數(shù)據(jù)庫技術(shù)與人工智能的學(xué)習(xí),能夠關(guān)注到更多統(tǒng)計學(xué)與數(shù)據(jù)挖掘上的共通點,但是兩者存在的差異依然非常大。數(shù)據(jù)挖掘就是指對大量的數(shù)據(jù)信息不斷挖掘的過程,DM能夠?qū)?shù)據(jù)模式內(nèi)的數(shù)據(jù)關(guān)系進行充分挖掘,并對觀測到的數(shù)據(jù)庫處理有著極高的關(guān)注度?! 《?、數(shù)據(jù)挖掘的主要過程 從數(shù)據(jù)本身出發(fā)探討數(shù)據(jù)挖掘過程,數(shù)據(jù)挖掘的過程分為信息的收集、數(shù)據(jù)集成、數(shù)據(jù)處理、數(shù)據(jù)變換、數(shù)據(jù)挖掘?qū)嵤┑冗^程。
首先,要將業(yè)務(wù)對象確定下來,明確不同業(yè)務(wù)定義,并認(rèn)清數(shù)據(jù)挖掘的目的,這是做好數(shù)據(jù)挖掘最關(guān)鍵的一步,也是最重要的一步,雖然挖掘的結(jié)果不能被準(zhǔn)確預(yù)測到,但卻需要對問題的可預(yù)見性進行探索[5]。其次,還要做好數(shù)據(jù)準(zhǔn)備工作,包含數(shù)據(jù)清理、數(shù)據(jù)變換等工作,數(shù)據(jù)清理的實際意義是將噪聲與空缺值補全,針對這一問題,可以使用平滑技術(shù),而空缺值的處理則是屬性中最常見的,可以將統(tǒng)計中最可能出現(xiàn)的值作為一個空缺值[6]?! ⌒畔⑹占傅氖前凑仗囟ǖ臄?shù)據(jù)分析對象,可以將分析中需要的特征信息抽象出來,并在此基礎(chǔ)上選擇出較為科學(xué)、適合的信息收集方法,將全部的信息全部錄入到特定的數(shù)據(jù)庫中。如果數(shù)據(jù)量較大,則可以選擇一個專門的管理數(shù)據(jù)的倉庫,實現(xiàn)對信息的有效保護與管理;數(shù)據(jù)集成就是指將來源不同、格式不同、性質(zhì)不同、特點不同的數(shù)據(jù)集成到一起,進而為企業(yè)提供更為全面、系統(tǒng)的數(shù)據(jù)共享平臺;數(shù)據(jù)變換就是通過聚集、概化、規(guī)范化等方式對數(shù)據(jù)進行挖掘,對于一些實用數(shù)據(jù),則可以通過分層與分離方式實現(xiàn)對數(shù)據(jù)的轉(zhuǎn)換;數(shù)據(jù)挖掘就是結(jié)合數(shù)據(jù)倉庫中的數(shù)據(jù)信息點,并選擇正確的分析方法實現(xiàn)對有價值數(shù)據(jù)的挖掘,事例推理、規(guī)則推理、遺傳算法等都是應(yīng)用較多的方法[7]。 三、統(tǒng)計學(xué)方法中的聚類分析 在統(tǒng)計學(xué)聚類方法基礎(chǔ)上能夠構(gòu)建出潛在的概率分布假設(shè),可以使用試圖優(yōu)化的方法構(gòu)建數(shù)據(jù)與統(tǒng)計模型的擬合效果?;诮y(tǒng)計學(xué)聚類方法當(dāng)中,Cobweb方法是在1987年由Fisher提出的,能夠以分類樹作為層次聚類創(chuàng)建的方法,在分類樹上,每一個節(jié)點都能代表著一個概念,該方法就是對節(jié)點概率描述的過程。Cobweb方法還使用了啟發(fā)式估算方式,使用分類效用對分類樹的構(gòu)建進行指導(dǎo),從而實現(xiàn)對最高分類的劃分目的,能夠?qū)⒉煌诸悓ο笕繗w類到一個類別中,并依據(jù)這些內(nèi)容創(chuàng)建出一個新的類別。但是這種方法也存在一定局限性,局限性在于假設(shè)的屬性概率分布都是獨立的,并不能始終處于成立狀態(tài)中。
統(tǒng)計分析 | 多變量技術(shù)——綜合排名方法 互聯(lián)網(wǎng)視頻課程
這篇文章是俺2009年在博客里寫的多變量分析方法介紹之一,今天在微信公號分享!
綜合排名問題是一個多變量分析技術(shù)!
近一時期排名非常時髦,形成了排名經(jīng)濟,比如:胡潤富人排行榜,財富500強,慈善排名,城市競爭力排行,MBA商學(xué)院排名,大學(xué)排行榜等等!最近剛剛完成廣播電視節(jié)目綜合評估體系客體評估項目,其中也涉及到電視節(jié)目的綜合評估問題,特別是綜合排名問題。大部分情況下綜合評價問題都會涉及到排名,多指標(biāo)排名問題。
記?。菏袌鲅芯炕蜃餮芯康娜藦膩聿慌琶皇亲鲅芯客枰琶?!
綜合排名是一項系統(tǒng)綜合評估研究方法,焦點是如何科學(xué)、客觀地將一個多維度、多評價指標(biāo)問題綜合成為一個單指標(biāo)形式,利用產(chǎn)生的綜合評價指數(shù)進行排名和評價。
綜合排名的的形成需要研究人員對評價對象進行大量基礎(chǔ)性數(shù)據(jù)分析基礎(chǔ)上,并依據(jù)專業(yè)知識和評價方法的認(rèn)識,確定評估指標(biāo)體系,對每個評價指標(biāo)在綜合評價體系中的重要程度進行測算。研究人員需根據(jù)各指標(biāo)的重要性確定了權(quán)重,據(jù)此對每項不同測量尺度指標(biāo)進行修正后加權(quán)并標(biāo)準(zhǔn)化無量綱,最終采用多元統(tǒng)計分析方法對評價指標(biāo)進行了系統(tǒng)最佳綜合,形成最終綜合評價。
主要包括以下幾個方面:
綜合評估問題涉及面比較廣,下面我們僅僅就綜合排名問題講講,我們采用大學(xué)研究生排行榜的數(shù)據(jù)進行綜合排名!我收集了某年的大學(xué)研究生排行榜,因為顯示的問題我僅僅截取了前20名,
人民大學(xué)
提到了前面進入第20名!(數(shù)據(jù)源已經(jīng)記不清楚出處了)
從上面我們可以看到:20家大學(xué)研究生院的綜合排名情況,最左邊一列是最初的排名,這個排名名次是按照六個指標(biāo)得到了,六個指標(biāo)分別是:
我這里并不關(guān)心這六個指標(biāo)如何獲得,和數(shù)據(jù)準(zhǔn)確性問題,我們只關(guān)心應(yīng)該如何在現(xiàn)有指標(biāo)下進行綜合排名問題!
當(dāng)然,大家要關(guān)注這六個指標(biāo)的測量尺度,取值范圍,量綱的大小等,你將來總不希望把噸和克進行相加吧!
方法一:等權(quán)重求和法 T1
我們先來看看,把現(xiàn)在六個指標(biāo)求和,得到T1=P1+P2+P3+P4+P5+P6,然后按T1降序排名;
看到了嗎?該排行榜的發(fā)布就是用的加法,最簡單的方法!
從數(shù)據(jù)看以看出,指標(biāo)P6與其它指標(biāo)單位差異較大,簡單相加有缺陷,但是這種方法是大家最常用的,比如:高考錄取分?jǐn)?shù)就是各門考試成績加總,得到總成績(
高考成績
),根據(jù)錄取人數(shù)取得分位點,然后確定錄取分?jǐn)?shù)線,并排名從高到底錄??;當(dāng)然碩士研究生錄取也是這種方法!
為什么要用這種方法呢?如果用復(fù)雜多變量方法,得到總指標(biāo)排名,估計家長們或?qū)W生都要瘋了,都不知道自己如何能夠被錄取,
算法
不懂,怎么被錄取!顯然,其它方法是不能采用的,這是最好的可執(zhí)行方案!
方法二:主觀加權(quán)求和法 T2
但是,錄取單位總是想能不能把偏科的人錄取,比如我看重數(shù)學(xué)、物理,這兩個指標(biāo)應(yīng)該權(quán)重更大些,比如我們假設(shè)考了6門課,我們根據(jù)經(jīng)驗、主觀判斷、領(lǐng)導(dǎo)指示或?qū)<以u估最終確定:30:25:20:15:10:5的權(quán)重!
再次計算;T2=p1 * 0.30 + p2 * 0.25 + p3 * 0.20 + p4 * 0.15 + p5 * 0.10 + p6 * 0.05
我們按照T2降序排列,看一下排名,基本次序是一致的,只是在15名附近發(fā)生一點改變!
如果按照這種方式排名,首先所有指標(biāo)應(yīng)該在同一個量綱上,經(jīng)常是在指標(biāo)都是在100分制下,并且權(quán)重最好合計為1,最終得到的排名總分也是同樣量綱和尺度!
這種情況最適合綜合評價方式,加權(quán)平均啦!當(dāng)然如何確定權(quán)重就成為關(guān)注的要點,科學(xué)性、合理性都需要明確!大部分綜合評估方法在最后都是采用這種排名方法!
方法三:秩綜合排名法 T3
什么是秩,秩序就是求次序!所有我們可以計算每個指標(biāo)的秩,然后根據(jù)秩的大小進行求和!
從
SPSS軟件
可以選擇個案排秩,指定最大值=1,我們可以得到六個指標(biāo)的秩指標(biāo)次序!我們采用簡單加法求和和排名,看看結(jié)果如何?
計算 T3=Rp1 + Rp2 + Rp3 + Rp4 + Rp5 + Rp6,按照T3升序排列!
從T3升序排列看,這時候大致排名與原始沒有發(fā)生顛覆性變化,只是在前后名次上有了一定改變!
這種方法也是一種排名方法,經(jīng)常用在比如
世界杯
最佳陣容或最佳球隊評選上,假如有六個記者或?qū)<医o所有球隊或球員選出最佳陣容或球隊時,往往比較可操作的方法是讓所有評價者給評價對象打分或者排名,排名更好操作,然后求和!
注意:往往評價者只會評出他最熟悉的,可能會產(chǎn)生缺省值問題,所以要根據(jù)每個評價者的情況和缺失情況進行缺省值處理!然后進行求和!
方法四:主成分排名法 T4
這種方法就是多變量分析技術(shù)了,
主成分分析
方法經(jīng)常用來進行綜合評估和排名!有關(guān)主成分分析技術(shù)的相關(guān)內(nèi)容我將在主成分分析專題講,這里還是關(guān)注如何進行排名!
主成分分析是根據(jù)指標(biāo)和數(shù)據(jù)得到第一主成分,并根據(jù)第一主成分得分進行排名的方法!因為,第一主成分往往是凝聚了所有變量的最大變差,也就是解釋了6個指標(biāo)的最大差異(解釋度),或者說最大綜合成分,排名就是找差異嗎?據(jù)此排名!
SPSS軟件
沒有專門命名主成分分析,是與因子分析整合的,在選擇因子分析后,只要不進行旋轉(zhuǎn),就可以得到
主成分分析
結(jié)果,記住把得分保存下來,我們可以要求保存所有主成分,六個指標(biāo)得到六個主成分,但我們只要保存前兩個就可以了!
從主成分可以看出:第一主成分解釋了6個指標(biāo)變差的72.409%,把保存的第一主成分按降序排列,我們看一下排名情況;
從排名順序我們看到,這種方法與方法二加權(quán)排名幾乎一樣,當(dāng)然與簡單求和也基本一致!這說明,這種方法是能夠得到理想的綜合排名的?。ɡ碚撋险f,如果排名對象差異很大,不同方法得當(dāng)?shù)慕Y(jié)果基本一致?。?/p>
同時,你可以看到,成分得分
系數(shù)矩陣
的第一主成分列,實際上就是基于數(shù)據(jù)驅(qū)動的權(quán)重啦,所以這種方法不需要事先得到主觀權(quán)重,完全數(shù)據(jù)驅(qū)動!但是,得到的只是排名,具體的排名得分沒有實際意義了,如果你希望得到排名的得分具有實際意義,顯然該方法會把人搞糊涂!但是我們也可以把主成分得分進行數(shù)值變化或映射,得到指數(shù)或什么規(guī)范得分!
說明:你也可以按照第二主成分進行排名,但這個時候完全不同了!
這里我們可以得到另外一種收獲,就是可以按照第一主成分和第二主成分進行散點圖分析,得到直觀分析!
你會看這種圖嗎?
方法五:主成分綜合加權(quán)法 T5
我們從上面一種排名方法看到,雖然按照第一主成分進行了排名,但第二主成分也解釋了21.894%,如果綜合將可以解釋數(shù)據(jù)的94.303%;(學(xué)術(shù)研究有時候更追求高解釋度),好了,現(xiàn)在我們可以按照主成分的解釋度作為權(quán)重,把兩個主成分進行加權(quán)求和!
計算:T5=FAC1_1 * 72.409 + FAC2_1 * 21.894
我們看看排名情況:
對照著第一列的原始排名,這時候排名結(jié)果發(fā)生了改變,特別是
人民大學(xué)
前進了幾名!
這時候,我們要看看排名的指標(biāo)對排名的意義和影響了,我們可以分析看出,6個評價排名指標(biāo)實際上主要是兩個維度,簡單說就是自然科學(xué)和社會科學(xué)維度,前面四種排名方法基本上權(quán)重都在自然科學(xué)維度上,第五種方法考慮了社會科學(xué)維度!
我們看一下因子分析結(jié)果,采用最大方差旋轉(zhuǎn)!
顯然,第一因子我們命名為:自然科學(xué),第二因子命名:社會科學(xué)
所以,我說我們學(xué)??偸遣荒苓M入排行榜呢?原來所謂的排行榜就是看自然科學(xué)(工科類)的排名??!哈哈!
針對我們文科和藝術(shù)類學(xué)校,只能墊底啦!下次我要是排名,一定想法用復(fù)雜的排名技術(shù),把我們學(xué)校排進去,相信我能做到這一點!或者咱們來個分類排名,反正咱有技術(shù)!開玩笑啦!
記住一點:方法五在采用的時候一定格外小心,因為主成分是正交的,不同方向能否綜合要記住,也就是數(shù)值越大越表示好,也就是兩個指標(biāo)具有數(shù)值同向,才有可能滿足線性可加性!不行還是方法四比較妥當(dāng)!
方法六:乘法原則
在指標(biāo)同是正向,我們也可以將各個指標(biāo)相乘,值越大排名考前!乘法原則主要用在:一票否決,或某些指標(biāo)是另一個指標(biāo)的修正因子!
方法七:其它方法
你還可以采用部分乘法原則與加法原則綜合法,也可以因子得分進行排名,因子得分加權(quán)排名,所有主成分或因子加權(quán)排名等等!
排名方法大致就介紹到這里了,我的工作也就完成了!
至于排行榜的發(fā)布,商業(yè)的、行政的、領(lǐng)導(dǎo)的、媒體的、企業(yè)的各種因素都會最終影響排名和結(jié)果的發(fā)布~!到底最后怎么發(fā)布也有學(xué)問,大家好好學(xué)吧!
加法原則:取長補短,互有補充!
乘法原則:一損俱損,不可或缺!
上面的排名還沒有考慮指標(biāo)的標(biāo)準(zhǔn)化問題,以及如何標(biāo)準(zhǔn)化:插值法,最大值最小值法,理想點法等等!
排名是技術(shù),發(fā)布是藝術(shù)!
沈浩老師
——————
中國傳媒大學(xué)新聞學(xué)院教授、博士生導(dǎo)師
中國傳媒大學(xué)調(diào)查統(tǒng)計研究所所長
大數(shù)據(jù)挖掘與社會計算實驗室主任
中國市場研究行業(yè)協(xié)會會長
歡迎關(guān)注沈浩老師的微信公共號
_2001
數(shù)藝智訓(xùn)
DAtraining
歡迎關(guān)注:靈動數(shù)藝
——數(shù)藝智訓(xùn)
數(shù)據(jù)藝術(shù)家
TableauHome
Excel數(shù)據(jù)統(tǒng)計分析中36個小技巧 行業(yè)視頻課程
1、一列數(shù)據(jù)同時除以10000
復(fù)制10000所在單元格,選取數(shù)據(jù)區(qū)域 - 選擇粘性粘貼 - 除
2、同時凍結(jié)第1行和第1列
選取第一列和第一行交匯處的墻角位置B2,窗口 - 凍結(jié)窗格
3、快速把公式轉(zhuǎn)換為值
選取公式區(qū)域 - 按右鍵向右拖一下再拖回來 - 選取只保留數(shù)值。
4、顯示指定區(qū)域所有公式
查找 = 替換為“ =”(空格+=號) ,即可顯示工作表中所有公式
5、同時編輯所有工作表
全選工作表,直接編輯,會更新到所有工作表。
6、刪除重復(fù)值
選取數(shù)據(jù)區(qū)域 - 數(shù)據(jù) - 刪除重復(fù)值
7、顯示重復(fù)值
選取數(shù)據(jù)區(qū)域 - 開始 - 條件格式 - 顯示規(guī)則 - 重復(fù)值
8、把文本型數(shù)字轉(zhuǎn)換成數(shù)值型
選取文本數(shù)字區(qū)域,打開左上角單元格的綠三角,選取 轉(zhuǎn)換為數(shù)值
9、隱藏單元格內(nèi)容
選取要隱藏的區(qū)域 - 設(shè)置單元格格式 - 數(shù)字 - 自定義 - 輸入三個分號;;;
10、給excel文件添加密碼
文件 - 信息 - 保護工作簿 - 用密碼進行加密
11、給單元格區(qū)域添加密碼
審閱 - 允許用戶編輯區(qū)域 - 添加區(qū)域和設(shè)置密碼
12、把多個單元格內(nèi)容粘貼一個單元格
復(fù)制區(qū)域 - 打開剪貼板 - 選取某個單元格 - 在編輯欄中點擊剪貼板中復(fù)制的內(nèi)容
13、同時查看一個excel文件的兩個工作表
視圖 - 新建窗口 - 全部重排
14、輸入分?jǐn)?shù)
先后輸入 0 ,再輸入 空格, 再輸入分?jǐn)?shù)即可
15、強制換行
在文字后按alt+回車鍵即可換到下一行
16、刪除空行
選取A列 - Ctrl+g打開定位窗口 - 定位條件:空值 - 整行刪除
17、隔行插入空行
在數(shù)據(jù)表旁拖動復(fù)制1~N,然后再復(fù)制序號到下面,然后按序號列排序即可。
18、快速查找工作表
在進度條右鍵菜單中選取要找的工作表即可。
19、快速篩選
右鍵菜單中 - 篩選 - 按所選單元格值進行篩選
20、讓PPT的圖表隨excel同步更新
復(fù)制excel中的圖表 - 在PPT界面中 - 選擇性粘貼 - 粘貼鏈接
21、隱藏公式
選取公式所在區(qū)域 - 設(shè)置單元格格式 - 保護:選取隱藏 - 保護工作表
22、行高按厘米設(shè)置
點右下角“頁面布局”按鈕,行高單位即可厘米
23、復(fù)制時保護行高列寬不變
整行選取復(fù)制,粘貼后選取“保持列寬。
24、輸入以0開始的數(shù)字或超過15位的長數(shù)字
先輸入單引號,然后再輸入數(shù)字?;蛳仍O(shè)置格式為文本再輸入。
25、全部顯示超過11的長數(shù)字
選數(shù)區(qū)域 - 設(shè)置單元格格式 - 自定義 - 輸入0
26、快速調(diào)整列寬
選取多列,雙擊邊線即可自動調(diào)整適合的列寬
27、圖表快速添加新系列
復(fù)制 - 粘貼,即可給圖表添加新的系列
28、設(shè)置大于72磅的字體
excel里的最大字并不是72磅,而是409磅。你只需要輸入數(shù)字即可。
29、設(shè)置標(biāo)題行打印
頁面設(shè)置 - 工作表 - 頂端標(biāo)題行
30、不打印錯誤值
頁面設(shè)置 - 工作表 - 錯誤值打印為:空
31、隱藏0值
文件 - 選項 - 高級 - 去掉“顯在具有零值的單元格中顯示零”
32、設(shè)置新建文件的字體和字號
文件 - 選項 - 常規(guī) - 新建工作簿時....
33、快速查看函數(shù)幫助
在公式中點擊下面顯示的函數(shù)名稱,即可打開該函數(shù)的幫助頁面。
34、加快excel文件打開速度
如果文件公式過多,在關(guān)閉時設(shè)置為手動,打開時會更快。
35、按行排序
在排序界面,點擊選項,選中按行排序
36、設(shè)置可以打印的背景圖片
在頁眉中插入圖片即要
來源:網(wǎng)絡(luò)整理
百家號-【袁帥數(shù)據(jù)分析運營】運營者:袁帥,會展業(yè)信息化、數(shù)字化領(lǐng)域?qū)<?。新社匯平臺聯(lián)合創(chuàng)始人,永洪數(shù)據(jù)科學(xué)研究院MVP。認(rèn)證數(shù)據(jù)分析師、網(wǎng)絡(luò)營銷師、SEM搜索引擎營銷師、SEO工程師、中國電子商務(wù)職業(yè)經(jīng)理人。暢銷書《互聯(lián)網(wǎng)銷售寶典》聯(lián)合出品人。