JMP11新功能速覽
近日,SAS公司的可視化統(tǒng)計發(fā)現(xiàn)軟件JMP正式發(fā)布了最新的JMP11版(JMP普通版)及JMP Pro11版(JMP專業(yè)版)。在大數(shù)據(jù)話題越來越熱的今天,此次新品發(fā)布也受到了眾多統(tǒng)計分析愛好者和JMPer(JMP粉絲)們的關(guān)注。從內(nèi)容上看,JMP11的提升力度很大。在繼承了JMP可視化交互式分析的產(chǎn)品特色之外,JMP11新增或改進了16個功能大類,共計約140項功能,技術(shù)難度不亞于重新設(shè)計開發(fā)出一個新的小型統(tǒng)計分析軟件。
本文引用地址:http://butianyuan.cn/article/192612.htm本文將以統(tǒng)計應(yīng)用為導(dǎo)向,從用戶的視角出發(fā),將內(nèi)容及其豐富的JMP11新功能濃縮為探索性數(shù)據(jù)分析和數(shù)據(jù)可視化、質(zhì)量管理、產(chǎn)品研發(fā)、分析自動化與擴展和專業(yè)統(tǒng)計分析六大統(tǒng)計應(yīng)用領(lǐng)域,幫助廣大統(tǒng)計分析愛好者快速地對JMP11有一個全面而又準(zhǔn)確的了解。
1. 探索性數(shù)據(jù)分析和數(shù)據(jù)可視化
探索性數(shù)據(jù)分析和數(shù)據(jù)可視化一直是JMP倡導(dǎo)的現(xiàn)代統(tǒng)計分析的重要發(fā)展方向和其與眾不同的統(tǒng)計分析手段之一。在使用JMP11進行探索性數(shù)據(jù)分析和數(shù)據(jù)可視化的過程中,用戶體驗會更加愉快。這主要是因為相應(yīng)的變化有:新添獨有的列查看器Column Viewer、轉(zhuǎn)換變量Transform Varaibles、交互式HTML報告Interactive HTML Report,改進已有的數(shù)據(jù)過濾器Data Filter、圖形生成器Graph Builder、偏好設(shè)置Preference Setting等功能。
具體來說,改進的偏好設(shè)置是指JMP11提供更加出色的默認(rèn)圖表和表格,也可以方便地對圖表、表格和報告的外觀進行微調(diào),使用戶可以自動創(chuàng)建有效的可視化結(jié)果,最大程度地減少調(diào)整和優(yōu)化統(tǒng)計報表界面的無效時間,從而將精力更多地放到數(shù)據(jù)及其傳達(dá)的信息等有效事件上去。
新添的交互式 HTML報告是指很多原先只能在JMP軟件環(huán)境下才能實現(xiàn)動態(tài)互動式分析的圖形和報表,都可以被保存為 HTML5 格式的網(wǎng)頁,然后通過電子郵件發(fā)送給同事或朋友,或者直接公布到網(wǎng)站上,該報告支持最新的瀏覽器(包括移動設(shè)備瀏覽器)進行查看。這使得眾多還沒有安裝JMP的人員也能分享原創(chuàng)者的分析成果和樂趣,像安裝了JMP軟件一樣進行探索性數(shù)據(jù)分析。
2. 質(zhì)量管理
在質(zhì)量管理及其衍生出來的六西格瑪領(lǐng)域從業(yè)的工程師和經(jīng)理們是JMP軟件用戶群中的一個重要分支,JMP11不負(fù)眾望,在這個方面交出了令人滿意的答卷。其中比較大的變化是:新增響應(yīng)篩選Response Screening分析平臺,增強控制圖生成器Control Chart Builder和預(yù)測刻畫器Prediction Profiler兩個質(zhì)量分析工具。此外,還在過程能力分析Capability、魚骨圖Diagram、測量系統(tǒng)分析Measurement Systems Analysis等工具上有一些細(xì)節(jié)上的改進。
其中最值得一提的是增強的控制圖生成器和預(yù)測刻畫器。
很對人可能還對在JMP10中新推出的拖放式控制圖生成器記憶猶新:只需輕輕一點,即可創(chuàng)建過程控制圖表,不但可以判斷流程是否穩(wěn)定,而且可以分析流程不穩(wěn)定的原因所在。只是讓人略感遺憾的是它不支持離散變量,只能做計量型控制圖。JMP11彌補了這一遺憾,最新的控制圖生成器允許用戶創(chuàng)建包括np、p、C和U圖在內(nèi)的計數(shù)型控制圖。更令人驚喜的是,JMP11中的控制圖生成器還支持T和G圖在內(nèi)的稀有事件控制圖!T和G圖是了解稀有事件發(fā)生頻率是否高于預(yù)期和證明干預(yù)正當(dāng)性的一種有效方式 ,它在質(zhì)檢人員關(guān)注安全事故、嚴(yán)重質(zhì)量事故時非常實用,因為這時傳統(tǒng)的控制圖是無法真實表現(xiàn)出流程穩(wěn)定性的。
JMP中的預(yù)測刻畫器是很多人耳熟能詳?shù)囊粋€特色工具,十幾年前就有了。JMP11中的預(yù)測刻畫器新增評估變量重要性Assess Variable Importance的選項,不僅可以通過圖形進行定性分析,而且可以通過顯示的各自變量主效應(yīng)值和總效應(yīng)值,量化地了解建模過程中最重要的輸入因素。這個特點可以幫助我們在進行敏感度分析,或者需要在眾多潛在因子中分離出影響響應(yīng)的少數(shù)重要因子時,大幅節(jié)省分析時間,提高工作效率。
3. 產(chǎn)品研發(fā)
越來越多的人意識到統(tǒng)計質(zhì)量工具不僅僅適用在企業(yè)的質(zhì)量部門、工藝部門,其實在研發(fā)部門也大有用武之地,只是用到的工具會更復(fù)雜一些,如實驗設(shè)計DOE和可靠性Reliability。
具體來說,JMP11中實驗設(shè)計方面的主要變化是:新添獨創(chuàng)性的決定性篩選設(shè)計Definitive Screening Design平臺,改進已有的混料設(shè)計Mixture Design、篩選設(shè)計Screening Design、空間填充設(shè)計Space Filling Design等平臺。JMP11中可靠性方面的主要變化是:新添可靠性方塊圖Reliability Block Diagram平臺(僅限JMP Pro),改進已有的可靠性增長Reliability Growth、擬合參數(shù)生存Fit Parametric Survival等平臺。
這當(dāng)中最值得向研發(fā)人員推薦的就是新近開發(fā)的決定性篩選設(shè)計和可靠性方塊圖。
決定性篩選設(shè)計的亮點在于它能夠一舉克服傳統(tǒng)篩選設(shè)計的兩個缺陷:一是容易遺漏主效應(yīng)不顯著但二次項顯著的關(guān)鍵因子,二是當(dāng)存在的交互作用項較多時,需要執(zhí)行較多的實驗次數(shù)以提高實驗的分辨率。當(dāng)實驗中需要考慮的潛在因子越多時,JMP11中的決定性篩選設(shè)計為你帶來的價值越大。因為運用這種新方法時,實驗次數(shù)的增加與實驗因子的增加幾乎完全是線性的,而不像傳統(tǒng)篩選設(shè)計中那樣需要成倍增加。更重要的是,它在幫助你節(jié)省實驗成本和時間的同時,任何主要模型項之間又不會相互混淆,顯著提高了實驗分析的效率。也正是因為如此,負(fù)責(zé)這個DOE平臺的JMP研發(fā)人員還榮獲了美國質(zhì)量協(xié)會頒發(fā)的年度大獎呢。
可靠性方塊圖的最大特色在于以往我們能夠?qū)σ粋€簡單產(chǎn)品或零部件進行可靠性分析,但對一個復(fù)雜系統(tǒng)(如擁有多個硬盤的 RAID 存儲陣列,或者配備四個引擎的飛機)的可靠性往往會束手無策。JMP Pro11中的可靠性方塊圖就是專門為你創(chuàng)建和分析整個系統(tǒng)的可靠性的。它可以使用戶通過查看不同的設(shè)計和比較多個系統(tǒng)的設(shè)計圖來輕松進行假設(shè)分析,通過添加冗余部件來彌補系統(tǒng)弱點,從而避免系統(tǒng)將來發(fā)生故障。
4. 市場調(diào)研
除了質(zhì)量、工藝、研發(fā)等技術(shù)部門之外,企業(yè)的市場部門經(jīng)常會面臨客戶市場細(xì)分、滿意度調(diào)查、精準(zhǔn)營銷、客戶挽留等大量與統(tǒng)計分析相關(guān)的任務(wù),JMP軟件處理這類數(shù)據(jù)分析問題也是非常專業(yè)的。
以往這個特點一直是“藏在深閨無人知”,從JMP11開始,分析菜單中新增加了一個“客戶研究Consumer Research”的二級主菜單,整合并改進了已有的分類Categorical、選擇Choice、項目分析Item Analysis平臺,新添了提升Uplift平臺(僅限JMP Pro),顯示出JMP在市場調(diào)研領(lǐng)域也充滿了實力和信心。
這里和大家分享其中兩個最有價值的工具:分類和提升。
分類平臺早在JMP7時就有了,主要用于收集和分析有關(guān)客戶如何使用產(chǎn)品或客戶滿意度的信息。JMP11中分類的分析操作更加簡便,支持多種格式的調(diào)查問題,無論是內(nèi)容詳實的明細(xì)報告,還是內(nèi)容緊湊的簡潔報告,都可以輕松制作。用戶還可以分析調(diào)查中回答者可以選擇多個答案的多選問題。甚至提供一個拖放界面,用于構(gòu)建更加復(fù)雜的調(diào)查分析結(jié)構(gòu)。全部完成之后,還可以輕松將完成的分析表格輸出到 Excel 工作簿中。
JMP Pro11中的提升平臺初看和JMP中的另外一個平臺:分割(即決策樹)非常類似,但其實包含著全新的功能。它可以幫助用戶優(yōu)化市場營銷決策,確定個性化促銷方案,或者更用來預(yù)測不同的消費者對某項市場活動可能作出的不同回應(yīng)。它還可以像其他數(shù)據(jù)挖掘方法一樣使用訓(xùn)練、驗證和檢驗方法,防止過度擬合,使新建的模型能夠更好地推廣到新數(shù)據(jù)去。
5. 分析自動化與擴展
分析自動化與擴展的功能主要是指用編程的方式來自動調(diào)用JMP進行數(shù)據(jù)的整理和分析工作,并通過提高JMP與其他數(shù)據(jù)分析軟件的兼容性來快速提高JMP的適應(yīng)能力和分析能力。它是專門為JMP高級用戶準(zhǔn)備的。JMP11在這方面的亮點也是層出不窮,包括:構(gòu)建界面更友好的JSL(JMP腳本語言)編程環(huán)境、優(yōu)化應(yīng)用程序的實用功能、支持直接讀取Teradata數(shù)據(jù)庫、完善Excel導(dǎo)入向?qū)А⑴cMatlab無縫集成和導(dǎo)入海量外部數(shù)據(jù)前可事先抽樣等。
我們從中精選兩項內(nèi)容來說明一下:完善Excel導(dǎo)入向?qū)Ш团cMatlab無縫集成。
Excel是我們接觸頻率最高的數(shù)據(jù)分析軟件。常??吹竭@樣的情形:需要用JMP分析的數(shù)據(jù)分布在多個Excel工作簿里,其中又有不同的嵌套層次和分組的行或列,因此在開始分析前往往需要進行大量處理?,F(xiàn)在,憑借完善后的JMP11 Excel導(dǎo)入向?qū)В瑪?shù)據(jù)導(dǎo)入的難題迎刃而解,無需進行長時間的清理和格式修改,只需簡單幾步,即可獲得JMP標(biāo)準(zhǔn)格式的分析表格。如果文件發(fā)生變更或更新,還可自動生成JSL用于刷新數(shù)據(jù)。
和大眾化的Excel相反,Matlab的主要用戶是專業(yè)的信號處理工程師和計算金融分析師,在某些特定的領(lǐng)域積累了豐富的行業(yè)經(jīng)驗和現(xiàn)成的Matlab分析代碼,同時他們也喜歡交互性強、可視化效果好的JMP分析界面(如JMP獨有的預(yù)測刻畫器)。現(xiàn)在,像這樣的用戶不必再糾結(jié)如何取舍工具軟件的問題了。因為JMP11可以與Matlab無縫集成。使用JMP11中的JSL功能,JMP可以直接與Matlab結(jié)合,啟動 Matlab連接、向Matlab發(fā)送數(shù)據(jù)、提交代碼以及將數(shù)據(jù)輸出或送回JMP。更有意義的是,哪怕對Matlab及其編程知識一無所知的人,也可以借助同行現(xiàn)有的Matlab模型,進一步拓展分析能力,大幅提高工作效率。
6. 專業(yè)統(tǒng)計分析
對于從事數(shù)據(jù)挖掘與建模預(yù)測、統(tǒng)計科研與教育的專業(yè)統(tǒng)計分析人士來說,以上介紹的內(nèi)容可能還不過癮。其實,JMP11對于統(tǒng)計高端用戶也推出了很多頗具幫助價值的新功能,其中包括全新或改進過的穩(wěn)健模型Robust Modeling、廣義回歸 Generalized Regression (僅限JMP Pro)、混合模型Mixed Models (僅限JMP Pro)、偏最小二乘Partial Least Squares等。
舉兩個例子來說,廣義回歸的適應(yīng)場景是:如果你有大量關(guān)聯(lián)性較強或者比觀測數(shù)據(jù)更多的預(yù)測變量,使用逐步回歸或其他標(biāo)準(zhǔn)方法將無法得到令人滿意的結(jié)果。這一類模型經(jīng)常會過度擬合,并且很難推廣到新數(shù)據(jù)。JMP Pro 11中的廣義回歸能夠面對雜亂的大型數(shù)據(jù)集創(chuàng)建預(yù)測模型,這是JMP數(shù)據(jù)挖掘工具箱中的一項重要新功能,可用于對大量預(yù)測變量進行變量選擇或創(chuàng)建數(shù)據(jù)挖掘模型。它能夠幫助你以非常自然的方式處理說明變量中的多重共線性,通過對估計參數(shù)的較大波動施加懲罰來避免過度擬合。除標(biāo)準(zhǔn)的正態(tài)或二項分布外,JMP Pro 11中的廣義回歸還支持泊松分布、零膨脹泊松分布、負(fù)二項分布、零膨脹負(fù)二項分布等其他分布形式。
混合模型則適應(yīng)于:當(dāng)化工生產(chǎn)或制藥行業(yè)的藥物試驗、交叉設(shè)計過程中需要對多個對象進行多次測量時,以及其他會同時涉及時間和空間的數(shù)據(jù)時,就可以在實驗數(shù)據(jù)分析中運用混合模型。JMP Pro11中全新的混合模型特質(zhì),能夠混合固定效應(yīng)和隨機效應(yīng)模型對數(shù)據(jù)進行擬合。用戶可以在直觀的拖放界面中指定固定、隨機和重復(fù)效應(yīng),關(guān)聯(lián)多組變量,設(shè)定受試對象和連續(xù)型效應(yīng)。另外,用戶還可以根據(jù)實際需要計算更多種關(guān)聯(lián)結(jié)構(gòu)的協(xié)方差參數(shù)。
評論