Java語言深入:有關(guān)Java語言的內(nèi)存泄漏
Java的一個(gè)重要優(yōu)點(diǎn)就是通過垃圾收集器(Garbage Collection,GC)自動(dòng)管理內(nèi)存的回收,程序員不需要通過調(diào)用函數(shù)來釋放內(nèi)存。因此,很多程序員認(rèn)為Java不存在內(nèi)存泄漏問題,或者認(rèn)為即使有內(nèi)存泄漏也不是程序的責(zé)任,而是GC或JVM的問題。其實(shí),這種想法是不正確的,因?yàn)镴ava也存在內(nèi)存泄露,但它的表現(xiàn)與C++不同。
隨著越來越多的服務(wù)器程序采用Java技術(shù),例如JSP,Servlet, EJB等,服務(wù)器程序往往長期運(yùn)行。另外,在很多嵌入式系統(tǒng)中,內(nèi)存的總量非常有限。內(nèi)存泄露問題也就變得十分關(guān)鍵,即使每次運(yùn)行少量泄漏,長期運(yùn)行之后,系統(tǒng)也是面臨崩潰的危險(xiǎn)。
Java是如何管理內(nèi)存
為了判斷Java中是否有內(nèi)存泄露,我們首先必須了解Java是如何管理內(nèi)存的。Java的內(nèi)存管理就是對(duì)象的分配和釋放問題。在Java中,程序員需要通過關(guān)鍵字new為每個(gè)對(duì)象申請(qǐng)內(nèi)存空間 (基本類型除外),所有的對(duì)象都在堆 (Heap)中分配空間。另外,對(duì)象的釋放是由GC決定和執(zhí)行的。在Java中,內(nèi)存的分配是由程序完成的,而內(nèi)存的釋放是有GC完成的,這種收支兩條線的方法確實(shí)簡化了程序員的工作。但同時(shí),它也加重了JVM的工作。這也是Java程序運(yùn)行速度較慢的原因之一。因?yàn)椋珿C為了能夠正確釋放對(duì)象,GC必須監(jiān)控每一個(gè)對(duì)象的運(yùn)行狀態(tài),包括對(duì)象的申請(qǐng)、引用、被引用、賦值等,GC都需要進(jìn)行監(jiān)控。
監(jiān)視對(duì)象狀態(tài)是為了更加準(zhǔn)確地、及時(shí)地釋放對(duì)象,而釋放對(duì)象的根本原則就是該對(duì)象不再被引用。
為了更好理解GC的工作原理,我們可以將對(duì)象考慮為有向圖的頂點(diǎn),將引用關(guān)系考慮為圖的有向邊,有向邊從引用者指向被引對(duì)象。另外,每個(gè)線程對(duì)象可以作為一個(gè)圖的起始頂點(diǎn),例如大多程序從main進(jìn)程開始執(zhí)行,那么該圖就是以main進(jìn)程頂點(diǎn)開始的一棵根樹。在這個(gè)有向圖中,根頂點(diǎn)可達(dá)的對(duì)象都是有效對(duì)象,GC將不回收這些對(duì)象。如果某個(gè)對(duì)象 (連通子圖)與這個(gè)根頂點(diǎn)不可達(dá)(注意,該圖為有向圖),那么我們認(rèn)為這個(gè)(這些)對(duì)象不再被引用,可以被GC回收。
以下,我們舉一個(gè)例子說明如何用有向圖表示內(nèi)存管理。對(duì)于程序的每一個(gè)時(shí)刻,我們都有一個(gè)有向圖表示JVM的內(nèi)存分配情況。以下右圖,就是左邊程序運(yùn)行到第6行的示意圖。
Java使用有向圖的方式進(jìn)行內(nèi)存管理,可以消除引用循環(huán)的問題,例如有三個(gè)對(duì)象,相互引用,只要它們和根進(jìn)程不可達(dá)的,那么GC也是可以回收它們的。這種方式的優(yōu)點(diǎn)是管理內(nèi)存的精度很高,但是效率較低。另外一種常用的內(nèi)存管理技術(shù)是使用計(jì)數(shù)器,例如COM模型采用計(jì)數(shù)器方式管理構(gòu)件,它與有向圖相比,精度行低(很難處理循環(huán)引用的問題),但執(zhí)行效率很高。
什么是Java中的內(nèi)存泄露
下面,我們就可以描述什么是內(nèi)存泄漏。在Java中,內(nèi)存泄漏就是存在一些被分配的對(duì)象,這些對(duì)象有下面兩個(gè)特點(diǎn),首先,這些對(duì)象是可達(dá)的,即在有向圖中,存在通路可以與其相連;其次,這些對(duì)象是無用的,即程序以后不會(huì)再使用這些對(duì)象。如果對(duì)象滿足這兩個(gè)條件,這些對(duì)象就可以判定為Java中的內(nèi)存泄漏,這些對(duì)象不會(huì)被GC所回收,然而它卻占用內(nèi)存。
在C++中,內(nèi)存泄漏的范圍更大一些。有些對(duì)象被分配了內(nèi)存空間,然后卻不可達(dá),由于C++中沒有GC,這些內(nèi)存將永遠(yuǎn)收不回來。在Java中,這些不可達(dá)的對(duì)象都由GC負(fù)責(zé)回收,因此程序員不需要考慮這部分的內(nèi)存泄露。
通過分析,我們得知,對(duì)于C++,程序員需要自己管理邊和頂點(diǎn),而對(duì)于Java程序員只需要管理邊就可以了(不需要管理頂點(diǎn)的釋放)。通過這種方式,Java提高了編程的效率。
因此,通過以上分析,我們知道在Java中也有內(nèi)存泄漏,但范圍比C++要小一些。因?yàn)镴ava從語言上保證,任何對(duì)象都是可達(dá)的,所有的不可達(dá)對(duì)象都由GC管理。
對(duì)于程序員來說,GC基本是透明的,不可見的。雖然,我們只有幾個(gè)函數(shù)可以訪問GC,例如運(yùn)行GC的函數(shù)System.gc(),但是根據(jù)Java語言規(guī)范定義, 該函數(shù)不保證JVM的垃圾收集器一定會(huì)執(zhí)行。因?yàn)?,不同的JVM實(shí)現(xiàn)者可能使用不同的算法管理GC。通常,GC的線程的優(yōu)先級(jí)別較低。JVM調(diào)用GC的策略也有很多種,有的是內(nèi)存使用到達(dá)一定程度時(shí),GC才開始工作,也有定時(shí)執(zhí)行的,有的是平緩執(zhí)行GC,有的是中斷式執(zhí)行GC。但通常來說,我們不需要關(guān)心這些。除非在一些特定的場(chǎng)合,GC的執(zhí)行影響應(yīng)用程序的性能,例如對(duì)于基于Web的實(shí)時(shí)系統(tǒng),如網(wǎng)絡(luò)游戲等,用戶不希望GC突然中斷應(yīng)用程序執(zhí)行而進(jìn)行垃圾回收,那么我們需要調(diào)整GC的參數(shù),讓GC能夠通過平緩的方式釋放內(nèi)存,例如將垃圾回收分解為一系列的小步驟執(zhí)行,Sun提供的HotSpot JVM就支持這一特性。
下面給出了一個(gè)簡單的內(nèi)存泄露的例子。在這個(gè)例子中,我們循環(huán)申請(qǐng)Object對(duì)象,并將所申請(qǐng)的對(duì)象放入一個(gè)Vector中,如果我們僅僅釋放引用本身,那么Vector仍然引用該對(duì)象,所以這個(gè)對(duì)象對(duì)GC來說是不可回收的。因此,如果對(duì)象加入到Vector后,還必須從Vector中刪除,最簡單的方法就是將Vector對(duì)象設(shè)置為null。
Vector v=new Vector(10);
for (int i=1;i<100; i++)
{
Object o=new Object();
v.add(o);
o=null;
}
//此時(shí),所有的Object對(duì)象都沒有被釋放,因?yàn)樽兞縱引用這些對(duì)象。
如何檢測(cè)內(nèi)存泄漏
最后一個(gè)重要的問題,就是如何檢測(cè)Java的內(nèi)存泄漏。目前,我們通常使用一些工具來檢查Java程序的內(nèi)存泄漏問題。市場(chǎng)上已有幾種專業(yè)檢查Java內(nèi)存泄漏的工具,它們的基本工作原理大同小異,都是通過監(jiān)測(cè)Java程序運(yùn)行時(shí),所有對(duì)象的申請(qǐng)、釋放等動(dòng)作,將內(nèi)存管理的所有信息進(jìn)行統(tǒng)計(jì)、分析、可視化。開發(fā)人員將根據(jù)這些信息判斷程序是否有內(nèi)存泄漏問題。這些工具包括Optimizeit Profiler,JProbe Profiler,JinSight , Rational 公司的Purify等。
下面,我們將簡單介紹Optimizeit的基本功能和工作原理。
Optimizeit Profiler版本4.11支持Application,Applet,Servlet和Romote Application四類應(yīng)用,并且可以支持大多數(shù)類型的JVM,包括SUN JDK系列,IBM的JDK系列,和Jbuilder的JVM等。并且,該軟件是由Java編寫,因此它支持多種操作系統(tǒng)。Optimizeit系列還包括Thread Debugger和Code Coverage兩個(gè)工具,分別用于監(jiān)測(cè)運(yùn)行時(shí)的線程狀態(tài)和代碼覆蓋面。
當(dāng)設(shè)置好所有的參數(shù)了,我們就可以在OptimizeIt環(huán)境下運(yùn)行被測(cè)程序,在程序運(yùn)行過程中,Optimizeit可以監(jiān)視內(nèi)存的使用曲線(如下圖),包括JVM申請(qǐng)的堆(heap)的大小,和實(shí)際使用的內(nèi)存大小。另外,在運(yùn)行過程中,我們可以隨時(shí)暫停程序的運(yùn)行,甚至強(qiáng)行調(diào)用GC,讓GC進(jìn)行內(nèi)存回收。通過內(nèi)存使用曲線,我們可以整體了解程序使用內(nèi)存的情況。這種監(jiān)測(cè)對(duì)于長期運(yùn)行的應(yīng)用程序非常有必要,也很容易發(fā)現(xiàn)內(nèi)存泄露。
在運(yùn)行過程中,我們還可以從不同視角觀查內(nèi)存的使用情況,Optimizeit提供了四種方式:
堆視角。 這是一個(gè)全面的視角,我們可以了解堆中的所有的對(duì)象信息(數(shù)量和種類),并進(jìn)行統(tǒng)計(jì)、排序,過濾。了解相關(guān)對(duì)象的變化情況。
方法視角。通過方法視角,我們可以得知每一種類的對(duì)象,都分配在哪些方法中,以及它們的數(shù)量。
對(duì)象視角。給定一個(gè)對(duì)象,通過對(duì)象視角,我們可以顯示它的所有出引用和入引用對(duì)象,我們可以了解這個(gè)對(duì)象的所有引用關(guān)系。
引用圖。 給定一個(gè)根,通過引用圖,我們可以顯示從該頂點(diǎn)出發(fā)的所有出引用。
在運(yùn)行過程中,我們可以隨時(shí)觀察內(nèi)存的使用情況,通過這種方式,我們可以很快找到那些長期不被釋放,并且不再使用的對(duì)象。我們通過檢查這些對(duì)象的生存周期,確認(rèn)其是否為內(nèi)存泄露。在實(shí)踐當(dāng)中,尋找內(nèi)存泄露是一件非常麻煩的事情,它需要程序員對(duì)整個(gè)程序的代碼比較清楚,并且需要豐富的調(diào)試經(jīng)驗(yàn),但是這個(gè)過程對(duì)于很多關(guān)鍵的Java程序都是十分重要的。
綜上所述,Java也存在內(nèi)存泄露問題,其原因主要是一些對(duì)象雖然不再被使用,但它們?nèi)匀槐灰谩榱私鉀Q這些問題,我們可以通過軟件工具來檢查內(nèi)存泄露,檢查的主要原理就是暴露出所有堆中的對(duì)象,讓程序員尋找那些無用但仍被引用的對(duì)象。
評(píng)論