博客專欄

EEPW首頁 > 博客 > Java 線程和操作系統(tǒng)的線程有啥區(qū)別?

Java 線程和操作系統(tǒng)的線程有啥區(qū)別?

發(fā)布人:編碼之外 時間:2021-04-23 來源:工程師 發(fā)布文章

想看解釋的小伙伴可直接翻到文末尋找答案。

1. 用戶空間和內(nèi)核空間

關(guān)于內(nèi)核態(tài)和用戶態(tài)我們在 了解操作系統(tǒng)的那些事兒,從這篇文章開始 這篇文章中已經(jīng)詳細介紹過,這里不再過多贅述。

至于什么是系統(tǒng)空間和用戶空間也非常好理解:在操作系統(tǒng)中,內(nèi)存通常會被分成用戶空間(User space)與內(nèi)核空間(Kernel space)這兩個部分。當進程/線程運行在用戶空間時就處于用戶態(tài),運行在內(nèi)核空間時就處于內(nèi)核態(tài):

  • 運行在內(nèi)核態(tài)的程序可以訪問用戶空間和內(nèi)核空間,或者說它可以訪問計算機的任何資源,不受限制,為所欲為,例如協(xié)調(diào) CPU 資源,分配內(nèi)存資源,提供穩(wěn)定的環(huán)境供應用程序運行等
  • 而應用程序基本都是運行在用戶態(tài)的,或者說用戶態(tài)就是提供應用程序運行的空間。運行在用戶態(tài)的程序只能訪問用戶空間

那為什么要區(qū)分用戶態(tài)和內(nèi)核態(tài)呢?

其實早期操作系統(tǒng)是不區(qū)分用戶態(tài)和內(nèi)核態(tài)的,也就是說應用程序可以訪問任意內(nèi)存空間,如果程序不穩(wěn)定常常會讓系統(tǒng)崩潰,比如清除了操作系統(tǒng)的內(nèi)存數(shù)據(jù)。為此大佬們設計出了一套規(guī)則:對于那些比較危險的操作需要切到內(nèi)核態(tài)才能運行,比如 CPU、內(nèi)存、設備等資源管理器程序就應該在內(nèi)核態(tài)運行,否則安全性沒有保證。

舉個例子,對于文件系統(tǒng)和數(shù)據(jù)來說,文件系統(tǒng)數(shù)據(jù)和管理就必須放在內(nèi)核態(tài),但是用戶的數(shù)據(jù)和管理可以放在用戶態(tài)。

用戶態(tài)的程序不能隨意操作內(nèi)核地址空間,這樣有效地防止了操作系統(tǒng)程序受到應用程序的侵害

那如果處于用戶態(tài)的程序想要訪問內(nèi)核空間的話怎么辦呢?就需要進行系統(tǒng)調(diào)用從用戶態(tài)切換到內(nèi)核態(tài)。

2. 操作系統(tǒng)線程① 在用戶空間中實現(xiàn)線程

早期的操作系統(tǒng)中,所有的線程都是在用戶空間下實現(xiàn)的,操作系統(tǒng)只能看到線程所屬的進程,而不能看到線程。

image.png

從我們開發(fā)者的角度來理解用戶級線程就是說:在這種模型下,我們需要自己定義線程的數(shù)據(jù)結(jié)構(gòu)、創(chuàng)建、銷毀、調(diào)度和維護等,這些線程運行在操作系統(tǒng)的某個進程內(nèi),然后操作系統(tǒng)直接對進程進行調(diào)度。

這種方式的好處一目了然,首先第一點,就是即使操作系統(tǒng)原生不支持線程,我們也可以通過庫函數(shù)來支持線程;第二點,線程的調(diào)度只發(fā)生在用戶態(tài),避免了操作系統(tǒng)從內(nèi)核態(tài)到用戶態(tài)的轉(zhuǎn)換開銷。

當然缺點也很明顯:由于操作系統(tǒng)看不見線程,不知道線程的存在,而 CPU 的時間片切換是以進程為維度的,所以如果進程中某個線程進行了耗時比較長的操作,那么由于用戶空間中沒有時鐘中斷機制,就會導致此進程中的其它線程因為得不到 CPU 資源而長時間的持續(xù)等待;另外,如果某個線程進行系統(tǒng)調(diào)用時比如缺頁中斷而導致了線程阻塞,此時操作系統(tǒng)也會阻塞住整個進程,即使這個進程中其它線程還在工作。

② 在內(nèi)核空間中實現(xiàn)線程

所謂內(nèi)核級線程就是運行在內(nèi)核空間的線程, 直接由內(nèi)核負責,只能由內(nèi)核來完成線程的調(diào)度。

幾乎所有的現(xiàn)代操作系統(tǒng),包括 Windows、Linux、Mac OS X 和 Solaris 等,都支持內(nèi)核線程。

每個內(nèi)核線程可以視為內(nèi)核的一個分身,這樣操作系統(tǒng)就有能力同時處理多件事情,支持多線程的內(nèi)核就叫做多線程內(nèi)核(Multi-Threads Kernel)。

從我們開發(fā)者的角度來理解內(nèi)核級線程就是說:我們可以直接使用操作系統(tǒng)中已經(jīng)內(nèi)置好的線程,線程的創(chuàng)建、銷毀、調(diào)度和維護等,都是直接由操作系統(tǒng)的內(nèi)核來實現(xiàn),我們只需要使用系統(tǒng)調(diào)用就好了,不需要像用戶級線程那樣自己設計線程調(diào)度等。

image.png

上圖畫的是 1:1 的線程模型,所謂線程模型,也就是用戶線程和內(nèi)核線程之間的關(guān)聯(lián)方式,線程模型當然不止 1:1 這一種,下面我們來詳細解釋以下這三種多線程模型:

下文翻譯自 https://www.cs.uic.edu/~jbell/CourseNotes/OperatingSystems/4_Threads.html

1)多對一線程模型

image.png

  • 在多對一模型中,多個用戶級線程映射到某一個內(nèi)核線程上
  • 線程管理由用戶空間中的線程庫處理,這非常有效
  • 但是,如果進行了阻塞系統(tǒng)調(diào)用,那么即使其他用戶線程能夠繼續(xù),整個進程也會阻塞
  • 由于單個內(nèi)核線程只能在單個 CPU 上運行,因此多對一模型不允許在多個 CPU 之間拆分單個進程

從并發(fā)性角度來總結(jié)下,雖然多對一模型允許開發(fā)人員創(chuàng)建任意多的用戶線程,但是由于內(nèi)核只能一次調(diào)度一個線程,所以并未增加并發(fā)性?,F(xiàn)在已經(jīng)幾乎沒有操作系統(tǒng)來使用這個模型了,因為它無法利用多個處理核。

2)一對一線程模型

image.png

  • 一對一模型克服了多對一模型的問題
  • 一對一模型創(chuàng)建一個單獨的內(nèi)核線程來處理每個用戶線程
  • 但是,管理一對一模型的開銷更大,涉及更多開銷和減慢系統(tǒng)速度
  • 此模型的大多數(shù)實現(xiàn)都限制了可以創(chuàng)建的線程數(shù)

從并發(fā)性角度來總結(jié)下,雖然一對一模型提供了更大的并發(fā)性,但是開發(fā)人員應注意不要在應用程序內(nèi)創(chuàng)建太多線程(有時系統(tǒng)可能會限制創(chuàng)建線程的數(shù)量),因為管理一對一模型的開銷更大。Windows (從 Win95 開始) 和 Linux 都實現(xiàn)了線程的一對一模型。

3)多對多線程模型

image.png

  • 多對多模型將任意數(shù)量的用戶線程復用到相同或更少數(shù)量的內(nèi)核線程上,結(jié)合了一對一和多對一模型的最佳特性
  • 用戶對創(chuàng)建的線程數(shù)沒有限制
  • 阻止內(nèi)核系統(tǒng)調(diào)用不會阻止整個進程
  • 進程可以分布在多個處理器上
  • 可以為各個進程分配可變數(shù)量的內(nèi)核線程,具體取決于存在的 CPU 數(shù)量和其他因素
3. Java 線程

在進入 Java 線程主題之前,有必要講解一下線程庫 Thread library 的概念。

在上面的模型介紹中,我們提到了通過線程庫來創(chuàng)建、管理線程,那么什么是線程庫呢?

線程庫就是為開發(fā)人員提供創(chuàng)建和管理線程的一套 API。

當然,線程庫不僅可以在用戶空間中實現(xiàn),還可以在內(nèi)核空間中實現(xiàn)。前者涉及僅在用戶空間內(nèi)實現(xiàn)的 API 函數(shù),沒有內(nèi)核支持。后者涉及系統(tǒng)調(diào)用,也就是說調(diào)用庫中的一個 API 函數(shù)將會導致對內(nèi)核的系統(tǒng)調(diào)用,并且需要具有線程庫支持的內(nèi)核。

下面簡單介紹下三個主要的線程庫:

1)POSIX Pthreads:可以作為用戶或內(nèi)核庫提供,作為 POSIX 標準的擴展

2)Win32 線程:用于 Window 操作系統(tǒng)的內(nèi)核級線程庫

3)Java 線程:Java 線程 API 通常采用宿主系統(tǒng)的線程庫來實現(xiàn),也就是說在 Win 系統(tǒng)上,Java 線程 API 通常采用 Win API 來實現(xiàn),在 UNIX 類系統(tǒng)上,采用 Pthread 來實現(xiàn)。

下面我們來詳細講解 Java 線程:

事實上,在 JDK 1.2 之前,Java 線程是基于稱為 "綠色線程"(Green Threads)的用戶級線程實現(xiàn)的,也就是說程序員大佬們?yōu)?JVM 開發(fā)了自己的一套線程庫或者說線程管理機制。

在 JDK 1.2 及以后,JVM 選擇了更加穩(wěn)定且方便使用的操作系統(tǒng)原生的內(nèi)核級線程,通過系統(tǒng)調(diào)用,將線程的調(diào)度交給了操作系統(tǒng)內(nèi)核。而對于不同的操作系統(tǒng)來說,它們本身的設計思路基本上是完全不一樣的,因此它們各自對于線程的設計也存在種種差異,所以 JVM 中明確聲明了:虛擬機中的線程狀態(tài),不反應任何操作系統(tǒng)中的線程狀態(tài)。

也就是說,在 JDK 1.2 及之后的版本中,Java 的線程很大程度上依賴于操作系統(tǒng)采用什么樣的線程模型,這點在不同的平臺上沒有辦法達成一致,JVM 規(guī)范中也并未限定 Java 線程需要使用哪種線程模型來實現(xiàn),可能是一對一,也可能是多對多或多對一。

總結(jié)來說,回答下文題,現(xiàn)今 Java 中線程的本質(zhì),其實就是操作系統(tǒng)中的線程,其線程庫和線程模型很大程度上依賴于操作系統(tǒng)(宿主系統(tǒng))的具體實現(xiàn),比如在 Windows 中 Java 就是基于 Wind32 線程庫來管理線程,且 Windows 采用的是一對一的線程模型


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: JAVA

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉