虛擬機已死 容器才是未來?
我也曾經(jīng)是容器技術(shù)尤其是Docker粉絲,但用了一年后覺得事情也沒那么美好,而頗有一些同學以及一些公司依然認為容器就是銀彈,虛擬機已經(jīng)是昨兒黃花必須打倒,大家趕緊一切皆容器。這里我對這種觀點吐吐槽。僅代表作者個人看法
本文引用地址:http://butianyuan.cn/article/201605/290774.htm首先要明確的是,軟件開發(fā)和運維活動中,可維護性、正確性、性能的優(yōu)先級是依次降低的,不要跟我抬杠少數(shù)極端情況。關于可維護性和正確性的先后,著 名的 "worse is better" 文章就是很好的無奈的解釋,如果你猶豫這兩者,這還情有可原,畢竟真善美和糙快猛的斗爭從未停歇,而你如果第一反應覺得性能是最重要的,那就不要繼續(xù)往下 看了,洗洗去睡吧——適合的才是最好的。
那么對于虛擬機 vs 容器,自然我們也需要從這三方面考察。
回合一:可維護性之爭
虛擬機—維護性
從 hypervisor 講,Xen/KVM/vSphere/HyperV 都很成熟了,久經(jīng)考驗,BSD 也在湊熱鬧搞 bhyve(FreeBSD) 和 vmm(OpenBSD),最近 unikernel 也在試圖跑在 hypervisor 上,而 AWS/GCE/Azure 等等云計算巨頭以及 Intel/AMD 等在CPU、磁盤和網(wǎng)絡IO虛擬化技術(shù)上的投資顯然不會立馬推翻,Linux 上虛擬機的開源管理方案也已成熟定型:libvirt, OpenStack, 沒人吃飽了撐的去弄個 “新的開源” 項目替換它們,雖然我很不喜歡 OpenStack 的亂糟和復雜。VM 的動態(tài)遷移也是成熟技術(shù),出來好多年了,實現(xiàn)原理非常簡單,反正整個 OS 內(nèi)存一鍋端弄過去,不操心少個依賴進程的內(nèi)存沒過去。想用不同版本內(nèi)核? 想要自定義內(nèi)核模塊?想調(diào)整內(nèi)核參數(shù)?期望更安全的隔離?期望如同物理機版幾乎一致的使用體驗?VM 就是虛擬機的縮寫嘛,這些都是拿手戲。
容器— 維護性
Linux 容器,Linux 一貫的作風,慢慢演化,不求仔細設計,然后就是 cgroup, pid/uts/ipc/net/uid namespace 一個個實現(xiàn)出來,湊出一個容器技術(shù),貌似 uid namespace 還是最近剛剛出來的特性。用戶空間則更是群雄并起,LXC,Docker,rkt,LXD,各有擁蹇,鹿死誰手,還真不好說,在這個局還沒明朗的時 候,Mesos、Swarm、Kubernetes、Nomad 又出來一堆攪局的,眼下看來最吸引眼球的 Kubernetes 儼然有 OpenStack 繼任者的感覺,但依然很嫩,沒幾個人敢在生產(chǎn)環(huán)境大規(guī)模使用。
Linux容器里進程的跨機器動態(tài)遷移我還沒聽說,不要說是個服務就得有集群有 HA 嘛,可還真有不少用戶一個服務就單機頂著呢,就算有熱備或者冷備,在線那臺機器內(nèi)存里的東西可寶貴了,輕易不能丟。用Linux容器就不能挑內(nèi)核,不能加 載內(nèi)核模塊,不能掛載文件系統(tǒng),不能調(diào)整內(nèi)核參數(shù),不能改網(wǎng)絡配置,等等,不要告訴我你能——你是不是開了 docker run --privileged 了? 你是不是沒 drop capability?你是不是沒有 remap uid?話說某大公司的容器還真就用 --privileged 選項跑的呢。 而 Linux 的隔離不徹底恐怕大部分人都沒意識到,/sys, /dev, /selinux 還有 /proc 下的某些關鍵文件比如 /proc/kcore 沒隔離呢。
Redhat 做的 project Atomic 意識到這些問題,正在積極的給 Docker 加 SELinux 支持,指定 SELinux policy,但 Docker 官方愛搭不理,而且 SELinux 這種高端技術(shù)是凡人玩的么? 結(jié)局大概依然是 "FAQ 1: 關掉 SELinux"。Linux 容器本來并不局限在一個容器里跑幾個進程,但 Docker 官方為了加強“輕量級”這詞的洗腦效果,搞出個無比腦殘的 single process 理念,被無數(shù)人捧臭腳,所幸有些人慢慢意識到問題,Yelp 搞了個 dumb-init 擦了一半屁股,還有無數(shù) docker image 用 runit、supervisor 之類的做 /sbin/init 替換,但問題在于這要自定義啟動腳本,需要加 ssh/cron/syslog/logrotate 等等邊角料——這已然是解決了無數(shù)遍的問題,還要解決一遍,不覺得麻煩嗎?難道沒有人認為這些包的作者或者打包者更善于處理服務啟動腳本么?像 systemd 那種搞法還算正道,特意考慮容器環(huán)境,跳過一些步驟,但貌似還沒做完善,需要手動刪除一些 .service 文件。
評論