基因測序、生物信息分析平臺工作站硬件配置推薦2020
(一)了解生物信息學
生物信息學(Bioinformatics)利用應用數學、信息學、統計學和計算機科學的方法研究生物學的問題。生物信息學的研究材料和結果就是各種各樣的生物學數據,其研究工具是計算機,研究方法包括對生物學數據的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。
生物信息學典型工作流程
這個過程是由一系列鏈接的步驟組成,這些步驟將原始輸入(測序原始數據RAW)轉換為有意義或可解釋的輸出,例如,高通量測序NGS數據而生成的fastq文件。然后用于基因組序列分析的特定功能方面的特定工具執(zhí)行。根據執(zhí)行的分析類型,工作流可以具有可變數量的步驟,因此可以是簡單的或復雜的。
生物信息學主要研究方向:DNA/RNA/蛋白質測序,序列比對,基因發(fā)現,基因組組裝,藥物設計,藥物發(fā)現,蛋白質結構比對和預測,通過使用計算密集型技術(用于模式識別,數據挖掘,機器學習算法和可視化)來加深對生物過程的理解。因此需要配備先進的計算設備和豐富專業(yè)的分析軟件
(二)生物信息學分析的計算特點
如何選購一個理想的圖形工作站硬件配置,可能很多人思考過:
什么是用于生物信息學和計算生物學研究的最佳PC/工作站?
用于生物信息學分析的服務器配置
全基因組序列分析實驗室的硬件配置
高通量序列分析服務器有什么要求
下一代測序數據分析硬件配置推薦
用于分析NGS宏基因組學數據的計算機配置?
2.1 生物信息分析的計算特點
生物信息數據分析涉及到基因組學、轉錄組學、蛋白質組學、宏基因組學、代謝物組學等,下圖是全基因組數據分析流程
生物信息學數據分析所涉及的計算主要是
(1)重測序過程中的序列/映射比對計算(Mapping)
對于使用BWA/Bowtie等程序進行映射讀取,對內存RAM要求不高(例如32GB即可),但CPU內核數量(及其頻率)將決定計算過程需要多長時間。如果要進行大量對齊和比對(例如使用BWA),那么擁有大量CPU核心比擁有大量內存更為重要。
當然配置規(guī)格取決于您的預算和計劃進行的分析類型。
RNASeq中計算量較大的就是比對步驟了,而比對往往只需要一次就可以! 一般32核CPU+64GB RAM硬件配置,可以滿足對基因組/轉錄組/虹基因組分析的標準映射(maping)以及下游分析。
(2)從頭測序De novo的序列組裝計算(Assembly)
如果要進行從頭組裝(例如Velvet),假設一個人的全基因組測序數據,采用二代測序的方法,人的基因組3G,10倍數據30G,那么這30G的堿基,在切成更小的kmer,假設數據增加到了100G,還不算存儲序列的一些其他信息,序列拼接的時候必須一次將所有數據同時存入內存,如果內存達不到100G,拼接根本無法完成。
因此,對于大型基因組裝而言,需要的硬件資源特別多,不緊cpu要有足夠的計算能力,內存在150G以上,但是如細菌基因組,數據集和基因組數據量不太大,內存128GB足夠了
為了使NGS(下一代測序)分析的工作負荷最大化,硬件配置三個關鍵瓶頸:可用的CPU核數、內存容量以及I/O帶寬
2.2 生信分析對硬件配置要求
如何處理454和Illumina數據? 全基因組裝配/組裝?序列拼接?映射讀取到參考基因組?
(1)需要多少存儲空間才能保持數據實時讀取(硬盤容量)?
開發(fā)下一代測序(高通量測序)的臨床應用的瓶頸是存儲和分析所生成的大量數據。應用程序多種多樣,但共同的主題在計算和分析上具有挑戰(zhàn)性。
(2)要分析的每個文件有多大(RAM容量,硬盤讀寫速度)?
(3)要使用的軟件準備好使用多處理器運行時間是否有要求(CPU核數)?
配置參考:
(1)基于基因組計劃的大小
NO 基因組計劃 配置參考 1 細菌(最高10MB) 32GB RAM,8個以上內核,10Gb磁盤空間 2 昆蟲(高達500MB) 128GB RAM,16個以上內核,1Tb磁盤空間 3 禽類/小型植物基因組(最大1GB) 256GB RAM,32個以上內核,1TB磁盤空間 4 哺乳動物基因組(最大3GB) 512GBBb RAM,32個以上內核,3TB磁盤空間 5 植物基因組(高達30GB) 1TB RAM,64 +核,10Tb磁盤空間
(2)基于課題組研究人員數量 NO 課題組 配置參考 1 單人 16核+64G~256GB+ 8TB硬盤 2 1到5人課題組 64核+512GB內存+64TB硬盤 3 5人以上的課題組 100核以上+1TB內存+海量并行存儲
(三)生物信息學分析的硬件配置推薦
NO |
品牌與型號 |
配置規(guī)格 |
價格 |
備注 |
1 |
H380 150128-10TA |
8核5.0GHz /128GB DDR4 /QuaroP620 /1.9TB SSD系統盤 +10TB SATA企業(yè)級/塔式(750w)/23寸-高清圖顯 |
35000 |
|
2 |
AX400 142256-12TA |
18核4.2GHz / 256GB DDR4 /QuaroP620 /1.9TB SSD系統盤 +12TB SATA企業(yè)級/塔式(750w)/23寸-高清圖顯 |
58500 |
|
3 |
EX630i 226256-20TA |
2顆Xeon 金5218R處理器(40核2.6GHz )/ 256GB DDR4 /QuaroP620 /1.9TB SSD系統盤+20TB SATA企業(yè)級/塔式(865w)/23寸-高清圖顯 |
69990 |
|
4 |
EX630i 228384-20TA |
2顆Xeon 金6230R處理器(52核2.8GHz )/ 384GB DDR4 /QuaroP620 /3.84TB SSD系統盤+20TB SATA企業(yè)級/塔式(865w)/23寸-高清圖顯 |
98000 |
|
5 |
Alpha730i 427512-42TA |
4顆Xeon 金5218處理器(64核2.7GHz )/ 512GB DDR4 /QuaroP1000 /3.84TB SSD系統盤 +42TB并行存儲/塔式(1400w冗余)/27"-4K圖顯 |
165000 |
|
6 |
Alpha730i 428512-70TA |
4顆Xeon 金6230處理器(80核2.8GHz )/ 512GB DDR4 /QuaroP1000 /1.92TB SSD系統盤 +1TB高速緩存/70TB并行存儲/塔式(1400w冗余)/27"-4K圖顯 |
199990 |
|
7 |
Alpha730i 432768-84TB |
4顆Xeon 金6248處理器(80核3.2GHz )/ 768GB DDR4 /QuaroP1000 /1.92TB SSD系統盤 +2TB高速緩存/84TB并行存儲/塔式(1400w冗余)/27"-4K圖顯 |
279000 |
|
8 |
Alpha730i 431768-84TB |
4顆Xeon 白金8260處理器(96核3.1GHz )/ 768GB DDR4 /QuaroP2000 /3.84TB SSD系統盤 +2TB高速緩存/98TB并行存儲/塔式(1400w冗余)/27"-4K圖顯 |
330000 |
|
9 |
Alpha730i 4341T-112TB |
4顆Xeon 白金8270處理器(104核3.4GHz )/ 1TB DDR4 /QuaroP2000 /3.84TB SSD系統盤 +4TB高速緩存/112TB并行存儲/塔式(1400w冗余)/27"-4K圖顯 |
428000 |
|
10 |
Alpha730i 4332T-112TB |
4顆Xeon 白金8280處理器(112核3.3GHz )/ 1.5TB DDR4 /QuaroP2000 /3.84TB SSD系統盤 +4TB高速緩存/112TB并行存儲/塔式(1400w冗余)/27"-4K圖顯 |
585000 |
|
上述所有配置,代表最新硬件架構,同時保證是最完美,最快,如有不符,可直接退貨
欲咨詢機器處理速度如何、技術咨詢、索取詳細技術方案,提供遠程測試,請聯系
UltraLAB圖形工作站供貨商:
西安坤隆計算機科技有限公司
國內知名高端定制圖形工作站廠家
業(yè)務電話:400-705-6800
咨詢微信號: