如今,多樣的交易模式以及大眾消費(fèi)觀念的改變使得數(shù)據(jù)庫應(yīng)用領(lǐng)域不斷擴(kuò)大,現(xiàn)代的大型分布式應(yīng)用系統(tǒng)的數(shù)據(jù)膨脹也對數(shù)據(jù)庫的海量數(shù)據(jù)處理能力和并行處理能力提出了更高的要求,如何在數(shù)據(jù)呈現(xiàn)海量擴(kuò)張的同時提高處理速度和應(yīng)用系統(tǒng)的可用性,使客戶能同時得到更高的處理速度、更高的數(shù)據(jù)可用性和更大的數(shù)據(jù)集,是數(shù)據(jù)庫系統(tǒng)面臨的一個挑戰(zhàn)。 通過TPC-H基準(zhǔn)測試,可獲得數(shù)據(jù)庫單位時間內(nèi)的性能處理能力,為評估數(shù)據(jù)庫系統(tǒng)的現(xiàn)有性能服務(wù)水平提供有效依據(jù),通過橫向?qū)Ρ却龠M(jìn)數(shù)據(jù)庫系統(tǒng)的整體質(zhì)量提升,能更好地在重大信息化工程中實(shí)現(xiàn)推廣。
一.TPC-H原理簡介
TPC-H是由TPC(Transaction Processing Performance Council)事務(wù)處理性能委員會公布的一套針對數(shù)據(jù)庫決策支持能力的測試基準(zhǔn),通過模擬數(shù)據(jù)庫中與業(yè)務(wù)相關(guān)的復(fù)雜查詢和并行的數(shù)據(jù)修改操作考察數(shù)據(jù)庫的綜合處理能力,獲取數(shù)據(jù)庫操作的響應(yīng)時間和每小時執(zhí)行的查詢數(shù)指標(biāo)(QphH@Size)。 TPC-H基準(zhǔn)模型中定義了一個數(shù)據(jù)庫模型,容量可以在1GB~10000GB的8個級別中進(jìn)行選擇。數(shù)據(jù)庫模型包括CUSTOMER、LINEITEM、NATION、ORDERS、PART、PARTSUPP、REGION和SUPPLIER 8張數(shù)據(jù)表,涉及22條復(fù)雜的select查詢流語句和2條帶有insert和delete程序段的更新流語句。
二.目的
1.比較在同等資源條件下具有分布式屬性的Greenplum與單機(jī)版MySQL在進(jìn)行TPC-H類測試的性能區(qū)別。
2.分析兩種DB造成性能區(qū)別的原因。
三.測試環(huán)境與配置信息
測試環(huán)境:騰訊云
測試對象:Greenplum、MySQL,兩者的配置信息統(tǒng)計如下: