從公共資源庫下載數(shù)據(jù)集
在開發(fā)預(yù)測分析收入水平模型時,我們使用UCI 機(jī)器學(xué)習(xí)資源庫的成人收入普查數(shù)據(jù)。數(shù)據(jù)集地下載鏈接為http://archive.ics.uci.edu/ml/datasets/Census+Income。該網(wǎng)站包含下載數(shù)據(jù)文件的鏈接,您可將adult.data數(shù)據(jù)文件下載到本地計算機(jī)。此數(shù)據(jù)集的格式以逗號分隔。另外,該網(wǎng)站還包含了在此數(shù)據(jù)集中的 15 個屬性信息,在上傳數(shù)據(jù)至實(shí)驗(yàn)之前我們使用此信息作為創(chuàng)建數(shù)據(jù)表的列標(biāo)題。
現(xiàn)在,用 Microsoft Excel 或任何其他電子表格工具中打開 adult.data 文件,并為其添加網(wǎng)站中屬性列表的詳細(xì)信息,這些信息如下列出。注意,其中的一部分屬性值為連續(xù)的,因?yàn)樗鼈円詳?shù)值的形式表現(xiàn),另一部分則為其選項(xiàng)值列表。