從公共資源庫下載數(shù)據(jù)集

 

在開發(fā)預測分析收入水平模型時,我們使用UCI 機器學習資源庫的成人收入普查數(shù)據(jù)。數(shù)據(jù)集地下載鏈接為http://archive.ics.uci.edu/ml/datasets/Census+Income。該網(wǎng)站包含下載數(shù)據(jù)文件的鏈接,您可將adult.data數(shù)據(jù)文件下載到本地計算機。此數(shù)據(jù)集的格式以逗號分隔。另外,該網(wǎng)站還包含了在此數(shù)據(jù)集中的 15 個屬性信息,在上傳數(shù)據(jù)至實驗之前我們使用此信息作為創(chuàng)建數(shù)據(jù)表的列標題。

現(xiàn)在,用 Microsoft Excel 或任何其他電子表格工具中打開 adult.data 文件,并為其添加網(wǎng)站中屬性列表的詳細信息,這些信息如下列出。注意,其中的一部分屬性值為連續(xù)的,因為它們以數(shù)值的形式表現(xiàn),另一部分則為其選項值列表。

  • 年齡(age),連續(xù)值

  • 工作種類(Workclass)個人(Private), 無限責任公司(Self-emp-not-inc), 有限責任公司(Self-emp-inc), 聯(lián)邦政府(Federal-gov), 地方政府( Local-gov), 州政府(State-gov), 無薪人員(Without-pay), 無工作經(jīng)驗人員(Never-worked)離散值

  • Fnlwgt連續(xù)值

  • 教育情況(Education Bachelors, So

    網(wǎng)友評論