大家在學習統(tǒng)計時,可能會過于重視分析方法的使用,而忽略了數(shù)據(jù)收百思特網(wǎng)集和整理的重要性 。一般而言,統(tǒng)計分析最重要的一步實際上是先將數(shù)據(jù)整理形成便于分析的數(shù)據(jù)形式,比如下表:

文章插圖
上表中雖然全是數(shù)字,但卻可以回答很多問題 。比如:每個人的年齡多大?是什么學歷?婚姻狀況如何?就業(yè)情況如何?家里有幾口人?
這些問題的答案都是我們所調(diào)查對象的一系列特征或?qū)傩?,統(tǒng)計學上稱為變量(variable),也就是上表頂行各條目的名稱 。初學統(tǒng)計學一定要訓練自己學會利用“變量”來表達 。
每個被調(diào)查對象被稱為一個觀測單位(case 或 observation),變量就是觀測單位的某種特征或?qū)傩裕兞康木唧w取值稱為“變量值” 。
由此,上表中的一系列問題對應的變量就是:年齡、學歷、婚姻狀況、就業(yè)情況、家庭人口數(shù)、ABO血型等 。
進一步觀察,可以發(fā)現(xiàn),有些變量的取值如年齡、家庭人口數(shù)是具體的、有實際意義的數(shù)值;而有些變量的取值如學歷、婚姻狀況雖用數(shù)字來表示,但其意義卻只是一個“代號”,背后都需要特定的文字進行定義說明,比如規(guī)定“0=未婚,1=已婚” 。
因此,像年齡、家庭人口數(shù)這類變量,其取值是定量的、有計算意義的,我們稱之為定量變量(quantitative variable);
而像學歷、婚姻狀況和就業(yè)狀況這類變量的取值是定性的、主要起代號作用,稱之為定性變量(qualitative variable) 。
另一方面,為了對定性變量進行統(tǒng)計學處理,往往需要對其進行編碼,比如“男為0,女為1” 。所以,在實際的統(tǒng)計工作中,要避免輸入漢字,而是要注意將其轉(zhuǎn)換為相應的數(shù)字 。
甚至變量名稱,如上述的“編號、年齡、學歷等”也盡量采用英文或漢語拼音來表示,避免統(tǒng)計軟件出錯 。
更進一步思考會發(fā)現(xiàn),年齡、人口數(shù)等變量一般是有單位的,并且不同人的年齡差異在理論上可以無限小,如1年、1個月、1天、1小時、0.1小時、0.01小時……
所以,年齡變量的取值范圍在理論上可以取任意正實數(shù),注意不是正整數(shù),比如一個人的年齡可以記為17.55歲,表示年齡為17歲6個月18天,甚至還可以利用出生時刻的信息精確到更小的時間單位(如“分、秒”) 。因此,這類變量稱為連續(xù)變量(continuous variable),主要是因為其取值范圍在理論上是連續(xù)不斷的 。
相反,家庭人口數(shù)這一變量就是相對于連續(xù)變量的另一類,即離散變量(discrete variable),因為不同家庭的人口數(shù)只可能相差0、1、2,而不能相差1.1、1.2等,它的取值范圍是間斷而不連續(xù)的 。
由此可見,一般僅定量變量有連續(xù)和離散百思特網(wǎng)之分,即一個定量變量要么是連續(xù)的、要么是離散的 。
相較而言,定性變量從數(shù)據(jù)表現(xiàn)上雖然和離散變量類似,但由于它只具有“代號”意義,所以一般不把它視為離散變量 。
除此之外,定性變量的取值往往表現(xiàn)為互不交叉的類別(所以定性變量也稱分類變量),同時這些類別有時會存在細微的差別 。
如學歷這類定性變性變量的取值為“文盲、小學、初中、高中……”,透露出一種等級或順序的感覺,因此也稱之為有序分類變量,這是指其取值的各類別之間存在著程度上的差別 。
另外一個常見的例子是“滿意程度”,包括“很不滿意、不滿意、一般、滿意、非常滿意” 。這類有序分類變量給人一種“半定量”的感覺,也稱為“等級變量”;
以上關于本文的內(nèi)容,僅作參考!溫馨提示:如遇健康、疾病相關的問題,請您及時就醫(yī)或請專業(yè)人士給予相關指導!
「愛刨根生活網(wǎng)」www.malaban59.cn小編還為您精選了以下內(nèi)容,希望對您有所幫助:- 德?lián)P進球效率超生涯巔峰 國安可期魯能阻擊恒大
- 伊斯科:皇馬不能靠名氣贏球 與J羅完全可以兼容
- 慢跑 可為身體充電的運動
- 抽脂肪的后遺癥 抽脂肪是永久的嗎
- 可以給孩子吃巧克力嗎 孩子可以吃巧克力制品嗎
- 生日送什么花 過生日可以送什么花
- 豆?jié){里有雌激素可以豐胸嗎 乳腺增生不能喝豆?jié){嗎
- 練習無氧運動 可讓女人更苗條
- 硫磺皂洗臉真的可以去黑頭嗎
- 硫磺皂到底可以用來洗臉嗎
