ⓘ 百科全書. 你知道吗? 页 366




                                               

多變量變異數分析

多變量變異數分析 ( multivariate analysis of variance , MANOVA )係變異數分析嘅一個變種,用嚟分析多過一個應變數;簡單講嘅話,MANOVA 做嘅嘢就係比較唔同組嘅平均值向量-喺一般嘅 ANOVA 當中,每組得一個數值(個應變數嘅平均值),而 MANOVA 要考慮多過一 ...

                                               

多重共線性

多重共線性 ( multicollinearity )係多重迴歸模型當中間中會出現嘅問題,指其中一個自變數嘅數值可以由其他自變數嘅線性噉預測,而且準確度有返咁上下高;喺有多重共線性嘅情況下,個多重迴歸模型嘅系數(嗰柞 β {\displaystyle \beta } )嘅估計數值可能會隨模型 ...

                                               

對立事件

對立事件 ( complementary event )係統計學同概率論等領域嘅一個概念。「 A {\displaystyle A} 嘅對立事件」( A ′ {\displaystyle A} )係指「 A {\displaystyle A} 冇發生」呢一件事件,而 P {\displaystyle P} 定義上會等如 1 − P {\displaystyle 1-P} 。

                                               

平均

平均 係兩個或者更多個數拉勻去計,喺統計學上可以細分做平均數、中位數同眾數,日常生活嘅「平均」多數係指平均數。

                                               

幾何平均值

幾何平均值 ( geometric mean )係平均值嘅一種計法,指將嗰 n {\displaystyle n} 個案嘅數值乘埋一齊,再計個數嘅 n {\displaystyle n} 根式: ∏ i = 1 n a i 1 n = a 1 a 2 ⋯ a n {\displaystyle \left\prod _{i=1}^{n}a_{i}\right^{\frac {1}{n}}={\sqrt{a_{1}a ...

                                               

建構效度

建構效度 ( construct validity )係指一個量度方法有幾合乎理論上嘅定義;例如理論上,智商測驗係量度智能嘅,而智能理論一般認為,智能包含一個個體解難嘅能力,所以一個智商測驗理應會考驗受試者嘅解難能力。

                                               

抽樣誤差

抽樣誤差 ( sampling error )係統計學上嘅一個概念,指因為抽樣造成嘅誤差-例如由一個有 10.00 個個體嘅總體嗰度是但抽 100 個個體出嚟,用呢 100 個個體嘅平均身高( μ s {\displaystyle \mu _{s}} )估計個總體嘅平均身高( μ 0 {\displaystyle \mu _{0}} ), ...

                                               

探索性因素分析

探索性因素分析 ( exploratory factor analysis , EFA )係因素分析嘅一種,指研究者冇作出任何事先假設嘅因素分析,研究者會由手上嘅數據嗰度估計因素嘅數量同每個變數條式。

                                               

推論統計學

推論統計學 ( inferential statistics )係指做數據分析,推論數據背後反映嘅概率分佈嘅過程。

                                               

操作化

操作化 ( operationalization )係指「定義要點樣量度一啲唔能夠直接量度得到嘅變數」嘅過程;例如係心理學研究成日都要應付一啲人腦入面嘅變數,呢啲變數好多時都難以直接量度,而個研究者要做嘅嘢包括定義好個變數,講明用某個直接量度得到嘅變數 p {\displaysty ...

                                               

效度

效度 ( validity )係評估一個量度方法有幾好嘅指標,指個方法有幾量度到佢理應要量度嗰樣嘢。

                                               

效應值

效應值 ( effect size )喺統計學上係指一個量度兩個變數之間嘅關係「有幾勁」嘅數值;要得到效應值有好多方法,簡單例子有變數之間嘅相關值(correlation)同埋迴歸分析(regression analysis)當中嘅迴歸系數。

                                               

效標效度

效標效度 ( criterion validity )係通常用嚟評估心理測驗嘅效度嘅一個指標,指個測驗嘅分數同俾人認為代表要量度嗰個變數有幾強相關;例如一個設計嚟量度一個人有幾外向嘅心理測驗,研究者搵咗班受試者返實驗室做個測驗,知道每位受試者嘅分數,然後喺實驗室入面 ...

                                               

數據分析

數據分析 ( data analysis )係指對數據作出分析,例如用數據建立統計模型解釋現象背後嘅原理。

                                               

普通最小二乘法

喺迴歸分析當中,最常用最普通嗰種估計 β {\displaystyle \beta } (迴歸系數)嘅方法係 普通最小二乘法 (粵拼: pou 2 tung 1 zeoi 3 siu 2 ji 6 sing 4 faat 3 ;英文: ordinary least squares )-就係建基於誤差值之上嘅。用呢種做法估計 β {\displaystyle \b ...

                                               

期望值

喺統計學上, 期望值 ( expected value ),係指加權平均數,係每個數據嘅可能值同佢嘅機會率(或者出現率)乘埋嘅總和。通常係用 E {\displaystyle E} 嚟表示 期望值 函數。 期望值 單位同數據單位相同。公式係 E = ∑ i = 1 n P x i {\displaystyle E=\sum _{i=1} ...

                                               

條件期望

條件期望 ( conditional expectation / conditional expected value )係概率論上嘅一個概念。一個有隨機性嘅變數嘅條件期望值係指,喺已知嘅情況下,當佢出現過若干次之後會有嘅平均值。

                                               

樣本

樣本 ( sample )係指由一個總體當中抽出嚟、用嚟做研究嘅一部份個體。

                                               

殘差平方和

殘差平方和 ( residual sum of squares ,「 RSS 」)喺統計學上係指將所有做預測嗰陣嘅殘差值(預測值同實際值嘅相差)嘅平方加埋得出嗰個數: R S = ∑ i = 1 n e i 2 {\displaystyle RSS=\sum _{i=1}^{n}e_{i}^{2}\,} RSS 呢個數值喺機械學習上係普通最小二乘法 ...

                                               

決定系數

決定系數 ( coefficient of determination )喺統計學上反映一個應變數嘅變異數有幾多可以由啲自變數預測;最廣義上嘅定義如下: R 2 = 1 − S r e S t o t {\displaystyle R^{2}=1-{SS_{\rm {res}} \over SS_{\rm {tot}}}\,} 當中 S r e s {\displaystyle SS_{\rm ...

                                               

泊淞分佈

泊淞分佈 (英文: Poisson distribution ;法文: Loi de Poisson )係種概率分佈,可以描寫隨機嘅自然現象嘅頻率,例如一段時間(一年、一個鐘)或者空間之內某種嘢(旋風、收到電話、地震、鯊魚咬人)嘅發生次數。泊淞隨機變數(Poisson random variable), X,條 ...

                                               

混淆變數

混淆變數 ( confounding variable / confounder )喺統計分析上係指一個同時會對自變數同應變數產生影響嘅變數,搞到研究者唔能夠肯定(如果搵到)自變數同應變數之間嘅關係係咪因為兩者真係有關,定係因為個混淆變數嘅影響;想像家陣研究者做一份研究,想知道 X { ...

                                               

獨立同分佈

獨立同分佈 ( independent and identically distributed , iid )係概率論同統計學上嘅一個概念。如果話一柞隨機性變數係獨立同分佈嘅話,意思係佢哋嘅概率分佈完全一樣,而且彼此之間獨立。

                                               

班佛定律

班佛定律 ( Benfords law ),又有叫 第一個位定律 ( first-digit law )喺統計學同相關領域上一種喺現實世界數據當中觀察到嘅現象。如果話一柞有單一變數 X {\displaystyle X} 嘅數據跟從班佛定律(假設啲數值以十進制寫),意思係話喺嗰柞數據入面,有大約 30% ...

                                               

百分位數

百分位數 ( percentile )係統計上嘅一個離散程度指標:家吓將樣本入面嗰 N {\displaystyle N} 個數值由細至大排好,噉第 n {\displaystyle n} 個案嘅百分位數( P {\displaystyle P} )就係指有幾多百分比嘅個案喺個變數數值上細過或者等如嗰個個案,即係 n = ⌈ P ...

                                               

相關唔蘊含因果

相關唔蘊含因果 ( correlation does not imply causation )係統計學上嘅一句說話,指緊就算兩個變數之間有統計相關,都唔表示兩個變數之間有因果關係;假想而家有兩個變數 X {\displaystyle X} 同 Y {\displaystyle Y} 之間有勁嘅相關(皮亞遜積差相關係數數值大 ...

                                               

相關圖

相關圖(correlogram)係一時間序列(en:time series)嘅柱自相關函數(en:autocorrelation function, "ACF")嘅柱型圖,可以幫我地認出一組數據嘅周期性之類特質,從而揾出啱用嘅模型。

                                               

眾數

眾數 係統計學上對平均嘅其中一種計法,係一種集中趨勢,方法係將所有數攞出現得最多嗰個,要數據夠多而且有好多重覆先至啱用。

                                               

確定性因素分析

確定性因素分析 ( confirmatory factor analysis , CFA )係因素分析嘅一種,指研究者分析前經已有個模型喺度;個模型會描述「因素有幾多個」以及「每個變數係邊幾個因素嘅函數」等嘅資訊,然後分析方法要做嘅係嘗試計出一啲量度「個模型有幾準確噉描述數據嘅實際 ...

                                               

組內相關

組內相關 ( intraclass correlation , ICC )喺統計學上係用嚟衡量每一組有幾「內部一致」嘅基準:想像有個數據,有若干個個案,而呢柞個案可以分做若干組,如果柞數據反映組內相關高,就表示同一組嘅個案嘅數值傾向彼此之間接近;要計組內相關可以有幾條唔同嘅式用。

                                               

結合數據

結合數據 ( aggregate data )喺統計學上係指由將幾個個體嘅數據以某啲方式結合成嘅數據;例:有個經濟學家想研究一間公司嘅營業額同員工嘅工作表現有乜關係,佢一個可能嘅做法係,每間公司都搵若干個員工(個體),量度每個員工嘅工作表現(個體嘅數據;假設員工 ...

                                               

統計模型

統計模型 ( statistical model )係一種數學模型。一個統計模型由用數據做估計產生,會對樣本數據有啲假設。

                                               

統計相關

相關 ( correlation )喺統計學上嘅定義如下:如果話 x {\displaystyle x} 同 y {\displaystyle y} 呢兩個變數成 正相關 (positive correlation),即係話 x {\displaystyle x} 數值高嗰陣 y {\displaystyle y} 數值都傾向高,而 x {\displaystyle x} 數值低嗰陣 ...

                                               

統計自由度

統計自由度 ( statistical degree of freedom , d f {\displaystyle df} )係統計學上嘅一個概念,簡單講就係「手上有得完全隨機變化嘅資訊量」超越「為咗建立統計模型而必要嘅資訊量」(要估計嘅參數數量)幾多;例如家陣做抽樣,抽咗 n {\displaystyle n} 個個 ...

                                               

統計量

統計量 ( statistic )喺統計學上係指由數據嗰度做計算得出、用嚟做進一步分析嘅數值,例子有平均值。

                                               

線性迴歸分析

線性迴歸分析 (粵拼: sin 3 sing 3 wui 4 gwai 1 fan 1 sik 1 ;英文: linear regression analysis )係最簡單嗰種迴歸分析。喺一個線性迴歸模型當中,個應變數(DV)係柞自變數(IV)嘅線性組合,即係話喺成條式入面,每個參數都衹有各自噉乘某啲常數(冇互相乘 ...

                                               

聚合效度

聚合效度 ( convergent validity )喺統計學上係一種效度指標,指一個量度方法有冇同一啲理論上同佢有相關嘅嘢有預期中嘅相關;例如智能喺理論上會同時影響一個人嘅邏輯能力同語言能力,所以邏輯能力同語言能力理論上應該會有返咁上下正相關。

                                               

自助抽樣法

自助抽樣法 ( bootstrapping )喺統計學上包括任何用咗邊替換邊抽樣(sampling with replacement)嘅做法,邊替換邊抽樣意思如下:設個數據入面嘅個案數量係 n;個演算法會由啲數據度隨機抽一個個案出嚟,將個個案放入 自助樣本 (bootstrap sample),跟住再擺返 ...

                                               

評分者間信度

評分者間信度 ( inter-rater reliability )係信度嘅一個指標,用嚟評估一個量度有幾受做量度嘅人影響;例如有一個俾教育家用嚟評估細路學習進度嘅方法,但做完研究發現,五位教育家分別噉用同一個方法評估同一班細路,五個得到完全唔同嘅數值,噉呢個量度方法嘅評 ...

                                               

誤差積聚

誤差積聚 ( accumulation of errors ),又有叫 不確定性傳播 ( propagation of uncertainty ),係指一柞變數嘅不確定性(隨機性嘅誤差)影響到基於柞變數嘅函數嘅不確定性;想像一架太空船嘅燃料缸,太空船要監察住自己仲淨低幾多燃料,而廿世紀嘅太空船做法係 ...

                                               

調和平均值

調和平均值 ( harmonic mean , H {\displaystyle H} )係平均值嘅一種計法,指以下嘅數值: H = n 1 x 1 + 1 x 2 + ⋯ + 1 x n = n ∑ i = 1 n 1 x i {\displaystyle H={\frac {n}

                                               

調節變數

調節變數 ( moderator variable )係指一個「調節」另外兩個變數之間嘅關係嘅變數( 調節效應 ;moderation effect,又叫 統計互動 ,statistical interaction),用迴歸分析諗嘅話: Y = b 0 + b 1 x 1 + b 2 x 2 + b 3 x 1 × x 2 + ε {\displaystyle Y=b_{0}+b_{ ...

                                               

變異數分析

變異數分析 ( analysis of variance , ANOVA )係統計學上一系列用嚟分析唔同組嘅平均值嘅方法。思路如下:假想家陣個研究者想比較三組喺變數 x {\displaystyle x} 嘅平均值上嘅差異,如果三組之間有顯著嘅差異,噉組之間嘅 x {\displaystyle x} 嘅變異數應該會大 ...

                                               

變異數擴大因子

變異數擴大因子 ( variance inflation factor , VIF )喺統計學上係用嚟衡量一個線性迴歸模型嘅多重共線性嘅指標,係一個表示一個「有多個自變數嘅統計模型嘅變異數」除以「得一個自變數(叫呢個自變數做 x {\displaystyle x} )嘅統計模型嘅變異數」之間嘅商數。

                                               

變異系數

變異系數 ( coefficient of variation , c v {\displaystyle c_{\rm {v}}} )喺統計上係指用一個變數嘅平均值除嗰個變數嘅標準差得出嘅數。 c v = σ μ {\displaystyle c_{\rm {v}}={\frac {\sigma }{\mu }}}

                                               

通徑分析

通徑分析 ( path analysis )喺統計學上係指一個描述若干個變數之間嘅方向性相關嘅模型;一個通徑分析會有若干個變數,並且指明每對變數之間有點樣嘅關係,例:由 x {\displaystyle x} 去 y {\displaystyle y} 嘅單向箭咀表示 x {\displaystyle x} 可以作為一個預 ...

                                               

連續性同離散性變數

連續性變數 ( continuous variable )同 離散性變數 ( discrete variable )係統計學上嘅概念。一個連續性變數嘅可能數值有無限咁多個,而離散性變數得若干個可能數值。例:真相得兩個可能數值(真同假),但溫度嘅可能數值嘅數量原則上有無限咁多個,攝氏 100 度 ...

                                               

邏輯迴歸

邏輯迴歸 ( logistic regression / logit regression )係迴歸分析嘅一種。喺邏輯迴歸當中,個應變數係一個二元(得兩個可能數值)變數,例如係「輸定贏」噉;啲自變數就可以係連續可以係離散;邏輯迴歸可以用嚟按一柞個案當中每個喺柞自變數上嘅數值,預測佢哋係 ...

                                               

重測試信度

重測試信度 ( test-retest reliability )指一個量度方法有幾受時間影響;例如有一個俾心理學家用嚟量度智商嘅測驗,做研究,搵班受試者返嚟做個測驗,得到一柞分數 test t 1 {\displaystyle {\text{test}}_{t1}} ,然後過咗一個月之後,搵返班受試者返嚟又做過, ...

                                               

量度不變特性

量度不變特性 ( measurement invariance )係統計學上做 多組分析 (multigroup analysis)嘅結構方程式模型嗰陣會用到嘅概念;如果話一個量度(例如係智商測試等嘅心理測驗)具有量度不變特性,即係話喺分析緊嗰幾組之間個量度所度緊嘅概念並冇差異。舉個例說明, ...