職稱論文發(fā)表網(wǎng)基于Matlab的考試數(shù)據(jù)
摘要:介紹了統(tǒng)計(jì)分析方法中的主成分分析法,對(duì)考生考試成績(jī)數(shù)據(jù)利用matlab軟件進(jìn)行了主成分分析,得出了數(shù)據(jù)的主成分和綜合評(píng)價(jià)函數(shù), 并結(jié)合學(xué)生成績(jī)進(jìn)行分析,了解到了每個(gè)考生在數(shù)學(xué)學(xué)科學(xué)習(xí)上有哪些優(yōu)勢(shì)和不足,從而為改善學(xué)習(xí)方法和提高學(xué)習(xí)成績(jī)方面的提供重要參考。
關(guān)鍵詞:主成分分析;考生考試數(shù)據(jù);matlab軟件 電子期刊
1 概述
考試是用來(lái)教學(xué)評(píng)價(jià)和檢查考生學(xué)習(xí)情況的基本手段,但每一次考試帶給我們的信息,絕不僅僅是每個(gè)考生的具體得了多少分?jǐn)?shù)。其實(shí)我們還可以了解到更多考生的學(xué)習(xí)情況,那么我們就需要對(duì)批改試卷產(chǎn)生的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,根據(jù)分析結(jié)果得到的結(jié)論,能夠?yàn)榻虒W(xué)和學(xué)習(xí)提供參考,從而能不斷改進(jìn)我們教學(xué)和學(xué)習(xí)工作。
對(duì)試卷進(jìn)行統(tǒng)計(jì)分析時(shí),我們會(huì)發(fā)現(xiàn)試卷各試題之問(wèn)往往存在一定的相關(guān)性,即有些題目考察了相似的知識(shí)點(diǎn)和考點(diǎn),對(duì)得到的數(shù)據(jù)不進(jìn)行任何處理就進(jìn)行分析,勢(shì)必會(huì)把試卷分析的變得復(fù)雜化.就不容易抓住數(shù)據(jù)的主要規(guī)律并對(duì)事物的性質(zhì)做出準(zhǔn)確的評(píng)價(jià)。因此,我們需要把原來(lái)的指標(biāo)轉(zhuǎn)化為一個(gè)或少數(shù)幾個(gè)互相獨(dú)立的綜合指標(biāo)來(lái)達(dá)到分析的目的。該文講的主成分分析法就是能達(dá)到這種目的的統(tǒng)計(jì)分析方法。
2 主成分分析的基本原理
2.1 主成分分析的基本思想[1]
主成分分析首先是Hotelling于1933年時(shí)提出的。主成分分析是一種利用數(shù)學(xué)思想達(dá)到降低維數(shù)的統(tǒng)計(jì)方法,即通過(guò)找出幾個(gè)綜合指標(biāo)來(lái)代替眾多的原始指標(biāo), 并盡可能多的反映原始數(shù)據(jù)所提供的信息量,而且彼此之間相互獨(dú)立。主成分分析所要做的內(nèi)容就是要設(shè)法把原來(lái)具有一定相關(guān)性的眾多變量,重新組合成一組新的相互獨(dú)立的綜合變量來(lái)代替原來(lái)變量,通常數(shù)學(xué)上的處理方法就是將原來(lái)的變量做線性組合,作為新的綜合變量,但這種組合如果不加以限制,就會(huì)有很多情況,那么我們?nèi)绾芜x擇呢?如果將選取的第一個(gè)線性組合作為第一個(gè)綜合變量記為[F1],那么我們自然希望它能盡可能地反應(yīng)原來(lái)變量的信息,這里我們把包含“信息”的多少用方差來(lái)測(cè)量,即[Var(F1)]越大,表示[Y1]包含的信息越多。
因此所選取的[F1]應(yīng)該是所有的線性組合中方差最大的,我們把[F1稱為]第一主成分。如果第一主成分不能夠代表原來(lái)多個(gè)變量的基本信息,那么就再選取第二個(gè)線性組合[F2],為了有效的反應(yīng)原來(lái)信息,[F1]已有的信息就不需要再出現(xiàn)在[F2]中,用數(shù)學(xué)語(yǔ)言表達(dá)就是要求[CovF1,F(xiàn)2=0],我們把[F2稱]為第二主成分,依此類(lèi)推,可以得到出第三、第四……第[p]個(gè)主成分。
2.2 主成分分析的基本理論[2]
設(shè)研究某一事物時(shí)涉及到[p]個(gè)變量,我們分別用[X1,X2,…,XP]表示,[X=(X1,X2,…,XP)T為]這[p]個(gè)指標(biāo)構(gòu)成的[p]維隨機(jī)向量。設(shè)隨機(jī)向量[X]均值[EX]和協(xié)方差陣[DX]分別為[μ]和Σ。對(duì)[X]進(jìn)行線性變換,即可得到新的綜合變量,它可由原來(lái)的變量線性表示,即滿足下式:
[Yi=μTiX=μ1iX1+μ2iX21+…+μpiXpi=1,2,…,p ] (1)
易見(jiàn) [VarYi=μTiμi,CovYi,Yj=μTiμj,(i,j=1,2,…,p)]
定義1 設(shè)[X=X1,X2,…,XPT] 為[P]維隨機(jī)向量。稱[Yi=μTiX] 為[X] 的第[i]主成分[i=1,2,…,p,如果:]
[μTiμi]=[μ21i+μ21i+…+μ21i=1,i=1,2,…,p] (2)
[CovYi,Yj=0],[i≠j, i,j=1,2,…,p,即Yi與Yj不相關(guān)] (3)
[VarY1?VarY2?…?VarYp] (4)
從這個(gè)定義1,我們可以知道主成分是原來(lái)[p]個(gè)原始變量進(jìn)行特殊線性組合構(gòu)成的. 那么, 我們?nèi)绾蝸?lái)求主成分呢? 一般地, 我們有:
定理 2 設(shè)[X=X1,X2,…,XPT] 為[P]維隨機(jī)向量。且[D(X)=Σ], [Σ] 的特征值為 [λ1≥λ2?…≥λp>0,] [α1,α2,…,αp]為相應(yīng)的單位正交特征向量,
則[X]的第[i]主成分為[Fi=αTiX i=1,2,…,p]
從這個(gè)定義2,我們了解到要求[X]的第[i]主成分,必須首先求出[X]方差的第[i]大特征值和相應(yīng)的單位正交特征向量。
2.3 主成分分析的分析步驟[3]
設(shè)研究某一事物涉及[到p]個(gè)變量,每個(gè)變量都有[n]個(gè)數(shù)據(jù)。那么我們就可以得到一個(gè)[n×p]階的矩陣,將其記為
[X=xijnm=x11…x1p???xn1…xnp]=[X1,X2,...,Xp]
1)對(duì)矩陣[X]進(jìn)行標(biāo)準(zhǔn)化處理
[xij=xij-xjσj],[i=1,2,...,n;j=1,2,...,p],
其中[xj=1ni=1nxij],[σj=1ni=1nxij-xij2] ,
得到標(biāo)準(zhǔn)化矩陣仍記為
[X=xijnm=x11…x1m???xn1…xnm]
[Xi=x1i,xni,...xniT,i=1,2,...,p]
2) 求標(biāo)準(zhǔn)化后矩陣的相關(guān)系數(shù)矩陣:
[R=r11…r1n???rp1…rpn]=[1nXTX]
其中,[rij=1ni=1nxijxik=1nXiTXk],[j,k=1,2,...,p]
3) 求相關(guān)系數(shù)矩陣[R]的特征值[λi]和相應(yīng)的特征向量[αi]
4) 確定要選取的主成分個(gè)數(shù),我們稱[λkk=1pλk]為第[k]個(gè)主成分的貢獻(xiàn)率,記為[ρk],稱[k=1mλkk=1pλk]為前[m]個(gè)主成分的累積貢獻(xiàn)率。當(dāng)前[m]個(gè)主成分累積貢獻(xiàn)率超過(guò)[83%]時(shí),取前[m]個(gè)主成分代替原來(lái)的[p]個(gè)指標(biāo)。
5) 求各主成分載荷[βi=λiαi]以及主成分載荷矩陣,再計(jì)算各主成分的得分函數(shù)[Fi=αiXi,i=1,2,...,m]
6) 把各變量的原始數(shù)據(jù)標(biāo)準(zhǔn)化后代入各主成分方程中,求得綜合評(píng)價(jià)值[F=ρ1F1+ρ2F2+...+ρmFm]進(jìn)行分析評(píng)價(jià)。
3 應(yīng)用主成分分析法分析考生成績(jī)[4-5]
3.1 選取主成分和構(gòu)造綜合評(píng)價(jià)函數(shù)
以貴陽(yáng)某中學(xué)的一個(gè)班在高三模擬考試中的數(shù)學(xué)選擇題的得分情況的數(shù)據(jù)為例.運(yùn)用主成分分析法對(duì)考生數(shù)學(xué)學(xué)習(xí)情況進(jìn)行分析。該班一共有50名考生。高中數(shù)學(xué)選擇題共12題,每題5分,將數(shù)學(xué)選擇題每個(gè)題目分別用[X1]、[X2]、[…]、[X12]。來(lái)表示,用[xij]表示第i個(gè)考生在數(shù)學(xué)選擇題第j題上的得分,則這樣就得到了一個(gè)[X=(xij)50×12]的矩陣,因此我們可以借助matlab主成分分析程序?qū)@個(gè)矩陣進(jìn)行主成分分析,得到下列結(jié)果:
根據(jù)主成分分析的相關(guān)理論,在選取主成分時(shí),只需要將特征值從小到大排列,選取前[m]個(gè)累計(jì)貢獻(xiàn)率超過(guò)83%的主成分即可,通過(guò)上面表格和圖形的顯示的累計(jì)貢獻(xiàn)率可知,我們只需要選取5個(gè)主成分,從上面累積貢獻(xiàn)率情況可知我們選取的這5個(gè)主成分是可以反映全部指標(biāo)的基本信息,所以可以用這5個(gè)新變量來(lái)代替原來(lái)的12個(gè)變量。根據(jù)前面講到的定理2我們可以得到選擇題的5個(gè)主成分公式,如下所示:
[F1=0.1932X1+0.1359X2+0.3402X3+0.2662X4+0.1254X5+0.2944X6 +0.2828X7+0.2454X8+0.5176X9+0.4098X10+0.2061X11+0.1915X12]
[F2=0.5196X1+0.5343X2+0.4956X3+0.2918X4-0.3985X5-0.4281X6 +0.3391X7-0.1558X8-0.1008X9+0.3771X10-0.3291X11-0.1933X12]
[F3=-0.0117X1-0.1687X2+0.1733X3-0.2693X4-0.3008X5+0.0588X6 +0.3456X7+0.5041X8-0.2919X9-0.2080X10-0.1174X11+0.5090X12]
[F4=-0.0802X1-0.0883X2+0.3429X3-0.0951X4-0.4928X5+0.5271X6 +0.0005X7-0.1161X8+0.1591X9-0.1941X10-0.2019X11-0.2702X12][F5=0.0993X1+0.1617X2+0.2707X3-0.0251X4+0.1000X5+0.1639X6 -0.3226X7-0.4542X8+0.0146X9+0.0011X10-0.4819X11+0.5571X12]
根據(jù)主成分分析的分析步驟的第6步可得到選擇題綜合評(píng)價(jià)函數(shù):
[F=0.1894X1+0.1578X2+0.3443X3+0.0904X4-0.1792X5+0.0873X6 +0.1840X7+0.0356X8+0.1024X9+0.1524X10-0.1397X11+0.1210X12]
3.2 選擇題主成分分析
3.2.1 各題目重要性比較
通過(guò)圖1,我們可以知道變量[X1]、[X2]、[X3]、[X7]、[X8]、 [X9]、[X12]所對(duì)應(yīng)的題目要高于平均重要性,而變量[X4]、[X5]、[X6]、[X8]、[X11]所對(duì)應(yīng)的題目重要性要低于平均重要性(0.0955)。
《職稱論文發(fā)表網(wǎng)基于Matlab的考試數(shù)據(jù)》
- 職稱論文刊發(fā)主體資格的
- 政法論文淺析工會(huì)法主體
- 化學(xué)在初中教學(xué)中的情感
- 中學(xué)教育論文思想政治方
- 法治論文投稿法治型市場(chǎng)
- 雜志社論文發(fā)表淺析推動(dòng)
- 新疆教育報(bào)投稿淺析學(xué)生
- 分男女招生錄取的合憲性
最新優(yōu)質(zhì)論文
- 教師評(píng)高級(jí)職稱需要幾篇
- 通信系列職稱對(duì)論文的要
- 互聯(lián)網(wǎng)金融論文能發(fā)表的
- 簡(jiǎn)述撰寫(xiě)職稱論文的要求
- SCI論文的審稿流程是什么
- 公司會(huì)計(jì)如何發(fā)表論文
- 企業(yè)管理論文怎么發(fā)表
- 為什么期刊要收版面費(fèi)?免
論文發(fā)表問(wèn)題熱點(diǎn)
- 中級(jí)職稱醫(yī)學(xué)論文結(jié)構(gòu)格
- 期刊論文發(fā)表的要求規(guī)范
- 職稱論文發(fā)表網(wǎng)企業(yè)管理
- 英語(yǔ)論文投稿提高中稿機(jī)
- 畢業(yè)論文快速投稿方法
- 會(huì)計(jì)畢業(yè)論文職稱論文準(zhǔn)
- 評(píng)職稱需要提供哪些材料
- 人民之聲期刊投稿有什么
新聞動(dòng)態(tài)
- 互聯(lián)網(wǎng)時(shí)代下的城郊新型
- 物聯(lián)網(wǎng)技術(shù)下計(jì)算機(jī)網(wǎng)絡(luò)
- 量子互聯(lián)網(wǎng)關(guān)鍵技術(shù)與發(fā)
- 局域網(wǎng)環(huán)境下計(jì)算機(jī)網(wǎng)絡(luò)
- 云計(jì)算技術(shù)在計(jì)算機(jī)網(wǎng)絡(luò)
- 銀行計(jì)算機(jī)與網(wǎng)絡(luò)系統(tǒng)的
- 探析計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)在電
- 互聯(lián)網(wǎng)+”下高校信息化