數(shù)據(jù)挖掘技術在學習效能評價的作用
時間:2022-10-17 02:55:24
導語:數(shù)據(jù)挖掘技術在學習效能評價的作用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

摘要:教育大數(shù)據(jù)的應用方興未艾,目前較多的研究應用在預測學生表現(xiàn)或挖掘影響因素方面。本論述采用關聯(lián)算法和決策樹方法所產(chǎn)生的結(jié)果集來評價教學質(zhì)量提升程度,為教學評價探索了一條新路。
關鍵詞:評價;教學;大數(shù)據(jù);決策
本論述的主要目的是研究如何應用數(shù)據(jù)挖掘思維評價學生的課業(yè)成績及授課質(zhì)量。由于數(shù)據(jù)挖掘算法眾多,主要應用決策樹及關聯(lián)算法作為研究手段,學習數(shù)據(jù)集主要來自高考成績、大學一年級出勤情況、課堂測試、討論發(fā)言、作業(yè)成績及期末考試成績等與學業(yè)相關的數(shù)據(jù),并將這些數(shù)據(jù)作為特征變量,將兩年之后的專業(yè)課成績總和作為目標變量。基本想法是將三年學生的數(shù)據(jù)作為訓練集,以此為依據(jù)每年預測新生畢業(yè)時的專業(yè)課成績優(yōu)良率,如實際與預測相符,則表明整個專業(yè)建設工作處于穩(wěn)定狀態(tài),包括授課質(zhì)量、教學改革、實驗實訓條件、師資隊伍建設等因素的總和處于穩(wěn)定狀態(tài);如實際大于預測或小于預測,則表明總體專業(yè)建設質(zhì)量在提升或下降,以便有針對性地提出加強和改進方案。
1數(shù)據(jù)挖掘主要技術
數(shù)據(jù)挖掘常用的主要技術有決策樹法、神經(jīng)網(wǎng)絡法、遺傳算法、統(tǒng)計分析方法、可視化方法等。1.1決策樹。決策樹法就是以信息論中的互信息(信息增益)原理為基礎尋找數(shù)據(jù)庫中具有最大信息量的字段建立決策樹的一個結(jié)點,再根據(jù)不同取值建立樹的分支;在每個分支子集中重復建立下層結(jié)點和分支,這樣便生成一棵決策樹。然后對決策樹進行剪枝處理,最終把決策樹轉(zhuǎn)化為規(guī)則,再利用規(guī)則對新事例進行分類。典型的決策樹方法有分類回歸樹(CART)、D3、C4.5等。該方法輸出結(jié)果容易理解,實用效果好,影響也較大。1.2神經(jīng)網(wǎng)絡法。神經(jīng)網(wǎng)絡法建立在可以自學習的數(shù)學模型基礎上。它是由一系列類似于人腦腦神經(jīng)元一樣的處理單元組成,那就是節(jié)點(Node)。這些節(jié)點通過網(wǎng)絡彼此互連,如果有數(shù)據(jù)輸入,它們便可以進行確定數(shù)據(jù)模式的工作。神經(jīng)網(wǎng)絡法對于非線性數(shù)據(jù)具有快速建模能力,其挖掘的基本過程是先將數(shù)據(jù)聚類,然后分類計算權值,神經(jīng)網(wǎng)絡的知識體現(xiàn)在網(wǎng)絡連接的權值上,該方法更適合用于非線性數(shù)據(jù)和含噪聲的數(shù)據(jù),在市場數(shù)據(jù)分析和建模方面有廣泛的應用。1.3遺傳算法。遺傳算法是一種模擬生物進化過程的算法,由三個基本算子組成:繁殖、交叉(重組)、變異(突變)。在遺傳算法實施過程中,首先對求解的問題進行編碼(染色體),產(chǎn)生初始群體;然后計算個體的適應度,再進行染色體的復制、交換、突變等操作,最后產(chǎn)生新的個體。經(jīng)過若干代的遺傳,將得到滿足要求的后代(即問題的解)。該方法計算簡單,優(yōu)化效果好,適合于聚類分析。1.4統(tǒng)計分析方法。統(tǒng)計分析方法是利用統(tǒng)計學、概率論的原理對數(shù)據(jù)庫中的信息進行統(tǒng)計分析,從而找出它們之間的關系和規(guī)律。常用的統(tǒng)計分析方法有:判別分析、因子分析、相關分析、多元回歸分析、偏最小二乘回歸方法等。統(tǒng)計分析方法是最基本的數(shù)據(jù)挖掘技術方法之一,可用于分類挖掘和聚類挖掘。1.5可視化方法??梢暬椒ㄊ且活愝o助方法,它采用比較直觀的圖形圖表方式將挖掘出來的模式表現(xiàn)出來,其大大拓寬了數(shù)據(jù)的表達和理解力,使用戶對數(shù)據(jù)的剖析更清楚。
2國外研究現(xiàn)狀
Alaael-Halees認為數(shù)據(jù)挖掘可以增強對學習過程的理解,要專注于與學生學習過程相關變量的識別、提取和評估;Han和Kamber[1]認為能夠分析不同維度數(shù)據(jù)的數(shù)據(jù)挖掘軟件,對教育數(shù)據(jù)的分類,并總結(jié)出挖掘過程中各種關系具有極大的推動作用。Pandey和Pal[2]選取了來自印度法扎巴德不同學院的600名學生,對他們的學習成績進行了研究。通過對學生的類別、語言、背景資格等進行分類,可以發(fā)現(xiàn)新生是否會成為優(yōu)秀畢業(yè)生;Hijazi和Naqvi[3]對300名學生(225名男生)的學習成績進行了研究。初期假設為“學生上課的態(tài)度、大學畢業(yè)后每天學習的時間、學生的家庭收入、學生母親的年齡及母親的教育程度與學生的學習成績顯著相關”。通過簡單的線性回歸分析,發(fā)現(xiàn)母親教育程度、學生家庭收入等因素與學生學業(yè)成績呈高度相關。Khan[4]對400名學生進行了研究包括200名男生和200名女生,主要目標建立的包含不同測度值的預測值集合,包含認知能力、成功的人格和人口統(tǒng)計學變量,從而試圖揭示在高中能取得科學學科成功的因素,算法選擇基于聚類的抽樣技術,研究分為聚類組合和隨機組。研究發(fā)現(xiàn),社會經(jīng)濟地位高的女生理科成績相對較高,社會經(jīng)濟地位低的男生理科成績總體較高;Galit[5]給出了一個案例研究,使用學生的數(shù)據(jù)來分析他們的學習行為,從而預測結(jié)果,并在期末考試前關注處于危險中的學生;Al-radaideh,[6]應用決策樹模型預測了2005年約旦Yarmouk大學c++課程學生的最終成績。采用ID3、C4.5和NaiveBayes三種不同的分類方法。結(jié)果表明,決策樹模型具有較好的預測效果;Pandey和Pal[7]選取了印度法扎巴德R.M.L.Awadh博士學位學院的60名學生,對他們的學習成績進行了研究。通過關聯(lián)規(guī)則發(fā)現(xiàn)學生對語言選修課的興趣;Ayesha,Mus⁃tafa,Sattar和Khan[8]描述了使用k-means聚類算法來預測學生的學習活動。數(shù)據(jù)挖掘技術實施后所產(chǎn)生的信息對教師和學生都有一定的幫助。Bray[9]在他關于私人輔導及其影響的研究中發(fā)現(xiàn),印度接受私人輔導的學生比例相對高于馬來西亞、新加坡、日本、中國和斯里蘭卡。研究還發(fā)現(xiàn),家教強度對學生的學業(yè)成績有促進作用,而家教強度的這種變化依賴于集合因素,即社會經(jīng)濟條件;Bhardwaj和Pal[10]對R.M.L.Awadh大學計算機應用學士學位課程5個不同學位學院的300名學生的學習成績進行了研究。運用貝葉斯分類方法對17個屬性進行分類,發(fā)現(xiàn)學生高中成績、居住地點、教學媒介、母親的資歷、學生的其他習慣、家庭年收入和家庭狀況與學生大學學業(yè)成績呈高度相關。
3實例分析
本例選取了財經(jīng)商貿(mào)學院2017~20畢業(yè)生共1800名學生的相關學習記錄數(shù)據(jù)。目標變量選取的是二、三年級的專業(yè)課總成績(STS),特征變量選取高考成績(CEEA)、大學一年級出勤情況(ATT)、課堂測試(CTG)、討論發(fā)言(SEM)、作業(yè)成績(ASS)及期末考試成績(ESM)。其等級分類表見表1所列。經(jīng)計算,CEEA與STS的相關程度最高,可將其作為根節(jié)點。通過決策樹的訓練,可以為從終端節(jié)點到根節(jié)點的每個路徑生成一個分類規(guī)則,通過刪除對象數(shù)目少于所需數(shù)目的節(jié)點來執(zhí)行剪枝技術,最后可得到如下if-then的關聯(lián)規(guī)則見表3所列。
4結(jié)論
本論述利用分類任務對學生數(shù)據(jù)庫進行分類,已有數(shù)據(jù)庫的基礎上預測學生學習成果等級。由于數(shù)據(jù)分類的方法很多,本論述使用決策樹方法,而信息數(shù)據(jù)從教學過程中得到。本研究是一種創(chuàng)新嘗試,希望通過大數(shù)據(jù)預測方法開辟新的教學評價之路,對高等教育評價工具的補充具有一定的參考價值。
作者:張武 康等銀 王德方 單位:蘭州資源環(huán)境職業(yè)技術學院