實踐項目 返回列表

智能學(xué)習系統中作業習慣建模研究

2021/7/10 9:28:45

殷寶媛1, 武法提2

(1.哈爾濱師範大學(xué) 教育科學(xué)學(xué)院, 黑龍江 哈爾濱 150080;

2.數字學(xué)習與教育公共服務教育部工程研究中心, 北京 100875)




[摘 要] 作業習慣與學(xué)習者的(de)學(xué)業成就緊密相關,作業習慣的(de)建模是智能學(xué)習系統設計中亟待解決的(de)問題。本研究應用混合式研究方法,依據多層次作業模型,确定“學(xué)業拖延”和(hé)“學(xué)業勤奮”作為(wèi)兩個重要且可(kě)以測量的(de)作業習慣的(de)維度,分别表征作業時間和(hé)作業努力這兩類核心的(de)作業行為(wèi)。構建了包括做(zuò)題拖延和(hé)提交拖延的(de)學(xué)業拖延習慣子(zǐ)模型,應用聚類實現了對學(xué)業拖延習慣的(de)診斷,定義了“無拖延習慣者”“嚴重拖延習慣者”“提交作業拖延者”“做(zuò)作業拖延者”四類學(xué)習者。以時間投入—專注度模型為(wèi)理(lǐ)論框架,構建了包括時間投入和(hé)專注度的(de)學(xué)業勤奮習慣子(zǐ)模型,應用人工神經網絡實現對學(xué)業勤奮習慣進行診斷,診斷出五種勤奮度的(de)級别,并驗證了模型的(de)有效性。

[關鍵詞] 學(xué)習習慣; 作業習慣; 學(xué)業拖延; 學(xué)業勤奮; 智能學(xué)習系統; 建模






一(yī)、引 言



作業是連接教與學(xué)的(de)重要環節,體現了教育的(de)價值取向和(hé)課程改革的(de)理(lǐ)念。作業在K-12教育中具有重要的(de)地(dì)位[1],作業可(kě)以補充和(hé)鞏固學(xué)生在學(xué)校的(de)學(xué)習,完善學(xué)生的(de)知識和(hé)技能[2]。因此,培養學(xué)生良好的(de)作業習慣,對于學(xué)生的(de)學(xué)業表現具有重要的(de)意義。随着信息技術的(de)發展,學(xué)生做(zuò)作業的(de)方式也從傳統的(de)紙和(hé)筆(bǐ)作業發展到在線作業以及線上線下混合的(de)作業形式,與傳統作業相比,在線作業可(kě)以使學(xué)生得到即時的(de)反饋與輔導,能帶來更好的(de)學(xué)習結果[3]。學(xué)生在線作業的(de)過程會以數據的(de)形式存儲在學(xué)習系統中,如(rú)何通過這些海量的(de)作業行為(wèi)數據,分析學(xué)生的(de)作業習慣,為(wèi)學(xué)生的(de)個性化學(xué)習提供支持和(hé)服務,是智能學(xué)習系統設計中亟待解決的(de)問題。




二、智能學(xué)習系統中作業習慣模型的(de)構建



智能學(xué)習系統中作業習慣的(de)建模可(kě)以應用學(xué)習習慣的(de)建模方法,可(kě)采用自(zì)上而下的(de)理(lǐ)論經驗法和(hé)自(zì)下而上的(de)數據挖掘法相結合的(de)混合式思路,重點解決學(xué)習習慣測量模型的(de)維度和(hé)學(xué)習習慣模型的(de)測量指标等問題[4]

(一(yī))智能學(xué)習系統中作業習慣模型維度的(de)确定

在智能學(xué)習系統中,學(xué)生的(de)作業習慣是通過其作業行為(wèi)表現出來的(de)。關于學(xué)生作業行為(wèi)的(de)研究, Flunger B認為(wèi)作業時間是作業行為(wèi)的(de)一(yī)個重要特征[5];Dettmers認為(wèi)學(xué)生在作業中投入的(de)努力程度可(kě)以表征其作業行為(wèi)[6];Trautwein U的(de)研究表明,作業對學(xué)業成就的(de)積極效果并不能僅由“作業時間”測量,還與作業的(de)完成質量(專注/效率、按時、正确)有關[7],并提出多層次作業模型,該模型認為(wèi)作業時間(即花費在作業上的(de)時間)和(hé)作業努力(即學(xué)習者認真對待作業的(de)程度)可(kě)以用來表征學(xué)生作業行為(wèi)的(de)兩個中心方面[8]。本研究以多層次作業模型為(wèi)基礎,探讨作業時間和(hé)作業努力這兩類作業行為(wèi)與哪些教育領域常識性的(de)學(xué)習習慣概念相對應,以确定作業習慣模型的(de)維度。

1. 通過文獻分析提取模型維度的(de)關鍵詞

作業模型維度關鍵詞篩選的(de)原則有兩個,一(yī)是從價值性的(de)角度出發,選擇需要測量的(de)作業習慣,即教育學(xué)領域認為(wèi)應該測量的(de)作業習慣,對學(xué)習者的(de)學(xué)習和(hé)發展會有重要影響的(de)作業習慣;二是從實用性的(de)角度出發,選擇能夠測量的(de)作業習慣,即當前技術手段等可(kě)以實現量化的(de)作業習慣。通過收集和(hé)整理(lǐ)國內(nèi)外關于學(xué)習習慣的(de)文獻,分析、總結和(hé)提取作業學(xué)習習慣維度的(de)關鍵詞。共提取出學(xué)習習慣維度的(de)關鍵詞76個,其中在線教育維度關鍵詞23個,混合學(xué)習環境關鍵詞53個,篩選出與作業有關的(de)關鍵詞48個。按照篩選的(de)兩個原則(一(yī)是需要測量的(de);二是能夠測量的(de)),對這48個關鍵詞進行篩選。得到學(xué)業拖延、時間管理(lǐ)、目标計劃、學(xué)習環境、主動學(xué)習、協作、學(xué)業勤奮、獨立思考等8個關鍵詞。

2. 通過專家訪談補充和(hé)修改模型維度的(de)關鍵詞

訪談6位具有在線教學(xué)和(hé)研究經驗的(de)專家,了解在線學(xué)習環境下專家對作業習慣關注的(de)要點,經過速記轉錄與整理(lǐ),形成了訪談文本資料。使用NVivo軟件對訪談資料進行編碼,提取出教師和(hé)專家關注的(de)作業習慣關鍵詞6個(拖延、勤奮、努力、主動、投入、專注)。将文獻分析的(de)8個關鍵詞與訪談挖掘的(de)關鍵詞進行整合,形成德爾菲法調查問卷的(de)關鍵詞集。

3. 通過德爾菲法确定模型維度

有16位專家(其中包括5位高(gāo)校教師、5位研究人員和(hé)6位中學(xué)教師)參與了本研究的(de)德爾菲調查。調查以問卷形式進行,征詢專家對作業習慣模型維度的(de)意見。根據兩輪意見征詢和(hé)修訂,确定将學(xué)業拖延、學(xué)業勤奮作為(wèi)兩個重要且可(kě)以測量的(de)作業習慣的(de)維度,分别表征作業時間、作業努力兩個方面作業行為(wèi)的(de)頻繁程度對學(xué)習的(de)影響。

(二)維度1:學(xué)業拖延習慣的(de)測量

作業模型中的(de)學(xué)業拖延習慣是指當學(xué)生面對與作業(學(xué)業任務)有關的(de)事件刺激所呈現的(de)延遲行為(wèi)。學(xué)業拖延習慣是一(yī)種常見的(de)不良學(xué)習習慣。研究發現,大約30%至60%的(de)學(xué)習者報告了自(zì)己在準備考試、寫學(xué)期論文等學(xué)習任務時具有拖延習慣[9]。學(xué)業拖延習慣會影響學(xué)習者的(de)學(xué)習表現,阻礙其學(xué)習進步,增加其壓力,并降低(dī)生活的(de)質量,對學(xué)習者的(de)身心健康産生消極影響[10]。由于學(xué)業拖延習慣對學(xué)業成就的(de)影響最為(wèi)直接,因此也是許多研究者和(hé)教師關注的(de)問題。

1. 學(xué)業拖延習慣子(zǐ)模型構建

在學(xué)業拖延習慣的(de)測量上,大多數采用調查問卷或量表,通過學(xué)習者自(zì)我報告的(de)形式來測量拖延習慣,如(rú)Tuckman拖延傾向量表(TPS[11])、Solomon等學(xué)業拖延量表(PASS[12])等;此外,還有教師評定的(de)方式(如(rú)出勤等)測量拖延習慣,如(rú)Miligram 等的(de)學(xué)業拖延量表(APS[13])等。學(xué)業拖延習慣通常表現為(wèi)放棄和(hé)推遲完成作業。用行為(wèi)數據來測量拖延,一(yī)般都是判斷行為(wèi)是否在截止時間前完成,用在作業拖延的(de)測量,通常都是單一(yī)維度的(de)判斷提交作業的(de)截止時間[14]。然而拖延作為(wèi)從時間角度表征作業行為(wèi)頻率對學(xué)習影響的(de)變量,不應該僅從“完成的(de)時間”進行單一(yī)維度的(de)判斷,還應該包括“做(zuò)的(de)時間”維度,做(zuò)作業的(de)時間長(cháng)短(duǎn)不僅是學(xué)習者知識能力的(de)表現,更是專注力等方面的(de)外顯。因此,本研究構建了包括“做(zuò)的(de)時間”和(hé)“完成的(de)時間”兩個維度的(de)學(xué)業拖延習慣模型,即做(zuò)題拖延和(hé)提交拖延二維模型。

2. 學(xué)業拖延習慣測量的(de)算法設計

研究假設:超出規定做(zuò)作業時間的(de)次數越多,拖延度越高(gāo);超出規定提交作業時間的(de)次數越多,拖延度越高(gāo)。拖延度表達為(wèi):Pr=f(T,N)。其中,f()是函數關系,Pr表示作業的(de)學(xué)業拖延度,T表示作業學(xué)習行為(wèi)中與時間相關的(de)參數,N表示作業學(xué)習行為(wèi)中與拖延次數相關的(de)參數。

(1)做(zuò)作業時的(de)拖延次數Nd的(de)計算

設Tst表示開始做(zuò)作業的(de)時間、Tsb表示提交作業的(de)時間、Tlt表示規定的(de)做(zuò)作業的(de)時長(cháng)、Nd表示做(zuò)作業時的(de)拖延次數。則第i次做(zuò)作業的(de)時長(cháng)Tdu(i)=Tsb(i)-Tst(i);第i次做(zuò)作業拖延的(de)時長(cháng)Tpd(i)=Tdu(i)-Tlt(i)。做(zuò)作業時的(de)拖延次數Nd的(de)計算公式為(wèi):Tpd(i)>0?Nd=Nd+1。其中i=1…n,n為(wèi)正整數。

(2)提交作業的(de)拖延次數Ns的(de)計算

設Tdl規定最晚提交作業的(de)時間,則第i次提交作業拖延的(de)時長(cháng)Tps(i)=Tsb(i)-Tdl(i)。提交作業的(de)拖延次數Ns的(de)計算公式為(wèi):Tps(i)>0?Ns=Ns+1。其中i=1…n,n為(wèi)正整數。

(3)學(xué)業拖延度Pr的(de)計算

研究的(de)目的(de)是診斷出具有不同拖延習慣的(de)學(xué)習者,即把學(xué)業拖延度Pr的(de)計算看成一(yī)個分類問題。聚類分析是解決分類問題的(de)有效方法,因此可(kě)以根據數據的(de)特點,選用不同的(de)聚類算法,對Pr進行分類,實現對學(xué)業拖延度的(de)計算。

(三)維度2:學(xué)業勤奮習慣模型的(de)測量

學(xué)業勤奮習慣用于表征作業行為(wèi)中的(de)努力行為(wèi)的(de)頻繁程度。學(xué)業勤奮是指學(xué)習者自(zì)覺地(dì)卷入學(xué)習任務,并不懈地(dì)追求學(xué)習目标的(de)惜時表現[15]。研究表明,學(xué)業勤奮習慣對于學(xué)業成就具有預測作用。在線學(xué)習環境下,學(xué)習者面臨更多的(de)誘惑,這會導緻學(xué)習者的(de)注意力分散,因此學(xué)習者保持學(xué)業勤奮習慣對其學(xué)業表現具有重要的(de)作用。

1. 學(xué)業勤奮習慣子(zǐ)模型構建

關于學(xué)業勤奮習慣的(de)測量,常采用問卷調查法,如(rú)Bernard 等編制的(de)基礎教育勤奮調查問卷DI-HS和(hé)高(gāo)等教育勤奮調查問卷DI-HE[16]等。但是問卷測量受到許多衆所周知的(de)限制,尤其是自(zì)我報告式問卷,存在社會期望偏差和(hé)其他的(de)限制,特别是當存在激勵因素時。有研究者認為(wèi),用學(xué)習行為(wèi)測量學(xué)業勤奮可(kě)能比問卷更适合,因為(wèi)行為(wèi)不依賴于主觀判斷,直接對行為(wèi)進行分析,可(kě)以消除參考偏倚、社會期望偏倚和(hé)造假相關的(de)局限性[17]

關于學(xué)業勤奮習慣維度的(de)研究主要有兩種取向。第一(yī)種是學(xué)習時間(行為(wèi))投入的(de)取向。該取向主要從學(xué)習者投入學(xué)習中的(de)時間或行為(wèi)的(de)多少來考察學(xué)業勤奮度,認為(wèi)個體在學(xué)習中投入的(de)時間或行為(wèi)越多,個體的(de)學(xué)業勤奮水平就越高(gāo)[18]。第二種是學(xué)習專注度的(de)取向。該取向強調從認知和(hé)情感投入角度來探究學(xué)業勤奮度,偏重于從專注程度的(de)視(shì)角來考察學(xué)業勤奮度[19]。但時間投入和(hé)專注度是不可(kě)分離(lí)的(de),專注度是通過學(xué)習時間投入表現出來的(de),學(xué)習時間投入是專注度的(de)載體。因此,單維取向不能夠有效地(dì)對學(xué)習者的(de)學(xué)業勤奮度水平進行合理(lǐ)的(de)評估。為(wèi)避免單維水平評估學(xué)習者的(de)學(xué)業勤奮的(de)不足,雷浩等綜合了時間投入和(hé)專注度兩種取向,提出了學(xué)業勤奮度的(de)“時間投入—專注度雙維核心模型”,并檢驗了該模型應用的(de)有效性[15]。但是該研究是通過自(zì)編的(de)《中學(xué)生學(xué)業勤奮度問卷》來獲得的(de)數據,仍然存在問卷調查法的(de)弊端。因此,本研究以“時間投入—專注度雙維核心模型”為(wèi)理(lǐ)論框架,探索基于學(xué)生學(xué)習行為(wèi)的(de)學(xué)業勤奮習慣測量模型。

2. 學(xué)業勤奮習慣測量的(de)算法設計

學(xué)業勤奮習慣的(de)測量假設是學(xué)業勤奮習慣與作業學(xué)習行為(wèi)是相關的(de)。這裏主要包括以下兩個問題:一(yī)是學(xué)業勤奮習慣水平與哪些在線作業行為(wèi)相關?二是在線作業行為(wèi)與學(xué)業勤奮習慣水平的(de)關系是否可(kě)以描述為(wèi)數學(xué)模型?

由于不同學(xué)習平台開發的(de)目的(de)不同,所提供的(de)工具不同,會導緻學(xué)習行為(wèi)指标選擇的(de)不同。因此,在确定兩個維度學(xué)習行為(wèi)的(de)量化指标時,需要考慮學(xué)習平台本身的(de)特點,以及數據采集的(de)可(kě)行性。一(yī)般來說,學(xué)業勤奮習慣主要表現在做(zuò)作業、觀看微視(shì)頻答題、作業互動、資源浏覽等多種行為(wèi),各種行為(wèi)對學(xué)業勤奮習慣貢獻的(de)程度也不同,這就導緻學(xué)業勤奮習慣的(de)輸入和(hé)輸出是一(yī)種複雜的(de)非線性關系。因此,勤奮習慣的(de)診斷是一(yī)個多層次、多目标的(de)問題,難以建立合理(lǐ)、準确的(de)數學(xué)公式。對于多指标的(de)預測和(hé)分類問題,通常采用多元線性回歸、logistic回歸等回歸方法,但這些方法是基于線性關系來進行評價,無法對非線性問題進行很好的(de)逼近。人工神經網絡的(de)優勢恰好體現在處理(lǐ)非線性問題上,相對于其他非線性回歸方法,人工神經網絡避免了選取何種非線性函數的(de)困擾,因此本研究根據數據之間的(de)非線性特點,以及需要解決問題的(de)性質,選擇人工神經網絡方法對勤奮習慣進行診斷。

本研究的(de)輸入數據為(wèi)學(xué)習者歸一(yī)化後的(de)特征向量,輸出數據為(wèi)勤奮度(勤奮學(xué)習習慣的(de)标度)數值,分為(wèi)1~5類(1類勤奮度最低(dī),5類勤奮度最高(gāo))。具體建模步驟包括:第一(yī)步,根據“時間投入—專注度雙維核心模型”的(de)理(lǐ)論框架,以及在線平台可(kě)收集到的(de)學(xué)習行為(wèi)數據,設計學(xué)業勤奮習慣數字化表征的(de)指标體系。第二步,根據學(xué)習行為(wèi)指标體系确定輸入層神經元的(de)個數,模型的(de)輸出為(wèi)學(xué)業勤奮習慣評價的(de)等級,确定模型的(de)拓撲結構。第三步,歸一(yī)化處理(lǐ)各指标數據。第四步,采用神經網絡對樣本進行訓練,建立學(xué)業勤奮習慣的(de)測量模型。第五步,應用學(xué)業勤奮習慣測量模型對學(xué)習者進行診斷,并輸出診斷結果,對模型性能進行分析。




三、智能學(xué)習系統中作業習慣模型實驗



本研究的(de)實驗平台為(wèi)“Cloudbag教育雲平台”,實驗數據來源為(wèi)L中學(xué)654名學(xué)習者使用智能學(xué)習系統進行常态化學(xué)習的(de)作業行為(wèi)數據。首先進行數據清洗,過濾掉因轉學(xué)等各種原因未參與的(de)學(xué)習者數據,以及由于誤操作的(de)多次提交行為(wèi)、多次做(zuò)作業的(de)行為(wèi)(一(yī)個作業在不同的(de)時間做(zuò)了多次)等數據,得到有效記錄。其次,處理(lǐ)缺失值和(hé)歸一(yī)化數據,應用極差變換對數據進行預處理(lǐ),将數據進行歸一(yī)化,縮放到從0到1的(de)閉區間。

(一(yī))維度1:學(xué)業拖延習慣子(zǐ)模型實驗

根據智能學(xué)習系統中收集的(de)學(xué)業拖延習慣數據特征選擇算法。由于數據是連續型數值數據,因此選用覆蓋型數值劃分聚類算法。K-Means聚類是比較成熟的(de)覆蓋型數值劃分聚類算法之一(yī),本實驗應用K-Means聚類來實現學(xué)業拖延度Pr的(de)分類。

1. 數據分析

本實驗聚類分析的(de)因變量是學(xué)業拖延習慣診斷結果,自(zì)變量是做(zuò)作業時的(de)拖延次數Nd、提交作業的(de)拖延次數Ns。當K為(wèi)4時,聚類效果具有最好的(de)解釋力,因此聚類數量選擇為(wèi)4。實驗結果如(rú)圖1所示,四種拖延類别具有明顯的(de)分區,類别1在Nd和(hé)Ns上的(de)數值均較小;類别2在Nd和(hé)Ns上的(de)數值均較大;類别3在Nd上的(de)數值較小,在Ns上的(de)數值較大;類别4在Ns上的(de)數值較小,在Nd上的(de)數值較大。在所有統計量中,類别1有398個,占60.9%,Nd的(de)中心點是0.49,Ns的(de)中心點是0.69;類别2有45個,占6.9%,Nd的(de)中心點是10.48,Ns的(de)中心點是9.57;類别3有124個,占19.0%,Nd的(de)中心點是2.69,Ns的(de)中心點是8.41;類别4有87個,占13.3%,Nd的(de)中心點是7.8,Ns的(de)中心點是2.39。方差分析結果顯示,Nd、Ns兩個變量能很好地(dì)區分各類(Sig.=0.000),各類别間的(de)差異較大。類别1占了整體的(de)60.9%,說明大部分學(xué)習者在作業方面沒有拖延習慣,這與中國當前的(de)中學(xué)教育現狀有關,在現有的(de)中學(xué)教育中,因為(wèi)高(gāo)考的(de)指向性,教學(xué)模式以教師為(wèi)主導,對于教師安排的(de)作業,大部分學(xué)習者都能在提交時間前完成,随着時間的(de)臨近,數據量逐步增加,導緻類别1數值偏大。

未标題-2.jpg

圖1 四種拖延類别在Nd和(hé)Ns上的(de)聚類圖

聚類質量的(de)評價采用輪廓測量和(hé)Silhouette指數。本研究的(de)Silhouette指數達到0.8,聚類輪廓測量也達到了“好”的(de)水平,說明本研究應用K-Means聚類分析對學(xué)業拖延習慣的(de)分類具有較好的(de)聚類質量。

2. 具有不同程度學(xué)業拖延習慣的(de)學(xué)習者特征

從不同類型的(de)學(xué)習者中選擇特定的(de)受訪者,進行訪談,并結合這類受訪者在行為(wèi)數據中體現出來的(de)行為(wèi)模式特點,分析學(xué)習者的(de)特征。通過對四類不同學(xué)習者進行訪談和(hé)觀察,發現四類學(xué)習者在學(xué)習上具有不同的(de)特征。“無拖延習慣者”即類别為(wèi)1的(de)學(xué)習者,統計數據上表現為(wèi):Nd和(hé)Ns均較小。在學(xué)習行為(wèi)上表現為(wèi):基本沒有做(zuò)題拖延行為(wèi)和(hé)提交拖延行為(wèi),能夠提前或按時完成作業,做(zuò)作業時注意力較為(wèi)集中,被視(shì)為(wèi)無拖延學(xué)習習慣。“嚴重拖延習慣者”即類别為(wèi)2的(de)學(xué)習者,統計數據上表現為(wèi):Nd和(hé)Ns均較大。在學(xué)習行為(wèi)上表現為(wèi):經常出現做(zuò)題拖延行為(wèi)和(hé)提交拖延行為(wèi),通常表現為(wèi)學(xué)習時間安排不合理(lǐ),經常忘記做(zuò)作業,喜歡把作業拖後完成或者不完成,而且做(zuò)作業時注意力不集中,經常被其他事情打擾,導緻做(zuò)作業的(de)時間很長(cháng),效率較低(dī)。“提交作業拖延者”即類别為(wèi)3的(de)學(xué)習者,統計數據上表現為(wèi):Nd較小,Ns較大。在學(xué)習行為(wèi)上表現為(wèi):經常出現提交拖延行為(wèi),但很少出現做(zuò)題拖延行為(wèi),這類學(xué)習者通常表現為(wèi)經常忘記做(zuò)作業,喜歡把作業拖後完成或者不完成,學(xué)習時間安排不合理(lǐ),但做(zuò)作業時能夠集中注意力,效率較高(gāo)。“做(zuò)作業拖延者”即類别為(wèi)4的(de)學(xué)習者,統計數據上表現為(wèi):Ns較小,Nd較大;在學(xué)習行為(wèi)上表現為(wèi):經常出現做(zuò)題拖延行為(wèi),但很少出現提交拖延行為(wèi),這類學(xué)習者通常表現為(wèi)能夠按時完成作業,看似在努力學(xué)習,但學(xué)習效率不高(gāo),在做(zuò)作業時,經常注意力分散、溜号,甚至迷航。以上四類學(xué)習者,“無拖延習慣者”是具有良好學(xué)習習慣的(de)學(xué)習者,“嚴重拖延習慣者”“提交作業拖延者”“做(zuò)作業拖延者”三類學(xué)習者都是具有不良學(xué)習習慣的(de)學(xué)習者,需要根據其習慣形成的(de)動力因素設計教學(xué)幹預,改善其不良的(de)作業習慣[20]

3. 模型診斷結果與人工診斷結果的(de)對比

将模型診斷結果與人工診斷結果進行對比,可(kě)以幫助完善模型,為(wèi)後續研究做(zuò)準備。随機抽取20位學(xué)習者,由兩位該班授課教師研究者背對背對20位學(xué)習者的(de)拖延類型進行診斷,對于不一(yī)緻的(de)結果,與第三位教師商讨後确定最終值,兩位教師評價的(de)Cohen's Kappa一(yī)緻性檢驗結果為(wèi)0.821,具有一(yī)緻性。模型的(de)診斷結果與教師診斷結果在類型1、類型2和(hé)類型3上具有較好的(de)一(yī)緻性,而類型4的(de)判斷上有一(yī)些不一(yī)緻,模型診斷出類型4的(de)數量要少,說明模型的(de)判斷标準比教師的(de)判斷标準寬松,原因在于,在判定“規定的(de)做(zuò)作業的(de)時長(cháng)”的(de)時候,教師是按照班級大多數同學(xué)能夠做(zuò)完的(de)時長(cháng),但當對學(xué)習者個人進行評價時,教師通常會從自(zì)己的(de)經驗和(hé)預期出發,根據學(xué)習者個人的(de)知識能力來進行判斷。如(rú)在某次作業中,教師認為(wèi)大多數學(xué)習者45分鍾能夠完成,對于甲同學(xué)(學(xué)習基礎比較差),如(rú)果甲45分鍾寫完,教師認為(wèi)其沒有拖延,但對于乙同學(xué)(學(xué)習基礎比較好),如(rú)果也是45分鍾寫完,教師認為(wèi)其有拖延,原因是教師對他的(de)預期應該是35分鍾之內(nèi)。因此,模型的(de)後續完善可(kě)以考慮增加學(xué)習者的(de)知識能力因素。 

(二)維度2:學(xué)業勤奮習慣子(zǐ)模型實驗

1. 提煉學(xué)習行為(wèi)測量指标

通過對Cloudbag雲平台可(kě)收集到的(de)作業學(xué)習行為(wèi)進行分析,同時參考已有文獻的(de)量化指标,提煉出基于Cloudbag教育雲平台的(de)學(xué)業勤奮習慣的(de)具體測量指标,共得到兩個維度下的(de)8項行為(wèi)指标,15項量化指标,本研究的(de)假設框架見表1。這15項量化指标與輸出均有關系,但沒有直接的(de)線性關系。基于此框架進行數據收集和(hé)分析,并修訂形成最終的(de)學(xué)業勤奮習慣子(zǐ)模型。

表1 學(xué)業勤奮習慣子(zǐ)模型的(de)假設框架

未标題-3.jpg

2. 構建專家樣本

建模的(de)目的(de)是将教師經驗中的(de)學(xué)習習慣與學(xué)習者的(de)學(xué)習行為(wèi)建立聯系。本實驗的(de)因變量是學(xué)業勤奮習慣,其數據來自(zì)于各種作業行為(wèi);自(zì)變量是專家樣本,來自(zì)于教師研究者的(de)人工标注。人工标注勤奮度數值分為(wèi)1~5類(1類勤奮度最低(dī),5類勤奮度最高(gāo));編碼的(de)一(yī)緻性檢驗結果Cohen’s Kappa系數為(wèi)0.712,對于不一(yī)緻的(de)編碼,加入第三個研究者,共同協商決定編碼的(de)類别。

3. 模型實驗

随機選取60%作為(wèi)訓練集、20%作為(wèi)校驗集、20%作為(wèi)測試集。模型選擇BP神經網絡的(de)多層感知器MLP模型,使用訓練集對模型進行訓練,網絡結構為(wèi):輸入層為(wèi)15個神經元(歸一(yī)化後的(de)15維的(de)特征向量),輸出層5個神經元作為(wèi)分類結果(1類勤奮度最低(dī),5類勤奮度最高(gāo)),隐藏層為(wèi)5層。如(rú)圖2,多層感知器MLP模型對于學(xué)業勤奮分類的(de)精度,在類别1和(hé)5上均超過了98%,達到了較高(gāo)的(de)值,說明模型在1和(hé)5類型上具有較高(gāo)的(de)識别能力,即對于“特别勤奮”和(hé)“特别懶惰”的(de)兩類極端學(xué)習者具有較好的(de)診斷能力,這符合後續研究的(de)需要,即對勤奮度不高(gāo)學(xué)習者幹預的(de)前提是對其精确的(de)診斷,尤其是診斷為(wèi)“懶惰”的(de)學(xué)習者是重點幹預對象。模型在類别2和(hé)4上的(de)精度在85%左右,雖沒有達到特别高(gāo)的(de)值,但符合實際情況,對于介于“特别勤奮”和(hé)“一(yī)般勤奮”,“特别懶惰”和(hé)“有點懶惰”之間的(de)學(xué)習者,實踐證明,人工标準也會出現±1級别的(de)誤差(在人工标注時,需加入第三個研究者對于不一(yī)緻的(de)編碼進行協商的(de)情況,也是大多出現在對第2類和(hé)第4類的(de)辨别上)。

4. 基于不同算法的(de)模型比較分析

對于不同的(de)分類問題,高(gāo)精度的(de)算法具有更好的(de)識别能力。下面,将本實驗應用的(de)算法與機器學(xué)習的(de)主流分類算法進行比較。收益圖提供了一(yī)種評估和(hé)比較多個預測模型并選擇最合适的(de)預測模型的(de)方法。如(rú)圖2所示,多層感知器MLP取得了最好的(de)預測效果,支持向量機SVM和(hé)TAN貝葉斯網絡也取得較好的(de)預測效果,決策樹DecisionTree次之,徑向基函數RBF最差,可(kě)見多層感知器MLP算法的(de)評估指标是五種模型中最高(gāo)的(de),對勤奮度分類結果是最優的(de)。因此,本文提出的(de)基于多層感知器MLP的(de)學(xué)業勤奮模型,通過輸入的(de)15維特征向量能夠較為(wèi)準确地(dì)診斷出學(xué)習者的(de)勤奮度級别。

未标題-1.jpg

圖 2 多層感知器MLP模型的(de)混淆矩陣與多個預測模型的(de)收益圖

對于診斷出學(xué)習者的(de)勤奮度級别的(de)教育意義說明:勤奮度級别(1、2、3、4、5)分别代表特别不同級别的(de)勤奮習慣(懶惰、有點懶惰、一(yī)般、勤奮、特别勤奮)。本研究認為(wèi)被診斷為(wèi)4級和(hé)5級的(de)學(xué)習者是具有良好作業習慣的(de),而被診斷為(wèi)1級和(hé)2級的(de)學(xué)習者是具有不良作業習慣的(de),分别被定義為(wèi)“勤奮嚴重不足者”和(hé)“勤奮不足者”類别,對于不良作業習慣的(de)學(xué)習者要采取相應的(de)教育幹預,幫助其改善作業習慣。




四、結 語



本研究提出了學(xué)業拖延習慣和(hé)學(xué)業勤奮習慣的(de)二維作業習慣模型,分别表征作業時間、作業努力兩個方面作業行為(wèi)的(de)頻繁程度對學(xué)習的(de)影響。以往學(xué)業拖延的(de)測量,通常都是單一(yī)維度的(de)對作業提交的(de)截止時間的(de)判斷,缺乏對做(zuò)作業拖延的(de)描述。本研究構建了包括“做(zuò)的(de)時間”和(hé)“完成的(de)時間”兩個維度的(de)學(xué)業拖延習慣子(zǐ)模型,使學(xué)業拖延習慣的(de)研究更加深入。學(xué)業勤奮習慣對于學(xué)習者的(de)學(xué)業成就具有很好預測作用,但學(xué)業勤奮與其他可(kě)以用學(xué)習行為(wèi)來測量的(de)概念(如(rú)學(xué)習行為(wèi)投入)相比,研究成果卻相當有限,學(xué)業勤奮的(de)測量也僅是通過一(yī)些調查問卷法。本研究提出學(xué)業勤奮習慣子(zǐ)模型包括時間投入和(hé)專注度兩個維度,并根據數據的(de)特點,選擇應用人工神經網絡實現對勤奮習慣的(de)表征,診斷出五個級别的(de)勤奮度,從而實現了通過學(xué)習行為(wèi)來測量學(xué)業勤奮習慣,改進了學(xué)業勤奮習慣的(de)測量方法。

  由于學(xué)習習慣具有多場景、多學(xué)段的(de)特征,未來需要将本研究提出的(de)作業習慣二維模型在不同應用場景、不同年(nián)齡段群體、不同類型的(de)數據結構表現形式上,作進一(yī)步的(de)驗證,使作業習慣測量模型進行多次叠代,不斷提高(gāo)模型的(de)效度。



本文發表于《電化教育研究》2021年(nián)第7期,轉載請與電化教育研究雜志社編輯部聯系(官方郵箱:dhjyyj@163.com)。

引用請注明參考文獻:殷寶媛, 武法提.智能學(xué)習系統中作業習慣建模研究[J].電化教育研究,2021,42(7):61-67.



責任編輯:甄   暾

校      對:樊曉紅(hóng)

審      核:郭   炯

參考文獻

[1] GILL B P, SCHLOSSMAN S L. Villain or Savior? The American discourse on homework, 1850-2003[J]. Theory into practice, 2004, 43(3):174-181.

[2] 凱洛夫.教育學(xué)(上)[M].北京:人民教育出版社,1951:151.

[3] SINGH R, SALEEM M, PRADHAN P, et al. Feedback during web-based homework: the role of hints[C]// International Conference on Artificial Intelligence in Education. Auckland:Springer-Verlag, 2011:328-336.

[4] 殷寶媛,武法提.智能學(xué)習系統中學(xué)習習慣建模的(de)方法研究[J].電化教育研究,2020,41(4):55-61.

[5] FLUNGER B, TRAUTWEIN U, NAGENGAST B, et al. A person-centered approach to homework behavior:students' characteristics predict their homework learning type[J]. Contemporary educational psychology, 2017, 48(7):1-15.

[6] DETTMERS S, TRAUTWEIN U, , et al. Students' emotions during homework in mathematics:testing a theoretical model of antecedents and achievement outcomes[J]. Contemporary educational psychology, 2011, 36(1):25-35.

[7] TRAUTWEIN U. The homework–achievement relation reconsidered:differentiating homework time, homework frequency, and homework effort[J]. Learning & instruction, 2007,17(3):372-388.

[8] DETTMERS S, TRAUTWEIN U,, OLIVER, et al. Homework works if homework quality is high:using multilevel modeling to predict the development of achievement in mathematics [J]. Journal of educational psychology, 2010,102(2):467-482.

[9] RABIN L A, FOGEL J, NUTTER-UPHAM K E. Academic procrastination in college students:the role of self-reported executive function[J]. Journal of clinical & experimental neuropsychology, 2011, 33(3):344-357.

[10] STAINTON M, LAY C H, FLETT G L. Trait procrastinators and behavior/trait-specific cognitions[J]. Journal of social behavior & personality, 2000, 15(5):297-312.

[11] TUCKMAN B W. The Development and concurrent validity of the procrastination scale[J]. Educational & psychological measurement, 1991, 51(2):473-480.

[12] SOLOMON L J, ROTHBLUM E D. Academic procrastination:frequency and cognitive-behavioral correlates[J].Journal of counseling psychology,1984,31(4):503-509.

[13] MILGRAM N A, BATORI G, MOWRER D. Correlates of academic procrastination[J]. Journal of school psychology, 1993, 31(4):487-500.

[14] LEVY Y, RAMIM M M. A Study of online exams procrastination using data analytics techniques[J]. Interdisciplinary journal of e-Learning and learning objects, 2012, 8(1):97-113.

[15] 雷浩,劉衍玲,魏錦,田瀾,王鑫強.基于時間投入——專注度雙維核心模型的(de)高(gāo)中生學(xué)業勤奮度研究[J].心理(lǐ)發展與教育,2012,28(4):384-391.

[16] BERNARD H, SCHUTTENBERG E M. Development of the diligence inventory-higher education form[J]. Journal of research & development in education, 1995(28):91-100.

[17] GALLA B M, PLUMMER B D, WHITE R E, et al. The Academic Diligence Task (ADT):assessing individual differences in effort on tedious but important schoolwork[J]. Contemporary educational psychology, 2014, 39(4):314-325.

[18] LOVAT T, CLEMENT N, DALLY K, et al. The impact of values education on school ambience and academic diligence[J]. International journal of educational research, 2011, 50(3):166-170.

[19] JASINEVICIUS T R, BERNARD H, SCHUTTENBERG E M. Application of the diligence inventory in dental education[J]. Journal of dental education, 1998, 62(4):294-301.

[20] 殷寶媛,武法提.學(xué)習習慣在線幹預的(de)原理(lǐ)與模型設計[J].電化教育研究,2019,40(12):72-79.


Study on Modeling of Homework Habits in Intelligent Learning System


YIN Baoyuan1, WU Fati2

(1.School of Educational Science, Harbin Normal University, Harbin Heilongjiang 150080;

2.Engineering Research Center of Digital Learning and Education Public Service Ministry of Education, Beijing 100875)


[Abstract] Homework habits are closely related to learners' academic achievement and the modeling of homework habits is an urgent problem in the design of intelligent learning system. Based on a multi-level homework model, this study adopts a hybrid research approach to identify "academic procrastination" and "academic diligence" as two important and measurable dimensions of homework habits, which represent the two core types of homework behaviors: homework time and homework effort. A sub-model of academic procrastination habits is constructed, including procrastination in doing and submitting. Clustering is applied to diagnose the habit of academic procrastination, and four types of learners are defined as "non-procrastinators", "severe procrastinators", "procrastinators in submitting" and " procrastinators in doing". Based on the theoretical framework of time investment and focus model, a sub-model of academic diligence habits including time investment and focus is constructed. The artificial neural network is used to diagnose the academic diligence habits, as a result, five levels of diligence are diagnosed, and the validity of the model is verified.

[Keywords] Studying Habit; Homework Habit; Academic Procrastination; Academic Diligence; Intelligent Learning System; Modeling

基金項目:教育部人文社會科學(xué)研究青年(nián)基金項目“互聯網+教育背景下學(xué)生學(xué)習習慣的(de)測評模型研究”(項目編号:18YJC880109)

[作者簡介] 殷寶媛(1980—),女,黑龍江哈爾濱人。副教授,博士,主要從事智能教育、學(xué)習分析、數字化學(xué)習資源與學(xué)習環境設計研究。E-mail:ybyuan2000@163.com。武法提為(wèi)通訊作者,E-mail:wft@bnu.edu.cn。



中文核心期刊
CSSCI來源期刊 
RCCSE中國權威學(xué)術期刊
AMI核心期刊

複印報刊資料重要轉載來源期刊


《電化教育研究》創刊于1980年(nián),是我國教育與電教界的(de)學(xué)術理(lǐ)論園地(dì)和(hé)權威性刊物,素有“中國電化教育理(lǐ)論研究基地(dì)”之稱譽。主要研究現代教育前沿問題,服務全國教育教學(xué)改革;關注國內(nèi)外信息化教育理(lǐ)論的(de)創新。

《電化教育研究》開設的(de)欄目主要包括理(lǐ)論探讨、網絡教育、學(xué)習環境與資源、課程與教學(xué)、學(xué)科建設與教師發展、中小學(xué)電教、曆史與國際比較等。