近年(nián)來,随着大數據成為(wèi)互聯網信息技術行業的(de)流行詞彙,教育逐漸被認為(wèi)是大數據可(kě)以大有作為(wèi)的(de)一(yī)個重要應用領域,有人大膽地(dì)預測大數據将給教育帶來革命性的(de)變化。大數據技術允許中小學(xué)和(hé)大學(xué)分析從學(xué)生的(de)學(xué)習行為(wèi)、考試分數到職業規劃等所有重要的(de)信息。許多這樣的(de)數據已經被諸如(rú)美國國家教育統計中心之類的(de)政府機構儲存起來用于統計和(hé)分析。盤點近年(nián)來大數據應用于教育行業的(de)十大案例。
國內(nèi):
一(yī)、華中科技大學(xué)近兩年(nián)個性化大數據的(de)實踐,通過數據理(lǐ)出學(xué)生在校期間生活和(hé)學(xué)習的(de)主線,并放在一(yī)個故事化的(de)場景裏來叙述,引起了衆多畢業生的(de)共鳴。
6月8日,一(yī)封名叫《光陰的(de)故事一(yī)緻某某》的(de)電子(zǐ)信件和(hé)截圖在華中科技大學(xué)畢業生的(de)微信朋(péng)友圈廣為(wèi)流傳。每一(yī)位即将離(lí)校的(de)學(xué)子(zǐ)隻要打開鏈接,輸入自(zì)己的(de)校園賬号就能獲取在校期間的(de)學(xué)習,讀書,餐飲等各方面數據和(hé)收獲。
該校網絡與信息化辦公室副主任王士賢介紹,《畢業生大數據--光陰的(de)故事》由華中科技大學(xué)網絡與信息 化中心在2015年(nián)第一(yī)次推出,今年(nián)在教務類數據的(de)基礎上還增加了畢業生的(de)借書、進出圖書館,黨員組織 發展,校園卡刷卡,計算機等考等相關數據。
二、由廈大圖書館設計的(de)一(yī)個名為(wèi)“圕(tuan)·時光”的(de)網站, 收集整理(lǐ)了畢業生大學(xué)時代的(de)閱讀記錄、進館次數等, 被畢業生視(shì)為(wèi)大學(xué)生涯的(de)圖書館記憶。今年(nián),這個網站還特别增加了畢業生在食堂的(de)消費記錄,如(rú)打了多少份免費米飯。也就是說,這是一(yī)份物質食糧和(hé)精神食糧的(de)雙重記憶。
由于今年(nián)的(de)“圕·時光”,新增了學(xué)生們在食堂的(de)消費記錄,畢業生登錄後,不僅能看到自(zì)己最愛去(qù)的(de)餐 廳、超市、消費的(de)金額,還能看到自(zì)己在大學(xué)期間,打了多少份米飯。廈大圖書館表示,這是根據學(xué)生一(yī)卡通的(de)大數據統計出來的(de),隻提供給學(xué)生本人。
三、每個月在食堂吃飯超過60頓、一(yī)個月總消費不足420元的(de),被列為(wèi)受資助對象。
據報道(dào),南京理(lǐ)工大學(xué)教育基金會通過數據分析,每個月在食堂吃飯超過60頓、一(yī)個月總消費不足420元 的(de),被列為(wèi)受資助對象。南京理(lǐ)工大學(xué)還采取直接将補貼款打入學(xué)生飯卡的(de)方式,學(xué)生無需填表申請,不用審核。
四、電子(zǐ)科大曾做(zuò)過一(yī)個課題——尋找校園中最孤獨的(de)人。 他們從3萬名在校生中,采集到了2億多條行為(wèi)數據,
數據來自(zì)學(xué)生選課記錄、進出圖書館、寝室,以及食堂用餐、超市購物等數據。通過對不同的(de)校園一(yī)卡通 前一(yī)後刷卡”的(de)記錄進行分析,可(kě)以發現一(yī)個學(xué)生在學(xué)校有多少親密朋(péng)友,比如(rú)戀人、閨蜜。
最後,通過這個課題找到了800多個校園中最孤獨的(de)人,他們平均在校兩年(nián)半時間,一(yī)個知心朋(péng)友都沒有。 這些人中的(de)17%可(kě)能産生心理(lǐ)疾病,剩下的(de)則可(kě)能用意志力暫時戰勝了症狀,但需要學(xué)校和(hé)家長(cháng)重點予以關愛。
國外:
五、紐約州波基普西市瑪麗斯特學(xué)院(Marist College)與商業數據分析公司Pentaho合作發起開源學(xué)術分析計劃 (The Open Academic Analytics Initiative),旨在一(yī) 門新課程開始的(de)兩周內(nèi)預測哪些學(xué)生可(kě)能會無法順利完成課程。
該計劃基于Pentaho的(de)開源商業分析平台(Business Analytics Platform)開發了一(yī)個分析模型,通過收集分析學(xué)生的(de)學(xué)習習慣——例如(rú)點擊線上閱讀材料、是否在網上論壇中發言、完成作業的(de)時長(cháng)——來預測學(xué)生的(de)學(xué)業情況、及時幹預幫助問題學(xué)生,從而提升畢業率。
六、KickUp是一(yī)個專注教師測評的(de)标準化SaaS工具,測評數據來自(zì)教師的(de)自(zì)查報告及學(xué)年(nián)內(nèi)的(de)各項教學(xué)結果的(de)反饋,這些數據可(kě)以縱向記錄教師的(de)成長(cháng)曆程,提出有待改善的(de)地(dì)方。KickUp根據學(xué)生和(hé)老師的(de)數量、 按地(dì)區進行收費,目前全美有超過50個地(dì)區的(de)學(xué)校在使用這款測評工具。
七、以美國的(de)著名高(gāo)校卡內(nèi)基梅隆大學(xué)和(hé)普渡大學(xué)為(wèi)例: 對這兩所高(gāo)校,領英都收集了60000多名畢業生的(de)職業生涯數據。數據量之龐大,足以在其中看出清晰的(de)規律。輸入“MIT”,你很快就會看到這所高(gāo)校的(de)畢業生一(yī)般會在谷歌、IBM和(hé)甲骨文公司找到工作。輸入“普渡”,你會發現禮菜、康明斯和(hé)波音是畢業生的(de)首選。
這類信息對于中學(xué)的(de)高(gāo)年(nián)級生和(hé)低(dī)年(nián)級學(xué)生都是一(yī)座金礦,因為(wèi)大多數中學(xué)生對将來的(de)職業都隻有模糊的(de)想法。運用領英的(de)這個工具,對太陽能、編劇、或者醫療器械感興趣的(de)學(xué)生,就可(kě)以挑選那些畢業生最容易進入相關領域的(de)大學(xué)拫考了
八、據PBS報道(dào),伊薩卡學(xué)院(Ithaca College)自(zì)2007年(nián)開始收集學(xué)生的(de)社交網絡數據。該學(xué)院為(wèi)申請者設立了一(yī)個類似Facebook的(de)網站IC PEERS,讓申請者得 以通過網站聯系學(xué)院教師和(hé)彼此。
伊薩卡使用舊(jiù)M統計分析系統來收集IC PEERS上産生的(de)數據,研究擁有怎樣的(de)網絡行為(wèi)的(de)學(xué)生更有可(kě)能選擇就讀伊薩卡。收集的(de)數據包括申請者上傳了多少張賬戶照片、擁有多少名IC PEERS好友。研究人員認為(wèi), 這能反映出申請者對這所學(xué)院有多感興趣。
九、“希維塔斯學(xué)習”是一(yī)家專門聚焦于運用預測性分析、 機器學(xué)習從而提高(gāo)學(xué)生成績的(de)年(nián)輕公司。Civitas Learning提供了一(yī)套應用程序,學(xué)生和(hé)老師可(kě)以在其中規劃自(zì)己的(de)課程和(hé)安排。“希維塔斯學(xué)習’’各種基于雲的(de)智能手機第三方應用程序(APP)都是用戶友好型的(de),能夠根據高(gāo)校的(de)需要個性化。這意味着高(gāo)校能聚焦于各自(zì)不同的(de)對象,相互不同地(dì)用這家公司的(de)分析工具開展大數據工作。
該公司在高(gāo)等教育領域建立起最大的(de)跨校學(xué)習數據庫。 通過這些海量數據,能夠看到學(xué)生的(de)分數、出勤率、 辍學(xué)率和(hé)保留率的(de)主要趨勢。通過使用100多萬名學(xué)生的(de)相關記錄和(hé)700萬個課程記錄,這家公司的(de)軟件能夠讓用戶探測性地(dì)知道(dào)導緻辍學(xué)和(hé)學(xué)習成績表現不良的(de)警告性信号。此外,還允許用戶發現那些導緻無謂消耗的(de)特定課程,并且看出哪些資源和(hé)幹預是最成功的(de)。
十、一(yī)家名為(wèi)Knewton的(de)大數據公司開發了一(yī)個數字平台, 該平台分析了幾百萬學(xué)生(從幼兒園到大學(xué))的(de)學(xué)習過 程,并基于這一(yī)分析來設計更加合理(lǐ)的(de)測試題目和(hé)更加個性化課程目标。該公司與Houghton Mifflin Harcourt建立了合作關系,開發出了 K-12階段的(de)個性化數學(xué)課程,同時還與法國創業公司Gutenberg Technology—道(dào),開發了智能數字教科書。
簡單來說,這些課程和(hé)教科書能夠适應每個學(xué)生的(de)差異。學(xué)生可(kě)以按照自(zì)己的(de)節奏來控制學(xué)習進度,而不會受到周圍其他學(xué)生的(de)行為(wèi)的(de)影響。然後,系統會給教師一(yī)個反饋,告知哪個學(xué)生在哪個方面有困難,同時給出全班學(xué)生的(de)表現的(de)整體分析數據。
在教育學(xué)習領域,大數據中提取價值的(de)5種主要的(de)技術如(rú)下:
1.預測(Prediction)——覺知預料中的(de)事實的(de)可(kě)能性。例如(rú),要具備知道(dào)一(yī)個學(xué)生在什麽情況下盡管事實上有能力但卻有意回答錯誤的(de)能力。
2.聚類(Clustering)——發現自(zì)然集中起來的(de)數據點。這對于把有相同學(xué)習興趣的(de)學(xué)生分在一(yī)組很有用。
3.相關性挖掘(Relationship Mining)——發現各種變量之間的(de)關系,并對其進行解碼以便今後使用它們。這對探知學(xué)生在尋求幫助後是否能夠正确回答問題的(de)可(kě)靠性很有幫助。
4.升華人的(de)判斷(Distillation for human judgment)——建立可(kě)視(shì)的(de)機器學(xué)習的(de)模式。
5.用模式進行發現(Discovery with models)——使用通過大數據分析開發出的(de)模式進行“元學(xué)習”(meta-study)。一(yī)家名為(wèi)Knewton的(de)大數據公司開發了一(yī)個數字平台, 該平台分析了幾百萬學(xué)生(從幼兒園到大學(xué))的(de)學(xué)習過 程,并基于這一(yī)分析來設計更加合理(lǐ)的(de)測試題目和(hé)更加個性化課程目标。該公司與Houghton Mifflin Harcourt建立了合作關系,開發出了 K-12階段的(de)個性化數學(xué)課程,同時還與法國創業公司Gutenberg Technology—道(dào),開發了智能數字教科書。