時間:2023-02-28 16:00:55
導(dǎo)言:作為寫作愛好者,不可錯過為您精心挑選的10篇教育測量評價(jià)論文,它們將為您的寫作提供全新的視角,我們衷心期待您的閱讀,并希望這些內(nèi)容能為您提供靈感和參考。
一
高中語文人教版“表達(dá)與交流”模塊對高中寫作教學(xué)無疑具有指揮棒的作用。由五本課本中“表達(dá)與交流”內(nèi)容編排的分析,我們可以看出教材注重什么淡化什么。具體為必修一:心音共鳴――寫觸動心靈的人和事,親近自然――寫景要抓住特征,人性光輝――寫人要凸顯個性,黃河九曲――寫事要有點(diǎn)波瀾。必修二:直面挫折學(xué)習(xí)描寫,美的發(fā)現(xiàn)學(xué)習(xí)抒情,想象世界學(xué)習(xí)虛構(gòu)。必修三:多思善想――學(xué)習(xí)選取理論的角度,學(xué)會寬容――學(xué)習(xí)選擇和使用論據(jù),善待生命――學(xué)習(xí)論證,愛的奉獻(xiàn)――學(xué)習(xí)議論中的記敘。必修四:解讀時間――學(xué)習(xí)橫向展開議論,發(fā)現(xiàn)幸福――學(xué)習(xí)縱向展開議論,確立自信――學(xué)習(xí)反駁,善于思辨――學(xué)習(xí)辯證分析。必修五:緣事析理,學(xué)習(xí)寫得深刻;謳歌親情,學(xué)習(xí)寫得充實(shí);錘煉思想,學(xué)習(xí)寫得有文采;注重創(chuàng)新,學(xué)習(xí)寫得新穎。
不管從標(biāo)題上,還是從篇目內(nèi)容及課后練習(xí)上,認(rèn)真分析比較,我們都可以歸納出“表達(dá)與交流”的三大內(nèi)容:一談如何寫好記敘,描寫,抒情,議論,二談“虛構(gòu)”與真實(shí),側(cè)重虛構(gòu),三談好文章的四項(xiàng)指標(biāo)――深刻、充實(shí)、文采、新穎。沒有涉及它們與文體的相關(guān),更沒有涉及文體的理論知識與實(shí)際操作指導(dǎo)。必修教材的“表達(dá)與交流”忠實(shí)地執(zhí)行了我國《語文課程標(biāo)準(zhǔn)》的要求。我國《語文課程標(biāo)準(zhǔn)》并不特別強(qiáng)調(diào)文體,小學(xué)以敘述文為主;初中有明確的文體要求:“寫記敘文,做到內(nèi)容具體;寫簡單的說明文,做到明白清楚;寫簡單的議論文,努力做到有理有據(jù);根據(jù)生活需要,寫日常應(yīng)用文?!逼胀ǜ咧兄灰缶C合運(yùn)用記敘、說明、描寫、議論和抒情等表達(dá)方式,并沒有明確的文體規(guī)定。這反映出《語文課程標(biāo)準(zhǔn)》淡化文體意識的價(jià)值取向。
美國高中作文教學(xué)卻與我們不同,文體教學(xué)在美國高中作文教學(xué)中有著重要地位,在作文教學(xué)的幾大模塊中占有相當(dāng)大的比重。
如在作文教學(xué)綱要和指導(dǎo)觀念里,實(shí)用文體的寫作訓(xùn)練和寫作基本能力訓(xùn)練與表達(dá)方式的訓(xùn)練共同組成美國的寫作教學(xué)的三大內(nèi)容。這三大訓(xùn)練有多種訓(xùn)練體系,有單向的也有綜合的。“文體”意識和實(shí)際指導(dǎo)在這些體系中隨處可見,如“思維―表達(dá)訓(xùn)練體系”主要進(jìn)行思維和文體寫作的訓(xùn)練,其他還有一般文體寫作訓(xùn)練體系、實(shí)用文體寫作訓(xùn)練體系。如美國加利福尼亞州的《公立學(xué)校英語課程標(biāo)準(zhǔn)》明確要求學(xué)生寫敘述文、文學(xué)評論、研究報(bào)告、勸說文、技術(shù)性文章及常用應(yīng)用文,對每一文體都有明確規(guī)定。
在實(shí)際教學(xué)操作中,文體教學(xué)得到了同樣的重視。
如三冊《美國語文》(2004年同心出版社出版的《美國語文―――美國著名中學(xué)課文精選》,以下簡稱《美國語文》)是中國大陸第一套系統(tǒng)引進(jìn)的西方著名中學(xué)語文教材。文體類型(除編譯時由于篇幅關(guān)系刪去的戲劇、詩歌外)統(tǒng)計(jì)如下:
文體類型具體類型舉例:
(1)小說:短篇小說、科幻小說、長篇小說;
(2)散文:分析散文、諷刺散文、說明散文、思考性散文;
(3)其他類:日志、神話、傳說、故事、敘述文、布道、自傳、勸說文、演講、格言、書信、通告、游記、回憶錄等。
課后寫作練習(xí)文體訓(xùn)練類型舉例:
(1)想象、娛樂、感受類:神話、短篇小說、科幻小說、電影情景、人物傳記、日記、續(xù)寫、改寫、廣告、網(wǎng)頁制作、格言等;
(2)通告、闡釋、描述類:通信、通告、新聞報(bào)道、報(bào)告、描述性信件、摘要、訃告、課程描述、競賽公告等;
(3)勸說、建議、說明類:說服性的短文、給校長的建議、建議專欄、收藏者指南、提議、有說服力的信條等;
(4)分析、評論類:文學(xué)分析、社論、批判性回應(yīng)、說服力評價(jià)、比較研究等。
與淡化文體教學(xué)對應(yīng)的是中國作文評價(jià)標(biāo)準(zhǔn)是面向文學(xué)性、詩意和哲理性很強(qiáng)的記敘文、議論文、說明文的通用標(biāo)準(zhǔn);與注重文體訓(xùn)練對應(yīng)的是美國評價(jià)標(biāo)準(zhǔn)鮮明地體現(xiàn)為分文體定標(biāo)準(zhǔn)。這種分文體制訂評價(jià)標(biāo)準(zhǔn)的做法是較為嚴(yán)謹(jǐn)?shù)?。它能充分反映評價(jià)學(xué)生駕馭不同文體的能力,較之抽象地評價(jià)內(nèi)容充實(shí)否、結(jié)構(gòu)完整否、符合要求的“通用”標(biāo)準(zhǔn)否,更能起到實(shí)際的評分指導(dǎo)與規(guī)范作用。
我認(rèn)為美國作文教學(xué)對文體教學(xué)的重視,是美國作文教學(xué)卓有成效的原因之一。在美國教學(xué)中最令全球教育界驚奇的事就是美國人普遍具有良好的寫作能力,只要受過普通教育的美國人,都能把自己要說的話寫在紙上且表達(dá)清楚,同時盡可能遣詞造句,使意義更準(zhǔn)確。而這種情況,反映的正是美國高中作文評價(jià)有相當(dāng)高的效度。
美國作文教學(xué)之所以卓有成效,注重文體教學(xué)和注重效標(biāo)效度的分文體制訂評價(jià)標(biāo)準(zhǔn)的作文評價(jià)功不可沒。這樣的結(jié)論不是主觀臆測,而是通過客觀分析得出的。了解美國文體教學(xué)與分文體制訂評價(jià)標(biāo)準(zhǔn)的作文評價(jià),并對評價(jià)效度進(jìn)行分析,我國作文評價(jià)的效度問題亟待解決。
二
怎么改進(jìn)甚至改革高中作文教學(xué)呢?作文成績與寫作能力是否成正比呢?
舉個比較絕對的例子,假如高中作文教學(xué)只有新詩教學(xué),作文練習(xí)與測評題只有新詩形式的測評題,有這么一個可能結(jié)果,老師抱怨作文難教,學(xué)生抱怨作文難學(xué)難寫、沒東西可寫、太多束縛不自由……還有一個可能結(jié)果是,作文測評成績不錯的高中畢業(yè)生在社會上不會寫讀書筆記,不會寫文學(xué)評論,不會寫報(bào)告,不會寫社論,不會寫計(jì)劃書,不會寫基本的商業(yè)策劃,不會寫比賽公告……作文測評成績不好的高中畢業(yè)生在社會上卻成了新興作家或者公司的文案高手……于是作文教學(xué)改革呼聲四起,興起了半命題寫詩、話題寫詩、材料寫詩、漫畫寫詩、不定題材寫詩、生活化寫詩、心靈化寫詩、學(xué)生詩作互評、多就少改詩、總評詩、面評詩、每日一詩……
當(dāng)然,上述是一個較為絕對的例子,可事實(shí)是,這個絕對例子與當(dāng)下高中作文教學(xué)內(nèi)容的關(guān)系只不過是五十步與百步的差別。高中作文教學(xué)中并未有更多樣的文體介紹和指導(dǎo),在大部分學(xué)生的腦海中,他們知道的文體就只有文學(xué)性質(zhì)的記敘文、散文、論點(diǎn)論據(jù)論證式議論文、詩歌和戲劇,就在這有限的三四個文體中選擇,較之于事實(shí)上豐富多樣的文體而言,“文體不限”能算是真正意義上的文體不限么?腦海中根本就沒有多少文體概念知識,何談文體不限的選擇呢?在記敘文、散文、論點(diǎn)論據(jù)論證式議論文、詩歌和戲劇范圍內(nèi)分文體定標(biāo)準(zhǔn)的作文評價(jià)是否是真正意義上的分文體定標(biāo)準(zhǔn)作文評價(jià)呢?如前文所示美國中學(xué)文體訓(xùn)練類型涵蓋了工作崗位上大部分的文體寫作,培養(yǎng)了美國人而不是美國學(xué)生普遍良好的寫作能力,而大部分接受過高中作文教學(xué)的中國高中畢業(yè)生,在進(jìn)行工作崗位上基本的文案寫作時一般都是初次接觸,能力匱乏。這不僅是高中語文作文教學(xué)中文體教學(xué)缺失造成的后果,還反映了對應(yīng)于淡化文體教學(xué)的淡化文體評價(jià)的作文評價(jià)的低效度。
任何測評都涉及效度。效度是指所測量到的結(jié)果反映所想要考察內(nèi)容的程度,測量結(jié)果與要考察的內(nèi)容越吻合,則效度越高;反之,則效度越低。在作文教學(xué)中或者在升學(xué)考試中指作文測評的分?jǐn)?shù)反映學(xué)生作文真實(shí)能力的程度。在判斷作文測評是否有效性時,在考慮到測評的內(nèi)容效度的同時還必須考慮到效標(biāo)效度。
內(nèi)容效度最容易理解,它關(guān)心的是測量的內(nèi)容。比如某一個學(xué)段進(jìn)行詩歌寫作教學(xué),內(nèi)容效度就會考察詩歌寫作測題是不是與這個學(xué)段教授的詩歌寫作知識、方法和技能有正相關(guān)。
效標(biāo)效度稍微復(fù)雜些,是指當(dāng)前一項(xiàng)測驗(yàn)結(jié)果與作為效標(biāo)的資料或數(shù)量之間的相關(guān)程度。效度的高與低,需要有一定的參照點(diǎn)加以考查,尤其是能力的測試。實(shí)際上能力都是無法測量的,因此我們只能確定一個或幾個能反映能力的標(biāo)準(zhǔn),然后做間接的比較。這種人為確定的效度標(biāo)準(zhǔn)簡稱“效標(biāo)”。效標(biāo)效度關(guān)心的是測量結(jié)果和另外一個效標(biāo)(criterion)的符合程度。比如,據(jù)說微軟公司招人的時候會考一些類似腦筋急轉(zhuǎn)彎的問題,像“紐約有多少個水井蓋”之類。考察者并不真的關(guān)心答題者是不是真的知道紐約有多少個水井蓋,他關(guān)心的是答題者以后的工作業(yè)績(相當(dāng)于效標(biāo))。那么考題到底能在多大程度上預(yù)測工作業(yè)績呢,或者說這些考題和工作業(yè)績的相關(guān)程度到底如何呢,這就是效標(biāo)效度。比如,在美國高中作文教學(xué)進(jìn)行的同時,進(jìn)行多種文體的訓(xùn)練與測評,這個測評,除了關(guān)心測評題與教學(xué)內(nèi)容的相關(guān)程度外,更關(guān)心學(xué)生實(shí)際生活和工作中的寫作能力及發(fā)展。測題到底能在多大程度上預(yù)測寫作能力呢?或者說這些測題與日后的寫作能力的相關(guān)程度到底如何呢?這就是效標(biāo)效度。
內(nèi)容效度和效標(biāo)效度的區(qū)別首先是調(diào)查者(investigator)的觀察的取向(orientation)不同。使用內(nèi)容效度的調(diào)查者,關(guān)心的是測量的得分。比如教師對學(xué)生進(jìn)行寫作測驗(yàn),那么學(xué)生在這張?jiān)嚲砩系牡梅终墙處熕P(guān)心的。使用效標(biāo)效度的調(diào)查者,他關(guān)心的是效標(biāo)的得分。比如上面舉的招聘的例子,公司并不真正在乎你在招聘試題上的得分,他在乎的是你以后的工作業(yè)績(相當(dāng)于效標(biāo)),上面舉的作文測評的例子,教師還關(guān)心學(xué)生在以后的生活和工作中的寫作能力(相當(dāng)于效標(biāo))。
這是兩種效度在觀察重心上的區(qū)別,另一個明顯的區(qū)別就是推論(inference)的程度的不同。對使用內(nèi)容效度的測量者來說,基本上不存在推論。還以作文測題為例,作文成績高分就說明這學(xué)生作文能力好,教師不需要進(jìn)行推論,作文成績得分直接說明問題(如果要引申到學(xué)生的學(xué)習(xí)態(tài)度就是在進(jìn)行推論了)。在效標(biāo)效度的例子里,推論是很明顯的。招聘試題上的得分真的能預(yù)測將來的工作業(yè)績嗎,詩歌寫作成績好真的能預(yù)測將來生活和工作中的寫作能力嗎?局限于記敘文、散文、小說、論點(diǎn)論據(jù)論證式議論文和詩歌的寫作成績好,真的能預(yù)測將來的寫作能力嗎?這時候推論的意味已經(jīng)很強(qiáng)烈了,實(shí)際上效標(biāo)效度就是用來衡量這種推論的可靠性的。
測量者關(guān)心的是測量得分時,用內(nèi)容效度;測量者關(guān)心的是效標(biāo)得分時,用效標(biāo)效度,也許還需要解釋一下,這兩種效度并非只能用于不同的作文測題,而是取決于測量者如何使用作文測題。比如,同樣是一套或一系列作文測題,兩種效度都可以用來考核它,這取決于施測者如何使用這套或者一系列作文測題。如果施測者只想從中知道學(xué)生對相關(guān)的寫作知識和能力的掌握情況,那么他應(yīng)該關(guān)心這套或這個系列作文測題的內(nèi)容效度如何;如果施測者想以此推斷學(xué)生將來工作生活中的寫作能力,那么他應(yīng)該關(guān)心這套或者這個系列的寫作測題的效標(biāo)效度如何。
在關(guān)注效標(biāo)效度時,不能忽略了同時效度和預(yù)測效度。它們是在時間上對效標(biāo)效度進(jìn)行的分類。它們的區(qū)別是時間上不同,同時效度的效標(biāo)和原測量工具是同時施測的,而預(yù)測效度的效標(biāo)是在原測量工具之后施測的。比如學(xué)習(xí)期間正式進(jìn)行的作文寫作測驗(yàn)的同時效度的效標(biāo)是與這些測驗(yàn)并行的學(xué)生寫作練習(xí)成績和老師觀察評價(jià)等,而預(yù)測效度的效標(biāo)則可以是期末考作文成績,高考作文成績和生活工作中的寫作能力。
前文已經(jīng)說道,效標(biāo)效度的使用者真正關(guān)心的是效標(biāo)上的結(jié)果,因而待檢驗(yàn)的測量工具其實(shí)是作為效標(biāo)的替代物出現(xiàn)的。為什么要使用替代物呢?其理由在預(yù)測效度這里很明顯,效標(biāo)是作用于將來的,我現(xiàn)在要知道結(jié)果就必須使用替代物。比如要知道學(xué)生在將來正式高考時的可能成績,那么我們需要使用有較高的預(yù)測效度的模擬試卷。又或者要知道學(xué)生將來寫研究報(bào)告的能力,那么教學(xué)時應(yīng)該使用有較高的預(yù)測性的作文測題;這兩個例子里的模擬試卷和寫作測題都是為了實(shí)現(xiàn)預(yù)測的目的而必須使用的替代性的測量工具。
結(jié)合以上關(guān)于內(nèi)容效度和效標(biāo)效度的分析,我國作文教學(xué)和作文評價(jià)的現(xiàn)狀如下:高中作文教學(xué)模塊“表達(dá)與交流”有三大內(nèi)容:一談如何寫好記敘,描寫,抒情,議論,二談“虛構(gòu)”與真實(shí),側(cè)重虛構(gòu),三談好文章的四項(xiàng)指標(biāo)――深刻,充實(shí),文采,新穎。作文評價(jià)對應(yīng)于這三大內(nèi)容的評價(jià)標(biāo)準(zhǔn)。那么從理論上說作文評價(jià)已有了較高的內(nèi)容效度??墒莾?nèi)容效度高并不代表作文評價(jià)的效度高,并不能真實(shí)反映作文教學(xué)的成效如何,是否科學(xué)合理。在作文教學(xué)中,文體教學(xué)的嚴(yán)重缺失,文體意識嚴(yán)重匱乏導(dǎo)致學(xué)生日后生活中自由寫作思維極為狹隘,沒有可供自由選擇的文體寫作,駕馭文體能力相當(dāng)乏弱導(dǎo)致學(xué)生日后無法快速應(yīng)對豐富多樣的文體寫作,這反映了我國高中作文教學(xué)評價(jià)相當(dāng)?shù)偷男?biāo)效度。
事實(shí)上,高中畢業(yè)后大部分人都有這樣的經(jīng)驗(yàn),開始社會生活、走上工作崗位后,沒有多少人會繼續(xù)進(jìn)行我國高中作文類型的寫作,例如寫文學(xué)性、詩意、哲理性很強(qiáng)的記敘文、散文、議論文,反而是當(dāng)下高中作文教學(xué)所淡化的形式規(guī)范性很嚴(yán)格而且思維能力要求各具特色的其他文體寫作特別是實(shí)用文體寫作成了很多人的日常寫作,可是在作文評價(jià)過程中,忽視對效標(biāo)效度的分析,并沒有把駕馭這些文體的寫作能力當(dāng)做預(yù)測效標(biāo)來分析和重視。缺少這種效標(biāo)效度分析的作文評價(jià)就無法發(fā)現(xiàn)當(dāng)下作文教學(xué)成效低微,學(xué)生應(yīng)對生活與工作的實(shí)際寫作能力低弱的真正原因。
參考文獻(xiàn):
[1]黃全愈.高考招生制度改革的追問[J].全球教育展望,2005(5).
[2]陳文中.外國大學(xué)入學(xué)作文考試的啟示[J].中學(xué)語文教學(xué),2004(4).
[3]周鸞飛.近五年我國高中教學(xué)作文評價(jià)的研究[J].湖南師范大學(xué)碩士學(xué)位論文,2009.5.
[4]賀義廉.高考備考作文訓(xùn)練的現(xiàn)狀與誤區(qū)[J].當(dāng)代教育論壇,2008第5期.
[5]王選遨.構(gòu)建符合課程標(biāo)準(zhǔn)要求的寫作教學(xué)新思路[J].語文教學(xué)通訊高中版,2005(3)
[6]朱曉斌.西方寫作教學(xué)研究的新進(jìn)展[J].心理科學(xué),2001,VOL24(4).
[7]張娟.我國高考作文命題及評價(jià)回歸生活的訴求[J].教育測量與評價(jià),2008.9.
[8]黃全愈.“高考”在美國[M].廣西師范大學(xué)出版社.
[9]瞿寶奎.教育學(xué)文集?教育評價(jià)[M].人民教育出版社,1989.
隨著知識經(jīng)濟(jì)時代的到來,科學(xué)技術(shù)和創(chuàng)新能力已成為國家間競爭的核心要素。高校作為國家科技創(chuàng)新體系的重要組成部分,扮演著越來越重要的角色。作為科研生產(chǎn)活動的主體,高校教師的科研生產(chǎn)力在很大程度上影響著高校整體的科研產(chǎn)出水平和創(chuàng)新能力。
因?yàn)榭蒲挟a(chǎn)出具有不確定性(即較多的投入并不一定能夠獲得相應(yīng)的產(chǎn)出結(jié)果,在自然科學(xué)研究中表現(xiàn)得尤為明顯)、多樣性、連續(xù)性(即本期的研究成果可能會影響下一期的項(xiàng)目申請)、直接傳播性、社會影響深遠(yuǎn)性等,所以,教育界對于高校教師科研生產(chǎn)力的測量指標(biāo)莫衷一是。
一、概念界定
科學(xué)研究是科學(xué)工作者生產(chǎn)知識、應(yīng)用知識的活動,這種活動屬于高度社會化的一般勞動,使人類擁有認(rèn)識和改造自然的巨大力量,反映了人與自然的關(guān)系,應(yīng)該歸屬于生產(chǎn)力的范疇。學(xué)者趙紅州認(rèn)為,社會的科學(xué)能力應(yīng)該屬于特殊的生產(chǎn)力,也就是科學(xué)領(lǐng)域的生產(chǎn)力或科研生產(chǎn)力。謝彩霞等人指出,科研生產(chǎn)力由科研生產(chǎn)要素構(gòu)成,整個科學(xué)研究過程離不開科研生產(chǎn)要素。姚東瑞進(jìn)一步指出,科研生產(chǎn)力作為科學(xué)研究活動的一種產(chǎn)出能力,既包括通過發(fā)現(xiàn)、創(chuàng)造而實(shí)現(xiàn)創(chuàng)新理論、生產(chǎn)知識與發(fā)展科學(xué)的能力,又包括通過整合和應(yīng)用而實(shí)現(xiàn)技術(shù)創(chuàng)新、知識運(yùn)用和轉(zhuǎn)化的能力。葉鐘靈就美國對科研生產(chǎn)力的評價(jià)指標(biāo)進(jìn)行了綜述,按研究開發(fā)工作的成果進(jìn)行統(tǒng)計(jì),常見的指標(biāo)有專利發(fā)明數(shù)、論文出版數(shù)、成果得獎數(shù)、論文引述數(shù)等??蒲猩a(chǎn)力是科學(xué)勞動社會化的必然結(jié)果,結(jié)合已有研究,本文中的科研生產(chǎn)力是指科學(xué)研究活動的產(chǎn)出能力,具體表現(xiàn)在產(chǎn)出的數(shù)量和質(zhì)量上。
二、文獻(xiàn)綜述
(一)數(shù)量測量
從國家層面上看,國外對高校教師科研生產(chǎn)力的評價(jià)非常重視,尤其是美國和英國。美國主要是從教學(xué)、科研以及服務(wù)三個方面對高校教師進(jìn)行評價(jià),其中科研評價(jià)包括學(xué)術(shù)研究和科研項(xiàng)目。學(xué)術(shù)研究包括舉行學(xué)術(shù)報(bào)告、展覽,發(fā)表學(xué)術(shù)論文、專著,申請專利等;科研項(xiàng)目包括開展各級政府部門的縱向基金項(xiàng)目研究,為社會上的公司、企業(yè)進(jìn)行人員培訓(xùn),提供技術(shù)服務(wù)等。英國對高校教師的科研評價(jià)也比較系統(tǒng),設(shè)有英國大學(xué)科研評價(jià)體系,由專家組按照統(tǒng)一的標(biāo)準(zhǔn),依據(jù)達(dá)到國內(nèi)或國際先進(jìn)水平的成果數(shù)量,將評價(jià)結(jié)果分為七個等級同。澳大利亞科研評價(jià)體系則包括文獻(xiàn)計(jì)量指標(biāo)和非文獻(xiàn)計(jì)量指標(biāo)。文獻(xiàn)計(jì)量指標(biāo)包括出版物(賦有權(quán)重)、引用、展現(xiàn)科研特色的結(jié)構(gòu)指標(biāo)(包括出版物的領(lǐng)域分布、合作級別、科研類別)。非文獻(xiàn)計(jì)量指標(biāo)包括常用非文獻(xiàn)計(jì)量指標(biāo)(科研人員數(shù)量、科研時間、外部資金、研究生數(shù)據(jù)、榮譽(yù)和獎勵、演講、國際訪問),適用于人文社會科學(xué)的非文獻(xiàn)計(jì)量指標(biāo)(與校外機(jī)構(gòu)的研究合作產(chǎn)生的方案以及合作發(fā)表的出版物、參與大學(xué)管理、為社會提供學(xué)術(shù)服務(wù)等),以及適用于創(chuàng)造性藝術(shù)學(xué)科的非文獻(xiàn)計(jì)量指標(biāo)(舞蹈家、演員、音樂家、劇作家在公開場合的表演,建筑師和設(shè)計(jì)師的建筑或者創(chuàng)造等)三個方面。
國外研究者認(rèn)為,雖然用出版物的數(shù)量來衡量高校教師的科研產(chǎn)出有諸多局限性,但是從數(shù)據(jù)的可得性以及可靠性出發(fā),出版物的數(shù)量是一個很好的評價(jià)高校教師科研產(chǎn)出的指標(biāo)。出版物主要指發(fā)表的論文和所著專著兩個方面。
國內(nèi)學(xué)者在測量高校教師科研生產(chǎn)力時,也傾向于采用出版物的數(shù)量作為重要指標(biāo),但是,考慮到學(xué)科性質(zhì)的不同以及科研產(chǎn)出的多樣性,在借鑒國外經(jīng)驗(yàn)的同時,國內(nèi)學(xué)者對高校教師科研產(chǎn)出的測量指標(biāo)做了進(jìn)一步整理,主要從指標(biāo)分類、指標(biāo)篩選兩個方面進(jìn)行。他們認(rèn)為,科研產(chǎn)出主要表現(xiàn)為學(xué)術(shù)專著、、專利授權(quán)、成果鑒定、技術(shù)轉(zhuǎn)讓等方面。
1.指標(biāo)分類
有學(xué)者根據(jù)科技績效評價(jià)產(chǎn)出指標(biāo)性質(zhì),將指標(biāo)分為源生指標(biāo)、追加指標(biāo)和派生指標(biāo)三類。源生指標(biāo)包括論文、專著、專利授權(quán)、成果鑒定、技術(shù)轉(zhuǎn)讓、人才培養(yǎng)等;追加指標(biāo)建立在源生指標(biāo)的基礎(chǔ)之上,包括科技獎勵、論著引證、文章被索引及摘錄情況等;派生指標(biāo)是建立在優(yōu)秀的源生指標(biāo)和優(yōu)秀的追加指標(biāo)基礎(chǔ)之上的,包括學(xué)會、研究會、專業(yè)期刊的兼職、獲得榮譽(yù)稱號等。學(xué)者劉丹平、周建方等人采用層次分析法將高校教師科研能力評價(jià)指標(biāo)體系分為目標(biāo)層、準(zhǔn)則層和指標(biāo)層。目標(biāo)層即高校教師科研能力評價(jià),準(zhǔn)則層包括科研項(xiàng)目、科技成果、論文、論著、專利與著作權(quán)、科研綜合能力6個方面,指標(biāo)層包括國家級科研項(xiàng)目、省部級科研成果、三大檢索論文、學(xué)術(shù)專著、發(fā)明專利、專業(yè)創(chuàng)新能力、學(xué)科建設(shè)和團(tuán)隊(duì)合作精神等24項(xiàng)。
2.指標(biāo)篩選
在各類指標(biāo)中可能存在一些次要的評價(jià)指標(biāo),因此,需要對這些指標(biāo)進(jìn)行篩選,分清主次。通常使用的篩選方法主要有系統(tǒng)分析法、文獻(xiàn)資料分析優(yōu)選法以及應(yīng)用數(shù)理統(tǒng)計(jì)法等。靳希、張火春和姚力等人在總結(jié)國內(nèi)外有關(guān)業(yè)績考核工作經(jīng)驗(yàn)的基礎(chǔ)上,根據(jù)專業(yè)技術(shù)人員業(yè)績考核的目的,高校教師從事科研工作的特點(diǎn)以及模型設(shè)計(jì)的基本原則,建立了教師業(yè)績考核的指標(biāo)體系。這個體系包括研究任務(wù)、科研專著、科技論文、鑒定科技成果、獲獎科技成果、專利成果以及研究效益7項(xiàng)指標(biāo)。在這7項(xiàng)指標(biāo)的基礎(chǔ)上,根據(jù)科研績效定量評價(jià)體系的設(shè)計(jì)原則,賀天偉和張景林增加了培養(yǎng)人才這一指標(biāo)。鄭秀才從承擔(dān)的科研任務(wù)和取得的科研成果兩個方面綜合設(shè)定了高校教師科研績效評價(jià)指標(biāo):科研項(xiàng)目及經(jīng)費(fèi)、科研論著(期刊和專著)、科技成果(專利等)、科技成果應(yīng)用、科技成果獲獎。胡金秀、周國強(qiáng)等人從縱向科研立項(xiàng)、科研經(jīng)費(fèi)、成果鑒定、科技獎勵、學(xué)術(shù)論文、專利及計(jì)算機(jī)軟件、著作、對合作完成科研業(yè)績的分配這幾個方面來考察科研績效。胡俊在分析了國內(nèi)外教師科研業(yè)績以及高校教師科研特點(diǎn)的基礎(chǔ)上,建構(gòu)了包括學(xué)術(shù)論文、著作、鑒定成果、技術(shù)轉(zhuǎn)讓等在內(nèi)的新的指標(biāo)體系。
為使對高校教師科研生產(chǎn)力的評價(jià)科學(xué)、合理、全面、有效,在已有研究的基礎(chǔ)上,學(xué)者們進(jìn)一步完善了科研生產(chǎn)力的評價(jià)指標(biāo)體系。劉仁義選定以下指標(biāo)作為科研產(chǎn)出指標(biāo):學(xué)術(shù)論文,學(xué)術(shù)著作,專利申請與授權(quán),科技成果鑒定,研發(fā)成果應(yīng)用和其他科技服務(wù),人才培養(yǎng),科技獎勵,論著被引、被索及被摘,學(xué)術(shù)兼職,縱向項(xiàng)目,縱向科技經(jīng)費(fèi),排名與貢獻(xiàn)率,這些指標(biāo)下又分二級指標(biāo),以計(jì)算教師的科研產(chǎn)出。吳小妹通過專家訪談和問卷調(diào)查的方式,對高校教師科研能力指標(biāo)框架進(jìn)行了修正,其中,科研產(chǎn)出指標(biāo)又分為、發(fā)表專著、獲取專利、獲得獎項(xiàng)、研究報(bào)告、項(xiàng)目資助6個二級指標(biāo),這6個二級指標(biāo)下又分論文級別、作者排名、出版社等級、專著字?jǐn)?shù)等15個三級指標(biāo)。張宏琴在對當(dāng)前國內(nèi)許多高校正在使用的評價(jià)體系進(jìn)行考察的基礎(chǔ)上,提出了科學(xué)研究指標(biāo)、成果指標(biāo)、學(xué)術(shù)論文指標(biāo)、人才培養(yǎng)情況、社會工作情況(指學(xué)術(shù)講座、黨政職務(wù))等適用于教學(xué)研究型大學(xué)的高校教師科研績效評價(jià)指標(biāo)體系。
(二)質(zhì)量測量
國外學(xué)者考慮到出版物之間存在著質(zhì)量差異,高校教師在一本引用率很高的期刊上發(fā)表文章和在一本幾乎沒有人引用的期刊上發(fā)表文章所付出的努力和時間是不同的,因此,僅以出版物的數(shù)量來衡量高校教師的科研產(chǎn)出是片面的。于是,不少學(xué)者在計(jì)算出版物數(shù)量的基礎(chǔ)上增加了期刊質(zhì)量權(quán)重以及文章引用率,英國學(xué)者杰蘭特·瓊斯和吉爾·瓊斯為了區(qū)分文章的質(zhì)量,將出版物分為學(xué)術(shù)期刊上的論文、學(xué)術(shù)期刊上的書信、專業(yè)期刊上的文章、流行雜志上的文章、專著、書籍、官方報(bào)告、對編輯工作的貢獻(xiàn)8類。還有學(xué)者認(rèn)為,不同的學(xué)科面臨著不同的文章發(fā)表的競爭壓力,因此,不同學(xué)科學(xué)者的發(fā)表文章數(shù)量應(yīng)該用競爭壓力進(jìn)行修正。而競爭壓力可以用與該學(xué)科相關(guān)的期刊提供的空間和教師的發(fā)表需求之間的比值計(jì)算。
中圖分類號:G641
文獻(xiàn)標(biāo)識碼:A
文章編號:1672-0717(2015)01-0059-05
收稿日期:2014-11-30
基金項(xiàng)目:湖南省教育科學(xué)“十二五”規(guī)劃2012年度項(xiàng)目“高校有效學(xué)生學(xué)業(yè)評價(jià)研究”(XJK012CGD002);湖南省社科基金項(xiàng)目“高校發(fā)展性學(xué)習(xí)評估的國際經(jīng)驗(yàn)與借鑒”(13YBA077);全國教科規(guī)劃教育部重點(diǎn)項(xiàng)目“高校學(xué)業(yè)評估的國際比較研究”(DIA130302)。本文同時受湖南大學(xué)青年教師成長計(jì)劃經(jīng)費(fèi)資助。
作者簡介:劉聲濤(1976-),女,江西萍鄉(xiāng)人,教育學(xué)博士,湖南大學(xué)講師,主要從事高校教學(xué)與學(xué)習(xí)評估研究。
《高等學(xué)校章程制定暫行辦法》實(shí)施以來,教育部核準(zhǔn)了多所大學(xué)的章程,這些章程對學(xué)生學(xué)業(yè)評價(jià)工作的表述高度一致,即:學(xué)生公正地獲得學(xué)業(yè)上的評價(jià)。這個表述中有兩個看似平常實(shí)則復(fù)雜多義的概念:公正、學(xué)業(yè)評價(jià)。博登海墨(Edgar Bodenheimer)說:“公正有一張普洛透斯似的臉,變幻無常,隨時可呈不同形狀,并且有極不相同的面貌。當(dāng)我們仔細(xì)查看這張臉并試圖揭開隱藏其表面之后的秘密時,我們往往會深感迷惑。”[1]在不同的時代與人類活動中,人們對公正的涵義有不同的理解,不同的學(xué)者對于公正也有不完全相同的闡述,迄今尚未形成一個統(tǒng)一的公正論。教育領(lǐng)域中的評價(jià)是一個正在發(fā)展中的概念,其內(nèi)涵在不斷地?cái)U(kuò)大與豐富中。國際上,學(xué)生學(xué)業(yè)評價(jià)近幾十年正在產(chǎn)生教育評價(jià)歷史上從未有過的變革[2]。當(dāng)公正與學(xué)業(yè)評價(jià)兩個復(fù)雜的概念在一起時,有必要了解高校行政管理人員、教師、學(xué)生如何理解公正評價(jià)學(xué)生學(xué)業(yè),這種理解是否有偏差,如果有偏差那么更合適的理解又是什么。章程是高等學(xué)校依法自主辦學(xué)、實(shí)施管理和履行公正職責(zé)的基本準(zhǔn)則,探討上述問題有益于高校章程制定及以章程為依據(jù)來辦學(xué)。
一、對高校公正評價(jià)學(xué)生學(xué)業(yè)的實(shí)際理解
有三方面的證據(jù)表明,當(dāng)前我國高校學(xué)業(yè)評價(jià)相關(guān)群體主要將公正評價(jià)學(xué)生學(xué)業(yè)理解為通過以考試為主的方式來給予學(xué)生應(yīng)得的分?jǐn)?shù)或等級的活動。第一方面的證據(jù)來自于學(xué)生調(diào)查。2014年1月,筆者在某高校對大學(xué)生進(jìn)行了學(xué)業(yè)評價(jià)書面調(diào)查。調(diào)查包括三個問題:(1)大學(xué)期間,你的學(xué)業(yè)有沒有得到公正的評價(jià)?(2)請給出你或同學(xué)的學(xué)業(yè)被不公正評價(jià)的例子;(3)你認(rèn)為被不公正評價(jià)的原因是什么?學(xué)生針對這三個問題主要圍繞教師如何考及如何評分作答。第二方面的證據(jù)來自于高校相關(guān)政策文本的分析。有研究者對E大學(xué)學(xué)生評價(jià)管理機(jī)構(gòu)的管理職責(zé)、課程學(xué)習(xí)評價(jià)規(guī)定、學(xué)生實(shí)習(xí)評定和畢業(yè)論文評定的相關(guān)規(guī)定、畢業(yè)資格和學(xué)士學(xué)位授予資格的政策文本進(jìn)行分析,發(fā)現(xiàn)我國現(xiàn)行高校對學(xué)生評價(jià)的理解與要求是以專業(yè)知識為主要評價(jià)內(nèi)容,以考試為主要手段進(jìn)行考試成績鑒定[3]。第三方面的證據(jù)來自于研究文獻(xiàn)的內(nèi)容分析。以“高校、公正、評價(jià)”或“大學(xué)、公正、評價(jià)”為關(guān)鍵詞在CNKI數(shù)據(jù)庫中查詢到論述高校公正評價(jià)學(xué)生學(xué)業(yè)相關(guān)問題的3篇論文,這些論文對公正評價(jià)學(xué)生學(xué)業(yè)的界定都是給予學(xué)生客觀公平的學(xué)業(yè)成績??梢姡藗儗τ诟咝9u價(jià)學(xué)生學(xué)業(yè)的理解與實(shí)踐主要是圍繞學(xué)業(yè)考試和評分進(jìn)行,評價(jià)即考試,公正即評分準(zhǔn)確。
注重考試和評分的學(xué)業(yè)評價(jià)活動發(fā)揮了評價(jià)的測量功能:收集并量化信息。從測量功能角度理解學(xué)生學(xué)業(yè)評價(jià)并不奇怪。我國考試文化盛行,在不少人看來,學(xué)業(yè)評價(jià)即考試是自然而然的。首先,考試在我國有長期的歷史。1930年教育評價(jià)專家泰勒(R.W.Tyler)開始在教育領(lǐng)域使用評價(jià)一詞,此前評價(jià)學(xué)習(xí)的術(shù)語就是考試和測驗(yàn),而西方的考試和測驗(yàn)發(fā)展的源頭正是我國的科舉制。其次,我國人口眾多,經(jīng)濟(jì)尚欠發(fā)達(dá),社會誠信體系不成熟,考試依然是對社會有重大影響力的人才選拔手段。
測量意義上的公正評價(jià)學(xué)生學(xué)業(yè)要求評分準(zhǔn)確。簡單地說,公正是在一定社會范圍內(nèi)通過對社會資源的公平合理分配使每一個成員得其所應(yīng)得[4]。測量意義上的學(xué)生學(xué)業(yè)評價(jià)分配什么?最容易被想到的就是學(xué)業(yè)評價(jià)的直接分配――分?jǐn)?shù)或等級。直接的分配類似于代幣,用來獲得真正的分配,如保研資格、獎學(xué)金、工作機(jī)會等社會資源或和社會資源密切相關(guān)的東西。分?jǐn)?shù)或等級是學(xué)生學(xué)業(yè)成就客觀真實(shí)狀態(tài)的數(shù)字表征,公正則意味著數(shù)字表征準(zhǔn)確或地位表征準(zhǔn)確。數(shù)字表征準(zhǔn)確指數(shù)字完全和學(xué)生學(xué)業(yè)成就客觀真實(shí)狀態(tài)相符。因?yàn)楣饕头峙溆嘘P(guān),數(shù)字對學(xué)生學(xué)業(yè)成就在其團(tuán)體中所處位置表征準(zhǔn)確也能確保學(xué)生在分配時得其所應(yīng)得,這就是地位表征準(zhǔn)確。本文中將數(shù)字表征準(zhǔn)確或地位表征準(zhǔn)確統(tǒng)稱為準(zhǔn)確。
二、測量視角下公正評價(jià)學(xué)生學(xué)業(yè)的挑戰(zhàn)
研究者若對測量意義上的學(xué)業(yè)評價(jià)的基本技術(shù)有更多的了解和思考,會發(fā)現(xiàn)準(zhǔn)確評價(jià)學(xué)生學(xué)業(yè)在測量的各環(huán)節(jié)上都面臨著挑戰(zhàn)。
首先是收集哪些方面的信息。學(xué)業(yè)評價(jià)需要收集學(xué)生在預(yù)期學(xué)習(xí)成果上的表現(xiàn)信息。高校中的學(xué)業(yè)評價(jià)主要是課程學(xué)業(yè)成就評價(jià)。為了保護(hù)高校教師的學(xué)術(shù)自由,同時也因?yàn)楦咝Un程多且不斷變化,課程應(yīng)該有怎樣的學(xué)習(xí)成果由教師自行決定。在制定高校學(xué)術(shù)標(biāo)準(zhǔn)和質(zhì)量標(biāo)準(zhǔn)方面世界領(lǐng)先的英國高等教育質(zhì)量保障署(Quality Assurance Agency for Higher Education, QAA) 也僅是在學(xué)科層次上制定基準(zhǔn),不再細(xì)化到專業(yè)、課程層次。表層上,教師理解課程、設(shè)定合適的教學(xué)目標(biāo)的能力以及個人風(fēng)格等方面的差異導(dǎo)致課程目標(biāo)多樣化。深層上,課程到底該取得何種學(xué)習(xí)成果及價(jià)值判斷,原本就是一個難有統(tǒng)一答案的問題。因而,不同教師授課的同一門課程上被評價(jià)的很可能是學(xué)生不同的學(xué)習(xí)成果的表現(xiàn)。
其次是用什么評價(jià)方法去收集信息。按學(xué)生在評價(jià)活動中要做出的反應(yīng),測量學(xué)意義上的學(xué)業(yè)評價(jià)可分為選擇――反應(yīng)評價(jià)和建構(gòu)――反應(yīng)評價(jià)。選擇――反應(yīng)評價(jià)包括選擇題、判斷題、匹配題等需要學(xué)生找出答案的評價(jià)形式,建構(gòu)――反應(yīng)評價(jià)包括論文題、表現(xiàn)性測試、檔案袋評價(jià)等需要學(xué)生自己產(chǎn)生答案的評價(jià)形式。每種評價(jià)方式都有其適用情形及局限。選擇――反應(yīng)評價(jià)能考察學(xué)生大范圍的知識掌握情況,易于計(jì)分,但難以考察高層次能力;建構(gòu)――反應(yīng)評價(jià)能引發(fā)學(xué)生在高層次能力上的表現(xiàn),但難以對學(xué)生的真實(shí)狀況做準(zhǔn)確推論,難以計(jì)分。迄今為止,從測量技術(shù)上沒有找到能很好地克服每類評價(jià)方式局限性的方法。
再次是收集多少信息。由于用于信息收集的時間有限,實(shí)際工作中只能在預(yù)期學(xué)習(xí)成果中選擇若干并設(shè)計(jì)有限的評價(jià)任務(wù),因而學(xué)業(yè)評價(jià)只能測量學(xué)生特定的、有限的行為樣本。測量實(shí)質(zhì)上是對學(xué)生的真實(shí)狀態(tài)作出推論,推論基于有限的行為樣本,同時推論本身會有或多或少的誤差,這些都導(dǎo)致評分有誤差。
最后是收集到的信息如何量化。選擇――反應(yīng)評價(jià)具有易于計(jì)分但難以測量高層次能力的特點(diǎn)。高等教育的重要教學(xué)目標(biāo),如理解分析綜合能力、溝通合作能力、自主學(xué)習(xí)創(chuàng)新能力等都需要借助建構(gòu)――反應(yīng)評價(jià)方法來評價(jià)。教育測量學(xué)中,建構(gòu)――反應(yīng)評價(jià)的評分者一致性受到高度關(guān)注。因?yàn)楦叩冉逃闹匾虒W(xué)目標(biāo)難以量化,人們希望至少不同評分者對同一行為樣本的評分不要相差太遠(yuǎn)。但這種對評分者間一致性的期望也面臨挑戰(zhàn):評分者的標(biāo)準(zhǔn)設(shè)定或?qū)σ延袠?biāo)準(zhǔn)的理解不盡相同,同時教育測量學(xué)已經(jīng)證實(shí)學(xué)業(yè)評價(jià)中各種心理效應(yīng)導(dǎo)致的評價(jià)偏差客觀存在且難以克服?;谠u分的困難,波帕姆(W.James Popham)等著名教育評價(jià)專家都認(rèn)為應(yīng)對論文題或檔案袋評價(jià)的使用持謹(jǐn)慎態(tài)度[5](P139)。
事實(shí)上,對測量技術(shù)有更多了解和反思的學(xué)者對考試有著冷靜而客觀的認(rèn)識。波帕姆認(rèn)為應(yīng)該降低教師對分?jǐn)?shù)能反映學(xué)生實(shí)際成就水平的迷信[5](P28);沃爾弗德(Barbara E.Walvoord)建議放棄擁有完美、簡單的等級評分體系的幻想,接受它會有缺陷和限制的現(xiàn)實(shí)[6](P10);劉易斯(Harry R.Lewis)認(rèn)為分?jǐn)?shù)決不可能成為準(zhǔn)確比較不同學(xué)科成績的標(biāo)尺,即使在一門課程內(nèi),分?jǐn)?shù)也是不準(zhǔn)確的[7];韋墨(Maryellen Weimer)指出分?jǐn)?shù)能夠精確地衡量與客觀評價(jià)學(xué)習(xí)的認(rèn)識是錯誤的[8]。
可以說,準(zhǔn)確評價(jià)學(xué)生學(xué)業(yè)是一種誤解和想象,但當(dāng)前我國高校卻對它有著過度的依賴和關(guān)注,并且高校教和學(xué)中的很多負(fù)面現(xiàn)象都和這種依賴和關(guān)注有關(guān)。
盡管多數(shù)教師不能從測量技術(shù)的角度說清楚給學(xué)生準(zhǔn)確評價(jià)學(xué)業(yè)有多困難,但是他們會感受到這點(diǎn),尤其是面對建構(gòu)――反應(yīng)題時。有的教師會因沒有合理評價(jià)學(xué)生而內(nèi)心不安,還有教師擔(dān)心評分不合理導(dǎo)致學(xué)生投訴。為避免評分可能帶來的麻煩,高校教師經(jīng)常使用以下策略:(1)抬高分?jǐn)?shù)。給全體同學(xué)更高的分?jǐn)?shù),盡管這對于優(yōu)秀的學(xué)生不公正,但可以避免因評分過低而被學(xué)生投訴;(2)對學(xué)生按正態(tài)分布評分。正態(tài)分布是眾所周知的能力分布,按正態(tài)分布分配不同分?jǐn)?shù)等級的人數(shù)比例,這樣使得分?jǐn)?shù)看起來很正常;(3)盡量用選擇――反應(yīng)題。選擇――反應(yīng)題好評分,在理工科的測驗(yàn)中普遍使用;(4)秘而不宣的標(biāo)準(zhǔn)與任務(wù)。若公開標(biāo)準(zhǔn)與任務(wù),教師擔(dān)心學(xué)生通過不同的渠道做準(zhǔn)備,導(dǎo)致分?jǐn)?shù)看起來不符合學(xué)生水平。
一直以來,大學(xué)生學(xué)習(xí)研究不斷地證明著學(xué)業(yè)評價(jià)對于學(xué)生學(xué)習(xí)的影響[9]。學(xué)業(yè)評價(jià)過于依賴與關(guān)注考試對學(xué)生的負(fù)面影響包括:(1)膚淺學(xué)習(xí)。選擇――反應(yīng)評價(jià)主要考查記憶、再認(rèn)等低層次的認(rèn)知能力,這只需要學(xué)生的膚淺學(xué)習(xí)即能應(yīng)對。即便是形式上的建構(gòu)――反應(yīng)評價(jià),若沒有對題目及評分進(jìn)行精心設(shè)計(jì),也可能只是考查學(xué)生低層次能力。(2)突擊學(xué)習(xí)??荚嚢l(fā)生在學(xué)習(xí)告一段落后,再加上考察低層次能力,學(xué)生完全可以通過突擊學(xué)習(xí)通過考試,部分學(xué)生甚至還能獲得高分。(3)舞弊。既然評價(jià)注重的是分?jǐn)?shù)而不是學(xué)習(xí),學(xué)生就會想方設(shè)法獲得分?jǐn)?shù),包括以舞弊的方式。(4)對課程的誤解。事實(shí)上,學(xué)生是根據(jù)學(xué)業(yè)評價(jià)而不是教師的課程介紹來定義課程[10]。一門只要求死記硬背的課程在學(xué)生眼中就是枯燥無味、干巴巴的。不合適的學(xué)業(yè)評價(jià)會讓學(xué)生對真實(shí)的成人智力世界產(chǎn)生誤解。(5)失去通過學(xué)業(yè)評價(jià)調(diào)整自己學(xué)習(xí)的機(jī)會??荚囋趯W(xué)期末進(jìn)行,沒有反饋,而反饋被認(rèn)為是改進(jìn)學(xué)習(xí)的核心要素。
三、高校公正評價(jià)學(xué)生學(xué)業(yè):以改進(jìn) 學(xué)習(xí)為首要目標(biāo)
面對測量意義上公正評價(jià)學(xué)生學(xué)業(yè)的挑戰(zhàn),自然要提高測量技術(shù),以不斷提高對學(xué)業(yè)的測量能力及測量準(zhǔn)確程度。更重要的是,要意識到并承認(rèn)考試固有的局限性。承認(rèn)這種局限性不僅是正確使用考試的關(guān)鍵,更是一種基本的科學(xué)態(tài)度,它告訴我們要改變對考試與分?jǐn)?shù)的過分依賴與關(guān)注,正確認(rèn)識公正評價(jià)學(xué)生學(xué)業(yè)的內(nèi)涵。
首先要正確認(rèn)識學(xué)業(yè)評價(jià)的內(nèi)涵。在過去的幾十年中,學(xué)業(yè)評價(jià)被不斷地審視與反思。早在1930年,泰勒開始在教育領(lǐng)域使用評價(jià)概念,提出評價(jià)比考試和測驗(yàn)有更多的功能和目的,認(rèn)為教育評價(jià)僅用于檢測學(xué)生的成就是不夠的,同時也要關(guān)注課程內(nèi)容、課程形式、學(xué)生活動、學(xué)習(xí)的多種結(jié)果。20世紀(jì)60年代初,克龍巴赫(Cronbach,L.J.)建議評價(jià)者們重新確定評價(jià)的概念――不是根據(jù)競爭的成績,而是作為一個搜集和報(bào)告對課程研制有指導(dǎo)意義的信息過程,強(qiáng)調(diào)評價(jià)的診斷和反饋?zhàn)饔肹11]??梢姡谠u價(jià)的最初發(fā)展階段,學(xué)者主要就“什么需要被評價(jià)”及“評價(jià)起什么作用”擴(kuò)展了評價(jià)的含義,認(rèn)為評價(jià)的功能是信息收集及分析反饋,這一功能不僅學(xué)業(yè)成就檢測上需要,與學(xué)習(xí)相關(guān)的多項(xiàng)工作上都需要。在此階段,教師被認(rèn)為是評價(jià)的組織實(shí)施者及評價(jià)信息的分析使用者。1968年,布盧姆(Benjamin Bloom)將形成性評價(jià)的概念用于學(xué)生學(xué)習(xí),認(rèn)為應(yīng)在學(xué)生學(xué)習(xí)過程中通過檢測診斷學(xué)習(xí)中的問題。形成性評價(jià)主要就“什么時候評價(jià)”擴(kuò)展了評價(jià)的含義。20世紀(jì)80年代后,社會經(jīng)濟(jì)發(fā)展不斷對人才培養(yǎng)工作提出更高要求,同時認(rèn)知心理學(xué)等學(xué)科揭示了學(xué)生在學(xué)習(xí)中發(fā)揮積極主動性的作用,大量學(xué)者開始進(jìn)一步挖掘評價(jià)在學(xué)習(xí)中所能起的作用。學(xué)者主要就“評價(jià)的核心功能及其實(shí)現(xiàn)途徑”、“學(xué)生在評價(jià)中的角色”擴(kuò)展評價(jià)的含義。評價(jià)依然是信息收集及分析反饋工具,但這一工具被認(rèn)為應(yīng)該是以改進(jìn)學(xué)習(xí)為首要目標(biāo)。不同學(xué)者或研究組織用不同的名稱來稱呼這種以改進(jìn)學(xué)習(xí)為首要目標(biāo)的評價(jià),如學(xué)習(xí)導(dǎo)向評價(jià)、為了學(xué)習(xí)的評價(jià)等,并且總結(jié)了這類評價(jià)的特征。英國的評價(jià)改革研究小組(Assessment Reform Group,ARG)認(rèn)為,為了學(xué)習(xí)的評價(jià)應(yīng)該是:有效的教學(xué)設(shè)計(jì)中的一部分;關(guān)注學(xué)生如何學(xué)習(xí);課堂活動的核心內(nèi)容;教師需要掌握的關(guān)鍵專業(yè)技能;建設(shè)性的,因?yàn)槿魏卧u價(jià)都會帶來學(xué)生情緒、情感的影響;考慮到學(xué)生學(xué)習(xí)動機(jī)的重要性;促進(jìn)對學(xué)習(xí)目標(biāo)的理解,在評價(jià)標(biāo)準(zhǔn)上應(yīng)該達(dá)成共識;保證學(xué)生得到如何取得進(jìn)步的建設(shè)性指導(dǎo);發(fā)展學(xué)生自我評價(jià)的能力,促進(jìn)他們進(jìn)行反思和自我管理;認(rèn)可學(xué)生各個方面的成就[12]。不同學(xué)者或研究組織總結(jié)的為了學(xué)習(xí)的評價(jià)的特征大同小異,從這些特征中可以明顯看出為了學(xué)習(xí)的學(xué)業(yè)評價(jià)從目的到形式完全不同于考試。
其次要正確認(rèn)識學(xué)業(yè)評價(jià)中公正的內(nèi)涵。為了學(xué)習(xí)的學(xué)業(yè)評價(jià)分配什么?分配的是能改進(jìn)學(xué)生學(xué)習(xí)的信息以及根據(jù)這些信息所確定的合適的教育。聯(lián)合國教科文組織的著名報(bào)告《學(xué)會生存――教育世界的今天和明天》在談及教育中的機(jī)會平等時指出:“給每個人平等的機(jī)會,并不是指名義上的平等,即對每一個人一視同仁,如目前許多人所認(rèn)為的那樣。機(jī)會平等是要肯定每一個人都能受到適當(dāng)?shù)慕逃?,而且這種教育的進(jìn)度和方法是適合個人的特點(diǎn)的。”[13]應(yīng)像理解教育中的機(jī)會平等一樣理解學(xué)業(yè)評價(jià)中的公正,因?yàn)樗鼈冇兄餐氖姑D―讓學(xué)生學(xué)會生存,獲得發(fā)展。
澄清學(xué)業(yè)評價(jià)工作的首要目標(biāo)不僅是評價(jià)內(nèi)涵擴(kuò)展和豐富的結(jié)果,還是使評價(jià)活動有效的要求。選拔、甄別、診斷、鑒定、認(rèn)證、發(fā)現(xiàn)、發(fā)展、管理等等都是評價(jià)可能具備的目標(biāo)。研究者認(rèn)為,包括學(xué)業(yè)評價(jià)在內(nèi)的評價(jià)活動之所以很困難就在于評價(jià)可以同時具備多種目標(biāo)[14],但難以同等良好地實(shí)現(xiàn)所有目標(biāo),得到最重視的目標(biāo)決定評價(jià)的內(nèi)在結(jié)構(gòu)與外在形式。這也就是為什么在學(xué)業(yè)評價(jià)的研究文獻(xiàn)中總是可以看到學(xué)者指出對某些評價(jià)功能和目標(biāo)“過于重視”、“過于關(guān)注”、“過于依賴”、“過分強(qiáng)調(diào)”,認(rèn)為對某些評價(jià)功能和目標(biāo)應(yīng)該“突顯”、“強(qiáng)調(diào)”。評價(jià)工作需要確定首要目標(biāo),并從這個首要目標(biāo)出發(fā)設(shè)計(jì)評價(jià),以確保首要目標(biāo)的達(dá)成而不是其它。
人們依賴考試一方面是對考試的局限性了解不夠,另一方面是強(qiáng)調(diào)了學(xué)業(yè)評價(jià)在人才培養(yǎng)中不合適的目標(biāo)――管理。當(dāng)前我國高校中的學(xué)業(yè)評價(jià),與其說是一種教育方式,不如說是一種管理方式。在高校管理中,考試是高效且便利的以考促學(xué)的工具。高校中的學(xué)業(yè)考試是高利害的,因?yàn)樗彤厴I(yè)及各種榮譽(yù)有關(guān),這樣的考試自然能促使學(xué)生學(xué)習(xí)。但我們必須追問,有沒有導(dǎo)致正確的學(xué)習(xí)?不管考試在管理上多么高效和便利,它終究是以犧牲學(xué)生的利益為代價(jià)。正是對于以管理為目標(biāo)的學(xué)業(yè)評價(jià)的依賴,人們很難看到它和改進(jìn)學(xué)生學(xué)習(xí)的關(guān)系。只有把學(xué)生的利益放在第一位,而不是把管理的效率和方便放在第一位,才能正確理解公正評價(jià)學(xué)生學(xué)業(yè)的內(nèi)涵。
為了學(xué)習(xí)的學(xué)業(yè)評價(jià)在國外高校人才培養(yǎng)工作中正在發(fā)揮著重要作用。首先政府部門和相關(guān)組織明確將以改進(jìn)學(xué)習(xí)為首要目標(biāo)的評價(jià)寫進(jìn)政策文件中。美國高等教育協(xié)會(The American Association for Higher Education,AAHE)制定的良好學(xué)生學(xué)習(xí)評價(jià)活動的第一條原則是:評價(jià)學(xué)生的學(xué)習(xí)必須從教育的價(jià)值開始[6](P171)。QAA明確要求:評估實(shí)踐應(yīng)促進(jìn)有效學(xué)習(xí)[15]。其次學(xué)者積極進(jìn)行理論研究,并和教師一起進(jìn)行學(xué)業(yè)評價(jià)改革。如,美國學(xué)者安吉洛和克羅斯(Anglo,T.&Cross,P.)等在20世紀(jì)80年代組織的課堂研究項(xiàng)目;澳大利亞學(xué)者南丁格爾(Nightingale,P.)等在20世紀(jì)90年代中期組織的大學(xué)教學(xué)促進(jìn)項(xiàng)目(Committee for the Advancement of University Teaching,CAUT)。這些項(xiàng)目均是由評價(jià)專家組織及指導(dǎo)教師進(jìn)行學(xué)業(yè)評價(jià)改革行動研究,在實(shí)踐中發(fā)現(xiàn)問題,解決問題,形成豐富的學(xué)業(yè)評價(jià)資源。如,學(xué)業(yè)評價(jià)方法、學(xué)業(yè)評價(jià)范例供更多教師使用,并致力于在高校形成以改進(jìn)學(xué)習(xí)為目標(biāo)的評價(jià)文化。相比之下,我國對高校學(xué)業(yè)評價(jià)的認(rèn)識及實(shí)踐還停留在考試階段,高校中盛行的依然是考試文化而不是評價(jià)文化。
四、結(jié)語
在各項(xiàng)教育改革中,評價(jià)均被視為最難點(diǎn)或瓶頸。評價(jià)的首要目標(biāo)選擇不當(dāng)是評價(jià)不能取得預(yù)期效果的重要原因之一。長期以來,我國高校學(xué)業(yè)評價(jià)均承擔(dān)著測量者的角色,人們認(rèn)為公正評價(jià)即公正評分。在這種情況下,需要從政策層面對人們的認(rèn)識和實(shí)踐進(jìn)行正確引導(dǎo)。翻看我國《教育法》,可以發(fā)現(xiàn)教育部已核準(zhǔn)的章程中,對學(xué)生學(xué)業(yè)評價(jià)工作的表述基本上和《教育法》中的表述一致。章程要與教育法保持一致無可厚非,但保持一致并不意味著原封不動,其遣詞造句若能有利于糾正對高校學(xué)業(yè)評價(jià)即考試的片面認(rèn)識,引導(dǎo)高校進(jìn)行有利于改進(jìn)學(xué)生學(xué)習(xí)的評價(jià)則更有益于高校提高人才培養(yǎng)質(zhì)量。即使對學(xué)生學(xué)業(yè)評價(jià)工作沿用和教育法一致的表述,也需要高校相關(guān)群體正確認(rèn)識與實(shí)踐公正評價(jià)學(xué)生學(xué)業(yè),讓學(xué)生真正從學(xué)業(yè)評價(jià)活動中受益。
參考文獻(xiàn)
[1] [美]博登海墨.法理學(xué)――法哲學(xué)及其方法[M].北京:華夏出版社,1987:238.
[2] 崔允t.促進(jìn)學(xué)習(xí):學(xué)業(yè)評價(jià)的新范式[J].教育科學(xué)研究,2010(03):11-15.
[3] 沈曉麗.我國普通高校學(xué)生評價(jià)實(shí)踐研究――以E大學(xué)為個案[D].華東師范大學(xué)碩士學(xué)位論文,2008:摘要.
[4] 洋龍.平等與公平、正義、公正之比較 [J].文史哲,2004(04):145-151.
[5] [美]W.James Popham.促進(jìn)教學(xué)的課堂評價(jià)[M].北京:中國輕工業(yè)出版社,2003.
[6] [美]Barbara E.Walvoord & Virginia Johnson Anderson.等級評分――學(xué)習(xí)和評價(jià)的有效工具[M].北京:中國輕工業(yè)出版社,2004.
[7] [美]哈瑞.劉易斯.失去靈魂的卓越[M].侯定凱,等譯.上海:華東師范大學(xué)出版社,2012:117.
[8] [美]瑪麗埃倫.韋默.以學(xué)習(xí)者為中心的教學(xué)――給教學(xué)實(shí)踐帶來的五項(xiàng)關(guān)鍵變化[M].洪崗譯.杭州:浙江大學(xué)出版社,2006:82.
[9] Nightingale,P.,Te Wiata,I.,Toohey,S.,Ryan,G.,Hughes,C.,and Magin,D.Assessing Learning in Universities.Sydney:University of New South Wales Press,1996.117.
[10] David Carless,Gordon Joughin,Ngar-Fun Liu.How Assessment Supports Learning:Learning-oriented Assessment in Action[M].Hong Kong University Press.2006:2.
[11] 王萍,高凌飚.“教育評價(jià)”概念變化溯源[J].華南師范大學(xué)學(xué)報(bào)(社會科學(xué)版),2009(04):39-43.
[12] Assessment Reform Group.Assessment for Learning:10 Principles[R].Cambridge:University of Cambridge,2002.
隨著高校擴(kuò)招,我國的高等教育進(jìn)入大眾化階段,越來越多的學(xué)生有機(jī)會走進(jìn)大學(xué)校園接受高等教育。然而,越來越多的人開始懷疑我國高校培養(yǎng)的這些學(xué)生的質(zhì)量,這些學(xué)生是不是高質(zhì)量的人才?他們能不能滿足社會各界對人才的需要?他們還是所謂的“天之驕子”嗎?
這些疑問漸漸地不再是疑問了,人們看到當(dāng)代大學(xué)生的素質(zhì)正在逐漸降低,一方面社會各行各業(yè)對人才的需求如饑似渴,另一方面越來越多的大學(xué)生失業(yè)。本科畢業(yè)不好找工作就考研,碩士畢業(yè)不好找工作就繼續(xù)考博,博士畢業(yè)呢?如今我國的高等教育廣受詬病,“讀書無用論”一再泛濫,廣大教育界師生一直在探討如何能提高我國高等教育的質(zhì)量,如何讓高等教育真正培養(yǎng)社會所需要的人才。
我們知道,高考具有“指揮棒”的作用,即“考什么,就學(xué)什么;怎么考,就怎么學(xué)”。到了高等教育階段之后,考試仍然發(fā)揮重要的作用,卻已不是對學(xué)生考核的唯一方法,對學(xué)生的評價(jià)也不能僅僅看分?jǐn)?shù)了。既然考核評價(jià)機(jī)制的改革有助于提高我國高等教育的質(zhì)量,我們首先要全面了解考核評價(jià)機(jī)制的含義、內(nèi)容和作用。
考核評價(jià)機(jī)制包括考核和評價(jià)兩方面內(nèi)容,考核是考察核實(shí)、研究考證之義,評價(jià)是衡量、評估價(jià)值之義,一套完整的考核評價(jià)機(jī)制要有完善的考核方法,并根據(jù)考核的結(jié)果做出評價(jià)。考核評價(jià)機(jī)制的作用有三個方面:
第一,考核評價(jià)機(jī)制是測量教育教學(xué)效果的工具,教學(xué)質(zhì)量的判定既有定性描述又有定量分析,考核評價(jià)機(jī)制就是教育效果的測量工具。舉例來說,考試是一種重要的考核方法,分?jǐn)?shù)是評價(jià)教學(xué)效果的重要媒介。第二,考核評價(jià)的結(jié)果是對教育教學(xué)信息的反饋。考核評價(jià)的結(jié)果可以為教育教學(xué)系統(tǒng)反饋重要的信息。這種信息反饋給教研人員,能使教研活動更具針對性和實(shí)效性;這種信息反饋給教師,能使教師及時改進(jìn)教學(xué)方法,提高教學(xué)效率;這種信息反饋給學(xué)生,為學(xué)生改進(jìn)學(xué)習(xí)方法提供依據(jù)。第三,考核評價(jià)機(jī)制對教育教學(xué)的發(fā)展具有重要導(dǎo)向作用。學(xué)生會根據(jù)考核評價(jià)機(jī)制的要求進(jìn)行學(xué)習(xí),教師會按照考核評價(jià)機(jī)制的要求進(jìn)行教學(xué),學(xué)校會按照考核評價(jià)機(jī)制的要求布置教學(xué)任務(wù),什么樣的考核評價(jià)機(jī)制就會使教育教學(xué)教學(xué)機(jī)構(gòu)培養(yǎng)出什么樣的學(xué)生??己嗽u價(jià)機(jī)制導(dǎo)向作用的突出表現(xiàn)之一是高考的“指揮棒”作用。
因?yàn)榭己嗽u價(jià)機(jī)制對教育教學(xué)有如此重要的影響,所以改革考核評價(jià)機(jī)制對教育質(zhì)量的影響也是巨大的。相比于初、中等教育,國家和社會對高等教育的質(zhì)量更為關(guān)注,因?yàn)楦叩冉逃囵B(yǎng)的人才直接面向社會需要,完成高等教育的學(xué)生會直接進(jìn)入社會、參與社會。因而,本文著重分析改革考核評級機(jī)制對提高我國高等教育質(zhì)量的作用。
長期以來,我國高等教育系統(tǒng)中對學(xué)生的考核評價(jià)機(jī)制存在諸多不合理之處,這些不合理之處表現(xiàn)在以下五個方面:
(一)考核形式單一,缺乏多樣性。目前我國高等教育階段對學(xué)生的考核仍然以考試為主,而且多數(shù)是閉卷的筆試,除外語類的其他科目考試基本沒有口試。筆試多是期末一次性考試,考試成績的偶然性較大,很少有平時的考試,這種考核方式與應(yīng)試教育的考核方式?jīng)]有差別,并不能真正考察教育教學(xué)的效果??荚囋谄谀┻M(jìn)行,削弱了考試對教育教學(xué)信息反饋的作用。雖然許多高校都設(shè)有平時成績這一項(xiàng),但平時成績名存實(shí)亡,平時成績的多少由老師給定,有些老師以出勤定成績,有些老師甚至不考慮出勤情況,完全忽視對平時成績的考察,多數(shù)情況下平時成績成為老師為不及格學(xué)生提分的工具。另一方面,增加平時的考核內(nèi)容會增加老師的負(fù)擔(dān),由于學(xué)校缺少對平時考核的監(jiān)督檢查,在缺少監(jiān)督的情況下,多數(shù)老師對平時的考核很懈怠,平時成績儼然已成為“雞肋”。論文是對學(xué)生綜合運(yùn)用知識能力的考核,但僅有少數(shù)課程以論文的形式就行考核,而且論文多是期末交,缺乏對平時學(xué)習(xí)效果的考核。
(二)考試內(nèi)容以記憶性知識為主,缺少對學(xué)生創(chuàng)新性和對知識運(yùn)用能力的考核。閉卷考試的題型固定,分值固定,考試的知識點(diǎn)多為記憶性的。很多老師在考前為學(xué)生劃重點(diǎn),讓學(xué)生加強(qiáng)記憶,甚至有些老師通過漏題的形式提高學(xué)生的成績。這樣的考試形式使記憶能力強(qiáng)的學(xué)生能考得好成績,很多學(xué)生依靠考前的突擊式的背書就能考高分,而記憶能力差的學(xué)生就會吃虧,而且這樣的考試也不能考察學(xué)生的分析能力和創(chuàng)新性,對知識缺乏應(yīng)用。
(三)我國嚴(yán)進(jìn)寬出的高等教育模式使考核缺乏嚴(yán)格性。學(xué)生一旦進(jìn)入大學(xué),意味著不再需要像高中那樣刻苦學(xué)習(xí),“六十分萬歲”的思想頗為流行,如果僅僅是為了拿畢業(yè)證和學(xué)位證,大學(xué)可以說無學(xué)習(xí)壓力可言。對于辛辛苦苦考上大學(xué)的學(xué)生來說,如果因?yàn)榭荚嚥患案穸鵁o法畢業(yè),別說學(xué)生,就是家長和老師恐怕都無法接受,因而老師自然而然就降低了考試判分的嚴(yán)格性??荚嚨膰?yán)格性降低,再加上伸縮性極強(qiáng)的平時成績,學(xué)生很容易就能及格,這樣的考核根本不能真實(shí)反映高等教育的效果,教育質(zhì)量怎能提升?此外,學(xué)生的自由選課權(quán)給老師造成一定的壓力,如果一個老師給分低了學(xué)生就不選他的課了,這在一定程度上使考試客觀性和嚴(yán)格性受到影響。
(四)對學(xué)生的評價(jià)過度依賴考試成績。學(xué)校評獎學(xué)金、保送研究生、評優(yōu)秀班干部、推優(yōu)入黨都和考試成績掛鉤,這一方面使得成績好的同學(xué)追求更好的成績,造成類似應(yīng)試教育的效果,另一方面使得成績不好的同學(xué)放棄對好成績的追求,學(xué)生對待考試成績的態(tài)度“兩極分化”,使考試失去激勵作用。無論是哪個結(jié)果,都無法發(fā)揮考試應(yīng)有的作用,考核評價(jià)機(jī)制檢測教育教學(xué)效果和反饋教育教學(xué)信息的作用嚴(yán)重削弱。
(五)對于期末一次性的考試,考完后學(xué)生只知道自己考了多少分,而究竟哪些題做錯了,哪些知識點(diǎn)丟分則完全不知道,由于一門課考完后就不再學(xué)了,學(xué)生也就不去想到底哪兒出錯了,這樣不利于學(xué)生全面掌握知識。學(xué)校沒有相關(guān)的規(guī)定要求老師向?qū)W生完整地反饋考試結(jié)果,學(xué)生也很少主動向老師索要,老師則更不會主動去勞神費(fèi)心地為學(xué)生提供分析。
我國高等教育考核評價(jià)機(jī)制存在的這些問題嚴(yán)重影響我國高等教育的質(zhì)量,考核評價(jià)機(jī)制在我國高等教育教學(xué)中發(fā)揮的作用不容忽視,因而,構(gòu)建科學(xué)的考核評價(jià)機(jī)制勢在必行。根據(jù)我國高等教育考核評價(jià)機(jī)制存在的問題,為了達(dá)到高等教育質(zhì)量的提升的目的,改革考核評價(jià)機(jī)制應(yīng)該包括以下五個方面:
(一)考核形式的多樣化,注重平時成績的考核。高校應(yīng)該增加平時成績在綜合成績中所占的比重,并增加平時成績考核的多樣性,利用平時小論文、課堂展示、課程設(shè)計(jì)、課堂討論和小組合作等形式進(jìn)行考核。平時成績的考察能增強(qiáng)考核評價(jià)機(jī)制反饋教育教學(xué)信息的作用,并能減少期末考試一考定成績的偶然性,真實(shí)反映學(xué)生在教學(xué)過程中學(xué)習(xí)情況。利用口試的形式全面了解學(xué)生對知識的掌握和運(yùn)用能力。期末考試應(yīng)更多利用論文、案例分析、開卷考試等形式,綜合考察學(xué)生的各項(xiàng)能力,尤其是注重利用論文作為考核的方式,論文的寫作需要查閱大量相關(guān)文獻(xiàn),能綜合考核學(xué)生的理解、分析和寫作能力。
(二)考核內(nèi)容的全面性與科學(xué)性。要減少對記憶性知識的考核,增加對知識運(yùn)用和分析能力的考核;試卷中減少客觀題比例,增加主觀題比例,考察學(xué)生運(yùn)用所學(xué)知識進(jìn)行論述和案例分析的能力。發(fā)達(dá)國家高等教育階段對學(xué)生的考核很少涉及記憶性內(nèi)容,更側(cè)重綜合能力的考核,這一點(diǎn)值得我們學(xué)習(xí)。
(三)增強(qiáng)考核的嚴(yán)格性和客觀性。要想通過考核檢測教育教學(xué)效果和反饋教育教學(xué)信息,必須增強(qiáng)考核的嚴(yán)格性和客觀性。要統(tǒng)一判分的標(biāo)準(zhǔn),不能因人而異,判分要嚴(yán)格依照判分標(biāo)準(zhǔn),對于主觀題,老師要根據(jù)學(xué)生答題內(nèi)容公平地給分,不能通融不及格的學(xué)生??己藝?yán)格了,學(xué)生們自然不敢懈怠,考核的目的也就達(dá)到了。不僅期末考試要嚴(yán)格,平時考核也要嚴(yán)格,考核方式一旦確定,老師和學(xué)生都要嚴(yán)格遵守考核規(guī)定,對于違反規(guī)定的,學(xué)校要依照規(guī)章制度予以懲罰。
(四)評價(jià)學(xué)生不能單純依靠學(xué)習(xí)成績。學(xué)習(xí)成績固然是評價(jià)學(xué)生的重要工具,但是對于高等教育階段的學(xué)生,其綜合素質(zhì)不僅表現(xiàn)在學(xué)習(xí)成績方面,還表現(xiàn)在思想上和道德上。評價(jià)學(xué)生要考慮其參與社會實(shí)踐的程度,思想道德的發(fā)展和其他學(xué)術(shù)成果等,關(guān)注其綜合素質(zhì)。鼓勵大學(xué)生參與社會實(shí)踐,培養(yǎng)自身興趣愛好,提高自身解決問題的能力。
(五)老師要把考核結(jié)果及學(xué)生存在的問題反饋給學(xué)生。大學(xué)生通常只知道自己考試得了多少分,至于哪些知識點(diǎn)上丟分則不知道,加之一門課只學(xué)一學(xué)期,考完后學(xué)生們也不想知道到底哪些知識點(diǎn)沒學(xué)好。因此,要想讓學(xué)生學(xué)好,必須把考核結(jié)果完整地反饋給學(xué)生,使學(xué)生真正明白。
我國的高等教育正處在快速發(fā)展階段,而考核評價(jià)機(jī)制卻沒有跟上高等教育發(fā)展的步伐,考核評價(jià)方式與初、中等教育階段沒有太大的區(qū)別,落后的考核評價(jià)機(jī)制制約了我國高等教育質(zhì)量的提升,不符合培養(yǎng)高質(zhì)量人才的要求。因而必須改革我國高等教育的考核評價(jià)機(jī)制,引導(dǎo)高等教育發(fā)展,通過考核提高學(xué)生學(xué)習(xí)的積極性,全方位培養(yǎng)學(xué)生能力,公正、客觀地評價(jià)教育教學(xué)效果,發(fā)揮高等教育培養(yǎng)高端人才的作用。
[參考文獻(xiàn)]
[1]胡海霞,李鋼.談教學(xué)型高??己嗽u價(jià)機(jī)制下的考試制度[J].考試周刊(考試研究版),2010(9):1-3
[2]楊愛英,宋揚(yáng).高等教育考核方式改革初探[J].常州信息職業(yè)技術(shù)學(xué)院學(xué)報(bào),2009(2):19-20
[3]趙麗娟,孟憲國.淺論素質(zhì)教育考核評價(jià)體系之構(gòu)建與創(chuàng)新[J].齊齊哈爾大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版),2005.7:151-152
一、活動背景
光污染是繼水、氣、聲和渣污染之后的一種新型污染,主要包括白亮污染、人工白晝和彩光污染。光污染的影響首先在于破壞天文觀測環(huán)境,歷史上天文臺因此而被迫搬遷的案例屢見不鮮。英國格林尼治天文臺早在1948年就為躲避光污染和大氣污染而遷往東南沿海環(huán)境優(yōu)美、觀測條件更好的赫斯特蒙蘇堡地區(qū)。在美國、加拿大、日本、西班牙、葡萄牙等國,多個著名天文臺都曾幾次遷址。我國紫金山天文臺的觀測工作也全部轉(zhuǎn)移到了其他觀測站點(diǎn),紫臺園區(qū)則已改建為天文博物館,以天文科普和天文旅游為主,僅保留了少量與太陽觀測有關(guān)的科研工作。
光污染的影響其實(shí)并不局限于天文觀測。居高不下的學(xué)生近視率、迷途的海龜幼崽、撞上玻璃幕墻的飛鳥、爆發(fā)性增殖的水藻、能源緊缺與氣候變暖,這些看似并無關(guān)聯(lián)的人與事,其實(shí)背后都與燈光之?dāng)_息息相關(guān)。
作為長三角地區(qū)的重要城市之一――無錫的光污染較為嚴(yán)重。在距市中心三陽廣場約6.2公里遠(yuǎn)的天一中學(xué)校園里,天空是白的是灰的是橙的是多彩的,北斗七星中的天權(quán)是看不到的,獅子座的鐮刀是認(rèn)不全的……在距三陽廣場16.9公里遠(yuǎn)的斗山山頂,連仙女座大星系M31和獵戶座大星云M42都僅能勉強(qiáng)分辨,山腳下的路燈和遠(yuǎn)近城鎮(zhèn)的光源清晰可見,天空泛著淺淺的灰白色……在與市區(qū)間隔有10公里的太湖十八灣地區(qū)竟連天頂附近的銀河都徹夜不現(xiàn),三角座星系M33也必須要通過雙筒鏡才能被觀察到……
為提高學(xué)生及公眾對光污染的認(rèn)識,學(xué)校針對性地引進(jìn)了一批測光儀,并依托天一天文社加賀谷穰工作室(文化宣傳部)、達(dá)蓋爾工作室(學(xué)術(shù)委員會)、伽利略工作室(普及委員會)和斯科特工作室(項(xiàng)目辦公室),設(shè)計(jì)了“多層次城市夜空光度測量科技教育活動”,策劃并實(shí)施了多個文宣、教育、科普和研究性項(xiàng)目。
二、活動目標(biāo)
知識與技能:
1.理解夜空光度、光污染的概念,了解導(dǎo)致夜空光度增大的主要原因。
2.掌握夜空光度分級的方法,并能運(yùn)用器材測量夜空光度值。
3.了解背景光對天文觀測的影響,
學(xué)會設(shè)計(jì)反映此原理的科普實(shí)驗(yàn)。
過程與方法:
1.開展觀星活動、光污染攝影與夜空光度測量活動,掌握天文觀測及夜空光度測量的基本方法。
2.了解策劃、組織活動的過程,學(xué)會科學(xué)研究的一般方法,實(shí)驗(yàn)設(shè)計(jì)的一般結(jié)構(gòu)。
情感、態(tài)度和價(jià)值觀:
1.了解城市對自然地理環(huán)境的改變,不合理的城市亮化帶來的環(huán)境問題,敢于解決問題。
2.在活動中,提升科學(xué)素養(yǎng),發(fā)展科學(xué)思維、合作創(chuàng)新精神。
三、參與對象與活動形式
活動對象以天一天文社社員為主體,包括國際分社約40人,少年分社約40人,高中分社約70人,榮譽(yù)分社約20人。此外,還包括無錫市中小學(xué)天文聯(lián)合會(錫天聯(lián))下屬成員學(xué)校約150人,以及其他相關(guān)單位的學(xué)生約300人。
活動主體――天一天文社社員參與了“多層次城市夜空光度測量科技教育活動”的全部項(xiàng)目、環(huán)節(jié)的活動,包括項(xiàng)目研究、實(shí)驗(yàn)設(shè)計(jì)、科普觀測和攝影活動。錫天聯(lián)成員學(xué)校、無錫市少年宮等其他相關(guān)單位的學(xué)生主要參與了科普觀測和攝影活動。
四、活動的重點(diǎn)、難點(diǎn)、創(chuàng)新點(diǎn)
活動重點(diǎn):搭建天文研究平臺,以光污染研究為抓手,調(diào)動學(xué)生積極性,讓更多的學(xué)生參與到天文活動中來。
活動難點(diǎn):城市夜空光度測量研
究,光污染相關(guān)實(shí)驗(yàn)設(shè)計(jì)。
活動創(chuàng)新點(diǎn):由中學(xué)發(fā)起并組織
的使用國際頂尖測光儀對城市進(jìn)行高覆蓋度的夜空光度測量研究,夜天光監(jiān)測站點(diǎn)建設(shè)在世界范圍內(nèi)都具有唯一性;由中學(xué)生開展科普實(shí)驗(yàn)設(shè)計(jì)與教材編寫同樣具有開創(chuàng)性;以光污染為主題的攝影大賽在當(dāng)今世界也是少見的。
五、可利用的各類科技教育資源
1.技術(shù)指導(dǎo):中科院紫金山天文臺科普部、北京師范大學(xué)天文系高爽老師、國家天文臺劉博洋博士等以技術(shù)顧問的身份,參與了“城市夜空光度測量”的相關(guān)活動指導(dǎo)。此外,南京大學(xué)、中國科技大學(xué)、北京天文館的專家教授們也曾多次來校指導(dǎo)天文課程建設(shè)。
2.團(tuán)隊(duì)建設(shè):錫天聯(lián)成員學(xué)校、無錫市少年宮等作為天一天文社緊密的合作伙伴,不僅為開展與夜空光度相關(guān)的科普活動提供了場地與學(xué)生支持,而且還有一批教師參與共同開展天文教研活動,形成了教研團(tuán)隊(duì)。
3.資金支持:天一中學(xué)為開展天文教育投入了大量的資金,已多批次采購天文實(shí)驗(yàn)器材如望遠(yuǎn)鏡、測光儀、相機(jī)、野營設(shè)備、圖書等,并已建設(shè)完成天文創(chuàng)新實(shí)驗(yàn)室一間;天文創(chuàng)新實(shí)驗(yàn)室作為學(xué)?!癝TS綜合創(chuàng)新課程基地”的重要組成部分,還得到了省市區(qū)各級教育部門的專項(xiàng)建設(shè)資金支持;錫天聯(lián)成員學(xué)校、無錫市少年宮等單位也配套投入了相關(guān)的天文基地建設(shè)。
六、活動內(nèi)容
“多層次城市夜空光度測量科技教育活動”的全部項(xiàng)目、環(huán)節(jié)的活動,包括項(xiàng)目研究、實(shí)驗(yàn)設(shè)計(jì)、觀測實(shí)踐和攝影活動等多個層次,分別由天一天文社斯科特工作室(項(xiàng)目辦公室)、伽利略工作室(普及委員會)、達(dá)蓋爾工作室(學(xué)術(shù)委員會)和加賀谷穰工作室(文化宣傳部)等四大工作室具體負(fù)責(zé)。表1為各工作室的智能類型列表。
(一)主題活動一:城市夜空光度測量(項(xiàng)目研究)
1.選題背景及意義:
無錫作為長三角地區(qū)的重要城市之一,經(jīng)濟(jì)發(fā)達(dá),城市光污染情況總體比較嚴(yán)重,但是不同區(qū)域的污染程度也存在明顯差異。夜空光度是衡量城市光污染程度的重要指標(biāo),通過使用專門的測光儀器,對無錫城區(qū)進(jìn)行高覆蓋度的光度測量,從而了解無錫城區(qū)整體的污染程度,不同區(qū)域的污染水平差異,以及分析光污染產(chǎn)生的背景,并嘗試提出防治的建議,有利于提高公眾對光污染的認(rèn)識,也能為城市管理部門在優(yōu)化城市燈光設(shè)置時提供參考。
2.活動過程和步驟:
(1)編寫《無錫市夜空光度測量指導(dǎo)》方案。指導(dǎo)學(xué)生收集、整理與夜空光度測量相關(guān)的研究論文及其他材料,對“光污染”“夜空光度”等概念進(jìn)行界定,并組織編寫《無錫市夜空光度測量指導(dǎo)》方案,就測量時間、地點(diǎn)、方法及報(bào)告填寫的格式予以統(tǒng)一規(guī)范。
(2)撰寫開題報(bào)告。指導(dǎo)學(xué)生撰寫《無錫城市夜空光度測量》開題報(bào)告,對研究背景、要解決的問題、選題意義及研究價(jià)值,核心概念的界定、相關(guān)現(xiàn)狀、參考文獻(xiàn),研究目標(biāo)、研究內(nèi)容、研究假設(shè),研究思路、研究計(jì)劃,預(yù)期成果等內(nèi)容進(jìn)行項(xiàng)目論證。經(jīng)論證后的項(xiàng)目被中國教育學(xué)會地理教學(xué)專業(yè)委員會研究性學(xué)習(xí)課題專家組立項(xiàng)。
(3)開展測量活動。指導(dǎo)學(xué)生開展城市夜空光度測量活動,具體步驟有:
①儀器編號:為支持本課題組
的研究工作,學(xué)校從加拿大購置了9臺SQM測光儀,并予以編號(以分辨儀器本身存在的機(jī)械誤差)。
②路線設(shè)計(jì):將無錫市區(qū)劃分為
不同的片區(qū),并設(shè)計(jì)好測光的具體行
進(jìn)路線和測光任務(wù)。
③實(shí)地測量:將課題組成員分成不同的小組,每組由3人組成,分別負(fù)責(zé)儀器操作、數(shù)據(jù)記錄和坐標(biāo)定位,每個坐標(biāo)點(diǎn)測5個數(shù)據(jù),以減小誤差。
④數(shù)據(jù)處理:將測光所得的數(shù)據(jù)(經(jīng)度、緯度、時間、測光值)輸入EXCEL表格,進(jìn)行誤差分析,取平均值,得到各坐標(biāo)點(diǎn)夜空光亮度的最終值。
(4)撰寫結(jié)題論文。指導(dǎo)學(xué)生根據(jù)開題報(bào)告中預(yù)期成果的要求對收集的數(shù)據(jù)進(jìn)行不同角度的分析,并將結(jié)論撰寫成結(jié)題論文《無錫城市夜空光度測量研究》。結(jié)題論文主要結(jié)構(gòu)包括:夜空光概述,測量儀器及方法,數(shù)據(jù)分析及測量結(jié)果(數(shù)據(jù)測量與分析步驟、夜空光亮度的地區(qū)分異、夜空光亮度的地區(qū)變化、夜空光亮度的地平高度及方位分異、夜空光亮度的時間變化),反思及討論等。于2015年第4期《地理教學(xué)》雜志。
3.活動效果及呈現(xiàn)方式:
活動進(jìn)行過程中及之后,我們得到了諸多媒體的關(guān)注:指導(dǎo)教師受邀赴上海復(fù)旦大學(xué)為2015年第六屆全國天文社團(tuán)發(fā)展論壇作了《也談高中天文社團(tuán)建設(shè)》的專題報(bào)告,赴江陰為2015年第二屆無錫市高中生峰會作了《城市天文學(xué)》的專題報(bào)告。項(xiàng)目組還收到了國際天文學(xué)聯(lián)合會普及工作委員會及香港大學(xué)物理系的邀請函,受邀加入國際夜空光度監(jiān)測網(wǎng)絡(luò)并赴香港大學(xué)開展項(xiàng)目交流與培訓(xùn)。
在前期活動的基礎(chǔ)上,天一天文社發(fā)起成立了錫天聯(lián)、無錫城市夜空光度監(jiān)測網(wǎng)絡(luò)兩個組織,吸引了南菁中學(xué)、青陽中學(xué)、山明中學(xué)、旺莊實(shí)驗(yàn)小學(xué)等多家單位參與,將在無錫建設(shè)若干城市夜空光度監(jiān)測站,并以此為抓手,開展進(jìn)一步的天文教育活動。
(二)主題活動二:光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)(科普實(shí)驗(yàn))
1.選題背景及意義:
激發(fā)學(xué)生對科學(xué)的熱情,培養(yǎng)并學(xué)習(xí)掌握科學(xué)研究的方法與技能是我國進(jìn)行素質(zhì)教育的目的之一??茖W(xué)研究的方法和技能至少應(yīng)包括:分析和觀察周圍世界的技能,發(fā)現(xiàn)問題、提出問題、作出假設(shè)、安排實(shí)驗(yàn)的技能,真實(shí)地記錄觀察結(jié)果與數(shù)據(jù)的技能,按照正確方法處理數(shù)據(jù)的技能。
天文因?yàn)椴粚儆谥行W(xué)必修課程而不被大多數(shù)學(xué)生所了解,中學(xué)階段非常缺乏天文科普實(shí)驗(yàn)或科技制作的教學(xué)內(nèi)容,非常有必要利用天一天文社的資源優(yōu)勢整理、設(shè)計(jì)一些科普天文實(shí)驗(yàn)或制作,這些源自我們身邊的天文科學(xué)知識將極大地激發(fā)學(xué)生對天文的興趣,增加他們對天文的認(rèn)識,促進(jìn)天文知識在基礎(chǔ)教育階段的普及。
2.活動過程和步驟:
(1)編寫“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”模板。指導(dǎo)學(xué)生學(xué)習(xí)《高中物理實(shí)驗(yàn)手冊》等專業(yè)書籍,在此基礎(chǔ)上,編寫“光污染相關(guān)實(shí)驗(yàn)設(shè)計(jì)”模板:活動目標(biāo)、概念與方法、材料準(zhǔn)備、活動步驟、活動建議、活動拓展等,同時,設(shè)計(jì)一份樣稿《在微光中辨認(rèn)顏色》。
(2)開展“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”。指導(dǎo)學(xué)生開展“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”,具體步驟有:
①創(chuàng)意征集:發(fā)動學(xué)生提出光學(xué)
相關(guān)實(shí)驗(yàn)(及制作)設(shè)計(jì)的創(chuàng)意,組織人員從投稿的創(chuàng)意中精選可操作性較高的方案。
②方案編寫:制訂編寫計(jì)劃,并為課題組每一位學(xué)生分配編寫方案(草案),指導(dǎo)他們根據(jù)模板和樣稿的格式及要求進(jìn)行方案編寫。
③實(shí)驗(yàn)驗(yàn)證:將課題組成員分成不同的小組,每組2人,以小組為單位對所編寫的方案進(jìn)行實(shí)驗(yàn)驗(yàn)證。
(3)組織“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”比賽。面向全校師生組織開展“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”比賽,吸引對天文有興趣、樂于動手實(shí)踐的學(xué)生參加“在微光中辨認(rèn)顏色”“彗星為什么長尾巴”“簡易望遠(yuǎn)鏡制作”等比賽,并評優(yōu)頒獎。
(4)舉辦“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”科普活動。面向錫天聯(lián)成員學(xué)校、無錫市少年宮及無錫地區(qū)其他中小學(xué)、幼兒園開展“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”科普活動,針對不同年齡階段的受眾舉辦光污染科普講座或科普游戲。
3.活動效果及呈現(xiàn)方式:
學(xué)生編寫的“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”將被編入校本教材《中小學(xué)生天文學(xué)習(xí)指南3》,這是一本專門介紹天文相關(guān)科普實(shí)驗(yàn)及科技制作的教材,受眾定位為中小學(xué)天好者及天文指導(dǎo)教師。
上述科普實(shí)驗(yàn)及科技制作被引入天文社“宇宙意識”少兒天文科普項(xiàng)目及“天文全球化”社區(qū)天文科普項(xiàng)目,作為寓教于樂的教學(xué)素材向少年兒童及社區(qū)的天好者推廣。
(三)主題活動三:星空光害旅行團(tuán)(觀測實(shí)踐)
1.選題背景及意義:
對業(yè)余天好者來說,觀星是極大的樂趣所在。然而,嚴(yán)重的光污染正將燦爛的星空從我們身邊
奪走。
為便于普通學(xué)生及其他業(yè)余天好者通過對比觀測,直觀地了解無錫各地的光污染情況,我們依托天一天文社組織的“天一觀星營”項(xiàng)目,開展了“星空光害旅行團(tuán)”活動,帶領(lǐng)旅行團(tuán)的團(tuán)員們利用晚上的時間,去往錫城不同的地點(diǎn),實(shí)地觀測、考察并對比分析星星的數(shù)目,從而普及光污染的防治意識、夜空光度的概念。
2.活動過程和步驟:
(1)編寫觀測方案。指導(dǎo)學(xué)生編寫觀測方案,使用最常見的目視極限星等法,即通過肉眼能觀察到的最暗星等來進(jìn)行估算:選擇2個或2個以上地平高度大于40°的定標(biāo)天區(qū),數(shù)出該天區(qū)內(nèi)能觀察到的恒星數(shù)目,與國際流星組織提供的表格對應(yīng)來確定極限星等。同時,為便于零天文基礎(chǔ)的團(tuán)員參與,我們設(shè)計(jì)了簡易觀測法,請同學(xué)們觀測標(biāo)志性星座所在天區(qū)的恒星數(shù)量,來比較不同地點(diǎn)的光污染程度。
(2)開展觀測實(shí)踐。帶領(lǐng)旅行團(tuán)的團(tuán)員們利用晚上的時間,去往無錫城不同的地點(diǎn),實(shí)地觀測、考察并對比分析星星的數(shù)目。具體觀測過的地點(diǎn)有太湖廣場、馨和苑廣場、天一中學(xué)、斗山、保利廣場、崇安寺廣場、南禪寺廣場、安鎮(zhèn)高鐵新城、太湖十八灣等。(見圖9、圖10)
3.活動效果及呈現(xiàn)方式:
通過“星空光害旅行團(tuán)”活動,結(jié)識了一批無錫地區(qū)的成年及未成年業(yè)余天好者。以此為抓手,天一天文社發(fā)起成立了“無錫市業(yè)余天
好者協(xié)會”QQ群。以此活動為素材撰寫的《星星都去哪兒了》發(fā)表在《天好者》雜志2016年第2期。
(四)主題活動四:光污染攝影大賽(文化藝術(shù))
1.選題背景及意義:
為推動公眾思考光污染在無錫及其所在社區(qū)的狀況,讓公眾參與光污染活動,我們發(fā)起了“光污染攝影大賽”活動。邀請公眾使用攝影設(shè)備捕捉各種光污染的畫面,從而了解及思考無錫地區(qū)乃至全世界日益嚴(yán)重的光污染問題。比賽主題分為:光污染與生態(tài)、光污染與健康、光污染與能源、光污染的分布、光污染的來源等。評選標(biāo)準(zhǔn)主要有:攝影照片視覺美感、作品說明表達(dá)技巧、光污染意涵、手法創(chuàng)意等。
2.活動過程和步驟:
指導(dǎo)學(xué)生起草“光污染攝影大賽章程”,包括組織單位、大賽目的、比賽主題、參賽資格、參賽設(shè)備、照片格式、相關(guān)權(quán)益、比賽日程、評選規(guī)則等。
章程起草完畢后,通過錫天聯(lián)官網(wǎng)、錫天聯(lián)微信公眾號(AUWS2015)、無錫市業(yè)余天好者協(xié)會QQ群(91462404)、牧夫天文論壇無錫天協(xié)專版等渠道向外比賽信息。
投稿截止后,組織專家對作品進(jìn)行評審,并舉辦頒獎儀式。
3.活動效果及呈現(xiàn)方式:
通過光污染攝影比賽,一方面間接了解了無錫地區(qū)光污染的來源、分布情況,另一方面,在公眾中對光污染進(jìn)行了有效的宣傳與普及。光污染攝影作品還被制作成海報(bào),用于專題展覽。
七、活動可能出現(xiàn)的問題及解決預(yù)案
1.項(xiàng)目研究中的技術(shù)問題:
考慮到光污染問題在大陸地區(qū)的研究仍處于起步階段,即便在世界范圍內(nèi)也未引起足夠的重視,我們在開展夜空光度測量時會遇到各種各樣的技術(shù)問題。對此我們的解決方案主要是:
(1)開題報(bào)告與測量指南兩個指
導(dǎo)性文件必須花大力氣保證質(zhì)量,保證指導(dǎo)性和可操作性。
(2)爭取學(xué)校在測光儀采購上的
支持,以及年級組、班主任在學(xué)生活動時間上的支持。
(3)遇到實(shí)在難以解決的技術(shù)問題,請教中科院紫金山天文臺等相關(guān)研究機(jī)構(gòu)。
2.科普實(shí)驗(yàn)中的素材問題:
中學(xué)生的專業(yè)知識儲備畢竟是有限的,對生活的觀察能力也仍有待提高,這直接導(dǎo)致了科普實(shí)驗(yàn)素材的缺乏。對此我們的解決方案主要是:
(1)大量、深度閱讀中小學(xué)階段及國外的實(shí)驗(yàn)手冊,學(xué)習(xí)實(shí)驗(yàn)編寫的一般結(jié)構(gòu),積累與光學(xué)相關(guān)的實(shí)驗(yàn)和科技制作素材。
(2)通過天文科普書籍和天文歷
史故事,尋求實(shí)驗(yàn)和科技制作素材。
(3)面向全校發(fā)起光污染相關(guān)實(shí)
驗(yàn)和科技制作素材的征集活動。
3.觀測實(shí)踐中的安全問題:
夜間開展天文觀測實(shí)踐活動遇到的最大挑戰(zhàn)是人身與財(cái)產(chǎn)安全問題,很多學(xué)生、家長或教師不支持天文活動也主要是對此有深深的顧慮。對此我們的解決方案主要是:
(1)與參加活動的學(xué)生簽訂合同,
并要求學(xué)校同意、學(xué)生簽字、家長簽字。
(2)統(tǒng)一、強(qiáng)制購買意外險(xiǎn),分擔(dān)風(fēng)險(xiǎn)。
(3)與有資質(zhì)、口碑好的旅行社合作,聯(lián)系包車或食宿。
(4)對每一個觀測地點(diǎn)進(jìn)行事先
的實(shí)地探訪,確保觀測地的安全性,遠(yuǎn)離陡坡與水體。
4.攝影大賽中的發(fā)動問題:
攝影大賽看似簡單,就是摁一下快門的事。但真正要發(fā)動公眾參加,激發(fā)大家的熱情卻并不是一件簡單的事。對此我們的解決方案主要是:
(1)通過錫天聯(lián)成員學(xué)校的天文
指導(dǎo)教師,發(fā)動學(xué)生中的天好者參賽。
(2)通過官網(wǎng)、微信公眾號、QQ群等網(wǎng)絡(luò)平臺推送攝影大賽比賽通知。
(3)積極聯(lián)系贊助,為獲獎選手準(zhǔn)備證書、獎杯及獎品。
八、效果評價(jià)標(biāo)準(zhǔn)與方式
在評價(jià)的過程中,堅(jiān)持“主體多元”“方式多樣”“向度多維”等原則。
1.主體多元:
在活動過程中,要求學(xué)生首先進(jìn)行自評和互評,不同組別之間也可以進(jìn)行他評。這有利于加深學(xué)生對評價(jià)標(biāo)準(zhǔn)的認(rèn)識與理解,可以促進(jìn)學(xué)生自我反思和自我發(fā)展。教師在此基礎(chǔ)上,對學(xué)生自評、互評及他評進(jìn)行再評價(jià),保證了評價(jià)的指導(dǎo)性。
2.方式多樣:
在活動過程中,靈活運(yùn)用即時評價(jià)與延時評價(jià)。即時評價(jià)有利于表揚(yáng)先進(jìn),糾正缺陷;延時評價(jià)則體現(xiàn)了尊重、關(guān)愛與期待。此外,還將口頭評價(jià)與書面評價(jià),一次評價(jià)與多次評價(jià),診斷性評價(jià)、過程性評價(jià)與終結(jié)性評價(jià)等多樣化的評價(jià)方式相結(jié)合,以保護(hù)學(xué)生的積極性,強(qiáng)化學(xué)生的成就感。
《教育的樞紐》主要有七個主體章節(jié),主要從公眾關(guān)注的熱點(diǎn)、難點(diǎn)問題入手,對中國高考的一系列重大事件進(jìn)行解讀,并以云南省考試招生工作改革為主旨,詳細(xì)介紹了中央及云南省內(nèi)教育改革和發(fā)展計(jì)劃。在個別章節(jié),作者倡導(dǎo)崇尚實(shí)學(xué)、突破創(chuàng)新的教育風(fēng)氣,主張從現(xiàn)代教育的本質(zhì)和發(fā)展趨勢出發(fā),提出新時期中國教育發(fā)展的新思維,建立符合中國文化特征、符合中國民眾意識、符合時代需要的中國特色社會主義現(xiàn)代教育制度。顯然,這也是華山先生的現(xiàn)代教育理想,它并非單純意義上的改革思路,而是于其中貫穿著的現(xiàn)代教育文化意識。在此基礎(chǔ)上,他列舉了大量事例,運(yùn)用對比、互證等方式,總結(jié)研究出了眾多招考改革經(jīng)驗(yàn)和成果。
讀華山先生的《教育的樞紐》,還產(chǎn)生一些感慨。他說,“文章薈萃了一些實(shí)踐經(jīng)驗(yàn),收藏了一些辛勤付出、聚集了一些關(guān)心呼聲,大多論述的是中國教育改革,都是以當(dāng)事者的身份在解釋、評述、分析和探索教育的發(fā)展與改革,既表達(dá)了自己對中國教育改革成果的欣悅,也展開了自己對中國教育未來發(fā)展的憧憬。”每讀這段話,我都不禁怦然心動。這何嘗不是我們每一位關(guān)心中國教育改革和發(fā)展者的心聲呢!
推薦書目:《教育的樞紐》
作者:朱華山
出版社:云南教育出版社
Mislevy等(1993)指出,統(tǒng)計(jì)測驗(yàn)理論的發(fā)展可以分為經(jīng)典測驗(yàn)理論(Classical Test Theory, CTT)階段、概化理論階段和項(xiàng)目反應(yīng)理論(Item Response Theory, IRT)階段。CTT和IRT 都屬于標(biāo)準(zhǔn)測驗(yàn)理論。標(biāo)準(zhǔn)測驗(yàn)理論視所測的心理特質(zhì)為一個單純的統(tǒng)計(jì)結(jié)構(gòu),目的在于從宏觀上給個體一個整體的評估。隨著心理測量學(xué)和認(rèn)知心理學(xué)的進(jìn)一步發(fā)展和現(xiàn)代教育技術(shù)水平的進(jìn)步,學(xué)習(xí)者更加渴求獲得更具體的、細(xì)微水平的測量與診斷評估。Frederiksen、Mislevy和Bejar(1993)編著的Test theory for a new generation of tests正式出版,標(biāo)志著新一代測量理論的誕生。如圖1所示,認(rèn)知診斷評估逐步走入歷史舞臺,強(qiáng)調(diào)能力水平和認(rèn)知水平維度能夠被同時診斷,不再僅僅是單一的宏觀維度的知識水平。計(jì)算機(jī)化自適應(yīng)認(rèn)知診斷測驗(yàn)(Computerized Adaptive Test for Cognitive Diagnosis, CD-CAT)是計(jì)算機(jī)化自適應(yīng)測驗(yàn)理論和認(rèn)知診斷理論相結(jié)合的產(chǎn)物,目的是達(dá)到因材施教量體裁衣式的自適應(yīng)診斷,根據(jù)學(xué)習(xí)者當(dāng)前狀態(tài),選取與之相適應(yīng)的題目進(jìn)行測試,進(jìn)而診斷學(xué)習(xí)者能力水平和認(rèn)知水平,以診斷報(bào)告的方式為學(xué)習(xí)者提供提升的建議和策略。
縱觀計(jì)算機(jī)技術(shù)與統(tǒng)計(jì)測驗(yàn)的結(jié)合,其發(fā)展分為兩個階段:其一是以項(xiàng)目反應(yīng)理論(IRT)為代表的標(biāo)準(zhǔn)計(jì)算機(jī)自適應(yīng)測量階段;其二指新一代測量理論的計(jì)算機(jī)自適應(yīng)階段(認(rèn)知診斷是其核心內(nèi)容)。項(xiàng)目反應(yīng)理論的特點(diǎn)是以概率函數(shù)的形式來描述項(xiàng)目作答反映結(jié)果是如何受到被試能力水平和項(xiàng)目特征聯(lián)合作用的影響。自適應(yīng)測驗(yàn)起源于Alfred Binet(1904)開發(fā)的智力測驗(yàn),根據(jù)被試的不同特質(zhì)水平和題目的不同難度與區(qū)分度,對被試實(shí)測不同的測驗(yàn)題目,使這些題目與被試的實(shí)際水平盡可能相適應(yīng),這樣使測驗(yàn)更具有針對性,從而每施測一道題就能獲得最大的信息量。
當(dāng)現(xiàn)代技術(shù)手段計(jì)算機(jī)引入到測量領(lǐng)域中,計(jì)算機(jī)化自適應(yīng)測驗(yàn)(Computerized Adaptive Testing, CAT)由此誕生,由計(jì)算機(jī)自動從題庫中選擇合適的題目給學(xué)習(xí)者作答,一方面能夠在學(xué)習(xí)者做完后自動評估其能力水平,給出適合學(xué)習(xí)者的下一道題目;另一方面能夠自動設(shè)定終止規(guī)則,即當(dāng)達(dá)到能夠評估學(xué)習(xí)者能力的題目數(shù)后,測試會自動停止。之后,運(yùn)用CAT思想與認(rèn)知診斷理論結(jié)合,從題庫中選擇最適合學(xué)習(xí)者水平和最能區(qū)分水平能力的題目作答,對其知識狀態(tài)達(dá)到最恰當(dāng)?shù)脑u估。CD-CAT更多關(guān)注被試掌握模式的自適應(yīng),根據(jù)可觀察的行為和反應(yīng),推測潛在的知識結(jié)構(gòu)和技能掌握情況。例如,獲得相同分?jǐn)?shù)的學(xué)生不能夠體現(xiàn)個體差異,如果在測驗(yàn)中能夠?qū)W(xué)生作答反應(yīng)、知識反應(yīng)和能力診斷,從而能夠進(jìn)一步提出補(bǔ)救措施。CD-CAT的流程包括:開始測試初始題目選擇估計(jì)被試當(dāng)前狀態(tài)選題策略認(rèn)知診斷計(jì)量模型終止條件診斷報(bào)告。對于CD-CAT的研究目前處于探索開發(fā)階段,組成CD-CAT各個階段的問題仍需要摸索和實(shí)踐應(yīng)用,例如如何確定知識狀態(tài)和表征能力屬性、認(rèn)知診斷模型的應(yīng)用研究,如何選擇初始題目,以及題庫的開發(fā)、建設(shè)與維護(hù)等方面。
綜上所述,為了從整體上把握CD-CAT在國內(nèi)的發(fā)展脈絡(luò),厘清發(fā)展現(xiàn)狀和研究聚焦,提出實(shí)施CD-CAT的科研建議和實(shí)施策略,分別從以下方面進(jìn)行分析:一方面,以時間(2005-2015年)為軸,考察關(guān)于認(rèn)知診斷自適應(yīng)測試文獻(xiàn)的研究情況,采用內(nèi)容分析方法對已有百余篇中英文文獻(xiàn)進(jìn)行內(nèi)容分析,并通過數(shù)據(jù)的可視化表征和社會網(wǎng)絡(luò)分析工具,探討其研究重心和內(nèi)容;另一方面,通過分析國內(nèi)外已有CD-CAT平臺和項(xiàng)目的實(shí)踐情況,總結(jié)和借鑒國外實(shí)施經(jīng)驗(yàn),為我國今后的CD-CAT研究提供發(fā)展策略。
二、研究過程
(一) 研究方法與工具
本研究主要采用文獻(xiàn)研究法、內(nèi)容分析法和數(shù)據(jù)可視化的方法,通過對有效文獻(xiàn)的各類屬性進(jìn)行分析和標(biāo)識,從而獲得不同維度的計(jì)量分析結(jié)果,即對本質(zhì)內(nèi)容進(jìn)行不同方面、由淺入深、層層遞進(jìn)的非線性分析。研究主要借助軟件管理軟件NoteExpress、數(shù)據(jù)處理軟件SPSS 20.0和詞云生成平臺Tagxedo。首先,界定研究內(nèi)容和范圍CD-CAT;然后,團(tuán)隊(duì)成員分別對2005-2015年的文章進(jìn)行篩選,梳理成為研究樣本;接著,根據(jù)已有文獻(xiàn)確定分析維度,以理論概述、現(xiàn)狀實(shí)踐、研究方法等為分析內(nèi)容,對樣本進(jìn)行統(tǒng)計(jì)和處理。
(二) 數(shù)據(jù)收集
采用內(nèi)容分析法對2005-2015年國內(nèi)發(fā)表的關(guān)于自適應(yīng)認(rèn)知診斷的文獻(xiàn)進(jìn)行比較、分析、綜合,對研究內(nèi)容和現(xiàn)狀進(jìn)行梳理和總結(jié)。為了研究的嚴(yán)謹(jǐn)性和數(shù)據(jù)分析的準(zhǔn)確性,將學(xué)術(shù)論文與畢業(yè)論文分開統(tǒng)計(jì),中文數(shù)據(jù)庫來源有中國知網(wǎng)和萬方數(shù)據(jù)庫,以認(rèn)知診斷和認(rèn)知診斷自適應(yīng)測驗(yàn)為關(guān)鍵詞進(jìn)行搜索,與教育測量和教育技術(shù)領(lǐng)域相關(guān)的文獻(xiàn)匯總?cè)缦拢褐形膶W(xué)術(shù)期刊檢索到140篇,學(xué)位論文68篇;CSSCI期刊主要集中在《北京師范大學(xué)學(xué)報(bào)(社會科學(xué)版)》《教學(xué)學(xué)報(bào)》《心理科學(xué)》《心理科學(xué)進(jìn)展》和《心理學(xué)探新》等。為了對比中英文文獻(xiàn)關(guān)于結(jié)果分析中初步印象部分的差異,即關(guān)注焦點(diǎn)可視化部分,選取以Computerized Adaptive Test for Cognitive Diagnosis和Cognitive Diagnosis為關(guān)鍵詞,在Computers Education、 Computers in Human Behavior和Journal of Computer Assisted Learning(數(shù)據(jù)庫分別為ScienceDirect、SpringerLink、Wiley Online和ERIC)等教育技術(shù)專業(yè)相關(guān)期刊中搜集到論文66篇。
本研究進(jìn)行了兩輪文獻(xiàn)搜索和文獻(xiàn)篩選,共有5名團(tuán)隊(duì)成員參與,針對不同期刊進(jìn)行分工。第一輪主要對目標(biāo)期刊和目標(biāo)關(guān)鍵詞進(jìn)行地毯式搜索,得到中文文獻(xiàn)233篇,英文論文79篇,利用文獻(xiàn)管理工具NoteExpress將其分類保存;第二輪采用內(nèi)容分析法對自適應(yīng)認(rèn)知診斷文獻(xiàn)的關(guān)鍵詞、作者、研究主題進(jìn)行分類,最終確定中文文獻(xiàn)140篇,英文文獻(xiàn)66篇。對作者進(jìn)行分析的主要目的是對不同研究帶頭人和研究單位的分布進(jìn)行研究,以辨識其影響力和規(guī)模。首先,主要對文獻(xiàn)的研究主題進(jìn)行分析。團(tuán)隊(duì)成員基于文獻(xiàn)閱讀和積累對計(jì)算機(jī)自適應(yīng)測試、認(rèn)知診斷、自適應(yīng)認(rèn)知診斷測試的過程進(jìn)行分類,討論之后達(dá)成一致,構(gòu)建初步框架;其次,在上述框架基礎(chǔ)上,根據(jù)文獻(xiàn)的關(guān)鍵詞進(jìn)行記錄。如《小學(xué)數(shù)學(xué)圖形與幾何認(rèn)知診斷測驗(yàn)的編制》一文中,以認(rèn)知診斷、多策略、多級評分和Q矩陣為關(guān)鍵詞,對多策略的多級評分認(rèn)知診斷算法(多級評分廣義聚類判別法,GDD-P)進(jìn)行改進(jìn)與應(yīng)用,并且介紹了測驗(yàn)藍(lán)圖編制、Q矩陣,與單策略認(rèn)知診斷方法進(jìn)行對比,是對算法和理論的深入研究。因此,該文章涉及的分析內(nèi)容分別是:理論研究、Q矩陣、認(rèn)知診斷模型。該文章分析的一致性(5位成員)達(dá)到93%;最后,確定分析框架,對所有文獻(xiàn)進(jìn)行閱讀,完善文獻(xiàn)分析內(nèi)容。
(三) 結(jié)果分析
1. 初步印象:有哪些研究關(guān)注點(diǎn)
本研究選取數(shù)據(jù)可視化詞云的表達(dá)方式展示樣本研究的核心內(nèi)容??紤]到支持中文統(tǒng)計(jì)的功能,選擇統(tǒng)計(jì)平臺Tagxedo(http://tagxedo.com/app.html),詞云支持中文輸入,對文字的輸入內(nèi)容、形狀等可以個性化定義(如圖2所示)。中文詞云中認(rèn)知診斷規(guī)則空間模型和屬性等頻
次最高,領(lǐng)銜關(guān)鍵詞說明了研究領(lǐng)域的聚焦,其中研究問題主要關(guān)注于學(xué)業(yè)評估診斷、認(rèn)知診斷模型驗(yàn)證與應(yīng)用(如DINA模型)、紙筆考試與計(jì)算機(jī)自適應(yīng)考試差異研究與效度研究。可以初步推斷文獻(xiàn)研究集中于CD-CAT的知識屬性、認(rèn)知診斷模型研究等初步應(yīng)用階段。
為了使中英文文獻(xiàn)具有對照意義,同樣選取統(tǒng)計(jì)平臺Tagxedo進(jìn)行詞頻統(tǒng)計(jì)和可視化處理(如圖3所示)。英文詞云中顯示具體的應(yīng)用方法(蒙特卡羅模擬法)、語言程序(R語言)知識評估和學(xué)習(xí)干預(yù)成為僅次于測試、自適應(yīng)等的關(guān)鍵詞。從宏觀角度看,一方面,英文文獻(xiàn)的關(guān)注點(diǎn)更加聚焦,能夠?qū)?shí)際的認(rèn)知模型進(jìn)行測驗(yàn)和實(shí)踐應(yīng)用;另一方面,體現(xiàn)了自適應(yīng)認(rèn)知診斷測驗(yàn)的價(jià)值和意義所在,對學(xué)生的個性化學(xué)習(xí)進(jìn)行指導(dǎo)和教學(xué)干預(yù),利用技術(shù)促進(jìn)測試診斷最大化的實(shí)現(xiàn)。
通過詞云分析,對CD-CAT的研究熱點(diǎn)有了初步了解。研究發(fā)現(xiàn),國內(nèi)的研究關(guān)鍵詞集中在理論基礎(chǔ)、算法改進(jìn)層面,與教育、學(xué)習(xí)等過程關(guān)聯(lián)較少;國外論文分析領(lǐng)域表示逐步通過技術(shù)方法作用于教育領(lǐng)域,與評估評價(jià)、反饋干預(yù)的實(shí)驗(yàn)與應(yīng)用關(guān)聯(lián)較多。如Sanja(2015)以C++面向?qū)ο缶幊陶n程為例,開發(fā)實(shí)現(xiàn)自適應(yīng)測試平臺,選取實(shí)驗(yàn)組與對照組,分別用自適應(yīng)測試和筆紙測試進(jìn)行比較,結(jié)合問卷、訪談的分析方法對自適應(yīng)測試的過程、方法、優(yōu)勢、實(shí)驗(yàn)應(yīng)用進(jìn)行詳細(xì)闡述;Triantafillou(2008)以計(jì)算機(jī)自適應(yīng)測試?yán)碚摓榛A(chǔ),開發(fā)依托移動設(shè)備的自適應(yīng)測試工具,將專家的評價(jià)靈活地運(yùn)用于教育評估過程之中。
2. 漸入佳境:局部剖析
樣本分析單元分別從研究創(chuàng)新點(diǎn)、發(fā)表時間、單位、數(shù)量、研究方法和理論支撐等方面展開,具體統(tǒng)計(jì)維度涵蓋認(rèn)知診斷測驗(yàn)題庫建立、初始題選擇、選題策略、認(rèn)知診斷計(jì)量模型、知識狀態(tài)估計(jì)方法、終止規(guī)則、原始題參數(shù)在線估計(jì)和屬性在線標(biāo)定、理論研究和實(shí)踐應(yīng)用等。
(1) CD-CAT研究歷程分析
借助NoteExpress 統(tǒng)計(jì)學(xué)術(shù)論文和學(xué)位情況,以圖4表現(xiàn)發(fā)展歷程。
作為量體裁衣式的測驗(yàn),CAT始于20世紀(jì)七八十年代。隨著網(wǎng)絡(luò)與科技進(jìn)步,自適應(yīng)測試可謂發(fā)揮到了極致,如GRE、GMAT、美國注冊管理會計(jì)師(CMA)等等。以認(rèn)知診斷理論為基礎(chǔ)的CD-CAT相比較于CAT,更加能夠利用項(xiàng)目屬性和認(rèn)知模型優(yōu)勢,進(jìn)行診斷性的測驗(yàn)編制和評測。從圖4可以看出,我國的發(fā)展從2006年起步,2008年研究文獻(xiàn)逐步增多,例如曾彥鈞等人(2006)提出CD-CAT以認(rèn)知結(jié)構(gòu)為基礎(chǔ),在題庫建設(shè)、起始規(guī)則、選題策略、被試知識狀態(tài)估計(jì)、終止規(guī)則和曝光率等部分與傳統(tǒng)的CAT有很大區(qū)別。2011年,是學(xué)術(shù)論文和學(xué)位論文發(fā)展的高峰,之后學(xué)位論文研究數(shù)量所有下滑,期刊論文數(shù)量變化不大。
(2)CD-CAT研究內(nèi)容分析
參照認(rèn)知診斷評估的主要步驟包括:①描述測量目的和確定屬性;②創(chuàng)建認(rèn)知模型;③設(shè)計(jì)測驗(yàn)Q矩陣;④開發(fā)或選擇認(rèn)知診斷模型(CDM);⑤評估Q矩陣和CDM;⑥模型參數(shù)估計(jì);⑦評估診斷與干預(yù)。其中有的步驟可能循環(huán)或者迭代。對文獻(xiàn)的研究內(nèi)容進(jìn)行歸類(如表1所示)。
研究團(tuán)隊(duì)詳細(xì)閱讀140篇學(xué)術(shù)文獻(xiàn),發(fā)現(xiàn)很多文獻(xiàn)聚焦于診斷模型、Q矩陣,以及概況綜述和自適應(yīng)認(rèn)知診斷流程描述的研究,缺少完整的實(shí)踐應(yīng)用的成功案例。統(tǒng)計(jì)數(shù)據(jù)表明:
①相比較于國外CD-CAT,國內(nèi)相關(guān)研究進(jìn)程較慢,并且研究內(nèi)容集中在理論概述和小規(guī)模的實(shí)驗(yàn)證明上,缺乏大規(guī)模應(yīng)用CD-CAT相關(guān)的文獻(xiàn)支持??梢姡瑖鴥?nèi)自適應(yīng)的教育評價(jià)方式應(yīng)用還未大范圍普及,通過技術(shù)診斷學(xué)習(xí)者的能力水平和知識水平,并且提供有效的教學(xué)干預(yù)的案例還不夠成熟。
②基礎(chǔ)理論研究占文獻(xiàn)總數(shù)的74.2%。例如,唐小娟、丁樹良和俞宗火(2012)提出計(jì)算機(jī)化自適應(yīng)測驗(yàn)在認(rèn)知中的應(yīng)用,分別從認(rèn)知診斷模型、題庫建設(shè)、起始規(guī)則、選題策略、被試知識狀態(tài)和終止規(guī)則等幾部分進(jìn)行了詳細(xì)介紹。有64篇文獻(xiàn)(45.7%)對認(rèn)知診斷模型進(jìn)行介紹。截至2007年,常見的認(rèn)知診斷模型有補(bǔ)償模型LLTM(線性邏輯斯蒂克測驗(yàn)?zāi)P停┖蚆IRT-C等,非補(bǔ)償模型RSM(規(guī)則空間模型)、DINA(確定性輸入噪音與門模型)、HO-DINA(高階DINA模型)、RUM(融合模型)和AHM(屬性層級模型)。
③實(shí)驗(yàn)實(shí)踐比例為30%,其中有10%的文獻(xiàn)敘述了相應(yīng)的教育干預(yù)措施,例如數(shù)學(xué)、物理、化學(xué)和英語??荡夯ǖ龋?015)以小學(xué)數(shù)學(xué)與幾何的知識點(diǎn)和問題解決能力作為認(rèn)知屬性的分類,定義了數(shù)學(xué)知識和認(rèn)知過程,并采用口語報(bào)告法對認(rèn)知模型進(jìn)行質(zhì)性驗(yàn)證,選取某校六年級1,128名學(xué)生進(jìn)行了測驗(yàn)。
近幾年,新模型的研究也為自適應(yīng)認(rèn)知診斷測試研究開拓了一片新天地,例如祝玉芳等(2009)的多級評分AHM模型,涂冬波等(2010)提出多級評分DINA模型。余娜(2009)提出診斷模型的評估問題由信度和效度決定,認(rèn)知診斷評估中信度采用校正之后的模型產(chǎn)生兩組平行的模擬考生,分布估計(jì)每組掌握情況,計(jì)算相同考生被劃分到相同屬性掌握狀態(tài)的百分比。
3. 升華:合作關(guān)系追蹤
科學(xué)領(lǐng)域的研究往往存在學(xué)術(shù)帶頭人,也往往會以學(xué)術(shù)帶頭人為核心形成研究領(lǐng)域的網(wǎng)絡(luò)關(guān)系。本研究借鑒魏順平等(2008)提出的新的n-派系定義,利用研究者合作關(guān)系網(wǎng)絡(luò)研究,建立作者A-作者B關(guān)聯(lián)關(guān)系。在社會網(wǎng)絡(luò)分析中,派系(subgroup)是社群中的一小群人關(guān)系特別緊密。
首先,借助Excel統(tǒng)計(jì)研究者與文獻(xiàn)之間的關(guān)聯(lián)表(如表2所示),以作者-文獻(xiàn)-單位的方式表現(xiàn)。
本研究中CD-CAT文獻(xiàn)量大于5篇的作者見表3,通過論文作者和機(jī)構(gòu)分析發(fā)現(xiàn),大部分文獻(xiàn)作者來源于高校和研究所,并且主要來源于江西師范大學(xué)的心理學(xué)院和計(jì)算機(jī)信息工程學(xué)院,以及北京師范大學(xué)心理學(xué)院。究其原因,計(jì)算機(jī)自適應(yīng)認(rèn)知診斷測驗(yàn)研究屬于專業(yè)性較強(qiáng)、理論基礎(chǔ)扎實(shí)的研究領(lǐng)域,高校師生是新理念和方法的發(fā)起者和倡導(dǎo)者。認(rèn)知診斷測試的最終目的在于以K-12教育為代表的評估教育,能夠?qū)崿F(xiàn)學(xué)習(xí)者的自適應(yīng)學(xué)習(xí)和診斷評價(jià)。文獻(xiàn)分布說明研究內(nèi)容處于高校實(shí)驗(yàn)室階段,缺乏社會的廣泛關(guān)注、實(shí)踐和推廣應(yīng)用。
接下來,通過UCINET軟件呈現(xiàn)51個節(jié)點(diǎn),借助作者間的合作,觀察圖中度計(jì)算并排序,選出處于前列的若干位作者(假定中心作者為學(xué)術(shù)帶頭人),然后計(jì)算以丁樹良為中心的合作關(guān)系網(wǎng)絡(luò)圖,如表4所示。
由于文章作者合作較多,本研究以文獻(xiàn)篇數(shù)最多的丁樹良派系作為研究范例,將上表的矩陣導(dǎo)入U(xiǎn)CINET中,并繪圖(DRAW)得到科研合作關(guān)系網(wǎng)絡(luò)圖(如圖5)。
兩個節(jié)點(diǎn)的連線表示這兩個節(jié)點(diǎn)存在合作論文的關(guān)系,線條的粗細(xì)表示合作論文的篇數(shù),線條越粗,則合作論文數(shù)量越多。
采用UCINET 社會網(wǎng)絡(luò)分析軟件將這些派系進(jìn)行可視化處理。研究結(jié)果表明:
(1) 目前教育技術(shù)研究領(lǐng)域的合作類型主要為師生合作,較少跨校、跨區(qū)域合作;也存在少數(shù)的跨區(qū)域合作,因此形成了星狀輻射型。
(2) CD-CAT研究應(yīng)走出團(tuán)隊(duì)、校門,甚至跨越國界,開展跨校、跨區(qū)域、跨學(xué)科的科研合作,優(yōu)化研究團(tuán)隊(duì)構(gòu)成,從而進(jìn)一步提高研究質(zhì)量,加快知識擴(kuò)散。
三、CD-CAT研究項(xiàng)目現(xiàn)狀
接下來對國內(nèi)外認(rèn)知診斷自適應(yīng)測試的實(shí)驗(yàn)與應(yīng)用進(jìn)行詳細(xì)介紹。從上述文獻(xiàn)分析可知,國內(nèi)實(shí)踐案例較少,本研究團(tuán)隊(duì)經(jīng)過大量內(nèi)容采集和梳理,選取相對規(guī)模較大的實(shí)驗(yàn)案例分別進(jìn)行闡述。而國外相對起步較早,2001年美國通過No Child Left Behind Act of 2001,表明有義務(wù)將施測結(jié)果告知學(xué)生和家長。因此,診斷測試的價(jià)值和意義不再僅僅是提供分?jǐn)?shù),而是需要提供補(bǔ)救措施等。本研究列舉美國應(yīng)用較為廣泛的Smarter Balanced Assessment Consortium和最大的自適應(yīng)系統(tǒng)平臺Knewton,并分別闡釋。
2009年,教育部基礎(chǔ)教育司組織北京師范大學(xué)、江西師范大學(xué)和中央教育科學(xué)研究所(現(xiàn)中國教育科學(xué)研究院)等一大批研究學(xué)者,以數(shù)學(xué)和英語為考試切入點(diǎn),考察學(xué)生的核心知識和能力水平,以此命題進(jìn)行認(rèn)知診斷完成353道題目的編訂并且設(shè)定1套公共錨題,運(yùn)用DINA模型進(jìn)行診斷分析。
在北京師范大學(xué)心理學(xué)院劉紅云教授、美國伊利諾伊香檳分校張華華教授共同合作的The development of computerized adaptive testing with cognitive diagnosis for an English achievement test in China一文中介紹的研究,以國家基礎(chǔ)教育課程教材發(fā)展中心學(xué)生學(xué)業(yè)質(zhì)量評價(jià)項(xiàng)目為依托,闡述了其在北京、大連等地進(jìn)行計(jì)算機(jī)認(rèn)知診斷的大規(guī)模測試的情況。由于軟件和硬件以及專業(yè)技能的限制,將CD-CAT應(yīng)用于學(xué)校項(xiàng)目是一個巨大的挑戰(zhàn),該項(xiàng)目克服傳統(tǒng)C/S(Client/Server)框架,將B/S(Browser/Server)架構(gòu)設(shè)計(jì)應(yīng)用于國內(nèi)的英語二級考試中。來自北京8所小學(xué)的584名學(xué)生首先參與了基于Web環(huán)境的測試,該測試有36道固定長度題目,規(guī)定40分鐘內(nèi)完成。該實(shí)驗(yàn)驗(yàn)證了CD-CAT應(yīng)用于大規(guī)模考試的巨大潛力和高效性,同時參與測試的考生可以從中獲取技能掌握情況的診斷報(bào)告,為后續(xù)進(jìn)行學(xué)習(xí)干預(yù)和學(xué)習(xí)路徑調(diào)整提供了可能。此后,2011年1月,大約3萬名遼寧省大連市的五年級學(xué)生參加CD-CAT英語能力測試,該平臺利用網(wǎng)絡(luò)技術(shù)和自適應(yīng)診斷技術(shù),持續(xù)三天、同一時間承載2000人并發(fā)的測試。在此過程中,對題庫的優(yōu)化、采用香農(nóng)熵方法選題算法,以及內(nèi)容平衡和考試藍(lán)圖的限制的編制,都進(jìn)行了較好的實(shí)驗(yàn)。一方面,為學(xué)生和教師提供作答情況評定和診斷報(bào)告;另一方面,為研究者提供對CD-CAT效度全面審視的實(shí)踐機(jī)會,為認(rèn)知診斷技術(shù)的大規(guī)模推廣奠定了堅(jiān)實(shí)的基礎(chǔ)。
美國也有諸多公司關(guān)注和投入CAT的領(lǐng)域,如ASSESSMENT SYSTEMS的Smarter Balanced評估 系統(tǒng)(http://smarterbalanced.org/practice-test/)。在能力測驗(yàn)方面,主要應(yīng)用于評估學(xué)生的英語和數(shù)學(xué)能力。2010年,美國針對K-12提出了全美教育標(biāo)準(zhǔn)(Common Core States Standards, 簡稱CCSS),用于評估各個年級學(xué)生的數(shù)學(xué)能力和英語能力,并且已經(jīng)在全美46個州和哥倫比亞區(qū)施行。Smarter Balanced 評估系統(tǒng)利用強(qiáng)制性的終結(jié)性評價(jià)和可選的中期評估來提升計(jì)算機(jī)自適應(yīng)測試(CAT)的效率。在該評估系統(tǒng)中,計(jì)算機(jī)程序可以根據(jù)學(xué)生的響應(yīng)來調(diào)整整個評估問題的難度。例如,一個學(xué)生如果回答正確,則會收到一個更具挑戰(zhàn)性的題目,而一個不正確的答案產(chǎn)生一個更簡單的問題。通過適應(yīng)學(xué)生的能力水平,系統(tǒng)推薦了一系列量身定制的測驗(yàn)問題給每個學(xué)生,可以快速識別哪些技能學(xué)生已經(jīng)掌握,哪些知識維度學(xué)生還沒有掌握。Smarter Balanced Practice Tests包括評分指南,現(xiàn)可用于三年級到八年級的英語、藝術(shù)和數(shù)學(xué)的認(rèn)知診斷,能夠?yàn)閷W(xué)習(xí)者提供一份可預(yù)覽的Smarter Balanced評估,清晰地反映每一位考生在當(dāng)前學(xué)習(xí)中每一門學(xué)科中的強(qiáng)項(xiàng)和弱項(xiàng),以及在未來學(xué)習(xí)中需要重點(diǎn)關(guān)注的領(lǐng)域。這種計(jì)算機(jī)評估能夠方便家長、校長和老師在很短的時間內(nèi)看到成效,并且通過這些診斷反饋,對學(xué)生因材施教,滿足其個性化學(xué)習(xí)需求。
此外,熟知的Knewton公司基于項(xiàng)目反應(yīng)理論,真實(shí)地測量出學(xué)生對知識點(diǎn)的掌握程度,避免因題目的難易程度不同造成測量誤差。Knewton自適應(yīng)系統(tǒng)利用學(xué)生的歷史學(xué)習(xí)數(shù)據(jù)的網(wǎng)絡(luò)效應(yīng)來優(yōu)化推薦,提高學(xué)生學(xué)習(xí)效率。建立學(xué)生學(xué)習(xí)檔案,預(yù)設(shè)一些學(xué)習(xí)路徑點(diǎn)(根據(jù)知識技能圖譜),根據(jù)實(shí)際學(xué)生的使用數(shù)據(jù)(學(xué)習(xí)資源的使用效果和學(xué)習(xí)路徑點(diǎn)的學(xué)習(xí)效果),為后來的學(xué)習(xí)者推送下一個學(xué)習(xí)路徑點(diǎn)和學(xué)習(xí)資源。
綜上所述,國外CD-CAT發(fā)展已經(jīng)將智能學(xué)習(xí)系統(tǒng)、評估系統(tǒng)和教育測評融入其中。雖然從應(yīng)用角度來說,自適應(yīng)的成分居多,認(rèn)知的成分較少,但是將診斷功能結(jié)合到計(jì)算機(jī)自適應(yīng)測驗(yàn)中,已經(jīng)成為研究熱點(diǎn)之一,吸引了眾多學(xué)者繼續(xù)推進(jìn)CD-CAT的實(shí)施應(yīng)用。雖然國內(nèi)很多研究者已經(jīng)意識到CD-CAT的優(yōu)勢,也有研究者提出了中國教育進(jìn)展評估基于CD-CAT的改進(jìn)與展望,但是實(shí)踐應(yīng)用還處于研究或者起步階段。例如實(shí)際教學(xué)過程中,對相同分?jǐn)?shù)的學(xué)生還不能從能力和認(rèn)知水平角度進(jìn)行很好的診斷和評估,教師往往僅根據(jù)個人經(jīng)驗(yàn)來判斷學(xué)生的知識掌握狀態(tài)和認(rèn)知錯誤,其教學(xué)設(shè)計(jì)與教學(xué)干預(yù)不能滿足學(xué)生的個性化需求。
四、對我國教育評價(jià)診斷的啟示
新一代測驗(yàn)理論階段在認(rèn)知水平的研究范式下產(chǎn)生,強(qiáng)調(diào)測驗(yàn)應(yīng)同時在宏觀能力水平和微觀認(rèn)知水平下進(jìn)行,認(rèn)知水平的研究應(yīng)深入到被試作答的認(rèn)知加工過程,其目的在于診斷認(rèn)知能力結(jié)構(gòu),亦在于揭示不同被試的認(rèn)知加工特點(diǎn),是能力水平研究的深入。認(rèn)知診斷實(shí)現(xiàn)了傳統(tǒng)教育考試無法企及的診斷功能,它在實(shí)踐中的運(yùn)用價(jià)值是不言而喻的:根據(jù)診斷結(jié)果,學(xué)生可以有針對性地學(xué),教師可以有針對性地教;教育教學(xué)機(jī)構(gòu)部門來說則可以了解當(dāng)前教育情況,為教育規(guī)劃及教育決策的制定提供依據(jù)。
計(jì)算機(jī)自適應(yīng)認(rèn)知診斷測試在教育評估中具有重要的發(fā)展意愿,目前混合式的學(xué)習(xí)環(huán)境中需要個性化的、實(shí)時的、及時的診斷和評估報(bào)告。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,MOOC等一大批在線課程蜂擁而至,但縱觀眾多網(wǎng)絡(luò)課程和實(shí)踐研究,其中缺少對學(xué)習(xí)者量體裁衣式的診斷評估。同時,在我國教育的測評中,紙筆考試仍舊保留重要地位,然而缺少有效甄別、準(zhǔn)確評估和學(xué)習(xí)知識建議等內(nèi)容。同時,隨著高考改革的實(shí)施與推進(jìn),構(gòu)建健全的教育評價(jià)體系顯得尤為重要。通過針對學(xué)習(xí)過程、學(xué)習(xí)能力評價(jià)的綜合診斷方法,可以提升學(xué)生綜合素質(zhì)。華南師范大學(xué)心理學(xué)院張敏強(qiáng)教授談到如何運(yùn)用認(rèn)知診斷方法與技術(shù)來評價(jià)學(xué)生的認(rèn)知能力,從而讓學(xué)生知道自己優(yōu)勢在哪里、不足在哪里、有什么方法可以補(bǔ)救。
因此,本研究結(jié)合我國發(fā)展現(xiàn)狀與需求和國外已有應(yīng)用研究的優(yōu)勢,對國內(nèi)教育評價(jià)如何走向CD-CAT提出以下建議:
(一)教育評估方面
相比經(jīng)典測量理論和項(xiàng)目反應(yīng)理論,認(rèn)知診斷理論能把認(rèn)知過程與測量手段結(jié)合起來,不僅能對考生的整體水平做出評價(jià),還可以將考生的認(rèn)知結(jié)構(gòu)模式化,利用合適的測量模型對不同的認(rèn)知結(jié)構(gòu)模式進(jìn)行診斷,從而定時考察學(xué)生的認(rèn)知結(jié)構(gòu)和個體差異。認(rèn)知診斷方法可以應(yīng)用于會考、能力水平考試;課堂上運(yùn)用認(rèn)知診斷功能,可以幫助教師分析學(xué)生的優(yōu)勢和不足,不僅能對學(xué)生的整體水平進(jìn)行評價(jià),還能將學(xué)生的認(rèn)知結(jié)構(gòu)模式化,通過數(shù)據(jù)定量地分析出學(xué)生的認(rèn)知結(jié)構(gòu)和個體差異,這樣得到的信息量大且細(xì),有助于個性化教學(xué)的實(shí)現(xiàn)。
1. 重視測量工具的研究和應(yīng)用
實(shí)現(xiàn)個性化的測試平臺和題庫,不僅需要熟悉測量理論,還需要掌握測量模型和工具、計(jì)算機(jī)程序、統(tǒng)計(jì)程序等,因而需要有關(guān)教育部門與研究團(tuán)隊(duì)投入人力、物力,依托信息技術(shù)、網(wǎng)絡(luò)技術(shù)和硬件設(shè)備開發(fā)有價(jià)值的題庫和測試平臺。
2. 對教師進(jìn)行評測培訓(xùn)
認(rèn)知診斷測試過程中,教師不僅能夠依據(jù)經(jīng)驗(yàn)和教學(xué)目標(biāo)提供考試題目,而且需要對學(xué)生所需的認(rèn)知水平和能力水平進(jìn)行詳細(xì)劃分,與研究團(tuán)隊(duì)配合共同繪制測驗(yàn)藍(lán)圖,從而確定測試屬性和知識點(diǎn)。因此,教育評測的培訓(xùn)是教學(xué)過程中必不可少的工具,對教師的專業(yè)培訓(xùn)尤其重要。
3. 題庫和測試平臺的地位
相比較紙筆考試,CD-CAT能夠更快地獲知考試成績或者錄取結(jié)果,測試能夠不受時間和地點(diǎn)限制,考試環(huán)境更加舒適和個性化。通過搭建題庫和測試平臺,能夠保障和實(shí)現(xiàn)認(rèn)知診斷自適應(yīng)測試:既快速獲取診斷結(jié)果、報(bào)告,又可實(shí)施大規(guī)模題庫,保障大部分學(xué)生的考試題目難度和區(qū)分度一致,為教育公平提供可能。
(二)科研創(chuàng)新方面
打造精銳團(tuán)隊(duì),延伸研究深度。從文獻(xiàn)數(shù)據(jù)分析說明,目前我國研究派系較為集中,能夠拓展實(shí)踐應(yīng)用的驅(qū)動項(xiàng)目較少。因此,應(yīng)當(dāng)加強(qiáng)跨團(tuán)隊(duì)、跨區(qū)域甚至跨國界的學(xué)術(shù)交流和合作,共享資源與經(jīng)驗(yàn),共同豐富和深化CD-CAT。
(三)實(shí)踐應(yīng)用方面
1. 利用現(xiàn)有資源進(jìn)行校際合作
當(dāng)前大部分測驗(yàn)只能提供單一的測驗(yàn)總分或能力值,但是具有相同分?jǐn)?shù)或能力值學(xué)生的認(rèn)知結(jié)構(gòu)(或稱知識狀態(tài))可能不同,因此,對他們采取的教學(xué)補(bǔ)救措施是不一樣的。由此產(chǎn)生了一個很重要的問題:如何才能精確地測量出學(xué)生的知識狀態(tài)呢?認(rèn)知診斷理論能夠回答該問題。
一、認(rèn)知診斷的發(fā)展
理論和實(shí)際需求推動了認(rèn)知診斷的快速發(fā)展。理論上,認(rèn)知診斷的計(jì)量模型可以提供一個有效機(jī)制來驗(yàn)證認(rèn)知理論;實(shí)踐中,美國政府于2001年提出的《不讓一個孩子掉隊(duì)》的法案更是促進(jìn)了認(rèn)知診斷的蓬勃發(fā)展。其實(shí)早在20世紀(jì)80年代,就已經(jīng)有眾多學(xué)者開始注重認(rèn)知科學(xué)和心理測量學(xué)的結(jié)合對教育領(lǐng)域的指導(dǎo)作用。Glaser曾批判傳統(tǒng)的教育測驗(yàn)缺乏對被測心理特征的關(guān)注[1],Snow和Lohman在其編寫的《認(rèn)知心理學(xué)對教育測量的影響》中曾預(yù)測,教育測驗(yàn)可能會要求提供更多的學(xué)習(xí)診斷及教學(xué)指導(dǎo)信息。Nichols首次將認(rèn)知科學(xué)和心理測量學(xué)的結(jié)合稱作認(rèn)知診斷評估,并在1995年出版專著《認(rèn)知診斷評估》,從而使得該名稱沿用至今[2]。Stout認(rèn)為在21世紀(jì),認(rèn)知診斷將會成為新的測驗(yàn)范式[3],并得到廣泛的研究。許多認(rèn)知診斷研究者先后出版專著,從各個角度詳細(xì)地介紹了認(rèn)知診斷理論及其應(yīng)用,其中包括:Leighton和Gierl在2007年出版的《教育認(rèn)知診斷評估:理論及應(yīng)用》[4],Tatsuoka于2009年出版的《認(rèn)知評估:規(guī)則空間簡介》[5],以及Rupp等人于2010年出版的《診斷測量:理論,方法及應(yīng)用》[6]。
近幾年國際和國內(nèi)更是掀起了認(rèn)知診斷的研究熱潮。2012年9月在南昌舉辦的第十屆海峽兩岸心理與教育測驗(yàn)學(xué)術(shù)研討會出版了專著《認(rèn)知診斷理論、方法與應(yīng)用》,對國內(nèi)的認(rèn)知診斷研究起到了極大的推動作用。作者僅在CNKI輸入“認(rèn)知診斷”關(guān)鍵詞查詢所有期刊后,就得到了23835條結(jié)果,而且呈逐年遞增趨勢,可以看出認(rèn)知診斷研究正在蓬勃發(fā)展。
二、認(rèn)知診斷的相關(guān)理論
認(rèn)知診斷理論主要包含Q矩陣?yán)碚摷罢J(rèn)知診斷模型(CDM)兩部分,下面分別對這兩部分進(jìn)行介紹。
(一)Q矩陣?yán)碚?/p>
Q矩陣?yán)碚摰南闰?qū)是Tatsuoka教授,她認(rèn)為Q矩陣?yán)碚撚_定學(xué)生不可直接觀察的知識狀態(tài),并且運(yùn)用可以直接得到的觀察反應(yīng)模式(ORP)表示這些知識狀態(tài)[7]。學(xué)生的知識狀態(tài)由屬性向量表征,“屬性”表示測驗(yàn)項(xiàng)目的特征,是學(xué)生正確解決特定項(xiàng)目所需要的認(rèn)知加工能力和技能[8]。一個完整的Q矩陣?yán)碚摪簩傩詫蛹壗Y(jié)構(gòu)(AHS)、鄰接矩陣(A)、可達(dá)矩陣(R)、縮減矩陣(Qr)、學(xué)生Q矩陣(Qs)、測驗(yàn)Q矩陣(Qt)及期望反應(yīng)模式(ERP)[9]。下面用一個具體例子對Q矩陣?yán)碚撨M(jìn)行詳細(xì)闡述。圖1為假定的關(guān)于某份認(rèn)知診斷測驗(yàn)的屬性層級結(jié)構(gòu)。
如圖1所示,該份測驗(yàn)界定的6個屬性之間存在層級關(guān)系。例如,屬性1是屬性2和4的先決條件,即掌握屬性2之前必須首先掌握屬性1。這種層級關(guān)系是必要的,比如掌握乘法之前,必須先掌握加法。根據(jù)圖1所示結(jié)構(gòu),可以得到鄰接矩陣A陣,它是描述屬性間直接關(guān)系的矩陣,圖1的A陣如表1左側(cè)所示。由A與同階單位陣I的和A+I,通過Warshall算法可得到可達(dá)矩陣R陣,它是描述屬性間直接、間接以及和自身關(guān)系的矩陣,如表1所示。
注:A1-A6表示圖1中的6個屬性,“1”表示存在關(guān)系,“0”表示不存在關(guān)系
在得到R陣之后,可以通過刪除法[7]或擴(kuò)張算法[10]導(dǎo)出所有可能存在的項(xiàng)目類別,即在圖1所示的屬性層級結(jié)構(gòu)之下,一份測驗(yàn)?zāi)軌蚓幹瞥鰜淼念}目類型,記作縮減矩陣Qr陣,行代表屬性,列代表項(xiàng)目類。在圖1所示的層級結(jié)構(gòu)下,最多只能出15種類型的題目,如表2所示。
將Qr矩陣轉(zhuǎn)置并加上一列全0向量(代表該學(xué)生一個屬性都未掌握)即可得到圖1下所有可能的知識狀態(tài)的集合,共有16種知識狀態(tài)。
測驗(yàn)Q矩陣,即Qt矩陣是由Qr陣的列自由組合得到,但有一點(diǎn)十分關(guān)鍵,即自由組合中必須包含R陣,這樣才能使學(xué)生的知識狀態(tài)與期望反應(yīng)模式一一對應(yīng)[11],換句話說,Qt矩陣中必須包含R陣,才能保證對學(xué)生知識狀態(tài)評估的精確性。
期望反應(yīng)模式指學(xué)生在不存在任何失誤和猜測的情況下對題目的作答反應(yīng)模式,即學(xué)生掌握了題目考察的屬性就能答對該題,只要有一個屬性未掌握就答不對該題。但現(xiàn)實(shí)中,學(xué)生在作答時或多或少都會存在一些失誤或猜測,因此,期望反應(yīng)模式是一種理想化的反應(yīng)模式。
對上述概念進(jìn)行串聯(lián)之后,我們可以通過圖2來理解Q矩陣?yán)碚摚?/p>
(二)認(rèn)知診斷模型
測驗(yàn)施測后,只能得到學(xué)生的作答數(shù)據(jù),要想得到學(xué)生的知識狀態(tài),就需要使用認(rèn)知診斷模型進(jìn)行估計(jì)。目前開發(fā)出來的認(rèn)知診斷模型已達(dá)100多種[12]。下面僅簡單介紹幾個比較常用的認(rèn)知診斷模型。
1.線型邏輯斯蒂克特質(zhì)模型(LLTM)
Fischer提出的LLTM模型是認(rèn)知診斷模型的雛形[13],它是在Rasch模型的基礎(chǔ)上改造而成的,其模型為:
,其中θi是學(xué)生的能力參數(shù),bj是題目的難度參數(shù),qjk是屬性k在題目 j上的復(fù)雜度計(jì)分, K為測量到的屬性個數(shù),ηk是屬性k的復(fù)雜度權(quán)重,d是標(biāo)準(zhǔn)化常數(shù)。LLTM用屬性復(fù)雜度的線性組合表征題目難度,屬性對題目的貢獻(xiàn)越大,則題目的難度也越大。
2.規(guī)則空間模型(RSM)
Tatsuoka提出的規(guī)則空間模型是一種基于模式識別和分類技術(shù)的診斷方法。該方法首先基于Q矩陣?yán)碚摚治龀鰷y驗(yàn)考察的所有認(rèn)知屬性以及每道題目考察了這些認(rèn)知屬性中的哪些,同時還能確定學(xué)生所有可能的知識狀態(tài)種類。RSM認(rèn)為學(xué)生的作答還會出現(xiàn)失誤和猜測兩種意外情況,這時學(xué)生的ORP會與其ERP不符,那么該如何基于ORP估計(jì)出學(xué)生的知識狀態(tài)呢?RSM根據(jù)項(xiàng)目反應(yīng)模型計(jì)算出一組序偶R(θ,ζ),它在規(guī)則空間中是一個坐標(biāo)點(diǎn),稱為純規(guī)則點(diǎn)。θ是學(xué)生的能力參數(shù),ζ是基于項(xiàng)目反應(yīng)理論的一個警戒指標(biāo),表示能力為θ的學(xué)生其實(shí)際作答反應(yīng)模式偏離其真實(shí)能力水平相對應(yīng)的項(xiàng)目反應(yīng)模式的程度?;贠RP,可以計(jì)算出每個學(xué)生的序偶,然后使用貝葉斯判別或馬氏距離判別可將學(xué)生判歸為某個純規(guī)則點(diǎn),這個純規(guī)則點(diǎn)即代表了相應(yīng)的知識狀態(tài)。
3.屬性層級模型(AHM)
AHM是在RSM的基礎(chǔ)上發(fā)展起來的,該模型同樣采用了RSM模型的Q矩陣?yán)碚摚袃牲c(diǎn)不同之處。第一,AHM強(qiáng)調(diào)首先要界定好屬性及其層級結(jié)構(gòu),據(jù)此來編制診斷測驗(yàn),RSM是在現(xiàn)有測驗(yàn)的基礎(chǔ)之上,反推屬性及其層級結(jié)構(gòu)。第二,AHM根據(jù)最大相似概率對學(xué)生進(jìn)行判別,RSM通過建立規(guī)則空間,使用距離判別法對學(xué)生進(jìn)行判別。Leighton等提出了兩種基于項(xiàng)目反應(yīng)理論和概率論的分類方法:A方法和B方法。
方法A:
,其中
sj(01)表示學(xué)生i的期望反應(yīng)為0,但觀察反應(yīng)為1的所有題目的集合;sj(10)表示學(xué)生i的期望反應(yīng)為1,但觀察反應(yīng)為0的所有題目的集合。P(θi)為學(xué)生i的正確作答概率,由項(xiàng)目反應(yīng)模型估計(jì)得到。
方法B:
。該方法與A方法的區(qū)別在于,B方法認(rèn)為擁有某個觀察反應(yīng)模式的學(xué)生,掌握了所有邏輯包含在其中的期望反應(yīng)模式的屬性組合,對于那些邏輯不包含的期望反應(yīng)模式,只需考慮失誤而不需考慮猜測[14]。
4.確定性輸入,噪音“與”門模型(DINA)
DINA模型是具有顯式項(xiàng)目特征函數(shù)的診斷模型[15],其數(shù)學(xué)表達(dá)式為:
,其中
是潛在反應(yīng)指標(biāo),具體含義是指,若學(xué)生i掌握了項(xiàng)目j所考察的全部屬性,則ηj=1,否則,ηj=0。從中可以看出,DINA模型能將學(xué)生分為兩類,一類是掌握了題目考察的全部屬性,一類是至少有一個題目考察的屬性未掌握。αik 指學(xué)生i是否掌握了第k個屬性(k=1,2,…,K), αik =1表示掌握,αik =0表示未掌握。qjk表示項(xiàng)目j是否考察了屬性k,若qjk=1表示考察了,qjk=0表示未考察。sj是題目的失誤參數(shù),它表示學(xué)生 i 掌握了題目 j 考察的全部屬性,反而答錯的概率;gj是題目的猜測參數(shù),它表示學(xué)生 i 未全部掌握題目 j 考察的屬性,反而答對的概率。一個質(zhì)量較好的題目,應(yīng)該具有較小的 sj 和 gj 參數(shù),并且要滿足1-sj>gj[16]。
5.融合模型(FM)
FM被認(rèn)為是一個很成功的認(rèn)知診斷模型[17],其數(shù)學(xué)表達(dá)式為:
。
其中
,表示掌握題目j考察的全部屬性的學(xué)生的正確作答概率,也稱作題目的難度參數(shù),其值越大,題目難度越小。
表示學(xué)生未掌握屬性k所帶來的懲罰,每少掌握一個題目j考察的屬性,正答概率就會下降。r*ik也稱作屬性區(qū)分度,其值越小表明屬性越重要。cj 表示學(xué)生答對項(xiàng)目 j 所需殘余能力的程度,它是表征 Q 矩陣完整性的指標(biāo),cj值越大說明 Q 矩陣界定越完備[18]。
三、認(rèn)知診斷測驗(yàn)編制方法
認(rèn)知診斷測驗(yàn)與傳統(tǒng)測驗(yàn)的主要區(qū)別在于:(1)認(rèn)知診斷測驗(yàn)的目的是偵查出學(xué)生的知識漏洞,進(jìn)而采取針對性的補(bǔ)救措施,促進(jìn)個體的認(rèn)知發(fā)展;而傳統(tǒng)測驗(yàn)意在對學(xué)生進(jìn)行整體評價(jià)或篩選,較少關(guān)注個體的認(rèn)知結(jié)構(gòu)。(2)認(rèn)知診斷測驗(yàn)需要由認(rèn)知心理學(xué)和心理測量學(xué)專家事先界定出完成測驗(yàn)任務(wù)所需的認(rèn)知屬性,以及它們之間的層級結(jié)構(gòu),然后根據(jù)Q矩陣?yán)碚摼幹茰y驗(yàn);傳統(tǒng)測驗(yàn)一般是根據(jù)雙向細(xì)目表來編制測驗(yàn),無法偵查出學(xué)生在認(rèn)知結(jié)構(gòu)和認(rèn)知加工過程方面的情況。(3)在編制認(rèn)知診斷測驗(yàn)時,不僅要滿足測驗(yàn)考察的內(nèi)容、題型、難度、區(qū)分度等標(biāo)準(zhǔn),同時還要兼顧可達(dá)矩陣、每個屬性的考察次數(shù)以及每道題目所考察的屬性個數(shù)等因素。(4)傳統(tǒng)測驗(yàn)追求的是總分分布形態(tài)盡量呈正態(tài)分布,分?jǐn)?shù)之間的變異性越大越好[19],認(rèn)知診斷測驗(yàn)對總分形態(tài)沒有要求。
基于以上區(qū)別,認(rèn)知診斷測驗(yàn)的編制方法與傳統(tǒng)測驗(yàn)大不相同。國外學(xué)者從不同方面對其編制方法進(jìn)行了研究[20],包括:認(rèn)知設(shè)計(jì)系統(tǒng)[21]、證據(jù)中心設(shè)計(jì)[22]及基于KL信息量的認(rèn)知診斷測驗(yàn)編制法[23]。在綜合了前人研究的基礎(chǔ)上,我們認(rèn)為編制一份優(yōu)良的認(rèn)知診斷測驗(yàn)應(yīng)該包含以下步驟:
1.確定認(rèn)知診斷評估的目標(biāo)和群體;
2.根據(jù)目標(biāo),由專家界定出完成測驗(yàn)任務(wù)所需的認(rèn)知屬性,以及它們之間的層級結(jié)構(gòu);
3.根據(jù)屬性層級結(jié)構(gòu),利用Q矩陣?yán)碚摻⒁幌盗芯仃?,其中測驗(yàn)矩陣Qt陣十分重要,是認(rèn)知診斷的測驗(yàn)藍(lán)圖[9];
4.根據(jù)Qt矩陣編制認(rèn)知診斷題目;
5.選擇合適的認(rèn)知診斷模型對題目參數(shù)和學(xué)生的知識狀態(tài)進(jìn)行評估;
6.對題目質(zhì)量進(jìn)行分析,例如,題目參數(shù)是否合理,Q矩陣質(zhì)量是否合格,界定是否完備;
7.根據(jù)第6步的結(jié)果對題目進(jìn)行修訂或增刪,以及對Q矩陣進(jìn)行重新標(biāo)定,之后重復(fù)2-7步驟,直到所有的題目均達(dá)到理想標(biāo)準(zhǔn);
8.測驗(yàn)組卷。
四、認(rèn)知診斷測驗(yàn)的效度檢驗(yàn)
效度檢驗(yàn)不應(yīng)該僅局限于對測驗(yàn)本身是否達(dá)到預(yù)期測量目標(biāo)的范圍(內(nèi)容/結(jié)構(gòu)效度),還應(yīng)該包括補(bǔ)救和指導(dǎo)效果的考察(校標(biāo)效度)[24]。關(guān)于效度檢驗(yàn),目前有以下兩派觀點(diǎn)。
(一)Messick框架
Messick提出的效度檢驗(yàn)框架[25],關(guān)注的是由認(rèn)知診斷設(shè)計(jì)帶來的正向或負(fù)向結(jié)果,它強(qiáng)調(diào)認(rèn)知診斷設(shè)計(jì)與補(bǔ)救之間的聯(lián)系。Messick區(qū)分了認(rèn)知診斷結(jié)構(gòu)效度的7個方面:(1)內(nèi)容是否體現(xiàn)了認(rèn)知診斷的目標(biāo)領(lǐng)域;(2)學(xué)生是否運(yùn)用了相應(yīng)的認(rèn)知加工過程去完成測驗(yàn)任務(wù);(3)評分是否反映了學(xué)生能力與目標(biāo)領(lǐng)域的交互作用;(4)認(rèn)知診斷得到的結(jié)果是否能預(yù)測期望的結(jié)果;(5)認(rèn)知診斷測驗(yàn)的結(jié)果是否公平可信;(6)認(rèn)知診斷測驗(yàn)是否有較好的聚合效度和區(qū)分效度;(7)測驗(yàn)結(jié)果的外推性如何,例如是否能夠推廣到不同時間、地點(diǎn)以及實(shí)測環(huán)境。
(二)荷蘭學(xué)者框架
Borsboom及其同事提出了認(rèn)知診斷效度檢驗(yàn)的三個主要概念[26]。(1)測量概念:認(rèn)知診斷評估需要關(guān)注的是那些可以被量化的研究側(cè)面,其中包括測量到的內(nèi)容與想要測量內(nèi)容的一致性、在不同情況下測量到的結(jié)果是否具有不變性,以及測量到的結(jié)果是否準(zhǔn)確。(2)決策概念:能夠用心理測量方法進(jìn)行量化研究,包括額外評估,以及根據(jù)經(jīng)驗(yàn)與診斷評估分?jǐn)?shù)相關(guān)聯(lián)的其他標(biāo)準(zhǔn)。強(qiáng)調(diào)對一個較穩(wěn)定特質(zhì)的測量結(jié)果是否能準(zhǔn)確預(yù)測未來,是否采用了最佳的測量方案等。(3)影響概念:量化基于診斷評估所進(jìn)行的決策評價(jià),不能直接追溯到診斷評價(jià)的心理測量性質(zhì)本身,而應(yīng)該根據(jù)測量結(jié)果的變異性來考察效度。該概念包括測量的結(jié)果是否可以被接受,對不同人群測量是否公平等。
以上兩派觀點(diǎn)均是從理論出發(fā),探討在認(rèn)知診斷中該如何對效度進(jìn)行檢驗(yàn),以及應(yīng)該關(guān)注的方面。實(shí)踐中,一些學(xué)者采取具體措施對效度問題進(jìn)行了檢驗(yàn)。Tatsuoka和Tatsuoka將補(bǔ)救措施作為實(shí)證效度的證據(jù)[27],他們對學(xué)生進(jìn)行前測后,根據(jù)診斷結(jié)果對學(xué)生實(shí)施了針對性的補(bǔ)救措施,然后在實(shí)施后測之后發(fā)現(xiàn),93%的學(xué)生有了進(jìn)步,7%的學(xué)生發(fā)生了退步;Jang在對二語閱讀理解進(jìn)行診斷后將結(jié)果反饋給教師和學(xué)生發(fā)現(xiàn),所有的教師認(rèn)為診斷信息十分有效,能夠使學(xué)生了解未掌握的屬性有哪些,并有效指導(dǎo)教師教學(xué),有39%的學(xué)生經(jīng)常使用反饋的診斷信息來指導(dǎo)自己學(xué)習(xí),50%的學(xué)生偶爾使用反饋信息[28]。Embretson和Yang還提出建立項(xiàng)目難度對認(rèn)知屬性的回歸檢驗(yàn),來測量認(rèn)知屬性對題目難度的解釋量,以此來驗(yàn)證Q矩陣的內(nèi)部效度[29]。
五、認(rèn)知診斷在實(shí)踐中的應(yīng)用
認(rèn)知診斷在實(shí)踐中得到了廣泛的運(yùn)用,概括起來,主要包含兩個領(lǐng)域:教育領(lǐng)域和臨床診斷領(lǐng)域。其中第一個領(lǐng)域的研究頗豐。
(一) 認(rèn)知診斷在教育領(lǐng)域的應(yīng)用
在數(shù)學(xué)學(xué)科方面,余嘉元運(yùn)用RSM對江蘇省中學(xué)生解不等式題進(jìn)行了診斷研究,這是RSM在國內(nèi)的首次應(yīng)用[30]。范士青用RSM,采用任務(wù)分析的方法歸納出加減法運(yùn)算的屬性及其層級結(jié)構(gòu),以此編制測驗(yàn),調(diào)查了268名小學(xué)二、三年級學(xué)生對整數(shù)減法計(jì)算的掌握情況,研究發(fā)現(xiàn),有87%的學(xué)生被成功劃歸到18個理想反應(yīng)模式中[31]。
在語言研究方面,Hartz等人運(yùn)用融合模型對小學(xué)三年級學(xué)生的閱讀評估測驗(yàn)及PSAT測驗(yàn)進(jìn)行了研究[32];劉慧以現(xiàn)代漢語普通話六個基本顏色詞為對象,運(yùn)用RSM對漢語非母語者對這些顏色詞的認(rèn)知模式作出判別,并對他們的掌握情況作出診斷性描述,這是RSM在漢語語言測試中的首次應(yīng)用[33]。王靜用RSM對857名被試進(jìn)行了C.TEST閱讀理解測驗(yàn)的診斷性評價(jià)研究,將90.57%的被試成功地劃歸到50個理想反應(yīng)模式中[34];趙雪晶用RSM對289名以漢語為第二語言學(xué)習(xí)者進(jìn)行了量詞掌握模式的診斷研究,有95.16%的被試得到了成功歸類[35];蔡艷、丁樹良和涂冬波根據(jù)高考英語數(shù)據(jù),采用AHM方法對82000名考生作了認(rèn)知診斷分析,探明了目前高中生在英語閱讀問題解決的認(rèn)知特征及存在的問題,為教學(xué)指導(dǎo)及評估提供了豐富信息[36]。
在認(rèn)知能力測驗(yàn)方面,康春花和戴海琦用LLTM對空間折疊能力(心理旋轉(zhuǎn))進(jìn)行了實(shí)證研究,取得了良好的效果[37]。戴海琦和劉聲濤還用LLTM對影響瑞文測驗(yàn)項(xiàng)目認(rèn)知難度因素進(jìn)行了實(shí)證研究[38]。余嘉元用RSM編制了40道題目,對南京市中學(xué)生進(jìn)行測量,發(fā)現(xiàn)其中有318人存在不同程度的認(rèn)知缺陷,他們能夠被劃歸到16種不同的理想反應(yīng)模式中[39]。趙頂位將AHM運(yùn)用于三段論推理測驗(yàn)編制及個體知識狀態(tài)的判別中[40]。趙頂位和戴海琦用高階DINA模型對江西省三所中小學(xué)4-8年級學(xué)生的幾何類比推理問題解決能力進(jìn)行了診斷評估,探明了目前學(xué)生在解決幾何類比推理問題中所存在的問題,進(jìn)而為提出針對性的補(bǔ)救措施提供依據(jù),使學(xué)生能夠更好地掌握知識[41]。
在其他學(xué)科中的應(yīng)用方面,劉啟亮用RSM作了初中化學(xué)認(rèn)知診斷的研究,將91.46%的被試判歸為21種理想屬性反應(yīng)模式,然后就根據(jù)診斷結(jié)果該如何進(jìn)行補(bǔ)救進(jìn)行了相關(guān)探討,從班級和個體兩個層面從理論上提出了一些補(bǔ)救方案[42]。黎嬌以歐姆定律學(xué)習(xí)為例,運(yùn)用RSM進(jìn)行了中學(xué)物理教學(xué)評價(jià)中的實(shí)證研究[43]。徐光建用高階DINA模型編制了高一物理認(rèn)知診斷測驗(yàn)[44]。
(二) 認(rèn)知診斷在臨床診斷領(lǐng)域的應(yīng)用
Templin等人運(yùn)用DINO模型對593名被試在病理性賭博方面進(jìn)行了臨床診斷研究,按照《精神障礙診斷與統(tǒng)計(jì)手冊》(DSM-IV-TR)給出的10條標(biāo)準(zhǔn),估計(jì)出了每個被試在各條標(biāo)準(zhǔn)上的“掌握程度”,從而判斷該被試是否存在病理性賭博傾向[16]。
此外,Reif等人認(rèn)為以往人格問卷的編制缺乏直觀性,并且題目的難度均是由實(shí)證研究所決定。為了增加問卷題目的結(jié)構(gòu)效度,他們使用LLTM編制了人格問卷[45]。
六、結(jié)語
未來認(rèn)知診斷的發(fā)展不僅需要關(guān)注對測量模型的研究,更需要加強(qiáng)理論建設(shè)(Q矩陣?yán)碚摚?,只有兩者齊頭并進(jìn),才能更好地壯大認(rèn)知診斷理論。正如Leighton等人曾說:“認(rèn)知診斷評價(jià)還處于嬰兒期,但它的起源是非常牢固的?!盵5]最后,希望更多的心理學(xué)工作者能夠加入到認(rèn)知診斷研究中,共同推進(jìn)該測量理論的發(fā)展。
參考文獻(xiàn):
[1]Glaser, R., The future of testing: A research agenda for cognitive psychology and psychometrics[J]. American Psychologist, 1981, 36(9): 923.
[2] Nichols, P.D., A framework for developing cognitively diagnostic assessments[J]. Review of Educational Research, 1994, 64(4): 575-603.
[3] Stout, W., Psychometrics: From practice to theory and back[J]. Psychometrika, 2002, 67(4): 485-518.
[4] Leighton, J. and M. Gierl, Cognitive diagnostic assessment for education: Theory and applications[M]. Cambridge University Press, 2007.
[5] Tatsuoka, K.K., Cognitive assessment: An introduction to the rule space method[M]. Routledge New York, NY,2009.
[6]Rupp, A., J. Templin, and R. Henson, Diagnostic measurement: Theory, methods, and applications[M]. Guilford Press, 2010.
[7]Tatsuoka, K.K., Architecture of knowledge structures and cognitive diagnosis: A statistical pattern recognition and classification approach[J]. Erlbaum: Hillsdale, 1995: 327-359.
[8]丁樹良, 王文義, 羅芬. 認(rèn)知診斷中Q矩陣和Q矩陣?yán)碚揫J].江西師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2012, 36(5): 441-445.
[9]丁樹良, 汪文義, 楊淑群. 認(rèn)知診斷測驗(yàn)藍(lán)圖的設(shè)計(jì)[J].心理科學(xué), 2011,34(2): 258-265.
[10]楊淑群, 蔡聲鎮(zhèn),丁樹良,林海菁,丁秋林. 求解簡化Q矩陣的擴(kuò)張算法[J].蘭州大學(xué)學(xué)報(bào): 自然科學(xué)版, 2008,44(3): 87-91.
[11]丁樹良, 楊淑群, 汪文義. 可達(dá)矩陣在認(rèn)知診斷測驗(yàn)編制中的重要作用.江西師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2010,34(5): 490-494.
[12]辛濤, 樂美玲, 張佳慧. 教育測量理論新進(jìn)展及發(fā)展趨勢[J].中國考試, 2012, 5: 002.
[13] Fischer, G.H., The linear logistic test model as an instrument in educational research[J]. Acta psychologica, 1973,37(6): 359-374.
[14]韓裕, 張敏強(qiáng). AHM分類方法的改良[J].華南師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2012.
[15]Junker, B.W. and K. Sijtsma, Cognitive assessment models with few assumptions, and connections with nonparametric item response theory[J]. Applied Psychological Measurement, 2001, 25(3): 258-272.
[16] Templin, J.L. and R.A. Henson, Measurement of psychological disorders using cognitive diagnosis models[J]. Psychological Methods, 2006, 11(3): 287.
[17]涂冬波,蔡艷,戴海琦,漆書青. 現(xiàn)代測量理論下四大認(rèn)知診斷模型述評[J].心理學(xué)探新, 2008. 28(2): 64-68.
[18] Hartz, S.M., A Bayesian framework for the unified model for assessing cognitive abilities: Blending theory with practicality[D]. Unpublished doctoral dissertation, University of Illinois at Urbana-Champaign, Urbana-Champaign, IL., 2002.
[19]漆書青, 戴海崎,丁樹良, 現(xiàn)代教育與心理測量學(xué)原理[M].北京:高等教育出版社. 2002.
[20]蔡艷, 涂冬波, 丁樹良, 認(rèn)知診斷測驗(yàn)編制的理論及方法[J].考試研究, 2010(003): 79-92.
[21] Embretson, S.E., A cognitive design system approach to generating valid tests: Application to abstract reasoning[J]. Psychological Methods, 1998, 3(3): 380-396.
[22] Mislevy, R.J., L.S. Steinberg, and R.G. Almond, On the role of task model variables in assessment design. In Siring & P. Kyullonene ( Eds. ), Generating items for cognitive tests: Theory and practice[M]. Hillsdale, NJ: Erlbaum, 2003.
[23] Henson, R. and J. Douglas, Test construction for cognitive diagnosis[J]. Applied Psychological Measurement, 2005, 29(4): 262-277.
[24]王卓然, 郭磊, 邊玉芳, 從與標(biāo)準(zhǔn)測驗(yàn)理論差異談?wù)J知診斷的特征[J].考試研究, 2012, 32(3): 10-20.
[25]Messick, S.. Validity. In R. Linn (Ed.), Educational measurement ( 3rd ed., pp. 13-103) [M].NewYork: Macmillan,1989.
[26]Borsboom, D., &Mellenbergh, G. J..Testvalidity in cognitive assessment.In J. P. Leighton&M. J. Gierl (Eds.). Cognitive diagnostic assessment for education:Theory andapplication(pp. 85-118) [M]. Cambridge, UK:Cambridge University Press,2007.
[27] Tatsuoka, K.K. and M.M. Tatsuoka, Computerized cognitive diagnostic adaptive testing: effect on remedial instruction as empirical validation[J]. Journal of Educational Measurement, 1997,34(1): 3-20.
[28] Jang, E.E., Cognitive diagnostic assessment of L2 reading comprehension ability: Validity arguments for Fusion Model application to LanguEdge assessment[J]. Language Testing, 2009,26(1): 31-73.
[29]Embretson, S.E., & Yang, X.. Construct validity and cognitive diagnostic assessment.In J. P. Leighton., & M. Gierl (Eds.), Cognitive Diagnostic Assessment for Education[M]. New York: Cambridge University Press,2007.
[30]余嘉元. 運(yùn)用規(guī)則空間模型識別解題中的認(rèn)知錯誤[J].心理學(xué)報(bào), 1995,27(2): 196-203
[31]范士青. 小學(xué)生加減法計(jì)算錯誤的分類與認(rèn)知分析[D],華中師范大學(xué)碩士學(xué)位論文,2008.
[32]Hartz, S., L. Roussos, and W. Stout, Skills diagnosis: Theory and practice[J]. User Manual for Arpeggio software. ETS, 2002.
[33]劉慧.規(guī)則空間模型在留學(xué)生漢語顏色詞掌握模式診斷中的應(yīng)用[D],北京語言大學(xué)碩士學(xué)位論文,2006.
[34]王靜.C. TEST 閱讀理解測驗(yàn)的診斷性評價(jià)研究[D], 北京語言大學(xué)碩士學(xué)位論文,2008.
[35]趙雪晶. 漢語作為第二語言學(xué)習(xí)者量詞掌握模式診斷研究[D],北京語言大學(xué)碩士學(xué)位論文,2009.
[36]蔡艷, 丁樹良, 涂冬波。英語閱讀問題解決的認(rèn)知診斷[J].心理科學(xué), 2011,34(2): 272-277.
[37]康春, 戴海崎. 采用LLTM作測量與認(rèn)知結(jié)合研究的初步探討[J].心理科學(xué), 2001,24(5): 569-572.
[38]戴海崎, 劉聲濤. 瑞文測驗(yàn)項(xiàng)目認(rèn)知難度因素分析及LLTM擬合驗(yàn)證[J].心理與行為研究, 2004,2(2): 411-414.
[39]余嘉元. 關(guān)于新課程改革中的診斷性測驗(yàn)研究[J].教育探索, 2006. 5: 24-25.
[40]趙頂位. 屬性層次方法下的三段論推理測驗(yàn)制及個體屬性掌握模式的判別[D],江西師范大學(xué)碩士學(xué)位論文,2007.
[41]趙頂位, 戴海琦. 基于認(rèn)知設(shè)計(jì)系統(tǒng)的幾何類比推理測驗(yàn)的編制及認(rèn)知模型分析[J].心理學(xué)探新, 2011,31(3): 278-283.
[42]劉啟亮. 規(guī)則空間模型在初中生化學(xué)知識學(xué)習(xí)診斷與補(bǔ)救中的應(yīng)用研究[D],江西師范大學(xué)碩士學(xué)位論文,2008.
高等職業(yè)教育是高等教育的重要組成部分,其教學(xué)過程和培養(yǎng)目標(biāo)有三個顯著特點(diǎn):一是注重崗位能力培養(yǎng),根據(jù)“按需施教、學(xué)以致用”的原則,組織課程教學(xué)和實(shí)習(xí)實(shí)訓(xùn);二是強(qiáng)調(diào)課程體系的針對性,課程設(shè)置不是從學(xué)科出發(fā),而是從職業(yè)崗位需要出發(fā);三是突出實(shí)踐環(huán)節(jié)教學(xué),主動適應(yīng)地方社會經(jīng)濟(jì)建設(shè)發(fā)展要求。因此,要對整個教學(xué)過程進(jìn)行全面、系統(tǒng)、公正地評價(jià),就要從考試內(nèi)容、形式、成績構(gòu)成等方面進(jìn)行系統(tǒng)規(guī)劃與分析,力求探索出相對完整、切實(shí)可行的能充分發(fā)揮考試功能和實(shí)現(xiàn)高職教育教學(xué)目的的考試方法和手段,從而實(shí)現(xiàn)高職教育教學(xué)目的。
高職院校工程測量技術(shù)專業(yè)專業(yè)課程主要包括《地形測量》、《控制測量》、《工程測量》、《GPS測量技術(shù)》、《數(shù)字測圖》、《測量平差》、《攝影測量》等,各專業(yè)課程的考試均應(yīng)具有顯示功能、反饋功能和導(dǎo)向功能,因此要結(jié)合現(xiàn)有工程測量技術(shù)專業(yè)專業(yè)課程考試存在的弊端,構(gòu)建新的考試機(jī)制,同時促進(jìn)數(shù)字化校園的建設(shè)?,F(xiàn)有的考試模式存在著很多問題, 如形式單一、考試目標(biāo)的模糊等情況,造成學(xué)生創(chuàng)造力的抵制,綜合能力的下降,具體分析主要包括是以下幾個方面的問題:
1、考試目標(biāo)僵化??荚囀且粋€學(xué)習(xí)過程,這應(yīng)該是一個考試的主題教育管理論文,其目的是促進(jìn)學(xué)生更好、更全面、更深入學(xué)習(xí)的手段,是為了對所學(xué)知識的一種提升,為今后的運(yùn)用打下堅(jiān)實(shí)基礎(chǔ),從而拓寬思路,成為創(chuàng)新人才的起步。而現(xiàn)在考試形式促使學(xué)生考試目標(biāo)僵化,態(tài)度不明確,認(rèn)為考試是學(xué)習(xí)的終結(jié)者。
2、考試方式過于單一。目前高職院校大部分學(xué)科考試主要是是采取終結(jié)式考核, 即教師出各種題型的試題,學(xué)生在規(guī)定時間內(nèi)閉卷筆試,教師按標(biāo)準(zhǔn)答案進(jìn)行閱卷,給出學(xué)生的期末考試成績,結(jié)合學(xué)生平時成績,做出學(xué)生該門課程的期末總評成績??荚嚨膯我恍?,使學(xué)生學(xué)習(xí)一門課程之前便習(xí)慣性產(chǎn)生為了考試而學(xué)習(xí)的慣性思維。不光答題紙張耗材,教師閱卷、試卷回收也耗時。
3、考試內(nèi)容主觀性過強(qiáng)。目前考試內(nèi)容大多由任課教師或?qū)I(yè)教師自主出題,自主閱卷。老師出卷自由度小,試卷質(zhì)量低。多數(shù)老師在出卷時都只會側(cè)重大綱中的重難點(diǎn),而忽略或者說是無法把各科知識進(jìn)行鏈接,也無法區(qū)別對待,從而測試出個體真實(shí)的成績論文服務(wù)。導(dǎo)致學(xué)生為考試而學(xué),教師為考試而教。教師在授課過程中注重強(qiáng)調(diào)考試內(nèi)容,便會導(dǎo)致理論知識的傳授過于傾斜。試題內(nèi)容的泄露,批改閱卷過程中存在的主觀判錯、計(jì)算錯誤等現(xiàn)象都會促使最后結(jié)果失去客觀真實(shí)性、公平性。不能客觀、真實(shí)地反映出學(xué)生的能力水平,同時又有測試內(nèi)容不全面的因素,因此考試形式的改革和創(chuàng)新是迫在眉捷事宜,只有改革考試模式才能夠真正激發(fā)學(xué)生的創(chuàng)新意識,培養(yǎng)其創(chuàng)新能力。
4、考試評價(jià)方法片面。目前期末總評成績中,期末考試成績是主要的決定因素,而期末考試往往是書面閉卷形式,這就給學(xué)生造成了很大壓力和僥幸心理,有的同學(xué)在考前搞題海戰(zhàn)術(shù),有的同學(xué)把“投機(jī)取巧”的功夫用在考場上,同時也不利于學(xué)生創(chuàng)造性和主動性的發(fā)揮,阻礙了創(chuàng)新思維的培養(yǎng)與發(fā)展。為培養(yǎng)學(xué)生學(xué)習(xí)的自主性、自覺性和創(chuàng)造性,促使學(xué)生充分利用平時時間努力學(xué)習(xí),就必須對傳統(tǒng)的考試模式進(jìn)行改革,建立一個真正全面、客觀、合理的課程考核體系。
5、考試反饋機(jī)制缺乏。由于考試是期末一次性終結(jié)考試,學(xué)生考試結(jié)束,就意味著本門課程學(xué)習(xí)的終結(jié)??荚囍写嬖诘膯栴},教師不能與學(xué)生進(jìn)行及時的反饋與交流。這樣的考試模式有可能將學(xué)生引向一種僵化、死板的學(xué)習(xí)軌道。
這些弊端的出現(xiàn)都會降低學(xué)生學(xué)習(xí)的積極性、自主性、創(chuàng)新性以及個體綜合素質(zhì)的全面發(fā)展,同時還導(dǎo)致高職教育教學(xué)目的失去重心。
現(xiàn)代科技的發(fā)展教育管理論文,信息技術(shù)廣泛應(yīng)用,計(jì)算機(jī)已滲透到各行各業(yè)。其中,憑借計(jì)算機(jī)的考試系統(tǒng)以方便快捷等優(yōu)點(diǎn)得到了充分的肯定。駕駛理論考試就是運(yùn)用計(jì)算機(jī)考試的一個實(shí)際應(yīng)用,它實(shí)現(xiàn)了理論考試的無紙化,以往出題、印試卷、批改試卷等繁瑣的工作也隨之被計(jì)算機(jī)所替代??荚囀墙虒W(xué)過程中的重要環(huán)節(jié),它擔(dān)負(fù)著因材施教、選拔人才、評價(jià)教學(xué)等眾多功能。隨著時代變遷,這種計(jì)算機(jī)無紙化考試系統(tǒng)由于安全性高、便于組卷和評閱、資源消耗低、自動化程度高、可以實(shí)現(xiàn)遠(yuǎn)程考試等特點(diǎn),在學(xué)歷考試、各種職稱考試、證書考試中已被廣泛使用。
工程測量技術(shù)專業(yè)專業(yè)課程考試模式改革應(yīng)首先通過對專業(yè)考試現(xiàn)狀的分析,收集資料建設(shè)試題庫,同時與計(jì)算機(jī)編程技術(shù)人員合作構(gòu)建考試模擬系統(tǒng)。因此,核心內(nèi)容便是依托建立的考試模擬系統(tǒng),其原理應(yīng)同駕校理論考試一致,可以隨機(jī)抽取題庫試題組卷、計(jì)算機(jī)智能閱卷評分和試卷分析等功能于一身,更能體現(xiàn)客觀、公平、公正的考試特點(diǎn),且不受時間和空間的限制,隨時隨地進(jìn)行測試更適合信息時代的考試要求,也切合了高校數(shù)字校園的建設(shè)。采用此考試模式,不僅使得教學(xué)管理部門不再面臨人工印刷試卷的艱巨任務(wù),也讓教師從此告別了出題、組卷、人工閱卷、評分、試卷分析、登記分?jǐn)?shù)等繁瑣的工作,節(jié)省大量的人力物力,因此考試模擬系統(tǒng)代替?zhèn)鹘y(tǒng)的考試已經(jīng)成為必然趨勢。以下從多方面對其特點(diǎn)進(jìn)行分析探討:
1、隨機(jī)抽題功能,降低了考生作弊的可能性,達(dá)到公平、公正性。支持隨機(jī)組合卷,可以從指定的若干試卷中按要求隨機(jī)抽取考題進(jìn)行考試,或從試題庫中隨機(jī)抽題供考生作答,保證每個考生的試卷都不一樣。用于考生平時自測也十分方便。由于試題是隨機(jī)抽取的,所以考生試卷的試題順序是不同的,這極大降低了考生作弊的可能性,有效防止相互抄襲行為,也確保了考試的公平性。
2、題型可以豐富,自主選擇性強(qiáng)。教師可以在選擇單選、多選、簡答等題型的基礎(chǔ)上,如條件充裕,可以設(shè)計(jì)新增判斷題、不定項(xiàng)選擇題、填空題、計(jì)算題、識圖題、簡答題等題型。
3、考試過程自動控制,在規(guī)定的時間內(nèi)自動交卷、評分。整個考試過程由系統(tǒng)自動計(jì)時,時間到系統(tǒng)將自動提交試卷,避免了傳統(tǒng)考試中考試結(jié)束時,考生還不愿意停筆交卷的拖延現(xiàn)象論文服務(wù)。
4、成績分析功能,有效幫助教師了解教學(xué)情況??忌峤辉嚲砗?,系統(tǒng)將立刻對試卷進(jìn)行自動評分,生成成績通知單。最終將整個班級學(xué)生的成績匯總教育管理論文,并按分?jǐn)?shù)段排列,形成分析報(bào)告。真正實(shí)現(xiàn)考生考完即刻知道考試成績的愿望,也體現(xiàn)出考試高效、快捷的特點(diǎn)。
5、可支持試題庫管理,方便錄入、導(dǎo)出試題,也可以在網(wǎng)上共享題庫資源。該系統(tǒng)可擁有簡單快捷的試題錄入模式,方便對試題庫的管理。試卷可以直接導(dǎo)出到WORD文檔或打印出來。可以把所有試題保存到數(shù)據(jù)庫,通過互聯(lián)網(wǎng)方便地進(jìn)行模擬考試,也允許設(shè)置為練習(xí)模式,讓學(xué)生考試過程自行判題。
6、考試模擬系統(tǒng)擴(kuò)展性強(qiáng)。其可以根據(jù)自己需求,在計(jì)算機(jī)技術(shù)基礎(chǔ)上增加各種功能。如新增考生身份檢查功能:對考生重考、二次登陸和考后查卷時進(jìn)行身份檢查,只有班級、考號、姓名和第一次考試輸入的信息一致方允許登錄,防止考生身份信息輸入出錯的情況。
7、界面可設(shè)計(jì)人性化,操作簡便。在實(shí)際使用中,從每一位學(xué)生到教師,在操作方面都沒有障礙,界面人性化,方便可行。
〔中圖分類號〕G44 〔文獻(xiàn)標(biāo)識碼〕A
〔文章編號〕1671-2684(2014)04-0004-03
心理健康(mental health)是指個體在適應(yīng)環(huán)境的過程中,生理、心理和社會性方面達(dá)到協(xié)調(diào)一致,保持良好的心理功能狀態(tài)[1]。它是影響人們幸福感的重要因素。然而,據(jù)美國衛(wèi)生局報(bào)告,我國精神疾病目前占所有疾病的14.3%,預(yù)計(jì)到2020年將上升到17.4%[2],這表明我國心理健康問題形勢嚴(yán)峻。小學(xué)生情緒能力和認(rèn)知能力處于迅速發(fā)展的關(guān)鍵期,其心理健康狀況不僅影響其幸福感,更對其健康成長起著不可忽視的作用。對此,有學(xué)者就我國小學(xué)生的心理健康狀況進(jìn)行了調(diào)查,結(jié)果發(fā)現(xiàn),小學(xué)生中有中度心理和行為問題的占16.4%,有嚴(yán)重心理問題的占4.2%[3]。這反映了我國小學(xué)生的心理健康問題堪憂。
越來越多的研究認(rèn)識到研究小學(xué)生心理健康問題不僅是學(xué)術(shù)議題,更是進(jìn)行小學(xué)生心理健康教育的必要基礎(chǔ),因此大量的研究先后探究了小學(xué)生心理健康狀況。為了把握小學(xué)生心理健康研究的具體情況,本文對源自中國期刊網(wǎng)的453篇相關(guān)論文進(jìn)行文獻(xiàn)計(jì)量學(xué)分析,以深入了解小學(xué)生心理健康研究的具體開展情況,為今后的理論研究與應(yīng)用實(shí)踐提供參考。
一、研究方法
1.統(tǒng)計(jì)方法
文獻(xiàn)計(jì)量法,以頻次、百分比為主。
2.文獻(xiàn)取樣
以中國期刊網(wǎng)為平臺,對2003年1月至2012年12月所發(fā)表的有關(guān)小學(xué)生心理健康方面的所有文獻(xiàn)進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)有453篇包含“小學(xué)生心理健康”的文章題錄。
3.分析類目與單元
在對代表性論文進(jìn)行參考的基礎(chǔ)上,對以下6個單元作統(tǒng)計(jì)分析:年代分布、受資助狀況、合作者人數(shù)、內(nèi)容分布、作者機(jī)構(gòu)及作者所在地區(qū)。
二、結(jié)果與分析
1.研究論文的年代分布
對2003~2012年發(fā)表的453篇小學(xué)生心理健康方面的文章進(jìn)行年代分布統(tǒng)計(jì)分析,如下頁表1所示。除2005年(4.4%)和2009年(10.2%)出現(xiàn)稍大的波動外,我國關(guān)于小學(xué)生心理健康研究的論文數(shù)量總體呈現(xiàn)增長趨勢。2003~2007年的論文數(shù)為159篇,2008~2012年的論文數(shù)為294篇,分別占總數(shù)的35.1%和64.9%,后者較前者增長了29.8個百分點(diǎn),這說明近十年來小學(xué)生的心理健康問題越來越受到研究者的關(guān)注。
2.研究論文的受資助情況
對近十年來的453篇論文的受資助情況進(jìn)行分析,如表2所示,結(jié)果發(fā)現(xiàn)有84.1%不受任何項(xiàng)目資助,僅有15.9%的論文受資助。在受資助的文章中,最多的是省部級項(xiàng)目(9.5%),來自“相關(guān)協(xié)會”(1.1%)及“國家級”(1.3%)資助的項(xiàng)目相對較少。整體而言,受資助的研究數(shù)比例低且不同級別間數(shù)額差異很大。這給未來的研究以啟示:小學(xué)生心理健康研究的全面開展需更多資助,尤其是國家級項(xiàng)目及相關(guān)協(xié)會項(xiàng)目的支持。
3.研究論文的內(nèi)容
對453篇文章的內(nèi)容進(jìn)行具體分析(見表3),結(jié)果發(fā)現(xiàn)“現(xiàn)狀調(diào)查”(18.9%)、“相關(guān)研究”(21.9%)及“對策研究”(19.4%)這三項(xiàng)研究內(nèi)容所占比例相當(dāng),但都低于“其他”內(nèi)容類別(37.1%)的研究論文,而這部分論文是作者基于小學(xué)生心理健康問題某角度而提出的一般性看法或陳述,缺乏科學(xué)研究的嚴(yán)謹(jǐn)性。“綜述研究”及“測量方法研究”則分別只占總體的0.9%、1.8%,這提示著綜述性與測量方法類研究目前呈現(xiàn)出一定困境,亟待突破。
4.研究論文的形式及其研究力量
對研究論文的合作形式和研究力量進(jìn)行分析(見
表4),結(jié)果發(fā)現(xiàn),獨(dú)著論文數(shù)占論文總數(shù)的67.8%,合著論文僅占32.2%,且論文合著以兩人合作形式(17.2%)為主,課題組合作形式僅占0.7%。這表明研究者需加強(qiáng)各種形式的合作力度,組建課題組形式的專業(yè)研究團(tuán)隊(duì),增強(qiáng)研究的系統(tǒng)性和全面性。
以第一作者的單位作為研究力量機(jī)構(gòu)分析的基礎(chǔ),“其他(小學(xué)教師及協(xié)會等)”占研究力量的55.8%,其次為“師范類院?!保?7.7%),而來自其他單位的研究相對缺乏,見表5。這表明,小學(xué)教師及協(xié)會是最主要的者,這些發(fā)表者的研究內(nèi)容基本上是一般陳述性的研究,這與表3中關(guān)于研究內(nèi)容的數(shù)據(jù)結(jié)果(“其他”類別即一般性看法或陳述性研究占最大比重)契合。由此可以看出,專業(yè)研究團(tuán)隊(duì)參與力度的薄弱可能影響到研究內(nèi)容的的專業(yè)性與系統(tǒng)性,研究需更多專業(yè)力量的
投入。
為了進(jìn)一步了解研究力量的分布,本研究對研究力量的省份分布情況作了分析,分布總體來說呈不平衡狀。研究力量位列前五位的省份分別為:江蘇(11.0%)、山東(7.5%)、甘肅(7.5%)、浙江(7.1%)與吉林(5.1%),表明小學(xué)生的心理健康問題在我國較發(fā)達(dá)地區(qū)已經(jīng)普遍受到研究者的關(guān)注。位列后五位的省份分別為:青海(1.1%)、內(nèi)蒙古(1.1%)、(0.9%)、寧夏(0.5%)及新疆(0.5%),即我國偏遠(yuǎn)貧困地區(qū)的相關(guān)研究極度缺乏。
三、討論
1.拓展測量方法
本研究發(fā)現(xiàn),近十年來關(guān)于小學(xué)生心理健康的研究數(shù)量較多,同時內(nèi)容涵蓋面較廣,包括現(xiàn)狀調(diào)查、相關(guān)研究、對策研究、綜述研究、測量方法研究及其他研究等,但關(guān)于測量方法的研究卻相對匱乏。目前國內(nèi)研究仍較多引進(jìn)國外的測量方法,易出現(xiàn)跨文化問題;此外,現(xiàn)有量表內(nèi)容多側(cè)重負(fù)面心理特質(zhì),與小學(xué)生發(fā)展的實(shí)際有所偏離[4]。我國研究者也意識到這些問題,心理健康的評估工具已經(jīng)從單純引進(jìn)發(fā)展到自編問卷,量表內(nèi)容在向多領(lǐng)域延伸,也編制出了一些信效度較好的量表。但總體來看,我國心理健康量表的信效度普遍較低,自編量表有低水平重復(fù)現(xiàn)象,測量積極心理的量表少[5]。即我國仍需本土化的較為統(tǒng)一的科學(xué)測查工具和標(biāo)準(zhǔn)。廣大研究者需加強(qiáng)對研究方法的探索,改善測量工具,以便為更深入的研究奠定基礎(chǔ)。
2.研究者的全面調(diào)動
小學(xué)生心理健康問題的研究需要研究者的積極參與。首先,對研究者合作積極性的調(diào)動。研究形式合作化已經(jīng)是當(dāng)今科研形式的主流,合作帶來的團(tuán)隊(duì)資源整合有助于促進(jìn)研究途徑多樣化以及研究本身的完整性、全面性與創(chuàng)新性。但上述數(shù)據(jù)顯示,獨(dú)立研究形式仍是小學(xué)生心理健康研究的主流。獨(dú)立性研究在一方面保留了研究縱向的獨(dú)特性及系統(tǒng)性,但另一方面獨(dú)立性研究缺少橫向文化間的合作交流。這與以往的研究一致[6,7],即跨文化、跨地區(qū)式大樣本研究缺乏。為此研究者應(yīng)當(dāng)積極尋找合作切入點(diǎn),突破束縛,加強(qiáng)各種形式的合作以逐步完善研究維度。
其次,對經(jīng)濟(jì)落后地區(qū)研究者的調(diào)動。有研究者在關(guān)于西部民族地區(qū)中小學(xué)心理健康教育需求現(xiàn)狀的研究中發(fā)現(xiàn),8.4%的中小學(xué)生認(rèn)為自己的心理健康狀況較差或很差,其中有28.7%為小學(xué)生[8],這說明西部落后地區(qū)小學(xué)生對心理健康教育的需求非常強(qiáng)烈。但本文數(shù)據(jù)顯示,我國一些落后的偏遠(yuǎn)地區(qū),如青海、內(nèi)蒙古、、寧夏及新疆等地關(guān)于小學(xué)生心理健康的研究極少,發(fā)展極慢,這也反映了落后地區(qū)小學(xué)生對于心理健康教育的需求遠(yuǎn)遠(yuǎn)得不到滿足,客觀經(jīng)濟(jì)條件的相對落后直接影響到理論研究與教育實(shí)踐的開展。同時研究工具的不完善、研究人力的不足等因素都妨礙了相關(guān)研究的發(fā)展。政府需增強(qiáng)支持,幫助其改善研究的物質(zhì)環(huán)境與人文環(huán)境,呼吁更多其他地區(qū)的研究者多進(jìn)行跨地域研究合作,提升研究意識,改善研究方法,加大研究力度。
最后,對各個單位研究力量的調(diào)動。本研究數(shù)據(jù)顯示,群體主要集中在小學(xué)教育者及有關(guān)協(xié)會方面,他們多以見解性、描述性的研究為主。這些研究與其自身教育實(shí)踐直接聯(lián)系,更具現(xiàn)實(shí)意義,且能為進(jìn)一步的研究提供啟發(fā)與思考,但這類研究缺乏專業(yè)性、科學(xué)性與系統(tǒng)性。由此,對來自不同研究單位的研究力量的全面調(diào)動可以融合多種研究優(yōu)勢,實(shí)現(xiàn)不同單位研究力量之間的互補(bǔ),以便研究成果能更高效地應(yīng)用于
實(shí)踐。
3.展望
心理健康問題的低齡化趨勢已經(jīng)受到社會的普遍關(guān)注,有關(guān)小學(xué)生心理健康的研究總體上正在不斷地深入和拓展。針對目前研究呈現(xiàn)的不足,未來的研究需要考慮以下幾方面:(1)加強(qiáng)研究的問題解決指向性,增加對策研究,將理論積極運(yùn)用于實(shí)踐;(2)實(shí)證研究有待強(qiáng)化,研究方法需不斷改進(jìn),尤其是測量工具的改進(jìn);(3)研究要邁向全面化合作,突破孤立局限,嘗試跨單位、跨地域、跨文化研究;(4)研究可多圍繞具體、典型的心理健康問題展開,增加個案研究并綜合群體研究以增強(qiáng)研究的臨床應(yīng)用性。
參考文獻(xiàn):
[1] 姚本先.學(xué)校心理健康教育概論[M].北京:高等教育出版社,2010:3-9.
[2] 肖旻嬋.中小學(xué)心理健康教育研究[D].上海:華東師范大學(xué),2005:1-2.
[3] 沃建中,馬紅中,劉軍.走向心理健康(發(fā)展篇)[M].北京:華文出版社,2002:9-10.
[4] 鄭日昌,張穎,劉視湘.小學(xué)生心理健康的結(jié)構(gòu)和量表編制[J].教育測量與評價(jià)(理論版),2008,(2):30-34.
[5] 廖全明,蘇丹,黃希庭.目前國內(nèi)常用心理健康量表的回顧與反思[J].心理學(xué)探新,2007,27(4):74-77.
[6] 楊宏飛.我國中小學(xué)心理健康研究的回顧[J].中國心理衛(wèi)生雜志,2001,15(4):289-290.