国产亚洲成AV在线下载|亚洲精品视频在线|久久av免费这里有精品|大香线蕉视频观看国产

<style id="akiq1"><progress id="akiq1"></progress></style><label id="akiq1"><menu id="akiq1"></menu></label>

<source id="akiq1"></source><rt id="akiq1"></rt>

投稿策略

期刊推薦

雜志分類

首頁學(xué)術(shù)雜志科普訂閱 SCI期刊投稿經(jīng)驗(yàn) 期刊咨詢文秘服務(wù) 論著出書出版社

首頁 > 精品范文 > 教育測量評價(jià)論文

教育測量評價(jià)論文模板(10篇)

時間：2023-02-28 16:00:55

導(dǎo)言：作為寫作愛好者，不可錯過為您精心挑選的10篇教育測量評價(jià)論文，它們將為您的寫作提供全新的視角，我們衷心期待您的閱讀，并希望這些內(nèi)容能為您提供靈感和參考。

教育測量評價(jià)論文

篇1

一

高中語文人教版“表達(dá)與交流”模塊對高中寫作教學(xué)無疑具有指揮棒的作用。由五本課本中“表達(dá)與交流”內(nèi)容編排的分析，我們可以看出教材注重什么淡化什么。具體為必修一：心音共鳴――寫觸動心靈的人和事，親近自然――寫景要抓住特征，人性光輝――寫人要凸顯個性，黃河九曲――寫事要有點(diǎn)波瀾。必修二：直面挫折學(xué)習(xí)描寫，美的發(fā)現(xiàn)學(xué)習(xí)抒情，想象世界學(xué)習(xí)虛構(gòu)。必修三：多思善想――學(xué)習(xí)選取理論的角度，學(xué)會寬容――學(xué)習(xí)選擇和使用論據(jù)，善待生命――學(xué)習(xí)論證，愛的奉獻(xiàn)――學(xué)習(xí)議論中的記敘。必修四：解讀時間――學(xué)習(xí)橫向展開議論，發(fā)現(xiàn)幸福――學(xué)習(xí)縱向展開議論，確立自信――學(xué)習(xí)反駁，善于思辨――學(xué)習(xí)辯證分析。必修五：緣事析理，學(xué)習(xí)寫得深刻；謳歌親情，學(xué)習(xí)寫得充實(shí)；錘煉思想，學(xué)習(xí)寫得有文采；注重創(chuàng)新，學(xué)習(xí)寫得新穎。

不管從標(biāo)題上，還是從篇目內(nèi)容及課后練習(xí)上，認(rèn)真分析比較，我們都可以歸納出“表達(dá)與交流”的三大內(nèi)容：一談如何寫好記敘，描寫，抒情，議論，二談“虛構(gòu)”與真實(shí)，側(cè)重虛構(gòu)，三談好文章的四項(xiàng)指標(biāo)――深刻、充實(shí)、文采、新穎。沒有涉及它們與文體的相關(guān)，更沒有涉及文體的理論知識與實(shí)際操作指導(dǎo)。必修教材的“表達(dá)與交流”忠實(shí)地執(zhí)行了我國《語文課程標(biāo)準(zhǔn)》的要求。我國《語文課程標(biāo)準(zhǔn)》并不特別強(qiáng)調(diào)文體，小學(xué)以敘述文為主；初中有明確的文體要求：“寫記敘文，做到內(nèi)容具體；寫簡單的說明文，做到明白清楚；寫簡單的議論文，努力做到有理有據(jù)；根據(jù)生活需要，寫日常應(yīng)用文?！逼胀ǜ咧兄灰缶C合運(yùn)用記敘、說明、描寫、議論和抒情等表達(dá)方式，并沒有明確的文體規(guī)定。這反映出《語文課程標(biāo)準(zhǔn)》淡化文體意識的價(jià)值取向。

美國高中作文教學(xué)卻與我們不同，文體教學(xué)在美國高中作文教學(xué)中有著重要地位，在作文教學(xué)的幾大模塊中占有相當(dāng)大的比重。

如在作文教學(xué)綱要和指導(dǎo)觀念里，實(shí)用文體的寫作訓(xùn)練和寫作基本能力訓(xùn)練與表達(dá)方式的訓(xùn)練共同組成美國的寫作教學(xué)的三大內(nèi)容。這三大訓(xùn)練有多種訓(xùn)練體系，有單向的也有綜合的。“文體”意識和實(shí)際指導(dǎo)在這些體系中隨處可見，如“思維―表達(dá)訓(xùn)練體系”主要進(jìn)行思維和文體寫作的訓(xùn)練，其他還有一般文體寫作訓(xùn)練體系、實(shí)用文體寫作訓(xùn)練體系。如美國加利福尼亞州的《公立學(xué)校英語課程標(biāo)準(zhǔn)》明確要求學(xué)生寫敘述文、文學(xué)評論、研究報(bào)告、勸說文、技術(shù)性文章及常用應(yīng)用文，對每一文體都有明確規(guī)定。

在實(shí)際教學(xué)操作中，文體教學(xué)得到了同樣的重視。

如三冊《美國語文》（2004年同心出版社出版的《美國語文―――美國著名中學(xué)課文精選》，以下簡稱《美國語文》）是中國大陸第一套系統(tǒng)引進(jìn)的西方著名中學(xué)語文教材。文體類型（除編譯時由于篇幅關(guān)系刪去的戲劇、詩歌外）統(tǒng)計(jì)如下：

文體類型具體類型舉例：

（1）小說：短篇小說、科幻小說、長篇小說；

（2）散文：分析散文、諷刺散文、說明散文、思考性散文；

（3）其他類：日志、神話、傳說、故事、敘述文、布道、自傳、勸說文、演講、格言、書信、通告、游記、回憶錄等。

課后寫作練習(xí)文體訓(xùn)練類型舉例：

（1）想象、娛樂、感受類：神話、短篇小說、科幻小說、電影情景、人物傳記、日記、續(xù)寫、改寫、廣告、網(wǎng)頁制作、格言等；

（2）通告、闡釋、描述類：通信、通告、新聞報(bào)道、報(bào)告、描述性信件、摘要、訃告、課程描述、競賽公告等；

（3）勸說、建議、說明類：說服性的短文、給校長的建議、建議專欄、收藏者指南、提議、有說服力的信條等；

（4）分析、評論類：文學(xué)分析、社論、批判性回應(yīng)、說服力評價(jià)、比較研究等。

與淡化文體教學(xué)對應(yīng)的是中國作文評價(jià)標(biāo)準(zhǔn)是面向文學(xué)性、詩意和哲理性很強(qiáng)的記敘文、議論文、說明文的通用標(biāo)準(zhǔn)；與注重文體訓(xùn)練對應(yīng)的是美國評價(jià)標(biāo)準(zhǔn)鮮明地體現(xiàn)為分文體定標(biāo)準(zhǔn)。這種分文體制訂評價(jià)標(biāo)準(zhǔn)的做法是較為嚴(yán)謹(jǐn)?shù)?。它能充分反映評價(jià)學(xué)生駕馭不同文體的能力，較之抽象地評價(jià)內(nèi)容充實(shí)否、結(jié)構(gòu)完整否、符合要求的“通用”標(biāo)準(zhǔn)否，更能起到實(shí)際的評分指導(dǎo)與規(guī)范作用。

我認(rèn)為美國作文教學(xué)對文體教學(xué)的重視，是美國作文教學(xué)卓有成效的原因之一。在美國教學(xué)中最令全球教育界驚奇的事就是美國人普遍具有良好的寫作能力，只要受過普通教育的美國人，都能把自己要說的話寫在紙上且表達(dá)清楚，同時盡可能遣詞造句，使意義更準(zhǔn)確。而這種情況，反映的正是美國高中作文評價(jià)有相當(dāng)高的效度。

美國作文教學(xué)之所以卓有成效，注重文體教學(xué)和注重效標(biāo)效度的分文體制訂評價(jià)標(biāo)準(zhǔn)的作文評價(jià)功不可沒。這樣的結(jié)論不是主觀臆測，而是通過客觀分析得出的。了解美國文體教學(xué)與分文體制訂評價(jià)標(biāo)準(zhǔn)的作文評價(jià)，并對評價(jià)效度進(jìn)行分析，我國作文評價(jià)的效度問題亟待解決。

二

怎么改進(jìn)甚至改革高中作文教學(xué)呢？作文成績與寫作能力是否成正比呢？

舉個比較絕對的例子，假如高中作文教學(xué)只有新詩教學(xué)，作文練習(xí)與測評題只有新詩形式的測評題，有這么一個可能結(jié)果，老師抱怨作文難教，學(xué)生抱怨作文難學(xué)難寫、沒東西可寫、太多束縛不自由……還有一個可能結(jié)果是，作文測評成績不錯的高中畢業(yè)生在社會上不會寫讀書筆記，不會寫文學(xué)評論，不會寫報(bào)告，不會寫社論，不會寫計(jì)劃書，不會寫基本的商業(yè)策劃，不會寫比賽公告……作文測評成績不好的高中畢業(yè)生在社會上卻成了新興作家或者公司的文案高手……于是作文教學(xué)改革呼聲四起，興起了半命題寫詩、話題寫詩、材料寫詩、漫畫寫詩、不定題材寫詩、生活化寫詩、心靈化寫詩、學(xué)生詩作互評、多就少改詩、總評詩、面評詩、每日一詩……

當(dāng)然，上述是一個較為絕對的例子，可事實(shí)是，這個絕對例子與當(dāng)下高中作文教學(xué)內(nèi)容的關(guān)系只不過是五十步與百步的差別。高中作文教學(xué)中并未有更多樣的文體介紹和指導(dǎo)，在大部分學(xué)生的腦海中，他們知道的文體就只有文學(xué)性質(zhì)的記敘文、散文、論點(diǎn)論據(jù)論證式議論文、詩歌和戲劇，就在這有限的三四個文體中選擇，較之于事實(shí)上豐富多樣的文體而言，“文體不限”能算是真正意義上的文體不限么？腦海中根本就沒有多少文體概念知識，何談文體不限的選擇呢？在記敘文、散文、論點(diǎn)論據(jù)論證式議論文、詩歌和戲劇范圍內(nèi)分文體定標(biāo)準(zhǔn)的作文評價(jià)是否是真正意義上的分文體定標(biāo)準(zhǔn)作文評價(jià)呢？如前文所示美國中學(xué)文體訓(xùn)練類型涵蓋了工作崗位上大部分的文體寫作，培養(yǎng)了美國人而不是美國學(xué)生普遍良好的寫作能力，而大部分接受過高中作文教學(xué)的中國高中畢業(yè)生，在進(jìn)行工作崗位上基本的文案寫作時一般都是初次接觸，能力匱乏。這不僅是高中語文作文教學(xué)中文體教學(xué)缺失造成的后果，還反映了對應(yīng)于淡化文體教學(xué)的淡化文體評價(jià)的作文評價(jià)的低效度。

任何測評都涉及效度。效度是指所測量到的結(jié)果反映所想要考察內(nèi)容的程度，測量結(jié)果與要考察的內(nèi)容越吻合，則效度越高；反之，則效度越低。在作文教學(xué)中或者在升學(xué)考試中指作文測評的分?jǐn)?shù)反映學(xué)生作文真實(shí)能力的程度。在判斷作文測評是否有效性時，在考慮到測評的內(nèi)容效度的同時還必須考慮到效標(biāo)效度。

內(nèi)容效度最容易理解，它關(guān)心的是測量的內(nèi)容。比如某一個學(xué)段進(jìn)行詩歌寫作教學(xué)，內(nèi)容效度就會考察詩歌寫作測題是不是與這個學(xué)段教授的詩歌寫作知識、方法和技能有正相關(guān)。

效標(biāo)效度稍微復(fù)雜些，是指當(dāng)前一項(xiàng)測驗(yàn)結(jié)果與作為效標(biāo)的資料或數(shù)量之間的相關(guān)程度。效度的高與低，需要有一定的參照點(diǎn)加以考查，尤其是能力的測試。實(shí)際上能力都是無法測量的，因此我們只能確定一個或幾個能反映能力的標(biāo)準(zhǔn)，然后做間接的比較。這種人為確定的效度標(biāo)準(zhǔn)簡稱“效標(biāo)”。效標(biāo)效度關(guān)心的是測量結(jié)果和另外一個效標(biāo)（criterion）的符合程度。比如，據(jù)說微軟公司招人的時候會考一些類似腦筋急轉(zhuǎn)彎的問題，像“紐約有多少個水井蓋”之類。考察者并不真的關(guān)心答題者是不是真的知道紐約有多少個水井蓋，他關(guān)心的是答題者以后的工作業(yè)績（相當(dāng)于效標(biāo)）。那么考題到底能在多大程度上預(yù)測工作業(yè)績呢，或者說這些考題和工作業(yè)績的相關(guān)程度到底如何呢，這就是效標(biāo)效度。比如，在美國高中作文教學(xué)進(jìn)行的同時，進(jìn)行多種文體的訓(xùn)練與測評，這個測評，除了關(guān)心測評題與教學(xué)內(nèi)容的相關(guān)程度外，更關(guān)心學(xué)生實(shí)際生活和工作中的寫作能力及發(fā)展。測題到底能在多大程度上預(yù)測寫作能力呢？或者說這些測題與日后的寫作能力的相關(guān)程度到底如何呢？這就是效標(biāo)效度。

內(nèi)容效度和效標(biāo)效度的區(qū)別首先是調(diào)查者（investigator）的觀察的取向（orientation）不同。使用內(nèi)容效度的調(diào)查者，關(guān)心的是測量的得分。比如教師對學(xué)生進(jìn)行寫作測驗(yàn)，那么學(xué)生在這張?jiān)嚲砩系牡梅终墙處熕P(guān)心的。使用效標(biāo)效度的調(diào)查者，他關(guān)心的是效標(biāo)的得分。比如上面舉的招聘的例子，公司并不真正在乎你在招聘試題上的得分，他在乎的是你以后的工作業(yè)績（相當(dāng)于效標(biāo)），上面舉的作文測評的例子，教師還關(guān)心學(xué)生在以后的生活和工作中的寫作能力（相當(dāng)于效標(biāo)）。

這是兩種效度在觀察重心上的區(qū)別，另一個明顯的區(qū)別就是推論（inference）的程度的不同。對使用內(nèi)容效度的測量者來說，基本上不存在推論。還以作文測題為例，作文成績高分就說明這學(xué)生作文能力好，教師不需要進(jìn)行推論，作文成績得分直接說明問題（如果要引申到學(xué)生的學(xué)習(xí)態(tài)度就是在進(jìn)行推論了）。在效標(biāo)效度的例子里，推論是很明顯的。招聘試題上的得分真的能預(yù)測將來的工作業(yè)績嗎，詩歌寫作成績好真的能預(yù)測將來生活和工作中的寫作能力嗎？局限于記敘文、散文、小說、論點(diǎn)論據(jù)論證式議論文和詩歌的寫作成績好，真的能預(yù)測將來的寫作能力嗎？這時候推論的意味已經(jīng)很強(qiáng)烈了，實(shí)際上效標(biāo)效度就是用來衡量這種推論的可靠性的。

測量者關(guān)心的是測量得分時，用內(nèi)容效度；測量者關(guān)心的是效標(biāo)得分時，用效標(biāo)效度，也許還需要解釋一下，這兩種效度并非只能用于不同的作文測題，而是取決于測量者如何使用作文測題。比如，同樣是一套或一系列作文測題，兩種效度都可以用來考核它，這取決于施測者如何使用這套或者一系列作文測題。如果施測者只想從中知道學(xué)生對相關(guān)的寫作知識和能力的掌握情況，那么他應(yīng)該關(guān)心這套或這個系列作文測題的內(nèi)容效度如何；如果施測者想以此推斷學(xué)生將來工作生活中的寫作能力，那么他應(yīng)該關(guān)心這套或者這個系列的寫作測題的效標(biāo)效度如何。

在關(guān)注效標(biāo)效度時，不能忽略了同時效度和預(yù)測效度。它們是在時間上對效標(biāo)效度進(jìn)行的分類。它們的區(qū)別是時間上不同，同時效度的效標(biāo)和原測量工具是同時施測的，而預(yù)測效度的效標(biāo)是在原測量工具之后施測的。比如學(xué)習(xí)期間正式進(jìn)行的作文寫作測驗(yàn)的同時效度的效標(biāo)是與這些測驗(yàn)并行的學(xué)生寫作練習(xí)成績和老師觀察評價(jià)等，而預(yù)測效度的效標(biāo)則可以是期末考作文成績，高考作文成績和生活工作中的寫作能力。

前文已經(jīng)說道，效標(biāo)效度的使用者真正關(guān)心的是效標(biāo)上的結(jié)果，因而待檢驗(yàn)的測量工具其實(shí)是作為效標(biāo)的替代物出現(xiàn)的。為什么要使用替代物呢？其理由在預(yù)測效度這里很明顯，效標(biāo)是作用于將來的，我現(xiàn)在要知道結(jié)果就必須使用替代物。比如要知道學(xué)生在將來正式高考時的可能成績，那么我們需要使用有較高的預(yù)測效度的模擬試卷。又或者要知道學(xué)生將來寫研究報(bào)告的能力，那么教學(xué)時應(yīng)該使用有較高的預(yù)測性的作文測題；這兩個例子里的模擬試卷和寫作測題都是為了實(shí)現(xiàn)預(yù)測的目的而必須使用的替代性的測量工具。

結(jié)合以上關(guān)于內(nèi)容效度和效標(biāo)效度的分析，我國作文教學(xué)和作文評價(jià)的現(xiàn)狀如下：高中作文教學(xué)模塊“表達(dá)與交流”有三大內(nèi)容：一談如何寫好記敘，描寫，抒情，議論，二談“虛構(gòu)”與真實(shí)，側(cè)重虛構(gòu)，三談好文章的四項(xiàng)指標(biāo)――深刻，充實(shí)，文采，新穎。作文評價(jià)對應(yīng)于這三大內(nèi)容的評價(jià)標(biāo)準(zhǔn)。那么從理論上說作文評價(jià)已有了較高的內(nèi)容效度?？墒莾?nèi)容效度高并不代表作文評價(jià)的效度高，并不能真實(shí)反映作文教學(xué)的成效如何，是否科學(xué)合理。在作文教學(xué)中，文體教學(xué)的嚴(yán)重缺失，文體意識嚴(yán)重匱乏導(dǎo)致學(xué)生日后生活中自由寫作思維極為狹隘，沒有可供自由選擇的文體寫作，駕馭文體能力相當(dāng)乏弱導(dǎo)致學(xué)生日后無法快速應(yīng)對豐富多樣的文體寫作，這反映了我國高中作文教學(xué)評價(jià)相當(dāng)?shù)偷男?biāo)效度。

事實(shí)上，高中畢業(yè)后大部分人都有這樣的經(jīng)驗(yàn)，開始社會生活、走上工作崗位后，沒有多少人會繼續(xù)進(jìn)行我國高中作文類型的寫作，例如寫文學(xué)性、詩意、哲理性很強(qiáng)的記敘文、散文、議論文，反而是當(dāng)下高中作文教學(xué)所淡化的形式規(guī)范性很嚴(yán)格而且思維能力要求各具特色的其他文體寫作特別是實(shí)用文體寫作成了很多人的日常寫作，可是在作文評價(jià)過程中，忽視對效標(biāo)效度的分析，并沒有把駕馭這些文體的寫作能力當(dāng)做預(yù)測效標(biāo)來分析和重視。缺少這種效標(biāo)效度分析的作文評價(jià)就無法發(fā)現(xiàn)當(dāng)下作文教學(xué)成效低微，學(xué)生應(yīng)對生活與工作的實(shí)際寫作能力低弱的真正原因。

參考文獻(xiàn)：

[1]黃全愈.高考招生制度改革的追問[J].全球教育展望，2005（5）.

[2]陳文中.外國大學(xué)入學(xué)作文考試的啟示[J].中學(xué)語文教學(xué)，2004（4）.

[3]周鸞飛.近五年我國高中教學(xué)作文評價(jià)的研究[J].湖南師范大學(xué)碩士學(xué)位論文，2009.5.

[4]賀義廉.高考備考作文訓(xùn)練的現(xiàn)狀與誤區(qū)[J].當(dāng)代教育論壇，2008第5期.

[5]王選遨.構(gòu)建符合課程標(biāo)準(zhǔn)要求的寫作教學(xué)新思路[J].語文教學(xué)通訊高中版，2005（3）

[6]朱曉斌.西方寫作教學(xué)研究的新進(jìn)展[J].心理科學(xué)，2001，VOL24（4）.

[7]張娟.我國高考作文命題及評價(jià)回歸生活的訴求[J].教育測量與評價(jià)，2008.9.

[8]黃全愈.“高考”在美國[M].廣西師范大學(xué)出版社.

[9]瞿寶奎.教育學(xué)文集?教育評價(jià)[M].人民教育出版社，1989.

篇2

隨著知識經(jīng)濟(jì)時代的到來，科學(xué)技術(shù)和創(chuàng)新能力已成為國家間競爭的核心要素。高校作為國家科技創(chuàng)新體系的重要組成部分，扮演著越來越重要的角色。作為科研生產(chǎn)活動的主體，高校教師的科研生產(chǎn)力在很大程度上影響著高校整體的科研產(chǎn)出水平和創(chuàng)新能力。

因?yàn)榭蒲挟a(chǎn)出具有不確定性（即較多的投入并不一定能夠獲得相應(yīng)的產(chǎn)出結(jié)果，在自然科學(xué)研究中表現(xiàn)得尤為明顯）、多樣性、連續(xù)性（即本期的研究成果可能會影響下一期的項(xiàng)目申請）、直接傳播性、社會影響深遠(yuǎn)性等，所以，教育界對于高校教師科研生產(chǎn)力的測量指標(biāo)莫衷一是。

一、概念界定

科學(xué)研究是科學(xué)工作者生產(chǎn)知識、應(yīng)用知識的活動，這種活動屬于高度社會化的一般勞動，使人類擁有認(rèn)識和改造自然的巨大力量，反映了人與自然的關(guān)系，應(yīng)該歸屬于生產(chǎn)力的范疇。學(xué)者趙紅州認(rèn)為，社會的科學(xué)能力應(yīng)該屬于特殊的生產(chǎn)力，也就是科學(xué)領(lǐng)域的生產(chǎn)力或科研生產(chǎn)力。謝彩霞等人指出，科研生產(chǎn)力由科研生產(chǎn)要素構(gòu)成，整個科學(xué)研究過程離不開科研生產(chǎn)要素。姚東瑞進(jìn)一步指出，科研生產(chǎn)力作為科學(xué)研究活動的一種產(chǎn)出能力，既包括通過發(fā)現(xiàn)、創(chuàng)造而實(shí)現(xiàn)創(chuàng)新理論、生產(chǎn)知識與發(fā)展科學(xué)的能力，又包括通過整合和應(yīng)用而實(shí)現(xiàn)技術(shù)創(chuàng)新、知識運(yùn)用和轉(zhuǎn)化的能力。葉鐘靈就美國對科研生產(chǎn)力的評價(jià)指標(biāo)進(jìn)行了綜述，按研究開發(fā)工作的成果進(jìn)行統(tǒng)計(jì)，常見的指標(biāo)有專利發(fā)明數(shù)、論文出版數(shù)、成果得獎數(shù)、論文引述數(shù)等?？蒲猩a(chǎn)力是科學(xué)勞動社會化的必然結(jié)果，結(jié)合已有研究，本文中的科研生產(chǎn)力是指科學(xué)研究活動的產(chǎn)出能力，具體表現(xiàn)在產(chǎn)出的數(shù)量和質(zhì)量上。

二、文獻(xiàn)綜述

（一）數(shù)量測量

從國家層面上看，國外對高校教師科研生產(chǎn)力的評價(jià)非常重視，尤其是美國和英國。美國主要是從教學(xué)、科研以及服務(wù)三個方面對高校教師進(jìn)行評價(jià)，其中科研評價(jià)包括學(xué)術(shù)研究和科研項(xiàng)目。學(xué)術(shù)研究包括舉行學(xué)術(shù)報(bào)告、展覽，發(fā)表學(xué)術(shù)論文、專著，申請專利等；科研項(xiàng)目包括開展各級政府部門的縱向基金項(xiàng)目研究，為社會上的公司、企業(yè)進(jìn)行人員培訓(xùn)，提供技術(shù)服務(wù)等。英國對高校教師的科研評價(jià)也比較系統(tǒng)，設(shè)有英國大學(xué)科研評價(jià)體系，由專家組按照統(tǒng)一的標(biāo)準(zhǔn)，依據(jù)達(dá)到國內(nèi)或國際先進(jìn)水平的成果數(shù)量，將評價(jià)結(jié)果分為七個等級同。澳大利亞科研評價(jià)體系則包括文獻(xiàn)計(jì)量指標(biāo)和非文獻(xiàn)計(jì)量指標(biāo)。文獻(xiàn)計(jì)量指標(biāo)包括出版物（賦有權(quán)重）、引用、展現(xiàn)科研特色的結(jié)構(gòu)指標(biāo)（包括出版物的領(lǐng)域分布、合作級別、科研類別）。非文獻(xiàn)計(jì)量指標(biāo)包括常用非文獻(xiàn)計(jì)量指標(biāo)（科研人員數(shù)量、科研時間、外部資金、研究生數(shù)據(jù)、榮譽(yù)和獎勵、演講、國際訪問），適用于人文社會科學(xué)的非文獻(xiàn)計(jì)量指標(biāo)（與校外機(jī)構(gòu)的研究合作產(chǎn)生的方案以及合作發(fā)表的出版物、參與大學(xué)管理、為社會提供學(xué)術(shù)服務(wù)等），以及適用于創(chuàng)造性藝術(shù)學(xué)科的非文獻(xiàn)計(jì)量指標(biāo)（舞蹈家、演員、音樂家、劇作家在公開場合的表演，建筑師和設(shè)計(jì)師的建筑或者創(chuàng)造等）三個方面。

國外研究者認(rèn)為，雖然用出版物的數(shù)量來衡量高校教師的科研產(chǎn)出有諸多局限性，但是從數(shù)據(jù)的可得性以及可靠性出發(fā)，出版物的數(shù)量是一個很好的評價(jià)高校教師科研產(chǎn)出的指標(biāo)。出版物主要指發(fā)表的論文和所著專著兩個方面。

國內(nèi)學(xué)者在測量高校教師科研生產(chǎn)力時，也傾向于采用出版物的數(shù)量作為重要指標(biāo)，但是，考慮到學(xué)科性質(zhì)的不同以及科研產(chǎn)出的多樣性，在借鑒國外經(jīng)驗(yàn)的同時，國內(nèi)學(xué)者對高校教師科研產(chǎn)出的測量指標(biāo)做了進(jìn)一步整理，主要從指標(biāo)分類、指標(biāo)篩選兩個方面進(jìn)行。他們認(rèn)為，科研產(chǎn)出主要表現(xiàn)為學(xué)術(shù)專著、、專利授權(quán)、成果鑒定、技術(shù)轉(zhuǎn)讓等方面。

1.指標(biāo)分類

有學(xué)者根據(jù)科技績效評價(jià)產(chǎn)出指標(biāo)性質(zhì)，將指標(biāo)分為源生指標(biāo)、追加指標(biāo)和派生指標(biāo)三類。源生指標(biāo)包括論文、專著、專利授權(quán)、成果鑒定、技術(shù)轉(zhuǎn)讓、人才培養(yǎng)等；追加指標(biāo)建立在源生指標(biāo)的基礎(chǔ)之上，包括科技獎勵、論著引證、文章被索引及摘錄情況等；派生指標(biāo)是建立在優(yōu)秀的源生指標(biāo)和優(yōu)秀的追加指標(biāo)基礎(chǔ)之上的，包括學(xué)會、研究會、專業(yè)期刊的兼職、獲得榮譽(yù)稱號等。學(xué)者劉丹平、周建方等人采用層次分析法將高校教師科研能力評價(jià)指標(biāo)體系分為目標(biāo)層、準(zhǔn)則層和指標(biāo)層。目標(biāo)層即高校教師科研能力評價(jià)，準(zhǔn)則層包括科研項(xiàng)目、科技成果、論文、論著、專利與著作權(quán)、科研綜合能力6個方面，指標(biāo)層包括國家級科研項(xiàng)目、省部級科研成果、三大檢索論文、學(xué)術(shù)專著、發(fā)明專利、專業(yè)創(chuàng)新能力、學(xué)科建設(shè)和團(tuán)隊(duì)合作精神等24項(xiàng)。

2.指標(biāo)篩選

在各類指標(biāo)中可能存在一些次要的評價(jià)指標(biāo)，因此，需要對這些指標(biāo)進(jìn)行篩選，分清主次。通常使用的篩選方法主要有系統(tǒng)分析法、文獻(xiàn)資料分析優(yōu)選法以及應(yīng)用數(shù)理統(tǒng)計(jì)法等。靳希、張火春和姚力等人在總結(jié)國內(nèi)外有關(guān)業(yè)績考核工作經(jīng)驗(yàn)的基礎(chǔ)上，根據(jù)專業(yè)技術(shù)人員業(yè)績考核的目的，高校教師從事科研工作的特點(diǎn)以及模型設(shè)計(jì)的基本原則，建立了教師業(yè)績考核的指標(biāo)體系。這個體系包括研究任務(wù)、科研專著、科技論文、鑒定科技成果、獲獎科技成果、專利成果以及研究效益7項(xiàng)指標(biāo)。在這7項(xiàng)指標(biāo)的基礎(chǔ)上，根據(jù)科研績效定量評價(jià)體系的設(shè)計(jì)原則，賀天偉和張景林增加了培養(yǎng)人才這一指標(biāo)。鄭秀才從承擔(dān)的科研任務(wù)和取得的科研成果兩個方面綜合設(shè)定了高校教師科研績效評價(jià)指標(biāo)：科研項(xiàng)目及經(jīng)費(fèi)、科研論著（期刊和專著）、科技成果（專利等）、科技成果應(yīng)用、科技成果獲獎。胡金秀、周國強(qiáng)等人從縱向科研立項(xiàng)、科研經(jīng)費(fèi)、成果鑒定、科技獎勵、學(xué)術(shù)論文、專利及計(jì)算機(jī)軟件、著作、對合作完成科研業(yè)績的分配這幾個方面來考察科研績效。胡俊在分析了國內(nèi)外教師科研業(yè)績以及高校教師科研特點(diǎn)的基礎(chǔ)上，建構(gòu)了包括學(xué)術(shù)論文、著作、鑒定成果、技術(shù)轉(zhuǎn)讓等在內(nèi)的新的指標(biāo)體系。

為使對高校教師科研生產(chǎn)力的評價(jià)科學(xué)、合理、全面、有效，在已有研究的基礎(chǔ)上，學(xué)者們進(jìn)一步完善了科研生產(chǎn)力的評價(jià)指標(biāo)體系。劉仁義選定以下指標(biāo)作為科研產(chǎn)出指標(biāo)：學(xué)術(shù)論文，學(xué)術(shù)著作，專利申請與授權(quán)，科技成果鑒定，研發(fā)成果應(yīng)用和其他科技服務(wù)，人才培養(yǎng)，科技獎勵，論著被引、被索及被摘，學(xué)術(shù)兼職，縱向項(xiàng)目，縱向科技經(jīng)費(fèi)，排名與貢獻(xiàn)率，這些指標(biāo)下又分二級指標(biāo)，以計(jì)算教師的科研產(chǎn)出。吳小妹通過專家訪談和問卷調(diào)查的方式，對高校教師科研能力指標(biāo)框架進(jìn)行了修正，其中，科研產(chǎn)出指標(biāo)又分為、發(fā)表專著、獲取專利、獲得獎項(xiàng)、研究報(bào)告、項(xiàng)目資助6個二級指標(biāo)，這6個二級指標(biāo)下又分論文級別、作者排名、出版社等級、專著字?jǐn)?shù)等15個三級指標(biāo)。張宏琴在對當(dāng)前國內(nèi)許多高校正在使用的評價(jià)體系進(jìn)行考察的基礎(chǔ)上，提出了科學(xué)研究指標(biāo)、成果指標(biāo)、學(xué)術(shù)論文指標(biāo)、人才培養(yǎng)情況、社會工作情況（指學(xué)術(shù)講座、黨政職務(wù)）等適用于教學(xué)研究型大學(xué)的高校教師科研績效評價(jià)指標(biāo)體系。

（二）質(zhì)量測量

國外學(xué)者考慮到出版物之間存在著質(zhì)量差異，高校教師在一本引用率很高的期刊上發(fā)表文章和在一本幾乎沒有人引用的期刊上發(fā)表文章所付出的努力和時間是不同的，因此，僅以出版物的數(shù)量來衡量高校教師的科研產(chǎn)出是片面的。于是，不少學(xué)者在計(jì)算出版物數(shù)量的基礎(chǔ)上增加了期刊質(zhì)量權(quán)重以及文章引用率，英國學(xué)者杰蘭特·瓊斯和吉爾·瓊斯為了區(qū)分文章的質(zhì)量，將出版物分為學(xué)術(shù)期刊上的論文、學(xué)術(shù)期刊上的書信、專業(yè)期刊上的文章、流行雜志上的文章、專著、書籍、官方報(bào)告、對編輯工作的貢獻(xiàn)8類。還有學(xué)者認(rèn)為，不同的學(xué)科面臨著不同的文章發(fā)表的競爭壓力，因此，不同學(xué)科學(xué)者的發(fā)表文章數(shù)量應(yīng)該用競爭壓力進(jìn)行修正。而競爭壓力可以用與該學(xué)科相關(guān)的期刊提供的空間和教師的發(fā)表需求之間的比值計(jì)算。

篇3

中圖分類號：G641

文獻(xiàn)標(biāo)識碼：A

文章編號：1672-0717（2015）01-0059-05

收稿日期：2014-11-30

基金項(xiàng)目：湖南省教育科學(xué)“十二五”規(guī)劃2012年度項(xiàng)目“高校有效學(xué)生學(xué)業(yè)評價(jià)研究”（XJK012CGD002）；湖南省社科基金項(xiàng)目“高校發(fā)展性學(xué)習(xí)評估的國際經(jīng)驗(yàn)與借鑒”（13YBA077）；全國教科規(guī)劃教育部重點(diǎn)項(xiàng)目“高校學(xué)業(yè)評估的國際比較研究”（DIA130302）。本文同時受湖南大學(xué)青年教師成長計(jì)劃經(jīng)費(fèi)資助。

作者簡介：劉聲濤（1976-），女，江西萍鄉(xiāng)人，教育學(xué)博士，湖南大學(xué)講師，主要從事高校教學(xué)與學(xué)習(xí)評估研究。

《高等學(xué)校章程制定暫行辦法》實(shí)施以來，教育部核準(zhǔn)了多所大學(xué)的章程，這些章程對學(xué)生學(xué)業(yè)評價(jià)工作的表述高度一致，即：學(xué)生公正地獲得學(xué)業(yè)上的評價(jià)。這個表述中有兩個看似平常實(shí)則復(fù)雜多義的概念：公正、學(xué)業(yè)評價(jià)。博登海墨（Edgar Bodenheimer）說：“公正有一張普洛透斯似的臉，變幻無常，隨時可呈不同形狀，并且有極不相同的面貌。當(dāng)我們仔細(xì)查看這張臉并試圖揭開隱藏其表面之后的秘密時，我們往往會深感迷惑。”[1]在不同的時代與人類活動中，人們對公正的涵義有不同的理解，不同的學(xué)者對于公正也有不完全相同的闡述，迄今尚未形成一個統(tǒng)一的公正論。教育領(lǐng)域中的評價(jià)是一個正在發(fā)展中的概念，其內(nèi)涵在不斷地?cái)U(kuò)大與豐富中。國際上，學(xué)生學(xué)業(yè)評價(jià)近幾十年正在產(chǎn)生教育評價(jià)歷史上從未有過的變革[2]。當(dāng)公正與學(xué)業(yè)評價(jià)兩個復(fù)雜的概念在一起時，有必要了解高校行政管理人員、教師、學(xué)生如何理解公正評價(jià)學(xué)生學(xué)業(yè)，這種理解是否有偏差，如果有偏差那么更合適的理解又是什么。章程是高等學(xué)校依法自主辦學(xué)、實(shí)施管理和履行公正職責(zé)的基本準(zhǔn)則，探討上述問題有益于高校章程制定及以章程為依據(jù)來辦學(xué)。

一、對高校公正評價(jià)學(xué)生學(xué)業(yè)的實(shí)際理解

有三方面的證據(jù)表明，當(dāng)前我國高校學(xué)業(yè)評價(jià)相關(guān)群體主要將公正評價(jià)學(xué)生學(xué)業(yè)理解為通過以考試為主的方式來給予學(xué)生應(yīng)得的分?jǐn)?shù)或等級的活動。第一方面的證據(jù)來自于學(xué)生調(diào)查。2014年1月，筆者在某高校對大學(xué)生進(jìn)行了學(xué)業(yè)評價(jià)書面調(diào)查。調(diào)查包括三個問題：（1）大學(xué)期間，你的學(xué)業(yè)有沒有得到公正的評價(jià)？（2）請給出你或同學(xué)的學(xué)業(yè)被不公正評價(jià)的例子；（3）你認(rèn)為被不公正評價(jià)的原因是什么？學(xué)生針對這三個問題主要圍繞教師如何考及如何評分作答。第二方面的證據(jù)來自于高校相關(guān)政策文本的分析。有研究者對E大學(xué)學(xué)生評價(jià)管理機(jī)構(gòu)的管理職責(zé)、課程學(xué)習(xí)評價(jià)規(guī)定、學(xué)生實(shí)習(xí)評定和畢業(yè)論文評定的相關(guān)規(guī)定、畢業(yè)資格和學(xué)士學(xué)位授予資格的政策文本進(jìn)行分析，發(fā)現(xiàn)我國現(xiàn)行高校對學(xué)生評價(jià)的理解與要求是以專業(yè)知識為主要評價(jià)內(nèi)容，以考試為主要手段進(jìn)行考試成績鑒定[3]。第三方面的證據(jù)來自于研究文獻(xiàn)的內(nèi)容分析。以“高校、公正、評價(jià)”或“大學(xué)、公正、評價(jià)”為關(guān)鍵詞在CNKI數(shù)據(jù)庫中查詢到論述高校公正評價(jià)學(xué)生學(xué)業(yè)相關(guān)問題的3篇論文，這些論文對公正評價(jià)學(xué)生學(xué)業(yè)的界定都是給予學(xué)生客觀公平的學(xué)業(yè)成績?？梢姡藗儗τ诟咝９u價(jià)學(xué)生學(xué)業(yè)的理解與實(shí)踐主要是圍繞學(xué)業(yè)考試和評分進(jìn)行，評價(jià)即考試，公正即評分準(zhǔn)確。

注重考試和評分的學(xué)業(yè)評價(jià)活動發(fā)揮了評價(jià)的測量功能：收集并量化信息。從測量功能角度理解學(xué)生學(xué)業(yè)評價(jià)并不奇怪。我國考試文化盛行，在不少人看來，學(xué)業(yè)評價(jià)即考試是自然而然的。首先，考試在我國有長期的歷史。1930年教育評價(jià)專家泰勒（R.W.Tyler）開始在教育領(lǐng)域使用評價(jià)一詞，此前評價(jià)學(xué)習(xí)的術(shù)語就是考試和測驗(yàn)，而西方的考試和測驗(yàn)發(fā)展的源頭正是我國的科舉制。其次，我國人口眾多，經(jīng)濟(jì)尚欠發(fā)達(dá)，社會誠信體系不成熟，考試依然是對社會有重大影響力的人才選拔手段。

測量意義上的公正評價(jià)學(xué)生學(xué)業(yè)要求評分準(zhǔn)確。簡單地說，公正是在一定社會范圍內(nèi)通過對社會資源的公平合理分配使每一個成員得其所應(yīng)得[4]。測量意義上的學(xué)生學(xué)業(yè)評價(jià)分配什么？最容易被想到的就是學(xué)業(yè)評價(jià)的直接分配――分?jǐn)?shù)或等級。直接的分配類似于代幣，用來獲得真正的分配，如保研資格、獎學(xué)金、工作機(jī)會等社會資源或和社會資源密切相關(guān)的東西。分?jǐn)?shù)或等級是學(xué)生學(xué)業(yè)成就客觀真實(shí)狀態(tài)的數(shù)字表征，公正則意味著數(shù)字表征準(zhǔn)確或地位表征準(zhǔn)確。數(shù)字表征準(zhǔn)確指數(shù)字完全和學(xué)生學(xué)業(yè)成就客觀真實(shí)狀態(tài)相符。因?yàn)楣饕头峙溆嘘P(guān)，數(shù)字對學(xué)生學(xué)業(yè)成就在其團(tuán)體中所處位置表征準(zhǔn)確也能確保學(xué)生在分配時得其所應(yīng)得，這就是地位表征準(zhǔn)確。本文中將數(shù)字表征準(zhǔn)確或地位表征準(zhǔn)確統(tǒng)稱為準(zhǔn)確。

二、測量視角下公正評價(jià)學(xué)生學(xué)業(yè)的挑戰(zhàn)

研究者若對測量意義上的學(xué)業(yè)評價(jià)的基本技術(shù)有更多的了解和思考，會發(fā)現(xiàn)準(zhǔn)確評價(jià)學(xué)生學(xué)業(yè)在測量的各環(huán)節(jié)上都面臨著挑戰(zhàn)。

首先是收集哪些方面的信息。學(xué)業(yè)評價(jià)需要收集學(xué)生在預(yù)期學(xué)習(xí)成果上的表現(xiàn)信息。高校中的學(xué)業(yè)評價(jià)主要是課程學(xué)業(yè)成就評價(jià)。為了保護(hù)高校教師的學(xué)術(shù)自由，同時也因?yàn)楦咝Ｕn程多且不斷變化，課程應(yīng)該有怎樣的學(xué)習(xí)成果由教師自行決定。在制定高校學(xué)術(shù)標(biāo)準(zhǔn)和質(zhì)量標(biāo)準(zhǔn)方面世界領(lǐng)先的英國高等教育質(zhì)量保障署（Quality Assurance Agency for Higher Education， QAA）也僅是在學(xué)科層次上制定基準(zhǔn)，不再細(xì)化到專業(yè)、課程層次。表層上，教師理解課程、設(shè)定合適的教學(xué)目標(biāo)的能力以及個人風(fēng)格等方面的差異導(dǎo)致課程目標(biāo)多樣化。深層上，課程到底該取得何種學(xué)習(xí)成果及價(jià)值判斷，原本就是一個難有統(tǒng)一答案的問題。因而，不同教師授課的同一門課程上被評價(jià)的很可能是學(xué)生不同的學(xué)習(xí)成果的表現(xiàn)。

其次是用什么評價(jià)方法去收集信息。按學(xué)生在評價(jià)活動中要做出的反應(yīng)，測量學(xué)意義上的學(xué)業(yè)評價(jià)可分為選擇――反應(yīng)評價(jià)和建構(gòu)――反應(yīng)評價(jià)。選擇――反應(yīng)評價(jià)包括選擇題、判斷題、匹配題等需要學(xué)生找出答案的評價(jià)形式，建構(gòu)――反應(yīng)評價(jià)包括論文題、表現(xiàn)性測試、檔案袋評價(jià)等需要學(xué)生自己產(chǎn)生答案的評價(jià)形式。每種評價(jià)方式都有其適用情形及局限。選擇――反應(yīng)評價(jià)能考察學(xué)生大范圍的知識掌握情況，易于計(jì)分，但難以考察高層次能力；建構(gòu)――反應(yīng)評價(jià)能引發(fā)學(xué)生在高層次能力上的表現(xiàn)，但難以對學(xué)生的真實(shí)狀況做準(zhǔn)確推論，難以計(jì)分。迄今為止，從測量技術(shù)上沒有找到能很好地克服每類評價(jià)方式局限性的方法。

再次是收集多少信息。由于用于信息收集的時間有限，實(shí)際工作中只能在預(yù)期學(xué)習(xí)成果中選擇若干并設(shè)計(jì)有限的評價(jià)任務(wù)，因而學(xué)業(yè)評價(jià)只能測量學(xué)生特定的、有限的行為樣本。測量實(shí)質(zhì)上是對學(xué)生的真實(shí)狀態(tài)作出推論，推論基于有限的行為樣本，同時推論本身會有或多或少的誤差，這些都導(dǎo)致評分有誤差。

最后是收集到的信息如何量化。選擇――反應(yīng)評價(jià)具有易于計(jì)分但難以測量高層次能力的特點(diǎn)。高等教育的重要教學(xué)目標(biāo)，如理解分析綜合能力、溝通合作能力、自主學(xué)習(xí)創(chuàng)新能力等都需要借助建構(gòu)――反應(yīng)評價(jià)方法來評價(jià)。教育測量學(xué)中，建構(gòu)――反應(yīng)評價(jià)的評分者一致性受到高度關(guān)注。因?yàn)楦叩冉逃闹匾虒W(xué)目標(biāo)難以量化，人們希望至少不同評分者對同一行為樣本的評分不要相差太遠(yuǎn)。但這種對評分者間一致性的期望也面臨挑戰(zhàn)：評分者的標(biāo)準(zhǔn)設(shè)定或?qū)σ延袠?biāo)準(zhǔn)的理解不盡相同，同時教育測量學(xué)已經(jīng)證實(shí)學(xué)業(yè)評價(jià)中各種心理效應(yīng)導(dǎo)致的評價(jià)偏差客觀存在且難以克服?；谠u分的困難，波帕姆（W.James Popham）等著名教育評價(jià)專家都認(rèn)為應(yīng)對論文題或檔案袋評價(jià)的使用持謹(jǐn)慎態(tài)度[5]（P139）。

事實(shí)上，對測量技術(shù)有更多了解和反思的學(xué)者對考試有著冷靜而客觀的認(rèn)識。波帕姆認(rèn)為應(yīng)該降低教師對分?jǐn)?shù)能反映學(xué)生實(shí)際成就水平的迷信[5]（P28）；沃爾弗德（Barbara E.Walvoord）建議放棄擁有完美、簡單的等級評分體系的幻想，接受它會有缺陷和限制的現(xiàn)實(shí)[6]（P10）；劉易斯（Harry R.Lewis）認(rèn)為分?jǐn)?shù)決不可能成為準(zhǔn)確比較不同學(xué)科成績的標(biāo)尺，即使在一門課程內(nèi)，分?jǐn)?shù)也是不準(zhǔn)確的[7]；韋墨（Maryellen Weimer）指出分?jǐn)?shù)能夠精確地衡量與客觀評價(jià)學(xué)習(xí)的認(rèn)識是錯誤的[8]。

可以說，準(zhǔn)確評價(jià)學(xué)生學(xué)業(yè)是一種誤解和想象，但當(dāng)前我國高校卻對它有著過度的依賴和關(guān)注，并且高校教和學(xué)中的很多負(fù)面現(xiàn)象都和這種依賴和關(guān)注有關(guān)。

盡管多數(shù)教師不能從測量技術(shù)的角度說清楚給學(xué)生準(zhǔn)確評價(jià)學(xué)業(yè)有多困難，但是他們會感受到這點(diǎn)，尤其是面對建構(gòu)――反應(yīng)題時。有的教師會因沒有合理評價(jià)學(xué)生而內(nèi)心不安，還有教師擔(dān)心評分不合理導(dǎo)致學(xué)生投訴。為避免評分可能帶來的麻煩，高校教師經(jīng)常使用以下策略：（1）抬高分?jǐn)?shù)。給全體同學(xué)更高的分?jǐn)?shù)，盡管這對于優(yōu)秀的學(xué)生不公正，但可以避免因評分過低而被學(xué)生投訴；（2）對學(xué)生按正態(tài)分布評分。正態(tài)分布是眾所周知的能力分布，按正態(tài)分布分配不同分?jǐn)?shù)等級的人數(shù)比例，這樣使得分?jǐn)?shù)看起來很正常；（3）盡量用選擇――反應(yīng)題。選擇――反應(yīng)題好評分，在理工科的測驗(yàn)中普遍使用；（4）秘而不宣的標(biāo)準(zhǔn)與任務(wù)。若公開標(biāo)準(zhǔn)與任務(wù)，教師擔(dān)心學(xué)生通過不同的渠道做準(zhǔn)備，導(dǎo)致分?jǐn)?shù)看起來不符合學(xué)生水平。

一直以來，大學(xué)生學(xué)習(xí)研究不斷地證明著學(xué)業(yè)評價(jià)對于學(xué)生學(xué)習(xí)的影響[9]。學(xué)業(yè)評價(jià)過于依賴與關(guān)注考試對學(xué)生的負(fù)面影響包括：（1）膚淺學(xué)習(xí)。選擇――反應(yīng)評價(jià)主要考查記憶、再認(rèn)等低層次的認(rèn)知能力，這只需要學(xué)生的膚淺學(xué)習(xí)即能應(yīng)對。即便是形式上的建構(gòu)――反應(yīng)評價(jià)，若沒有對題目及評分進(jìn)行精心設(shè)計(jì)，也可能只是考查學(xué)生低層次能力。（2）突擊學(xué)習(xí)?？荚嚢l(fā)生在學(xué)習(xí)告一段落后，再加上考察低層次能力，學(xué)生完全可以通過突擊學(xué)習(xí)通過考試，部分學(xué)生甚至還能獲得高分。（3）舞弊。既然評價(jià)注重的是分?jǐn)?shù)而不是學(xué)習(xí)，學(xué)生就會想方設(shè)法獲得分?jǐn)?shù)，包括以舞弊的方式。（4）對課程的誤解。事實(shí)上，學(xué)生是根據(jù)學(xué)業(yè)評價(jià)而不是教師的課程介紹來定義課程[10]。一門只要求死記硬背的課程在學(xué)生眼中就是枯燥無味、干巴巴的。不合適的學(xué)業(yè)評價(jià)會讓學(xué)生對真實(shí)的成人智力世界產(chǎn)生誤解。（5）失去通過學(xué)業(yè)評價(jià)調(diào)整自己學(xué)習(xí)的機(jī)會?？荚囋趯W(xué)期末進(jìn)行，沒有反饋，而反饋被認(rèn)為是改進(jìn)學(xué)習(xí)的核心要素。

三、高校公正評價(jià)學(xué)生學(xué)業(yè)：以改進(jìn) 學(xué)習(xí)為首要目標(biāo)

面對測量意義上公正評價(jià)學(xué)生學(xué)業(yè)的挑戰(zhàn)，自然要提高測量技術(shù)，以不斷提高對學(xué)業(yè)的測量能力及測量準(zhǔn)確程度。更重要的是，要意識到并承認(rèn)考試固有的局限性。承認(rèn)這種局限性不僅是正確使用考試的關(guān)鍵，更是一種基本的科學(xué)態(tài)度，它告訴我們要改變對考試與分?jǐn)?shù)的過分依賴與關(guān)注，正確認(rèn)識公正評價(jià)學(xué)生學(xué)業(yè)的內(nèi)涵。

首先要正確認(rèn)識學(xué)業(yè)評價(jià)的內(nèi)涵。在過去的幾十年中，學(xué)業(yè)評價(jià)被不斷地審視與反思。早在1930年，泰勒開始在教育領(lǐng)域使用評價(jià)概念，提出評價(jià)比考試和測驗(yàn)有更多的功能和目的，認(rèn)為教育評價(jià)僅用于檢測學(xué)生的成就是不夠的，同時也要關(guān)注課程內(nèi)容、課程形式、學(xué)生活動、學(xué)習(xí)的多種結(jié)果。20世紀(jì)60年代初，克龍巴赫（Cronbach，L.J.）建議評價(jià)者們重新確定評價(jià)的概念――不是根據(jù)競爭的成績，而是作為一個搜集和報(bào)告對課程研制有指導(dǎo)意義的信息過程，強(qiáng)調(diào)評價(jià)的診斷和反饋?zhàn)饔肹11]?？梢姡谠u價(jià)的最初發(fā)展階段，學(xué)者主要就“什么需要被評價(jià)”及“評價(jià)起什么作用”擴(kuò)展了評價(jià)的含義，認(rèn)為評價(jià)的功能是信息收集及分析反饋，這一功能不僅學(xué)業(yè)成就檢測上需要，與學(xué)習(xí)相關(guān)的多項(xiàng)工作上都需要。在此階段，教師被認(rèn)為是評價(jià)的組織實(shí)施者及評價(jià)信息的分析使用者。1968年，布盧姆（Benjamin Bloom）將形成性評價(jià)的概念用于學(xué)生學(xué)習(xí)，認(rèn)為應(yīng)在學(xué)生學(xué)習(xí)過程中通過檢測診斷學(xué)習(xí)中的問題。形成性評價(jià)主要就“什么時候評價(jià)”擴(kuò)展了評價(jià)的含義。20世紀(jì)80年代后，社會經(jīng)濟(jì)發(fā)展不斷對人才培養(yǎng)工作提出更高要求，同時認(rèn)知心理學(xué)等學(xué)科揭示了學(xué)生在學(xué)習(xí)中發(fā)揮積極主動性的作用，大量學(xué)者開始進(jìn)一步挖掘評價(jià)在學(xué)習(xí)中所能起的作用。學(xué)者主要就“評價(jià)的核心功能及其實(shí)現(xiàn)途徑”、“學(xué)生在評價(jià)中的角色”擴(kuò)展評價(jià)的含義。評價(jià)依然是信息收集及分析反饋工具，但這一工具被認(rèn)為應(yīng)該是以改進(jìn)學(xué)習(xí)為首要目標(biāo)。不同學(xué)者或研究組織用不同的名稱來稱呼這種以改進(jìn)學(xué)習(xí)為首要目標(biāo)的評價(jià)，如學(xué)習(xí)導(dǎo)向評價(jià)、為了學(xué)習(xí)的評價(jià)等，并且總結(jié)了這類評價(jià)的特征。英國的評價(jià)改革研究小組（Assessment Reform Group，ARG）認(rèn)為，為了學(xué)習(xí)的評價(jià)應(yīng)該是：有效的教學(xué)設(shè)計(jì)中的一部分；關(guān)注學(xué)生如何學(xué)習(xí)；課堂活動的核心內(nèi)容；教師需要掌握的關(guān)鍵專業(yè)技能；建設(shè)性的，因?yàn)槿魏卧u價(jià)都會帶來學(xué)生情緒、情感的影響；考慮到學(xué)生學(xué)習(xí)動機(jī)的重要性；促進(jìn)對學(xué)習(xí)目標(biāo)的理解，在評價(jià)標(biāo)準(zhǔn)上應(yīng)該達(dá)成共識；保證學(xué)生得到如何取得進(jìn)步的建設(shè)性指導(dǎo)；發(fā)展學(xué)生自我評價(jià)的能力，促進(jìn)他們進(jìn)行反思和自我管理；認(rèn)可學(xué)生各個方面的成就[12]。不同學(xué)者或研究組織總結(jié)的為了學(xué)習(xí)的評價(jià)的特征大同小異，從這些特征中可以明顯看出為了學(xué)習(xí)的學(xué)業(yè)評價(jià)從目的到形式完全不同于考試。

其次要正確認(rèn)識學(xué)業(yè)評價(jià)中公正的內(nèi)涵。為了學(xué)習(xí)的學(xué)業(yè)評價(jià)分配什么？分配的是能改進(jìn)學(xué)生學(xué)習(xí)的信息以及根據(jù)這些信息所確定的合適的教育。聯(lián)合國教科文組織的著名報(bào)告《學(xué)會生存――教育世界的今天和明天》在談及教育中的機(jī)會平等時指出：“給每個人平等的機(jī)會，并不是指名義上的平等，即對每一個人一視同仁，如目前許多人所認(rèn)為的那樣。機(jī)會平等是要肯定每一個人都能受到適當(dāng)?shù)慕逃?，而且這種教育的進(jìn)度和方法是適合個人的特點(diǎn)的。”[13]應(yīng)像理解教育中的機(jī)會平等一樣理解學(xué)業(yè)評價(jià)中的公正，因?yàn)樗鼈冇兄餐氖姑D―讓學(xué)生學(xué)會生存，獲得發(fā)展。

澄清學(xué)業(yè)評價(jià)工作的首要目標(biāo)不僅是評價(jià)內(nèi)涵擴(kuò)展和豐富的結(jié)果，還是使評價(jià)活動有效的要求。選拔、甄別、診斷、鑒定、認(rèn)證、發(fā)現(xiàn)、發(fā)展、管理等等都是評價(jià)可能具備的目標(biāo)。研究者認(rèn)為，包括學(xué)業(yè)評價(jià)在內(nèi)的評價(jià)活動之所以很困難就在于評價(jià)可以同時具備多種目標(biāo)[14]，但難以同等良好地實(shí)現(xiàn)所有目標(biāo)，得到最重視的目標(biāo)決定評價(jià)的內(nèi)在結(jié)構(gòu)與外在形式。這也就是為什么在學(xué)業(yè)評價(jià)的研究文獻(xiàn)中總是可以看到學(xué)者指出對某些評價(jià)功能和目標(biāo)“過于重視”、“過于關(guān)注”、“過于依賴”、“過分強(qiáng)調(diào)”，認(rèn)為對某些評價(jià)功能和目標(biāo)應(yīng)該“突顯”、“強(qiáng)調(diào)”。評價(jià)工作需要確定首要目標(biāo)，并從這個首要目標(biāo)出發(fā)設(shè)計(jì)評價(jià)，以確保首要目標(biāo)的達(dá)成而不是其它。

人們依賴考試一方面是對考試的局限性了解不夠，另一方面是強(qiáng)調(diào)了學(xué)業(yè)評價(jià)在人才培養(yǎng)中不合適的目標(biāo)――管理。當(dāng)前我國高校中的學(xué)業(yè)評價(jià)，與其說是一種教育方式，不如說是一種管理方式。在高校管理中，考試是高效且便利的以考促學(xué)的工具。高校中的學(xué)業(yè)考試是高利害的，因?yàn)樗彤厴I(yè)及各種榮譽(yù)有關(guān)，這樣的考試自然能促使學(xué)生學(xué)習(xí)。但我們必須追問，有沒有導(dǎo)致正確的學(xué)習(xí)？不管考試在管理上多么高效和便利，它終究是以犧牲學(xué)生的利益為代價(jià)。正是對于以管理為目標(biāo)的學(xué)業(yè)評價(jià)的依賴，人們很難看到它和改進(jìn)學(xué)生學(xué)習(xí)的關(guān)系。只有把學(xué)生的利益放在第一位，而不是把管理的效率和方便放在第一位，才能正確理解公正評價(jià)學(xué)生學(xué)業(yè)的內(nèi)涵。

為了學(xué)習(xí)的學(xué)業(yè)評價(jià)在國外高校人才培養(yǎng)工作中正在發(fā)揮著重要作用。首先政府部門和相關(guān)組織明確將以改進(jìn)學(xué)習(xí)為首要目標(biāo)的評價(jià)寫進(jìn)政策文件中。美國高等教育協(xié)會（The American Association for Higher Education，AAHE）制定的良好學(xué)生學(xué)習(xí)評價(jià)活動的第一條原則是：評價(jià)學(xué)生的學(xué)習(xí)必須從教育的價(jià)值開始[6]（P171）。QAA明確要求：評估實(shí)踐應(yīng)促進(jìn)有效學(xué)習(xí)[15]。其次學(xué)者積極進(jìn)行理論研究，并和教師一起進(jìn)行學(xué)業(yè)評價(jià)改革。如，美國學(xué)者安吉洛和克羅斯（Anglo，T.&Cross，P.）等在20世紀(jì)80年代組織的課堂研究項(xiàng)目；澳大利亞學(xué)者南丁格爾（Nightingale，P.）等在20世紀(jì)90年代中期組織的大學(xué)教學(xué)促進(jìn)項(xiàng)目（Committee for the Advancement of University Teaching，CAUT）。這些項(xiàng)目均是由評價(jià)專家組織及指導(dǎo)教師進(jìn)行學(xué)業(yè)評價(jià)改革行動研究，在實(shí)踐中發(fā)現(xiàn)問題，解決問題，形成豐富的學(xué)業(yè)評價(jià)資源。如，學(xué)業(yè)評價(jià)方法、學(xué)業(yè)評價(jià)范例供更多教師使用，并致力于在高校形成以改進(jìn)學(xué)習(xí)為目標(biāo)的評價(jià)文化。相比之下，我國對高校學(xué)業(yè)評價(jià)的認(rèn)識及實(shí)踐還停留在考試階段，高校中盛行的依然是考試文化而不是評價(jià)文化。

四、結(jié)語

在各項(xiàng)教育改革中，評價(jià)均被視為最難點(diǎn)或瓶頸。評價(jià)的首要目標(biāo)選擇不當(dāng)是評價(jià)不能取得預(yù)期效果的重要原因之一。長期以來，我國高校學(xué)業(yè)評價(jià)均承擔(dān)著測量者的角色，人們認(rèn)為公正評價(jià)即公正評分。在這種情況下，需要從政策層面對人們的認(rèn)識和實(shí)踐進(jìn)行正確引導(dǎo)。翻看我國《教育法》，可以發(fā)現(xiàn)教育部已核準(zhǔn)的章程中，對學(xué)生學(xué)業(yè)評價(jià)工作的表述基本上和《教育法》中的表述一致。章程要與教育法保持一致無可厚非，但保持一致并不意味著原封不動，其遣詞造句若能有利于糾正對高校學(xué)業(yè)評價(jià)即考試的片面認(rèn)識，引導(dǎo)高校進(jìn)行有利于改進(jìn)學(xué)生學(xué)習(xí)的評價(jià)則更有益于高校提高人才培養(yǎng)質(zhì)量。即使對學(xué)生學(xué)業(yè)評價(jià)工作沿用和教育法一致的表述，也需要高校相關(guān)群體正確認(rèn)識與實(shí)踐公正評價(jià)學(xué)生學(xué)業(yè)，讓學(xué)生真正從學(xué)業(yè)評價(jià)活動中受益。

參考文獻(xiàn)

[1] [美]博登海墨.法理學(xué)――法哲學(xué)及其方法[M].北京：華夏出版社，1987：238.

[2] 崔允t.促進(jìn)學(xué)習(xí)：學(xué)業(yè)評價(jià)的新范式[J].教育科學(xué)研究，2010（03）：11-15.

[3] 沈曉麗.我國普通高校學(xué)生評價(jià)實(shí)踐研究――以E大學(xué)為個案[D].華東師范大學(xué)碩士學(xué)位論文，2008：摘要.

[4] 洋龍.平等與公平、正義、公正之比較 [J].文史哲，2004（04）：145-151.

[5] [美]W.James Popham.促進(jìn)教學(xué)的課堂評價(jià)[M].北京：中國輕工業(yè)出版社，2003.

[6] [美]Barbara E.Walvoord & Virginia Johnson Anderson.等級評分――學(xué)習(xí)和評價(jià)的有效工具[M].北京：中國輕工業(yè)出版社，2004.

[7] [美]哈瑞.劉易斯.失去靈魂的卓越[M].侯定凱，等譯.上海：華東師范大學(xué)出版社，2012：117.

[8] [美]瑪麗埃倫.韋默.以學(xué)習(xí)者為中心的教學(xué)――給教學(xué)實(shí)踐帶來的五項(xiàng)關(guān)鍵變化[M].洪崗譯.杭州：浙江大學(xué)出版社，2006：82.

[9] Nightingale，P.，Te Wiata，I.，Toohey，S.，Ryan，G.，Hughes，C.，and Magin，D.Assessing Learning in Universities.Sydney：University of New South Wales Press，1996.117.

[10] David Carless，Gordon Joughin，Ngar-Fun Liu.How Assessment Supports Learning：Learning-oriented Assessment in Action[M].Hong Kong University Press.2006：2.

[11] 王萍，高凌飚.“教育評價(jià)”概念變化溯源[J].華南師范大學(xué)學(xué)報(bào)（社會科學(xué)版），2009（04）：39-43.

[12] Assessment Reform Group.Assessment for Learning：10 Principles[R].Cambridge：University of Cambridge，2002.

篇4

隨著高校擴(kuò)招，我國的高等教育進(jìn)入大眾化階段，越來越多的學(xué)生有機(jī)會走進(jìn)大學(xué)校園接受高等教育。然而，越來越多的人開始懷疑我國高校培養(yǎng)的這些學(xué)生的質(zhì)量，這些學(xué)生是不是高質(zhì)量的人才？他們能不能滿足社會各界對人才的需要？他們還是所謂的“天之驕子”嗎？

這些疑問漸漸地不再是疑問了，人們看到當(dāng)代大學(xué)生的素質(zhì)正在逐漸降低，一方面社會各行各業(yè)對人才的需求如饑似渴，另一方面越來越多的大學(xué)生失業(yè)。本科畢業(yè)不好找工作就考研，碩士畢業(yè)不好找工作就繼續(xù)考博，博士畢業(yè)呢？如今我國的高等教育廣受詬病，“讀書無用論”一再泛濫，廣大教育界師生一直在探討如何能提高我國高等教育的質(zhì)量，如何讓高等教育真正培養(yǎng)社會所需要的人才。

我們知道，高考具有“指揮棒”的作用，即“考什么，就學(xué)什么；怎么考，就怎么學(xué)”。到了高等教育階段之后，考試仍然發(fā)揮重要的作用，卻已不是對學(xué)生考核的唯一方法，對學(xué)生的評價(jià)也不能僅僅看分?jǐn)?shù)了。既然考核評價(jià)機(jī)制的改革有助于提高我國高等教育的質(zhì)量，我們首先要全面了解考核評價(jià)機(jī)制的含義、內(nèi)容和作用。

考核評價(jià)機(jī)制包括考核和評價(jià)兩方面內(nèi)容，考核是考察核實(shí)、研究考證之義，評價(jià)是衡量、評估價(jià)值之義，一套完整的考核評價(jià)機(jī)制要有完善的考核方法，并根據(jù)考核的結(jié)果做出評價(jià)。考核評價(jià)機(jī)制的作用有三個方面：

第一，考核評價(jià)機(jī)制是測量教育教學(xué)效果的工具，教學(xué)質(zhì)量的判定既有定性描述又有定量分析，考核評價(jià)機(jī)制就是教育效果的測量工具。舉例來說，考試是一種重要的考核方法，分?jǐn)?shù)是評價(jià)教學(xué)效果的重要媒介。第二，考核評價(jià)的結(jié)果是對教育教學(xué)信息的反饋。考核評價(jià)的結(jié)果可以為教育教學(xué)系統(tǒng)反饋重要的信息。這種信息反饋給教研人員，能使教研活動更具針對性和實(shí)效性；這種信息反饋給教師，能使教師及時改進(jìn)教學(xué)方法，提高教學(xué)效率；這種信息反饋給學(xué)生，為學(xué)生改進(jìn)學(xué)習(xí)方法提供依據(jù)。第三，考核評價(jià)機(jī)制對教育教學(xué)的發(fā)展具有重要導(dǎo)向作用。學(xué)生會根據(jù)考核評價(jià)機(jī)制的要求進(jìn)行學(xué)習(xí)，教師會按照考核評價(jià)機(jī)制的要求進(jìn)行教學(xué)，學(xué)校會按照考核評價(jià)機(jī)制的要求布置教學(xué)任務(wù)，什么樣的考核評價(jià)機(jī)制就會使教育教學(xué)教學(xué)機(jī)構(gòu)培養(yǎng)出什么樣的學(xué)生?？己嗽u價(jià)機(jī)制導(dǎo)向作用的突出表現(xiàn)之一是高考的“指揮棒”作用。

因?yàn)榭己嗽u價(jià)機(jī)制對教育教學(xué)有如此重要的影響，所以改革考核評價(jià)機(jī)制對教育質(zhì)量的影響也是巨大的。相比于初、中等教育，國家和社會對高等教育的質(zhì)量更為關(guān)注，因?yàn)楦叩冉逃囵B(yǎng)的人才直接面向社會需要，完成高等教育的學(xué)生會直接進(jìn)入社會、參與社會。因而，本文著重分析改革考核評級機(jī)制對提高我國高等教育質(zhì)量的作用。

長期以來，我國高等教育系統(tǒng)中對學(xué)生的考核評價(jià)機(jī)制存在諸多不合理之處，這些不合理之處表現(xiàn)在以下五個方面：

（一）考核形式單一，缺乏多樣性。目前我國高等教育階段對學(xué)生的考核仍然以考試為主，而且多數(shù)是閉卷的筆試，除外語類的其他科目考試基本沒有口試。筆試多是期末一次性考試，考試成績的偶然性較大，很少有平時的考試，這種考核方式與應(yīng)試教育的考核方式?jīng)]有差別，并不能真正考察教育教學(xué)的效果?？荚囋谄谀┻M(jìn)行，削弱了考試對教育教學(xué)信息反饋的作用。雖然許多高校都設(shè)有平時成績這一項(xiàng)，但平時成績名存實(shí)亡，平時成績的多少由老師給定，有些老師以出勤定成績，有些老師甚至不考慮出勤情況，完全忽視對平時成績的考察，多數(shù)情況下平時成績成為老師為不及格學(xué)生提分的工具。另一方面，增加平時的考核內(nèi)容會增加老師的負(fù)擔(dān)，由于學(xué)校缺少對平時考核的監(jiān)督檢查，在缺少監(jiān)督的情況下，多數(shù)老師對平時的考核很懈怠，平時成績儼然已成為“雞肋”。論文是對學(xué)生綜合運(yùn)用知識能力的考核，但僅有少數(shù)課程以論文的形式就行考核，而且論文多是期末交，缺乏對平時學(xué)習(xí)效果的考核。

（二）考試內(nèi)容以記憶性知識為主，缺少對學(xué)生創(chuàng)新性和對知識運(yùn)用能力的考核。閉卷考試的題型固定，分值固定，考試的知識點(diǎn)多為記憶性的。很多老師在考前為學(xué)生劃重點(diǎn)，讓學(xué)生加強(qiáng)記憶，甚至有些老師通過漏題的形式提高學(xué)生的成績。這樣的考試形式使記憶能力強(qiáng)的學(xué)生能考得好成績，很多學(xué)生依靠考前的突擊式的背書就能考高分，而記憶能力差的學(xué)生就會吃虧，而且這樣的考試也不能考察學(xué)生的分析能力和創(chuàng)新性，對知識缺乏應(yīng)用。

（三）我國嚴(yán)進(jìn)寬出的高等教育模式使考核缺乏嚴(yán)格性。學(xué)生一旦進(jìn)入大學(xué)，意味著不再需要像高中那樣刻苦學(xué)習(xí)，“六十分萬歲”的思想頗為流行，如果僅僅是為了拿畢業(yè)證和學(xué)位證，大學(xué)可以說無學(xué)習(xí)壓力可言。對于辛辛苦苦考上大學(xué)的學(xué)生來說，如果因?yàn)榭荚嚥患案穸鵁o法畢業(yè)，別說學(xué)生，就是家長和老師恐怕都無法接受，因而老師自然而然就降低了考試判分的嚴(yán)格性?？荚嚨膰?yán)格性降低，再加上伸縮性極強(qiáng)的平時成績，學(xué)生很容易就能及格，這樣的考核根本不能真實(shí)反映高等教育的效果，教育質(zhì)量怎能提升？此外，學(xué)生的自由選課權(quán)給老師造成一定的壓力，如果一個老師給分低了學(xué)生就不選他的課了，這在一定程度上使考試客觀性和嚴(yán)格性受到影響。

（四）對學(xué)生的評價(jià)過度依賴考試成績。學(xué)校評獎學(xué)金、保送研究生、評優(yōu)秀班干部、推優(yōu)入黨都和考試成績掛鉤，這一方面使得成績好的同學(xué)追求更好的成績，造成類似應(yīng)試教育的效果，另一方面使得成績不好的同學(xué)放棄對好成績的追求，學(xué)生對待考試成績的態(tài)度“兩極分化”，使考試失去激勵作用。無論是哪個結(jié)果，都無法發(fā)揮考試應(yīng)有的作用，考核評價(jià)機(jī)制檢測教育教學(xué)效果和反饋教育教學(xué)信息的作用嚴(yán)重削弱。

（五）對于期末一次性的考試，考完后學(xué)生只知道自己考了多少分，而究竟哪些題做錯了，哪些知識點(diǎn)丟分則完全不知道，由于一門課考完后就不再學(xué)了，學(xué)生也就不去想到底哪兒出錯了，這樣不利于學(xué)生全面掌握知識。學(xué)校沒有相關(guān)的規(guī)定要求老師向?qū)W生完整地反饋考試結(jié)果，學(xué)生也很少主動向老師索要，老師則更不會主動去勞神費(fèi)心地為學(xué)生提供分析。

我國高等教育考核評價(jià)機(jī)制存在的這些問題嚴(yán)重影響我國高等教育的質(zhì)量，考核評價(jià)機(jī)制在我國高等教育教學(xué)中發(fā)揮的作用不容忽視，因而，構(gòu)建科學(xué)的考核評價(jià)機(jī)制勢在必行。根據(jù)我國高等教育考核評價(jià)機(jī)制存在的問題，為了達(dá)到高等教育質(zhì)量的提升的目的，改革考核評價(jià)機(jī)制應(yīng)該包括以下五個方面：

（一）考核形式的多樣化，注重平時成績的考核。高校應(yīng)該增加平時成績在綜合成績中所占的比重，并增加平時成績考核的多樣性，利用平時小論文、課堂展示、課程設(shè)計(jì)、課堂討論和小組合作等形式進(jìn)行考核。平時成績的考察能增強(qiáng)考核評價(jià)機(jī)制反饋教育教學(xué)信息的作用，并能減少期末考試一考定成績的偶然性，真實(shí)反映學(xué)生在教學(xué)過程中學(xué)習(xí)情況。利用口試的形式全面了解學(xué)生對知識的掌握和運(yùn)用能力。期末考試應(yīng)更多利用論文、案例分析、開卷考試等形式，綜合考察學(xué)生的各項(xiàng)能力，尤其是注重利用論文作為考核的方式，論文的寫作需要查閱大量相關(guān)文獻(xiàn)，能綜合考核學(xué)生的理解、分析和寫作能力。

（二）考核內(nèi)容的全面性與科學(xué)性。要減少對記憶性知識的考核，增加對知識運(yùn)用和分析能力的考核；試卷中減少客觀題比例，增加主觀題比例，考察學(xué)生運(yùn)用所學(xué)知識進(jìn)行論述和案例分析的能力。發(fā)達(dá)國家高等教育階段對學(xué)生的考核很少涉及記憶性內(nèi)容，更側(cè)重綜合能力的考核，這一點(diǎn)值得我們學(xué)習(xí)。

（三）增強(qiáng)考核的嚴(yán)格性和客觀性。要想通過考核檢測教育教學(xué)效果和反饋教育教學(xué)信息，必須增強(qiáng)考核的嚴(yán)格性和客觀性。要統(tǒng)一判分的標(biāo)準(zhǔn)，不能因人而異，判分要嚴(yán)格依照判分標(biāo)準(zhǔn)，對于主觀題，老師要根據(jù)學(xué)生答題內(nèi)容公平地給分，不能通融不及格的學(xué)生?？己藝?yán)格了，學(xué)生們自然不敢懈怠，考核的目的也就達(dá)到了。不僅期末考試要嚴(yán)格，平時考核也要嚴(yán)格，考核方式一旦確定，老師和學(xué)生都要嚴(yán)格遵守考核規(guī)定，對于違反規(guī)定的，學(xué)校要依照規(guī)章制度予以懲罰。

（四）評價(jià)學(xué)生不能單純依靠學(xué)習(xí)成績。學(xué)習(xí)成績固然是評價(jià)學(xué)生的重要工具，但是對于高等教育階段的學(xué)生，其綜合素質(zhì)不僅表現(xiàn)在學(xué)習(xí)成績方面，還表現(xiàn)在思想上和道德上。評價(jià)學(xué)生要考慮其參與社會實(shí)踐的程度，思想道德的發(fā)展和其他學(xué)術(shù)成果等，關(guān)注其綜合素質(zhì)。鼓勵大學(xué)生參與社會實(shí)踐，培養(yǎng)自身興趣愛好，提高自身解決問題的能力。

（五）老師要把考核結(jié)果及學(xué)生存在的問題反饋給學(xué)生。大學(xué)生通常只知道自己考試得了多少分，至于哪些知識點(diǎn)上丟分則不知道，加之一門課只學(xué)一學(xué)期，考完后學(xué)生們也不想知道到底哪些知識點(diǎn)沒學(xué)好。因此，要想讓學(xué)生學(xué)好，必須把考核結(jié)果完整地反饋給學(xué)生，使學(xué)生真正明白。

我國的高等教育正處在快速發(fā)展階段，而考核評價(jià)機(jī)制卻沒有跟上高等教育發(fā)展的步伐，考核評價(jià)方式與初、中等教育階段沒有太大的區(qū)別，落后的考核評價(jià)機(jī)制制約了我國高等教育質(zhì)量的提升，不符合培養(yǎng)高質(zhì)量人才的要求。因而必須改革我國高等教育的考核評價(jià)機(jī)制，引導(dǎo)高等教育發(fā)展，通過考核提高學(xué)生學(xué)習(xí)的積極性，全方位培養(yǎng)學(xué)生能力，公正、客觀地評價(jià)教育教學(xué)效果，發(fā)揮高等教育培養(yǎng)高端人才的作用。

[參考文獻(xiàn)]

[1]胡海霞，李鋼.談教學(xué)型高?？己嗽u價(jià)機(jī)制下的考試制度[J].考試周刊（考試研究版），2010（9）：1-3

[2]楊愛英，宋揚(yáng).高等教育考核方式改革初探[J].常州信息職業(yè)技術(shù)學(xué)院學(xué)報(bào)，2009（2）：19-20

[3]趙麗娟，孟憲國.淺論素質(zhì)教育考核評價(jià)體系之構(gòu)建與創(chuàng)新[J].齊齊哈爾大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版)，2005.7：151-152

篇5

一、活動背景

光污染是繼水、氣、聲和渣污染之后的一種新型污染，主要包括白亮污染、人工白晝和彩光污染。光污染的影響首先在于破壞天文觀測環(huán)境，歷史上天文臺因此而被迫搬遷的案例屢見不鮮。英國格林尼治天文臺早在1948年就為躲避光污染和大氣污染而遷往東南沿海環(huán)境優(yōu)美、觀測條件更好的赫斯特蒙蘇堡地區(qū)。在美國、加拿大、日本、西班牙、葡萄牙等國，多個著名天文臺都曾幾次遷址。我國紫金山天文臺的觀測工作也全部轉(zhuǎn)移到了其他觀測站點(diǎn)，紫臺園區(qū)則已改建為天文博物館，以天文科普和天文旅游為主，僅保留了少量與太陽觀測有關(guān)的科研工作。

光污染的影響其實(shí)并不局限于天文觀測。居高不下的學(xué)生近視率、迷途的海龜幼崽、撞上玻璃幕墻的飛鳥、爆發(fā)性增殖的水藻、能源緊缺與氣候變暖，這些看似并無關(guān)聯(lián)的人與事，其實(shí)背后都與燈光之?dāng)_息息相關(guān)。

作為長三角地區(qū)的重要城市之一――無錫的光污染較為嚴(yán)重。在距市中心三陽廣場約6.2公里遠(yuǎn)的天一中學(xué)校園里，天空是白的是灰的是橙的是多彩的，北斗七星中的天權(quán)是看不到的，獅子座的鐮刀是認(rèn)不全的……在距三陽廣場16.9公里遠(yuǎn)的斗山山頂，連仙女座大星系M31和獵戶座大星云M42都僅能勉強(qiáng)分辨，山腳下的路燈和遠(yuǎn)近城鎮(zhèn)的光源清晰可見，天空泛著淺淺的灰白色……在與市區(qū)間隔有10公里的太湖十八灣地區(qū)竟連天頂附近的銀河都徹夜不現(xiàn)，三角座星系M33也必須要通過雙筒鏡才能被觀察到……

為提高學(xué)生及公眾對光污染的認(rèn)識，學(xué)校針對性地引進(jìn)了一批測光儀，并依托天一天文社加賀谷穰工作室（文化宣傳部）、達(dá)蓋爾工作室（學(xué)術(shù)委員會）、伽利略工作室（普及委員會）和斯科特工作室（項(xiàng)目辦公室），設(shè)計(jì)了“多層次城市夜空光度測量科技教育活動”，策劃并實(shí)施了多個文宣、教育、科普和研究性項(xiàng)目。

二、活動目標(biāo)

知識與技能：

1.理解夜空光度、光污染的概念，了解導(dǎo)致夜空光度增大的主要原因。

2.掌握夜空光度分級的方法，并能運(yùn)用器材測量夜空光度值。

3.了解背景光對天文觀測的影響，

學(xué)會設(shè)計(jì)反映此原理的科普實(shí)驗(yàn)。

過程與方法：

1.開展觀星活動、光污染攝影與夜空光度測量活動，掌握天文觀測及夜空光度測量的基本方法。

2.了解策劃、組織活動的過程，學(xué)會科學(xué)研究的一般方法，實(shí)驗(yàn)設(shè)計(jì)的一般結(jié)構(gòu)。

情感、態(tài)度和價(jià)值觀：

1.了解城市對自然地理環(huán)境的改變，不合理的城市亮化帶來的環(huán)境問題，敢于解決問題。

2.在活動中，提升科學(xué)素養(yǎng)，發(fā)展科學(xué)思維、合作創(chuàng)新精神。

三、參與對象與活動形式

活動對象以天一天文社社員為主體，包括國際分社約40人，少年分社約40人，高中分社約70人，榮譽(yù)分社約20人。此外，還包括無錫市中小學(xué)天文聯(lián)合會（錫天聯(lián)）下屬成員學(xué)校約150人，以及其他相關(guān)單位的學(xué)生約300人。

活動主體――天一天文社社員參與了“多層次城市夜空光度測量科技教育活動”的全部項(xiàng)目、環(huán)節(jié)的活動，包括項(xiàng)目研究、實(shí)驗(yàn)設(shè)計(jì)、科普觀測和攝影活動。錫天聯(lián)成員學(xué)校、無錫市少年宮等其他相關(guān)單位的學(xué)生主要參與了科普觀測和攝影活動。

四、活動的重點(diǎn)、難點(diǎn)、創(chuàng)新點(diǎn)

活動重點(diǎn)：搭建天文研究平臺，以光污染研究為抓手，調(diào)動學(xué)生積極性，讓更多的學(xué)生參與到天文活動中來。

活動難點(diǎn)：城市夜空光度測量研

究，光污染相關(guān)實(shí)驗(yàn)設(shè)計(jì)。

活動創(chuàng)新點(diǎn)：由中學(xué)發(fā)起并組織

的使用國際頂尖測光儀對城市進(jìn)行高覆蓋度的夜空光度測量研究，夜天光監(jiān)測站點(diǎn)建設(shè)在世界范圍內(nèi)都具有唯一性；由中學(xué)生開展科普實(shí)驗(yàn)設(shè)計(jì)與教材編寫同樣具有開創(chuàng)性；以光污染為主題的攝影大賽在當(dāng)今世界也是少見的。

五、可利用的各類科技教育資源

1.技術(shù)指導(dǎo)：中科院紫金山天文臺科普部、北京師范大學(xué)天文系高爽老師、國家天文臺劉博洋博士等以技術(shù)顧問的身份，參與了“城市夜空光度測量”的相關(guān)活動指導(dǎo)。此外，南京大學(xué)、中國科技大學(xué)、北京天文館的專家教授們也曾多次來校指導(dǎo)天文課程建設(shè)。

2.團(tuán)隊(duì)建設(shè)：錫天聯(lián)成員學(xué)校、無錫市少年宮等作為天一天文社緊密的合作伙伴，不僅為開展與夜空光度相關(guān)的科普活動提供了場地與學(xué)生支持，而且還有一批教師參與共同開展天文教研活動，形成了教研團(tuán)隊(duì)。

3.資金支持：天一中學(xué)為開展天文教育投入了大量的資金，已多批次采購天文實(shí)驗(yàn)器材如望遠(yuǎn)鏡、測光儀、相機(jī)、野營設(shè)備、圖書等，并已建設(shè)完成天文創(chuàng)新實(shí)驗(yàn)室一間；天文創(chuàng)新實(shí)驗(yàn)室作為學(xué)?！癝TS綜合創(chuàng)新課程基地”的重要組成部分，還得到了省市區(qū)各級教育部門的專項(xiàng)建設(shè)資金支持；錫天聯(lián)成員學(xué)校、無錫市少年宮等單位也配套投入了相關(guān)的天文基地建設(shè)。

六、活動內(nèi)容

“多層次城市夜空光度測量科技教育活動”的全部項(xiàng)目、環(huán)節(jié)的活動，包括項(xiàng)目研究、實(shí)驗(yàn)設(shè)計(jì)、觀測實(shí)踐和攝影活動等多個層次，分別由天一天文社斯科特工作室（項(xiàng)目辦公室）、伽利略工作室（普及委員會）、達(dá)蓋爾工作室（學(xué)術(shù)委員會）和加賀谷穰工作室（文化宣傳部）等四大工作室具體負(fù)責(zé)。表1為各工作室的智能類型列表。

（一）主題活動一：城市夜空光度測量（項(xiàng)目研究）

1.選題背景及意義：

無錫作為長三角地區(qū)的重要城市之一，經(jīng)濟(jì)發(fā)達(dá)，城市光污染情況總體比較嚴(yán)重，但是不同區(qū)域的污染程度也存在明顯差異。夜空光度是衡量城市光污染程度的重要指標(biāo)，通過使用專門的測光儀器，對無錫城區(qū)進(jìn)行高覆蓋度的光度測量，從而了解無錫城區(qū)整體的污染程度，不同區(qū)域的污染水平差異，以及分析光污染產(chǎn)生的背景，并嘗試提出防治的建議，有利于提高公眾對光污染的認(rèn)識，也能為城市管理部門在優(yōu)化城市燈光設(shè)置時提供參考。

2.活動過程和步驟：

（1）編寫《無錫市夜空光度測量指導(dǎo)》方案。指導(dǎo)學(xué)生收集、整理與夜空光度測量相關(guān)的研究論文及其他材料，對“光污染”“夜空光度”等概念進(jìn)行界定，并組織編寫《無錫市夜空光度測量指導(dǎo)》方案，就測量時間、地點(diǎn)、方法及報(bào)告填寫的格式予以統(tǒng)一規(guī)范。

（2）撰寫開題報(bào)告。指導(dǎo)學(xué)生撰寫《無錫城市夜空光度測量》開題報(bào)告，對研究背景、要解決的問題、選題意義及研究價(jià)值，核心概念的界定、相關(guān)現(xiàn)狀、參考文獻(xiàn)，研究目標(biāo)、研究內(nèi)容、研究假設(shè)，研究思路、研究計(jì)劃，預(yù)期成果等內(nèi)容進(jìn)行項(xiàng)目論證。經(jīng)論證后的項(xiàng)目被中國教育學(xué)會地理教學(xué)專業(yè)委員會研究性學(xué)習(xí)課題專家組立項(xiàng)。

（3）開展測量活動。指導(dǎo)學(xué)生開展城市夜空光度測量活動，具體步驟有：

①儀器編號：為支持本課題組

的研究工作，學(xué)校從加拿大購置了9臺SQM測光儀，并予以編號（以分辨儀器本身存在的機(jī)械誤差）。

②路線設(shè)計(jì)：將無錫市區(qū)劃分為

不同的片區(qū)，并設(shè)計(jì)好測光的具體行

進(jìn)路線和測光任務(wù)。

③實(shí)地測量：將課題組成員分成不同的小組，每組由3人組成，分別負(fù)責(zé)儀器操作、數(shù)據(jù)記錄和坐標(biāo)定位，每個坐標(biāo)點(diǎn)測5個數(shù)據(jù)，以減小誤差。

④數(shù)據(jù)處理：將測光所得的數(shù)據(jù)（經(jīng)度、緯度、時間、測光值）輸入EXCEL表格，進(jìn)行誤差分析，取平均值，得到各坐標(biāo)點(diǎn)夜空光亮度的最終值。

（4）撰寫結(jié)題論文。指導(dǎo)學(xué)生根據(jù)開題報(bào)告中預(yù)期成果的要求對收集的數(shù)據(jù)進(jìn)行不同角度的分析，并將結(jié)論撰寫成結(jié)題論文《無錫城市夜空光度測量研究》。結(jié)題論文主要結(jié)構(gòu)包括：夜空光概述，測量儀器及方法，數(shù)據(jù)分析及測量結(jié)果（數(shù)據(jù)測量與分析步驟、夜空光亮度的地區(qū)分異、夜空光亮度的地區(qū)變化、夜空光亮度的地平高度及方位分異、夜空光亮度的時間變化），反思及討論等。于2015年第4期《地理教學(xué)》雜志。

3.活動效果及呈現(xiàn)方式：

活動進(jìn)行過程中及之后，我們得到了諸多媒體的關(guān)注：指導(dǎo)教師受邀赴上海復(fù)旦大學(xué)為2015年第六屆全國天文社團(tuán)發(fā)展論壇作了《也談高中天文社團(tuán)建設(shè)》的專題報(bào)告，赴江陰為2015年第二屆無錫市高中生峰會作了《城市天文學(xué)》的專題報(bào)告。項(xiàng)目組還收到了國際天文學(xué)聯(lián)合會普及工作委員會及香港大學(xué)物理系的邀請函，受邀加入國際夜空光度監(jiān)測網(wǎng)絡(luò)并赴香港大學(xué)開展項(xiàng)目交流與培訓(xùn)。

在前期活動的基礎(chǔ)上，天一天文社發(fā)起成立了錫天聯(lián)、無錫城市夜空光度監(jiān)測網(wǎng)絡(luò)兩個組織，吸引了南菁中學(xué)、青陽中學(xué)、山明中學(xué)、旺莊實(shí)驗(yàn)小學(xué)等多家單位參與，將在無錫建設(shè)若干城市夜空光度監(jiān)測站，并以此為抓手，開展進(jìn)一步的天文教育活動。

（二）主題活動二：光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)（科普實(shí)驗(yàn)）

1.選題背景及意義：

激發(fā)學(xué)生對科學(xué)的熱情，培養(yǎng)并學(xué)習(xí)掌握科學(xué)研究的方法與技能是我國進(jìn)行素質(zhì)教育的目的之一?？茖W(xué)研究的方法和技能至少應(yīng)包括：分析和觀察周圍世界的技能，發(fā)現(xiàn)問題、提出問題、作出假設(shè)、安排實(shí)驗(yàn)的技能，真實(shí)地記錄觀察結(jié)果與數(shù)據(jù)的技能，按照正確方法處理數(shù)據(jù)的技能。

天文因?yàn)椴粚儆谥行W(xué)必修課程而不被大多數(shù)學(xué)生所了解，中學(xué)階段非常缺乏天文科普實(shí)驗(yàn)或科技制作的教學(xué)內(nèi)容，非常有必要利用天一天文社的資源優(yōu)勢整理、設(shè)計(jì)一些科普天文實(shí)驗(yàn)或制作，這些源自我們身邊的天文科學(xué)知識將極大地激發(fā)學(xué)生對天文的興趣，增加他們對天文的認(rèn)識，促進(jìn)天文知識在基礎(chǔ)教育階段的普及。

2.活動過程和步驟：

（1）編寫“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”模板。指導(dǎo)學(xué)生學(xué)習(xí)《高中物理實(shí)驗(yàn)手冊》等專業(yè)書籍，在此基礎(chǔ)上，編寫“光污染相關(guān)實(shí)驗(yàn)設(shè)計(jì)”模板：活動目標(biāo)、概念與方法、材料準(zhǔn)備、活動步驟、活動建議、活動拓展等，同時，設(shè)計(jì)一份樣稿《在微光中辨認(rèn)顏色》。

（2）開展“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”。指導(dǎo)學(xué)生開展“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”，具體步驟有：

①創(chuàng)意征集：發(fā)動學(xué)生提出光學(xué)

相關(guān)實(shí)驗(yàn)（及制作）設(shè)計(jì)的創(chuàng)意，組織人員從投稿的創(chuàng)意中精選可操作性較高的方案。

②方案編寫：制訂編寫計(jì)劃，并為課題組每一位學(xué)生分配編寫方案（草案），指導(dǎo)他們根據(jù)模板和樣稿的格式及要求進(jìn)行方案編寫。

③實(shí)驗(yàn)驗(yàn)證：將課題組成員分成不同的小組，每組2人，以小組為單位對所編寫的方案進(jìn)行實(shí)驗(yàn)驗(yàn)證。

（3）組織“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”比賽。面向全校師生組織開展“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”比賽，吸引對天文有興趣、樂于動手實(shí)踐的學(xué)生參加“在微光中辨認(rèn)顏色”“彗星為什么長尾巴”“簡易望遠(yuǎn)鏡制作”等比賽，并評優(yōu)頒獎。

（4）舉辦“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”科普活動。面向錫天聯(lián)成員學(xué)校、無錫市少年宮及無錫地區(qū)其他中小學(xué)、幼兒園開展“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”科普活動，針對不同年齡階段的受眾舉辦光污染科普講座或科普游戲。

3.活動效果及呈現(xiàn)方式：

學(xué)生編寫的“光學(xué)相關(guān)實(shí)驗(yàn)設(shè)計(jì)”將被編入校本教材《中小學(xué)生天文學(xué)習(xí)指南3》，這是一本專門介紹天文相關(guān)科普實(shí)驗(yàn)及科技制作的教材，受眾定位為中小學(xué)天好者及天文指導(dǎo)教師。

上述科普實(shí)驗(yàn)及科技制作被引入天文社“宇宙意識”少兒天文科普項(xiàng)目及“天文全球化”社區(qū)天文科普項(xiàng)目，作為寓教于樂的教學(xué)素材向少年兒童及社區(qū)的天好者推廣。

（三）主題活動三：星空光害旅行團(tuán)（觀測實(shí)踐）

1.選題背景及意義：

對業(yè)余天好者來說，觀星是極大的樂趣所在。然而，嚴(yán)重的光污染正將燦爛的星空從我們身邊

奪走。

為便于普通學(xué)生及其他業(yè)余天好者通過對比觀測，直觀地了解無錫各地的光污染情況，我們依托天一天文社組織的“天一觀星營”項(xiàng)目，開展了“星空光害旅行團(tuán)”活動，帶領(lǐng)旅行團(tuán)的團(tuán)員們利用晚上的時間，去往錫城不同的地點(diǎn)，實(shí)地觀測、考察并對比分析星星的數(shù)目，從而普及光污染的防治意識、夜空光度的概念。

2.活動過程和步驟：

（1）編寫觀測方案。指導(dǎo)學(xué)生編寫觀測方案，使用最常見的目視極限星等法，即通過肉眼能觀察到的最暗星等來進(jìn)行估算：選擇2個或2個以上地平高度大于40°的定標(biāo)天區(qū)，數(shù)出該天區(qū)內(nèi)能觀察到的恒星數(shù)目，與國際流星組織提供的表格對應(yīng)來確定極限星等。同時，為便于零天文基礎(chǔ)的團(tuán)員參與，我們設(shè)計(jì)了簡易觀測法，請同學(xué)們觀測標(biāo)志性星座所在天區(qū)的恒星數(shù)量，來比較不同地點(diǎn)的光污染程度。

（2）開展觀測實(shí)踐。帶領(lǐng)旅行團(tuán)的團(tuán)員們利用晚上的時間，去往無錫城不同的地點(diǎn)，實(shí)地觀測、考察并對比分析星星的數(shù)目。具體觀測過的地點(diǎn)有太湖廣場、馨和苑廣場、天一中學(xué)、斗山、保利廣場、崇安寺廣場、南禪寺廣場、安鎮(zhèn)高鐵新城、太湖十八灣等。（見圖9、圖10）

3.活動效果及呈現(xiàn)方式：

通過“星空光害旅行團(tuán)”活動，結(jié)識了一批無錫地區(qū)的成年及未成年業(yè)余天好者。以此為抓手，天一天文社發(fā)起成立了“無錫市業(yè)余天

好者協(xié)會”QQ群。以此活動為素材撰寫的《星星都去哪兒了》發(fā)表在《天好者》雜志2016年第2期。

（四）主題活動四：光污染攝影大賽（文化藝術(shù)）

1.選題背景及意義：

為推動公眾思考光污染在無錫及其所在社區(qū)的狀況，讓公眾參與光污染活動，我們發(fā)起了“光污染攝影大賽”活動。邀請公眾使用攝影設(shè)備捕捉各種光污染的畫面，從而了解及思考無錫地區(qū)乃至全世界日益嚴(yán)重的光污染問題。比賽主題分為：光污染與生態(tài)、光污染與健康、光污染與能源、光污染的分布、光污染的來源等。評選標(biāo)準(zhǔn)主要有：攝影照片視覺美感、作品說明表達(dá)技巧、光污染意涵、手法創(chuàng)意等。

2.活動過程和步驟：

指導(dǎo)學(xué)生起草“光污染攝影大賽章程”，包括組織單位、大賽目的、比賽主題、參賽資格、參賽設(shè)備、照片格式、相關(guān)權(quán)益、比賽日程、評選規(guī)則等。

章程起草完畢后，通過錫天聯(lián)官網(wǎng)、錫天聯(lián)微信公眾號（AUWS2015）、無錫市業(yè)余天好者協(xié)會QQ群（91462404）、牧夫天文論壇無錫天協(xié)專版等渠道向外比賽信息。

投稿截止后，組織專家對作品進(jìn)行評審，并舉辦頒獎儀式。

3.活動效果及呈現(xiàn)方式：

通過光污染攝影比賽，一方面間接了解了無錫地區(qū)光污染的來源、分布情況，另一方面，在公眾中對光污染進(jìn)行了有效的宣傳與普及。光污染攝影作品還被制作成海報(bào)，用于專題展覽。

七、活動可能出現(xiàn)的問題及解決預(yù)案

1.項(xiàng)目研究中的技術(shù)問題：

考慮到光污染問題在大陸地區(qū)的研究仍處于起步階段，即便在世界范圍內(nèi)也未引起足夠的重視，我們在開展夜空光度測量時會遇到各種各樣的技術(shù)問題。對此我們的解決方案主要是：

（1）開題報(bào)告與測量指南兩個指

導(dǎo)性文件必須花大力氣保證質(zhì)量，保證指導(dǎo)性和可操作性。

（2）爭取學(xué)校在測光儀采購上的

支持，以及年級組、班主任在學(xué)生活動時間上的支持。

（3）遇到實(shí)在難以解決的技術(shù)問題，請教中科院紫金山天文臺等相關(guān)研究機(jī)構(gòu)。

2.科普實(shí)驗(yàn)中的素材問題：

中學(xué)生的專業(yè)知識儲備畢竟是有限的，對生活的觀察能力也仍有待提高，這直接導(dǎo)致了科普實(shí)驗(yàn)素材的缺乏。對此我們的解決方案主要是：

（1）大量、深度閱讀中小學(xué)階段及國外的實(shí)驗(yàn)手冊，學(xué)習(xí)實(shí)驗(yàn)編寫的一般結(jié)構(gòu)，積累與光學(xué)相關(guān)的實(shí)驗(yàn)和科技制作素材。

（2）通過天文科普書籍和天文歷

史故事，尋求實(shí)驗(yàn)和科技制作素材。

（3）面向全校發(fā)起光污染相關(guān)實(shí)

驗(yàn)和科技制作素材的征集活動。

3.觀測實(shí)踐中的安全問題：

夜間開展天文觀測實(shí)踐活動遇到的最大挑戰(zhàn)是人身與財(cái)產(chǎn)安全問題，很多學(xué)生、家長或教師不支持天文活動也主要是對此有深深的顧慮。對此我們的解決方案主要是：

（1）與參加活動的學(xué)生簽訂合同，

并要求學(xué)校同意、學(xué)生簽字、家長簽字。

（2）統(tǒng)一、強(qiáng)制購買意外險(xiǎn)，分擔(dān)風(fēng)險(xiǎn)。

（3）與有資質(zhì)、口碑好的旅行社合作，聯(lián)系包車或食宿。

（4）對每一個觀測地點(diǎn)進(jìn)行事先

的實(shí)地探訪，確保觀測地的安全性，遠(yuǎn)離陡坡與水體。

4.攝影大賽中的發(fā)動問題：

攝影大賽看似簡單，就是摁一下快門的事。但真正要發(fā)動公眾參加，激發(fā)大家的熱情卻并不是一件簡單的事。對此我們的解決方案主要是：

（1）通過錫天聯(lián)成員學(xué)校的天文

指導(dǎo)教師，發(fā)動學(xué)生中的天好者參賽。

（2）通過官網(wǎng)、微信公眾號、QQ群等網(wǎng)絡(luò)平臺推送攝影大賽比賽通知。

（3）積極聯(lián)系贊助，為獲獎選手準(zhǔn)備證書、獎杯及獎品。

八、效果評價(jià)標(biāo)準(zhǔn)與方式

在評價(jià)的過程中，堅(jiān)持“主體多元”“方式多樣”“向度多維”等原則。

1.主體多元：

在活動過程中，要求學(xué)生首先進(jìn)行自評和互評，不同組別之間也可以進(jìn)行他評。這有利于加深學(xué)生對評價(jià)標(biāo)準(zhǔn)的認(rèn)識與理解，可以促進(jìn)學(xué)生自我反思和自我發(fā)展。教師在此基礎(chǔ)上，對學(xué)生自評、互評及他評進(jìn)行再評價(jià)，保證了評價(jià)的指導(dǎo)性。

2.方式多樣：

在活動過程中，靈活運(yùn)用即時評價(jià)與延時評價(jià)。即時評價(jià)有利于表揚(yáng)先進(jìn)，糾正缺陷；延時評價(jià)則體現(xiàn)了尊重、關(guān)愛與期待。此外，還將口頭評價(jià)與書面評價(jià)，一次評價(jià)與多次評價(jià)，診斷性評價(jià)、過程性評價(jià)與終結(jié)性評價(jià)等多樣化的評價(jià)方式相結(jié)合，以保護(hù)學(xué)生的積極性，強(qiáng)化學(xué)生的成就感。

篇6

《教育的樞紐》主要有七個主體章節(jié)，主要從公眾關(guān)注的熱點(diǎn)、難點(diǎn)問題入手，對中國高考的一系列重大事件進(jìn)行解讀，并以云南省考試招生工作改革為主旨，詳細(xì)介紹了中央及云南省內(nèi)教育改革和發(fā)展計(jì)劃。在個別章節(jié)，作者倡導(dǎo)崇尚實(shí)學(xué)、突破創(chuàng)新的教育風(fēng)氣，主張從現(xiàn)代教育的本質(zhì)和發(fā)展趨勢出發(fā)，提出新時期中國教育發(fā)展的新思維，建立符合中國文化特征、符合中國民眾意識、符合時代需要的中國特色社會主義現(xiàn)代教育制度。顯然，這也是華山先生的現(xiàn)代教育理想，它并非單純意義上的改革思路，而是于其中貫穿著的現(xiàn)代教育文化意識。在此基礎(chǔ)上，他列舉了大量事例，運(yùn)用對比、互證等方式，總結(jié)研究出了眾多招考改革經(jīng)驗(yàn)和成果。

讀華山先生的《教育的樞紐》，還產(chǎn)生一些感慨。他說，“文章薈萃了一些實(shí)踐經(jīng)驗(yàn)，收藏了一些辛勤付出、聚集了一些關(guān)心呼聲，大多論述的是中國教育改革，都是以當(dāng)事者的身份在解釋、評述、分析和探索教育的發(fā)展與改革，既表達(dá)了自己對中國教育改革成果的欣悅，也展開了自己對中國教育未來發(fā)展的憧憬。”每讀這段話，我都不禁怦然心動。這何嘗不是我們每一位關(guān)心中國教育改革和發(fā)展者的心聲呢！

推薦書目：《教育的樞紐》

作者：朱華山

出版社：云南教育出版社

篇7

Mislevy等（1993）指出，統(tǒng)計(jì)測驗(yàn)理論的發(fā)展可以分為經(jīng)典測驗(yàn)理論（Classical Test Theory， CTT）階段、概化理論階段和項(xiàng)目反應(yīng)理論（Item Response Theory， IRT）階段。CTT和IRT 都屬于標(biāo)準(zhǔn)測驗(yàn)理論。標(biāo)準(zhǔn)測驗(yàn)理論視所測的心理特質(zhì)為一個單純的統(tǒng)計(jì)結(jié)構(gòu)，目的在于從宏觀上給個體一個整體的評估。隨著心理測量學(xué)和認(rèn)知心理學(xué)的進(jìn)一步發(fā)展和現(xiàn)代教育技術(shù)水平的進(jìn)步，學(xué)習(xí)者更加渴求獲得更具體的、細(xì)微水平的測量與診斷評估。Frederiksen、Mislevy和Bejar（1993）編著的Test theory for a new generation of tests正式出版，標(biāo)志著新一代測量理論的誕生。如圖1所示，認(rèn)知診斷評估逐步走入歷史舞臺，強(qiáng)調(diào)能力水平和認(rèn)知水平維度能夠被同時診斷，不再僅僅是單一的宏觀維度的知識水平。計(jì)算機(jī)化自適應(yīng)認(rèn)知診斷測驗(yàn)（Computerized Adaptive Test for Cognitive Diagnosis， CD-CAT）是計(jì)算機(jī)化自適應(yīng)測驗(yàn)理論和認(rèn)知診斷理論相結(jié)合的產(chǎn)物，目的是達(dá)到因材施教量體裁衣式的自適應(yīng)診斷，根據(jù)學(xué)習(xí)者當(dāng)前狀態(tài)，選取與之相適應(yīng)的題目進(jìn)行測試，進(jìn)而診斷學(xué)習(xí)者能力水平和認(rèn)知水平，以診斷報(bào)告的方式為學(xué)習(xí)者提供提升的建議和策略。

縱觀計(jì)算機(jī)技術(shù)與統(tǒng)計(jì)測驗(yàn)的結(jié)合，其發(fā)展分為兩個階段：其一是以項(xiàng)目反應(yīng)理論（IRT）為代表的標(biāo)準(zhǔn)計(jì)算機(jī)自適應(yīng)測量階段；其二指新一代測量理論的計(jì)算機(jī)自適應(yīng)階段（認(rèn)知診斷是其核心內(nèi)容）。項(xiàng)目反應(yīng)理論的特點(diǎn)是以概率函數(shù)的形式來描述項(xiàng)目作答反映結(jié)果是如何受到被試能力水平和項(xiàng)目特征聯(lián)合作用的影響。自適應(yīng)測驗(yàn)起源于Alfred Binet（1904）開發(fā)的智力測驗(yàn)，根據(jù)被試的不同特質(zhì)水平和題目的不同難度與區(qū)分度，對被試實(shí)測不同的測驗(yàn)題目，使這些題目與被試的實(shí)際水平盡可能相適應(yīng)，這樣使測驗(yàn)更具有針對性，從而每施測一道題就能獲得最大的信息量。

當(dāng)現(xiàn)代技術(shù)手段計(jì)算機(jī)引入到測量領(lǐng)域中，計(jì)算機(jī)化自適應(yīng)測驗(yàn)（Computerized Adaptive Testing， CAT）由此誕生，由計(jì)算機(jī)自動從題庫中選擇合適的題目給學(xué)習(xí)者作答，一方面能夠在學(xué)習(xí)者做完后自動評估其能力水平，給出適合學(xué)習(xí)者的下一道題目；另一方面能夠自動設(shè)定終止規(guī)則，即當(dāng)達(dá)到能夠評估學(xué)習(xí)者能力的題目數(shù)后，測試會自動停止。之后，運(yùn)用CAT思想與認(rèn)知診斷理論結(jié)合，從題庫中選擇最適合學(xué)習(xí)者水平和最能區(qū)分水平能力的題目作答，對其知識狀態(tài)達(dá)到最恰當(dāng)?shù)脑u估。CD-CAT更多關(guān)注被試掌握模式的自適應(yīng)，根據(jù)可觀察的行為和反應(yīng)，推測潛在的知識結(jié)構(gòu)和技能掌握情況。例如，獲得相同分?jǐn)?shù)的學(xué)生不能夠體現(xiàn)個體差異，如果在測驗(yàn)中能夠?qū)W(xué)生作答反應(yīng)、知識反應(yīng)和能力診斷，從而能夠進(jìn)一步提出補(bǔ)救措施。CD-CAT的流程包括：開始測試初始題目選擇估計(jì)被試當(dāng)前狀態(tài)選題策略認(rèn)知診斷計(jì)量模型終止條件診斷報(bào)告。對于CD-CAT的研究目前處于探索開發(fā)階段，組成CD-CAT各個階段的問題仍需要摸索和實(shí)踐應(yīng)用，例如如何確定知識狀態(tài)和表征能力屬性、認(rèn)知診斷模型的應(yīng)用研究，如何選擇初始題目，以及題庫的開發(fā)、建設(shè)與維護(hù)等方面。

綜上所述，為了從整體上把握CD-CAT在國內(nèi)的發(fā)展脈絡(luò)，厘清發(fā)展現(xiàn)狀和研究聚焦，提出實(shí)施CD-CAT的科研建議和實(shí)施策略，分別從以下方面進(jìn)行分析：一方面，以時間（2005-2015年）為軸，考察關(guān)于認(rèn)知診斷自適應(yīng)測試文獻(xiàn)的研究情況，采用內(nèi)容分析方法對已有百余篇中英文文獻(xiàn)進(jìn)行內(nèi)容分析，并通過數(shù)據(jù)的可視化表征和社會網(wǎng)絡(luò)分析工具，探討其研究重心和內(nèi)容；另一方面，通過分析國內(nèi)外已有CD-CAT平臺和項(xiàng)目的實(shí)踐情況，總結(jié)和借鑒國外實(shí)施經(jīng)驗(yàn)，為我國今后的CD-CAT研究提供發(fā)展策略。

二、研究過程

（一）研究方法與工具

本研究主要采用文獻(xiàn)研究法、內(nèi)容分析法和數(shù)據(jù)可視化的方法，通過對有效文獻(xiàn)的各類屬性進(jìn)行分析和標(biāo)識，從而獲得不同維度的計(jì)量分析結(jié)果，即對本質(zhì)內(nèi)容進(jìn)行不同方面、由淺入深、層層遞進(jìn)的非線性分析。研究主要借助軟件管理軟件NoteExpress、數(shù)據(jù)處理軟件SPSS 20.0和詞云生成平臺Tagxedo。首先，界定研究內(nèi)容和范圍CD-CAT；然后，團(tuán)隊(duì)成員分別對2005-2015年的文章進(jìn)行篩選，梳理成為研究樣本；接著，根據(jù)已有文獻(xiàn)確定分析維度，以理論概述、現(xiàn)狀實(shí)踐、研究方法等為分析內(nèi)容，對樣本進(jìn)行統(tǒng)計(jì)和處理。

（二）數(shù)據(jù)收集

采用內(nèi)容分析法對2005-2015年國內(nèi)發(fā)表的關(guān)于自適應(yīng)認(rèn)知診斷的文獻(xiàn)進(jìn)行比較、分析、綜合，對研究內(nèi)容和現(xiàn)狀進(jìn)行梳理和總結(jié)。為了研究的嚴(yán)謹(jǐn)性和數(shù)據(jù)分析的準(zhǔn)確性，將學(xué)術(shù)論文與畢業(yè)論文分開統(tǒng)計(jì)，中文數(shù)據(jù)庫來源有中國知網(wǎng)和萬方數(shù)據(jù)庫，以認(rèn)知診斷和認(rèn)知診斷自適應(yīng)測驗(yàn)為關(guān)鍵詞進(jìn)行搜索，與教育測量和教育技術(shù)領(lǐng)域相關(guān)的文獻(xiàn)匯總?cè)缦拢褐形膶W(xué)術(shù)期刊檢索到140篇，學(xué)位論文68篇；CSSCI期刊主要集中在《北京師范大學(xué)學(xué)報(bào)（社會科學(xué)版）》《教學(xué)學(xué)報(bào)》《心理科學(xué)》《心理科學(xué)進(jìn)展》和《心理學(xué)探新》等。為了對比中英文文獻(xiàn)關(guān)于結(jié)果分析中初步印象部分的差異，即關(guān)注焦點(diǎn)可視化部分，選取以Computerized Adaptive Test for Cognitive Diagnosis和Cognitive Diagnosis為關(guān)鍵詞，在Computers Education、 Computers in Human Behavior和Journal of Computer Assisted Learning（數(shù)據(jù)庫分別為ScienceDirect、SpringerLink、Wiley Online和ERIC）等教育技術(shù)專業(yè)相關(guān)期刊中搜集到論文66篇。

本研究進(jìn)行了兩輪文獻(xiàn)搜索和文獻(xiàn)篩選，共有5名團(tuán)隊(duì)成員參與，針對不同期刊進(jìn)行分工。第一輪主要對目標(biāo)期刊和目標(biāo)關(guān)鍵詞進(jìn)行地毯式搜索，得到中文文獻(xiàn)233篇，英文論文79篇，利用文獻(xiàn)管理工具NoteExpress將其分類保存；第二輪采用內(nèi)容分析法對自適應(yīng)認(rèn)知診斷文獻(xiàn)的關(guān)鍵詞、作者、研究主題進(jìn)行分類，最終確定中文文獻(xiàn)140篇，英文文獻(xiàn)66篇。對作者進(jìn)行分析的主要目的是對不同研究帶頭人和研究單位的分布進(jìn)行研究，以辨識其影響力和規(guī)模。首先，主要對文獻(xiàn)的研究主題進(jìn)行分析。團(tuán)隊(duì)成員基于文獻(xiàn)閱讀和積累對計(jì)算機(jī)自適應(yīng)測試、認(rèn)知診斷、自適應(yīng)認(rèn)知診斷測試的過程進(jìn)行分類，討論之后達(dá)成一致，構(gòu)建初步框架；其次，在上述框架基礎(chǔ)上，根據(jù)文獻(xiàn)的關(guān)鍵詞進(jìn)行記錄。如《小學(xué)數(shù)學(xué)圖形與幾何認(rèn)知診斷測驗(yàn)的編制》一文中，以認(rèn)知診斷、多策略、多級評分和Q矩陣為關(guān)鍵詞，對多策略的多級評分認(rèn)知診斷算法（多級評分廣義聚類判別法，GDD-P）進(jìn)行改進(jìn)與應(yīng)用，并且介紹了測驗(yàn)藍(lán)圖編制、Q矩陣，與單策略認(rèn)知診斷方法進(jìn)行對比，是對算法和理論的深入研究。因此，該文章涉及的分析內(nèi)容分別是：理論研究、Q矩陣、認(rèn)知診斷模型。該文章分析的一致性（5位成員）達(dá)到93%；最后，確定分析框架，對所有文獻(xiàn)進(jìn)行閱讀，完善文獻(xiàn)分析內(nèi)容。

（三）結(jié)果分析

1. 初步印象：有哪些研究關(guān)注點(diǎn)

本研究選取數(shù)據(jù)可視化詞云的表達(dá)方式展示樣本研究的核心內(nèi)容?？紤]到支持中文統(tǒng)計(jì)的功能，選擇統(tǒng)計(jì)平臺Tagxedo（http：//tagxedo.com/app.html），詞云支持中文輸入，對文字的輸入內(nèi)容、形狀等可以個性化定義（如圖2所示）。中文詞云中認(rèn)知診斷規(guī)則空間模型和屬性等頻

次最高，領(lǐng)銜關(guān)鍵詞說明了研究領(lǐng)域的聚焦，其中研究問題主要關(guān)注于學(xué)業(yè)評估診斷、認(rèn)知診斷模型驗(yàn)證與應(yīng)用（如DINA模型）、紙筆考試與計(jì)算機(jī)自適應(yīng)考試差異研究與效度研究。可以初步推斷文獻(xiàn)研究集中于CD-CAT的知識屬性、認(rèn)知診斷模型研究等初步應(yīng)用階段。

為了使中英文文獻(xiàn)具有對照意義，同樣選取統(tǒng)計(jì)平臺Tagxedo進(jìn)行詞頻統(tǒng)計(jì)和可視化處理（如圖3所示）。英文詞云中顯示具體的應(yīng)用方法（蒙特卡羅模擬法）、語言程序（R語言）知識評估和學(xué)習(xí)干預(yù)成為僅次于測試、自適應(yīng)等的關(guān)鍵詞。從宏觀角度看，一方面，英文文獻(xiàn)的關(guān)注點(diǎn)更加聚焦，能夠?qū)?shí)際的認(rèn)知模型進(jìn)行測驗(yàn)和實(shí)踐應(yīng)用；另一方面，體現(xiàn)了自適應(yīng)認(rèn)知診斷測驗(yàn)的價(jià)值和意義所在，對學(xué)生的個性化學(xué)習(xí)進(jìn)行指導(dǎo)和教學(xué)干預(yù)，利用技術(shù)促進(jìn)測試診斷最大化的實(shí)現(xiàn)。

通過詞云分析，對CD-CAT的研究熱點(diǎn)有了初步了解。研究發(fā)現(xiàn)，國內(nèi)的研究關(guān)鍵詞集中在理論基礎(chǔ)、算法改進(jìn)層面，與教育、學(xué)習(xí)等過程關(guān)聯(lián)較少；國外論文分析領(lǐng)域表示逐步通過技術(shù)方法作用于教育領(lǐng)域，與評估評價(jià)、反饋干預(yù)的實(shí)驗(yàn)與應(yīng)用關(guān)聯(lián)較多。如Sanja（2015）以C++面向?qū)ο缶幊陶n程為例，開發(fā)實(shí)現(xiàn)自適應(yīng)測試平臺，選取實(shí)驗(yàn)組與對照組，分別用自適應(yīng)測試和筆紙測試進(jìn)行比較，結(jié)合問卷、訪談的分析方法對自適應(yīng)測試的過程、方法、優(yōu)勢、實(shí)驗(yàn)應(yīng)用進(jìn)行詳細(xì)闡述；Triantafillou（2008）以計(jì)算機(jī)自適應(yīng)測試?yán)碚摓榛A(chǔ)，開發(fā)依托移動設(shè)備的自適應(yīng)測試工具，將專家的評價(jià)靈活地運(yùn)用于教育評估過程之中。

2. 漸入佳境：局部剖析

樣本分析單元分別從研究創(chuàng)新點(diǎn)、發(fā)表時間、單位、數(shù)量、研究方法和理論支撐等方面展開，具體統(tǒng)計(jì)維度涵蓋認(rèn)知診斷測驗(yàn)題庫建立、初始題選擇、選題策略、認(rèn)知診斷計(jì)量模型、知識狀態(tài)估計(jì)方法、終止規(guī)則、原始題參數(shù)在線估計(jì)和屬性在線標(biāo)定、理論研究和實(shí)踐應(yīng)用等。

（1） CD-CAT研究歷程分析

借助NoteExpress 統(tǒng)計(jì)學(xué)術(shù)論文和學(xué)位情況，以圖4表現(xiàn)發(fā)展歷程。

作為量體裁衣式的測驗(yàn)，CAT始于20世紀(jì)七八十年代。隨著網(wǎng)絡(luò)與科技進(jìn)步，自適應(yīng)測試可謂發(fā)揮到了極致，如GRE、GMAT、美國注冊管理會計(jì)師（CMA）等等。以認(rèn)知診斷理論為基礎(chǔ)的CD-CAT相比較于CAT，更加能夠利用項(xiàng)目屬性和認(rèn)知模型優(yōu)勢，進(jìn)行診斷性的測驗(yàn)編制和評測。從圖4可以看出，我國的發(fā)展從2006年起步，2008年研究文獻(xiàn)逐步增多，例如曾彥鈞等人（2006）提出CD-CAT以認(rèn)知結(jié)構(gòu)為基礎(chǔ)，在題庫建設(shè)、起始規(guī)則、選題策略、被試知識狀態(tài)估計(jì)、終止規(guī)則和曝光率等部分與傳統(tǒng)的CAT有很大區(qū)別。2011年，是學(xué)術(shù)論文和學(xué)位論文發(fā)展的高峰，之后學(xué)位論文研究數(shù)量所有下滑，期刊論文數(shù)量變化不大。

（2）CD-CAT研究內(nèi)容分析

參照認(rèn)知診斷評估的主要步驟包括：①描述測量目的和確定屬性；②創(chuàng)建認(rèn)知模型；③設(shè)計(jì)測驗(yàn)Q矩陣；④開發(fā)或選擇認(rèn)知診斷模型（CDM）；⑤評估Q矩陣和CDM；⑥模型參數(shù)估計(jì)；⑦評估診斷與干預(yù)。其中有的步驟可能循環(huán)或者迭代。對文獻(xiàn)的研究內(nèi)容進(jìn)行歸類（如表1所示）。

研究團(tuán)隊(duì)詳細(xì)閱讀140篇學(xué)術(shù)文獻(xiàn)，發(fā)現(xiàn)很多文獻(xiàn)聚焦于診斷模型、Q矩陣，以及概況綜述和自適應(yīng)認(rèn)知診斷流程描述的研究，缺少完整的實(shí)踐應(yīng)用的成功案例。統(tǒng)計(jì)數(shù)據(jù)表明：

①相比較于國外CD-CAT，國內(nèi)相關(guān)研究進(jìn)程較慢，并且研究內(nèi)容集中在理論概述和小規(guī)模的實(shí)驗(yàn)證明上，缺乏大規(guī)模應(yīng)用CD-CAT相關(guān)的文獻(xiàn)支持?？梢姡瑖鴥?nèi)自適應(yīng)的教育評價(jià)方式應(yīng)用還未大范圍普及，通過技術(shù)診斷學(xué)習(xí)者的能力水平和知識水平，并且提供有效的教學(xué)干預(yù)的案例還不夠成熟。

②基礎(chǔ)理論研究占文獻(xiàn)總數(shù)的74.2%。例如，唐小娟、丁樹良和俞宗火（2012）提出計(jì)算機(jī)化自適應(yīng)測驗(yàn)在認(rèn)知中的應(yīng)用，分別從認(rèn)知診斷模型、題庫建設(shè)、起始規(guī)則、選題策略、被試知識狀態(tài)和終止規(guī)則等幾部分進(jìn)行了詳細(xì)介紹。有64篇文獻(xiàn)（45.7%）對認(rèn)知診斷模型進(jìn)行介紹。截至2007年，常見的認(rèn)知診斷模型有補(bǔ)償模型LLTM（線性邏輯斯蒂克測驗(yàn)?zāi)Ｐ停┖蚆IRT-C等，非補(bǔ)償模型RSM（規(guī)則空間模型）、DINA（確定性輸入噪音與門模型）、HO-DINA（高階DINA模型）、RUM（融合模型）和AHM（屬性層級模型）。

③實(shí)驗(yàn)實(shí)踐比例為30%，其中有10%的文獻(xiàn)敘述了相應(yīng)的教育干預(yù)措施，例如數(shù)學(xué)、物理、化學(xué)和英語?？荡夯ǖ龋?015）以小學(xué)數(shù)學(xué)與幾何的知識點(diǎn)和問題解決能力作為認(rèn)知屬性的分類，定義了數(shù)學(xué)知識和認(rèn)知過程，并采用口語報(bào)告法對認(rèn)知模型進(jìn)行質(zhì)性驗(yàn)證，選取某校六年級1，128名學(xué)生進(jìn)行了測驗(yàn)。

近幾年，新模型的研究也為自適應(yīng)認(rèn)知診斷測試研究開拓了一片新天地，例如祝玉芳等（2009）的多級評分AHM模型，涂冬波等（2010）提出多級評分DINA模型。余娜（2009）提出診斷模型的評估問題由信度和效度決定，認(rèn)知診斷評估中信度采用校正之后的模型產(chǎn)生兩組平行的模擬考生，分布估計(jì)每組掌握情況，計(jì)算相同考生被劃分到相同屬性掌握狀態(tài)的百分比。

3. 升華：合作關(guān)系追蹤

科學(xué)領(lǐng)域的研究往往存在學(xué)術(shù)帶頭人，也往往會以學(xué)術(shù)帶頭人為核心形成研究領(lǐng)域的網(wǎng)絡(luò)關(guān)系。本研究借鑒魏順平等（2008）提出的新的n-派系定義，利用研究者合作關(guān)系網(wǎng)絡(luò)研究，建立作者A-作者B關(guān)聯(lián)關(guān)系。在社會網(wǎng)絡(luò)分析中，派系（subgroup）是社群中的一小群人關(guān)系特別緊密。

首先，借助Excel統(tǒng)計(jì)研究者與文獻(xiàn)之間的關(guān)聯(lián)表（如表2所示），以作者-文獻(xiàn)-單位的方式表現(xiàn)。

本研究中CD-CAT文獻(xiàn)量大于5篇的作者見表3，通過論文作者和機(jī)構(gòu)分析發(fā)現(xiàn)，大部分文獻(xiàn)作者來源于高校和研究所，并且主要來源于江西師范大學(xué)的心理學(xué)院和計(jì)算機(jī)信息工程學(xué)院，以及北京師范大學(xué)心理學(xué)院。究其原因，計(jì)算機(jī)自適應(yīng)認(rèn)知診斷測驗(yàn)研究屬于專業(yè)性較強(qiáng)、理論基礎(chǔ)扎實(shí)的研究領(lǐng)域，高校師生是新理念和方法的發(fā)起者和倡導(dǎo)者。認(rèn)知診斷測試的最終目的在于以K-12教育為代表的評估教育，能夠?qū)崿F(xiàn)學(xué)習(xí)者的自適應(yīng)學(xué)習(xí)和診斷評價(jià)。文獻(xiàn)分布說明研究內(nèi)容處于高校實(shí)驗(yàn)室階段，缺乏社會的廣泛關(guān)注、實(shí)踐和推廣應(yīng)用。

接下來，通過UCINET軟件呈現(xiàn)51個節(jié)點(diǎn)，借助作者間的合作，觀察圖中度計(jì)算并排序，選出處于前列的若干位作者（假定中心作者為學(xué)術(shù)帶頭人），然后計(jì)算以丁樹良為中心的合作關(guān)系網(wǎng)絡(luò)圖，如表4所示。

由于文章作者合作較多，本研究以文獻(xiàn)篇數(shù)最多的丁樹良派系作為研究范例，將上表的矩陣導(dǎo)入U(xiǎn)CINET中，并繪圖（DRAW）得到科研合作關(guān)系網(wǎng)絡(luò)圖（如圖5）。

兩個節(jié)點(diǎn)的連線表示這兩個節(jié)點(diǎn)存在合作論文的關(guān)系，線條的粗細(xì)表示合作論文的篇數(shù)，線條越粗，則合作論文數(shù)量越多。

采用UCINET 社會網(wǎng)絡(luò)分析軟件將這些派系進(jìn)行可視化處理。研究結(jié)果表明：

（1）目前教育技術(shù)研究領(lǐng)域的合作類型主要為師生合作，較少跨校、跨區(qū)域合作；也存在少數(shù)的跨區(qū)域合作，因此形成了星狀輻射型。

（2） CD-CAT研究應(yīng)走出團(tuán)隊(duì)、校門，甚至跨越國界，開展跨校、跨區(qū)域、跨學(xué)科的科研合作，優(yōu)化研究團(tuán)隊(duì)構(gòu)成，從而進(jìn)一步提高研究質(zhì)量，加快知識擴(kuò)散。

三、CD-CAT研究項(xiàng)目現(xiàn)狀

接下來對國內(nèi)外認(rèn)知診斷自適應(yīng)測試的實(shí)驗(yàn)與應(yīng)用進(jìn)行詳細(xì)介紹。從上述文獻(xiàn)分析可知，國內(nèi)實(shí)踐案例較少，本研究團(tuán)隊(duì)經(jīng)過大量內(nèi)容采集和梳理，選取相對規(guī)模較大的實(shí)驗(yàn)案例分別進(jìn)行闡述。而國外相對起步較早，2001年美國通過No Child Left Behind Act of 2001，表明有義務(wù)將施測結(jié)果告知學(xué)生和家長。因此，診斷測試的價(jià)值和意義不再僅僅是提供分?jǐn)?shù)，而是需要提供補(bǔ)救措施等。本研究列舉美國應(yīng)用較為廣泛的Smarter Balanced Assessment Consortium和最大的自適應(yīng)系統(tǒng)平臺Knewton，并分別闡釋。

2009年，教育部基礎(chǔ)教育司組織北京師范大學(xué)、江西師范大學(xué)和中央教育科學(xué)研究所（現(xiàn)中國教育科學(xué)研究院）等一大批研究學(xué)者，以數(shù)學(xué)和英語為考試切入點(diǎn)，考察學(xué)生的核心知識和能力水平，以此命題進(jìn)行認(rèn)知診斷完成353道題目的編訂并且設(shè)定1套公共錨題，運(yùn)用DINA模型進(jìn)行診斷分析。

在北京師范大學(xué)心理學(xué)院劉紅云教授、美國伊利諾伊香檳分校張華華教授共同合作的The development of computerized adaptive testing with cognitive diagnosis for an English achievement test in China一文中介紹的研究，以國家基礎(chǔ)教育課程教材發(fā)展中心學(xué)生學(xué)業(yè)質(zhì)量評價(jià)項(xiàng)目為依托，闡述了其在北京、大連等地進(jìn)行計(jì)算機(jī)認(rèn)知診斷的大規(guī)模測試的情況。由于軟件和硬件以及專業(yè)技能的限制，將CD-CAT應(yīng)用于學(xué)校項(xiàng)目是一個巨大的挑戰(zhàn)，該項(xiàng)目克服傳統(tǒng)C/S（Client/Server）框架，將B/S（Browser/Server）架構(gòu)設(shè)計(jì)應(yīng)用于國內(nèi)的英語二級考試中。來自北京8所小學(xué)的584名學(xué)生首先參與了基于Web環(huán)境的測試，該測試有36道固定長度題目，規(guī)定40分鐘內(nèi)完成。該實(shí)驗(yàn)驗(yàn)證了CD-CAT應(yīng)用于大規(guī)模考試的巨大潛力和高效性，同時參與測試的考生可以從中獲取技能掌握情況的診斷報(bào)告，為后續(xù)進(jìn)行學(xué)習(xí)干預(yù)和學(xué)習(xí)路徑調(diào)整提供了可能。此后，2011年1月，大約3萬名遼寧省大連市的五年級學(xué)生參加CD-CAT英語能力測試，該平臺利用網(wǎng)絡(luò)技術(shù)和自適應(yīng)診斷技術(shù)，持續(xù)三天、同一時間承載2000人并發(fā)的測試。在此過程中，對題庫的優(yōu)化、采用香農(nóng)熵方法選題算法，以及內(nèi)容平衡和考試藍(lán)圖的限制的編制，都進(jìn)行了較好的實(shí)驗(yàn)。一方面，為學(xué)生和教師提供作答情況評定和診斷報(bào)告；另一方面，為研究者提供對CD-CAT效度全面審視的實(shí)踐機(jī)會，為認(rèn)知診斷技術(shù)的大規(guī)模推廣奠定了堅(jiān)實(shí)的基礎(chǔ)。

美國也有諸多公司關(guān)注和投入CAT的領(lǐng)域，如ASSESSMENT SYSTEMS的Smarter Balanced評估系統(tǒng)（http：//smarterbalanced.org/practice-test/）。在能力測驗(yàn)方面，主要應(yīng)用于評估學(xué)生的英語和數(shù)學(xué)能力。2010年，美國針對K-12提出了全美教育標(biāo)準(zhǔn)（Common Core States Standards，簡稱CCSS），用于評估各個年級學(xué)生的數(shù)學(xué)能力和英語能力，并且已經(jīng)在全美46個州和哥倫比亞區(qū)施行。Smarter Balanced 評估系統(tǒng)利用強(qiáng)制性的終結(jié)性評價(jià)和可選的中期評估來提升計(jì)算機(jī)自適應(yīng)測試（CAT）的效率。在該評估系統(tǒng)中，計(jì)算機(jī)程序可以根據(jù)學(xué)生的響應(yīng)來調(diào)整整個評估問題的難度。例如，一個學(xué)生如果回答正確，則會收到一個更具挑戰(zhàn)性的題目，而一個不正確的答案產(chǎn)生一個更簡單的問題。通過適應(yīng)學(xué)生的能力水平，系統(tǒng)推薦了一系列量身定制的測驗(yàn)問題給每個學(xué)生，可以快速識別哪些技能學(xué)生已經(jīng)掌握，哪些知識維度學(xué)生還沒有掌握。Smarter Balanced Practice Tests包括評分指南，現(xiàn)可用于三年級到八年級的英語、藝術(shù)和數(shù)學(xué)的認(rèn)知診斷，能夠?yàn)閷W(xué)習(xí)者提供一份可預(yù)覽的Smarter Balanced評估，清晰地反映每一位考生在當(dāng)前學(xué)習(xí)中每一門學(xué)科中的強(qiáng)項(xiàng)和弱項(xiàng)，以及在未來學(xué)習(xí)中需要重點(diǎn)關(guān)注的領(lǐng)域。這種計(jì)算機(jī)評估能夠方便家長、校長和老師在很短的時間內(nèi)看到成效，并且通過這些診斷反饋，對學(xué)生因材施教，滿足其個性化學(xué)習(xí)需求。

此外，熟知的Knewton公司基于項(xiàng)目反應(yīng)理論，真實(shí)地測量出學(xué)生對知識點(diǎn)的掌握程度，避免因題目的難易程度不同造成測量誤差。Knewton自適應(yīng)系統(tǒng)利用學(xué)生的歷史學(xué)習(xí)數(shù)據(jù)的網(wǎng)絡(luò)效應(yīng)來優(yōu)化推薦，提高學(xué)生學(xué)習(xí)效率。建立學(xué)生學(xué)習(xí)檔案，預(yù)設(shè)一些學(xué)習(xí)路徑點(diǎn)（根據(jù)知識技能圖譜），根據(jù)實(shí)際學(xué)生的使用數(shù)據(jù)（學(xué)習(xí)資源的使用效果和學(xué)習(xí)路徑點(diǎn)的學(xué)習(xí)效果），為后來的學(xué)習(xí)者推送下一個學(xué)習(xí)路徑點(diǎn)和學(xué)習(xí)資源。

綜上所述，國外CD-CAT發(fā)展已經(jīng)將智能學(xué)習(xí)系統(tǒng)、評估系統(tǒng)和教育測評融入其中。雖然從應(yīng)用角度來說，自適應(yīng)的成分居多，認(rèn)知的成分較少，但是將診斷功能結(jié)合到計(jì)算機(jī)自適應(yīng)測驗(yàn)中，已經(jīng)成為研究熱點(diǎn)之一，吸引了眾多學(xué)者繼續(xù)推進(jìn)CD-CAT的實(shí)施應(yīng)用。雖然國內(nèi)很多研究者已經(jīng)意識到CD-CAT的優(yōu)勢，也有研究者提出了中國教育進(jìn)展評估基于CD-CAT的改進(jìn)與展望，但是實(shí)踐應(yīng)用還處于研究或者起步階段。例如實(shí)際教學(xué)過程中，對相同分?jǐn)?shù)的學(xué)生還不能從能力和認(rèn)知水平角度進(jìn)行很好的診斷和評估，教師往往僅根據(jù)個人經(jīng)驗(yàn)來判斷學(xué)生的知識掌握狀態(tài)和認(rèn)知錯誤，其教學(xué)設(shè)計(jì)與教學(xué)干預(yù)不能滿足學(xué)生的個性化需求。

四、對我國教育評價(jià)診斷的啟示

新一代測驗(yàn)理論階段在認(rèn)知水平的研究范式下產(chǎn)生，強(qiáng)調(diào)測驗(yàn)應(yīng)同時在宏觀能力水平和微觀認(rèn)知水平下進(jìn)行，認(rèn)知水平的研究應(yīng)深入到被試作答的認(rèn)知加工過程，其目的在于診斷認(rèn)知能力結(jié)構(gòu)，亦在于揭示不同被試的認(rèn)知加工特點(diǎn)，是能力水平研究的深入。認(rèn)知診斷實(shí)現(xiàn)了傳統(tǒng)教育考試無法企及的診斷功能，它在實(shí)踐中的運(yùn)用價(jià)值是不言而喻的：根據(jù)診斷結(jié)果，學(xué)生可以有針對性地學(xué)，教師可以有針對性地教；教育教學(xué)機(jī)構(gòu)部門來說則可以了解當(dāng)前教育情況，為教育規(guī)劃及教育決策的制定提供依據(jù)。

計(jì)算機(jī)自適應(yīng)認(rèn)知診斷測試在教育評估中具有重要的發(fā)展意愿，目前混合式的學(xué)習(xí)環(huán)境中需要個性化的、實(shí)時的、及時的診斷和評估報(bào)告。隨著網(wǎng)絡(luò)技術(shù)的發(fā)展，MOOC等一大批在線課程蜂擁而至，但縱觀眾多網(wǎng)絡(luò)課程和實(shí)踐研究，其中缺少對學(xué)習(xí)者量體裁衣式的診斷評估。同時，在我國教育的測評中，紙筆考試仍舊保留重要地位，然而缺少有效甄別、準(zhǔn)確評估和學(xué)習(xí)知識建議等內(nèi)容。同時，隨著高考改革的實(shí)施與推進(jìn)，構(gòu)建健全的教育評價(jià)體系顯得尤為重要。通過針對學(xué)習(xí)過程、學(xué)習(xí)能力評價(jià)的綜合診斷方法，可以提升學(xué)生綜合素質(zhì)。華南師范大學(xué)心理學(xué)院張敏強(qiáng)教授談到如何運(yùn)用認(rèn)知診斷方法與技術(shù)來評價(jià)學(xué)生的認(rèn)知能力，從而讓學(xué)生知道自己優(yōu)勢在哪里、不足在哪里、有什么方法可以補(bǔ)救。

因此，本研究結(jié)合我國發(fā)展現(xiàn)狀與需求和國外已有應(yīng)用研究的優(yōu)勢，對國內(nèi)教育評價(jià)如何走向CD-CAT提出以下建議：

（一）教育評估方面

相比經(jīng)典測量理論和項(xiàng)目反應(yīng)理論，認(rèn)知診斷理論能把認(rèn)知過程與測量手段結(jié)合起來，不僅能對考生的整體水平做出評價(jià)，還可以將考生的認(rèn)知結(jié)構(gòu)模式化，利用合適的測量模型對不同的認(rèn)知結(jié)構(gòu)模式進(jìn)行診斷，從而定時考察學(xué)生的認(rèn)知結(jié)構(gòu)和個體差異。認(rèn)知診斷方法可以應(yīng)用于會考、能力水平考試；課堂上運(yùn)用認(rèn)知診斷功能，可以幫助教師分析學(xué)生的優(yōu)勢和不足，不僅能對學(xué)生的整體水平進(jìn)行評價(jià)，還能將學(xué)生的認(rèn)知結(jié)構(gòu)模式化，通過數(shù)據(jù)定量地分析出學(xué)生的認(rèn)知結(jié)構(gòu)和個體差異，這樣得到的信息量大且細(xì)，有助于個性化教學(xué)的實(shí)現(xiàn)。

1. 重視測量工具的研究和應(yīng)用

實(shí)現(xiàn)個性化的測試平臺和題庫，不僅需要熟悉測量理論，還需要掌握測量模型和工具、計(jì)算機(jī)程序、統(tǒng)計(jì)程序等，因而需要有關(guān)教育部門與研究團(tuán)隊(duì)投入人力、物力，依托信息技術(shù)、網(wǎng)絡(luò)技術(shù)和硬件設(shè)備開發(fā)有價(jià)值的題庫和測試平臺。

2. 對教師進(jìn)行評測培訓(xùn)

認(rèn)知診斷測試過程中，教師不僅能夠依據(jù)經(jīng)驗(yàn)和教學(xué)目標(biāo)提供考試題目，而且需要對學(xué)生所需的認(rèn)知水平和能力水平進(jìn)行詳細(xì)劃分，與研究團(tuán)隊(duì)配合共同繪制測驗(yàn)藍(lán)圖，從而確定測試屬性和知識點(diǎn)。因此，教育評測的培訓(xùn)是教學(xué)過程中必不可少的工具，對教師的專業(yè)培訓(xùn)尤其重要。

3. 題庫和測試平臺的地位

相比較紙筆考試，CD-CAT能夠更快地獲知考試成績或者錄取結(jié)果，測試能夠不受時間和地點(diǎn)限制，考試環(huán)境更加舒適和個性化。通過搭建題庫和測試平臺，能夠保障和實(shí)現(xiàn)認(rèn)知診斷自適應(yīng)測試：既快速獲取診斷結(jié)果、報(bào)告，又可實(shí)施大規(guī)模題庫，保障大部分學(xué)生的考試題目難度和區(qū)分度一致，為教育公平提供可能。

（二）科研創(chuàng)新方面

打造精銳團(tuán)隊(duì)，延伸研究深度。從文獻(xiàn)數(shù)據(jù)分析說明，目前我國研究派系較為集中，能夠拓展實(shí)踐應(yīng)用的驅(qū)動項(xiàng)目較少。因此，應(yīng)當(dāng)加強(qiáng)跨團(tuán)隊(duì)、跨區(qū)域甚至跨國界的學(xué)術(shù)交流和合作，共享資源與經(jīng)驗(yàn)，共同豐富和深化CD-CAT。

（三）實(shí)踐應(yīng)用方面

1. 利用現(xiàn)有資源進(jìn)行校際合作

篇8

當(dāng)前大部分測驗(yàn)只能提供單一的測驗(yàn)總分或能力值，但是具有相同分?jǐn)?shù)或能力值學(xué)生的認(rèn)知結(jié)構(gòu)（或稱知識狀態(tài)）可能不同，因此，對他們采取的教學(xué)補(bǔ)救措施是不一樣的。由此產(chǎn)生了一個很重要的問題：如何才能精確地測量出學(xué)生的知識狀態(tài)呢？認(rèn)知診斷理論能夠回答該問題。

一、認(rèn)知診斷的發(fā)展

理論和實(shí)際需求推動了認(rèn)知診斷的快速發(fā)展。理論上，認(rèn)知診斷的計(jì)量模型可以提供一個有效機(jī)制來驗(yàn)證認(rèn)知理論；實(shí)踐中，美國政府于2001年提出的《不讓一個孩子掉隊(duì)》的法案更是促進(jìn)了認(rèn)知診斷的蓬勃發(fā)展。其實(shí)早在20世紀(jì)80年代，就已經(jīng)有眾多學(xué)者開始注重認(rèn)知科學(xué)和心理測量學(xué)的結(jié)合對教育領(lǐng)域的指導(dǎo)作用。Glaser曾批判傳統(tǒng)的教育測驗(yàn)缺乏對被測心理特征的關(guān)注[1]，Snow和Lohman在其編寫的《認(rèn)知心理學(xué)對教育測量的影響》中曾預(yù)測，教育測驗(yàn)可能會要求提供更多的學(xué)習(xí)診斷及教學(xué)指導(dǎo)信息。Nichols首次將認(rèn)知科學(xué)和心理測量學(xué)的結(jié)合稱作認(rèn)知診斷評估，并在1995年出版專著《認(rèn)知診斷評估》，從而使得該名稱沿用至今[2]。Stout認(rèn)為在21世紀(jì)，認(rèn)知診斷將會成為新的測驗(yàn)范式[3]，并得到廣泛的研究。許多認(rèn)知診斷研究者先后出版專著，從各個角度詳細(xì)地介紹了認(rèn)知診斷理論及其應(yīng)用，其中包括：Leighton和Gierl在2007年出版的《教育認(rèn)知診斷評估：理論及應(yīng)用》[4]，Tatsuoka于2009年出版的《認(rèn)知評估：規(guī)則空間簡介》[5]，以及Rupp等人于2010年出版的《診斷測量：理論，方法及應(yīng)用》[6]。

近幾年國際和國內(nèi)更是掀起了認(rèn)知診斷的研究熱潮。2012年9月在南昌舉辦的第十屆海峽兩岸心理與教育測驗(yàn)學(xué)術(shù)研討會出版了專著《認(rèn)知診斷理論、方法與應(yīng)用》，對國內(nèi)的認(rèn)知診斷研究起到了極大的推動作用。作者僅在CNKI輸入“認(rèn)知診斷”關(guān)鍵詞查詢所有期刊后，就得到了23835條結(jié)果，而且呈逐年遞增趨勢，可以看出認(rèn)知診斷研究正在蓬勃發(fā)展。

二、認(rèn)知診斷的相關(guān)理論

認(rèn)知診斷理論主要包含Q矩陣?yán)碚摷罢J(rèn)知診斷模型（CDM）兩部分，下面分別對這兩部分進(jìn)行介紹。

（一）Q矩陣?yán)碚?/p>

Q矩陣?yán)碚摰南闰?qū)是Tatsuoka教授，她認(rèn)為Q矩陣?yán)碚撚_定學(xué)生不可直接觀察的知識狀態(tài)，并且運(yùn)用可以直接得到的觀察反應(yīng)模式（ORP）表示這些知識狀態(tài)[7]。學(xué)生的知識狀態(tài)由屬性向量表征，“屬性”表示測驗(yàn)項(xiàng)目的特征，是學(xué)生正確解決特定項(xiàng)目所需要的認(rèn)知加工能力和技能[8]。一個完整的Q矩陣?yán)碚摪簩傩詫蛹壗Y(jié)構(gòu)（AHS）、鄰接矩陣（A）、可達(dá)矩陣（R）、縮減矩陣（Qr）、學(xué)生Q矩陣（Qs）、測驗(yàn)Q矩陣（Qt）及期望反應(yīng)模式（ERP）[9]。下面用一個具體例子對Q矩陣?yán)碚撨M(jìn)行詳細(xì)闡述。圖1為假定的關(guān)于某份認(rèn)知診斷測驗(yàn)的屬性層級結(jié)構(gòu)。

如圖1所示，該份測驗(yàn)界定的6個屬性之間存在層級關(guān)系。例如，屬性1是屬性2和4的先決條件，即掌握屬性2之前必須首先掌握屬性1。這種層級關(guān)系是必要的，比如掌握乘法之前，必須先掌握加法。根據(jù)圖1所示結(jié)構(gòu)，可以得到鄰接矩陣A陣，它是描述屬性間直接關(guān)系的矩陣，圖1的A陣如表1左側(cè)所示。由A與同階單位陣I的和A+I，通過Warshall算法可得到可達(dá)矩陣R陣，它是描述屬性間直接、間接以及和自身關(guān)系的矩陣，如表1所示。

注：A1-A6表示圖1中的6個屬性，“1”表示存在關(guān)系，“0”表示不存在關(guān)系

在得到R陣之后，可以通過刪除法[7]或擴(kuò)張算法[10]導(dǎo)出所有可能存在的項(xiàng)目類別，即在圖1所示的屬性層級結(jié)構(gòu)之下，一份測驗(yàn)?zāi)軌蚓幹瞥鰜淼念}目類型，記作縮減矩陣Qr陣，行代表屬性，列代表項(xiàng)目類。在圖1所示的層級結(jié)構(gòu)下，最多只能出15種類型的題目，如表2所示。

將Qr矩陣轉(zhuǎn)置并加上一列全0向量（代表該學(xué)生一個屬性都未掌握）即可得到圖1下所有可能的知識狀態(tài)的集合，共有16種知識狀態(tài)。

測驗(yàn)Q矩陣，即Qt矩陣是由Qr陣的列自由組合得到，但有一點(diǎn)十分關(guān)鍵，即自由組合中必須包含R陣，這樣才能使學(xué)生的知識狀態(tài)與期望反應(yīng)模式一一對應(yīng)[11]，換句話說，Qt矩陣中必須包含R陣，才能保證對學(xué)生知識狀態(tài)評估的精確性。

期望反應(yīng)模式指學(xué)生在不存在任何失誤和猜測的情況下對題目的作答反應(yīng)模式，即學(xué)生掌握了題目考察的屬性就能答對該題，只要有一個屬性未掌握就答不對該題。但現(xiàn)實(shí)中，學(xué)生在作答時或多或少都會存在一些失誤或猜測，因此，期望反應(yīng)模式是一種理想化的反應(yīng)模式。

對上述概念進(jìn)行串聯(lián)之后，我們可以通過圖2來理解Q矩陣?yán)碚摚?/p>

（二）認(rèn)知診斷模型

測驗(yàn)施測后，只能得到學(xué)生的作答數(shù)據(jù)，要想得到學(xué)生的知識狀態(tài)，就需要使用認(rèn)知診斷模型進(jìn)行估計(jì)。目前開發(fā)出來的認(rèn)知診斷模型已達(dá)100多種[12]。下面僅簡單介紹幾個比較常用的認(rèn)知診斷模型。

1.線型邏輯斯蒂克特質(zhì)模型（LLTM）

Fischer提出的LLTM模型是認(rèn)知診斷模型的雛形[13]，它是在Rasch模型的基礎(chǔ)上改造而成的，其模型為：

，其中θi是學(xué)生的能力參數(shù)，bj是題目的難度參數(shù)，qjk是屬性k在題目 j上的復(fù)雜度計(jì)分， K為測量到的屬性個數(shù)，ηk是屬性k的復(fù)雜度權(quán)重，d是標(biāo)準(zhǔn)化常數(shù)。LLTM用屬性復(fù)雜度的線性組合表征題目難度，屬性對題目的貢獻(xiàn)越大，則題目的難度也越大。

2.規(guī)則空間模型（RSM）

Tatsuoka提出的規(guī)則空間模型是一種基于模式識別和分類技術(shù)的診斷方法。該方法首先基于Q矩陣?yán)碚摚治龀鰷y驗(yàn)考察的所有認(rèn)知屬性以及每道題目考察了這些認(rèn)知屬性中的哪些，同時還能確定學(xué)生所有可能的知識狀態(tài)種類。RSM認(rèn)為學(xué)生的作答還會出現(xiàn)失誤和猜測兩種意外情況，這時學(xué)生的ORP會與其ERP不符，那么該如何基于ORP估計(jì)出學(xué)生的知識狀態(tài)呢？RSM根據(jù)項(xiàng)目反應(yīng)模型計(jì)算出一組序偶R（θ，ζ），它在規(guī)則空間中是一個坐標(biāo)點(diǎn)，稱為純規(guī)則點(diǎn)。θ是學(xué)生的能力參數(shù)，ζ是基于項(xiàng)目反應(yīng)理論的一個警戒指標(biāo)，表示能力為θ的學(xué)生其實(shí)際作答反應(yīng)模式偏離其真實(shí)能力水平相對應(yīng)的項(xiàng)目反應(yīng)模式的程度?；贠RP，可以計(jì)算出每個學(xué)生的序偶，然后使用貝葉斯判別或馬氏距離判別可將學(xué)生判歸為某個純規(guī)則點(diǎn)，這個純規(guī)則點(diǎn)即代表了相應(yīng)的知識狀態(tài)。

3.屬性層級模型（AHM）

AHM是在RSM的基礎(chǔ)上發(fā)展起來的，該模型同樣采用了RSM模型的Q矩陣?yán)碚摚袃牲c(diǎn)不同之處。第一，AHM強(qiáng)調(diào)首先要界定好屬性及其層級結(jié)構(gòu)，據(jù)此來編制診斷測驗(yàn)，RSM是在現(xiàn)有測驗(yàn)的基礎(chǔ)之上，反推屬性及其層級結(jié)構(gòu)。第二，AHM根據(jù)最大相似概率對學(xué)生進(jìn)行判別，RSM通過建立規(guī)則空間，使用距離判別法對學(xué)生進(jìn)行判別。Leighton等提出了兩種基于項(xiàng)目反應(yīng)理論和概率論的分類方法：A方法和B方法。

方法A：

，其中

sj（01）表示學(xué)生i的期望反應(yīng)為0，但觀察反應(yīng)為1的所有題目的集合；sj（10）表示學(xué)生i的期望反應(yīng)為1，但觀察反應(yīng)為0的所有題目的集合。P（θi）為學(xué)生i的正確作答概率，由項(xiàng)目反應(yīng)模型估計(jì)得到。

方法B：

。該方法與A方法的區(qū)別在于，B方法認(rèn)為擁有某個觀察反應(yīng)模式的學(xué)生，掌握了所有邏輯包含在其中的期望反應(yīng)模式的屬性組合，對于那些邏輯不包含的期望反應(yīng)模式，只需考慮失誤而不需考慮猜測[14]。

4.確定性輸入，噪音“與”門模型（DINA）

DINA模型是具有顯式項(xiàng)目特征函數(shù)的診斷模型[15]，其數(shù)學(xué)表達(dá)式為：

，其中

是潛在反應(yīng)指標(biāo)，具體含義是指，若學(xué)生i掌握了項(xiàng)目j所考察的全部屬性，則ηj=1，否則，ηj=0。從中可以看出，DINA模型能將學(xué)生分為兩類，一類是掌握了題目考察的全部屬性，一類是至少有一個題目考察的屬性未掌握。αik 指學(xué)生i是否掌握了第k個屬性（k=1，2，…，K）， αik =1表示掌握，αik =0表示未掌握。qjk表示項(xiàng)目j是否考察了屬性k，若qjk=1表示考察了，qjk=0表示未考察。sj是題目的失誤參數(shù)，它表示學(xué)生 i 掌握了題目 j 考察的全部屬性，反而答錯的概率；gj是題目的猜測參數(shù)，它表示學(xué)生 i 未全部掌握題目 j 考察的屬性，反而答對的概率。一個質(zhì)量較好的題目，應(yīng)該具有較小的 sj 和 gj 參數(shù)，并且要滿足1-sj>gj[16]。

5.融合模型（FM）

FM被認(rèn)為是一個很成功的認(rèn)知診斷模型[17]，其數(shù)學(xué)表達(dá)式為：

。

其中

，表示掌握題目j考察的全部屬性的學(xué)生的正確作答概率，也稱作題目的難度參數(shù)，其值越大，題目難度越小。

表示學(xué)生未掌握屬性k所帶來的懲罰，每少掌握一個題目j考察的屬性，正答概率就會下降。r*ik也稱作屬性區(qū)分度，其值越小表明屬性越重要。cj 表示學(xué)生答對項(xiàng)目 j 所需殘余能力的程度，它是表征 Q 矩陣完整性的指標(biāo)，cj值越大說明 Q 矩陣界定越完備[18]。

三、認(rèn)知診斷測驗(yàn)編制方法

認(rèn)知診斷測驗(yàn)與傳統(tǒng)測驗(yàn)的主要區(qū)別在于：（1）認(rèn)知診斷測驗(yàn)的目的是偵查出學(xué)生的知識漏洞，進(jìn)而采取針對性的補(bǔ)救措施，促進(jìn)個體的認(rèn)知發(fā)展；而傳統(tǒng)測驗(yàn)意在對學(xué)生進(jìn)行整體評價(jià)或篩選，較少關(guān)注個體的認(rèn)知結(jié)構(gòu)。（2）認(rèn)知診斷測驗(yàn)需要由認(rèn)知心理學(xué)和心理測量學(xué)專家事先界定出完成測驗(yàn)任務(wù)所需的認(rèn)知屬性，以及它們之間的層級結(jié)構(gòu)，然后根據(jù)Q矩陣?yán)碚摼幹茰y驗(yàn)；傳統(tǒng)測驗(yàn)一般是根據(jù)雙向細(xì)目表來編制測驗(yàn)，無法偵查出學(xué)生在認(rèn)知結(jié)構(gòu)和認(rèn)知加工過程方面的情況。（3）在編制認(rèn)知診斷測驗(yàn)時，不僅要滿足測驗(yàn)考察的內(nèi)容、題型、難度、區(qū)分度等標(biāo)準(zhǔn)，同時還要兼顧可達(dá)矩陣、每個屬性的考察次數(shù)以及每道題目所考察的屬性個數(shù)等因素。（4）傳統(tǒng)測驗(yàn)追求的是總分分布形態(tài)盡量呈正態(tài)分布，分?jǐn)?shù)之間的變異性越大越好[19]，認(rèn)知診斷測驗(yàn)對總分形態(tài)沒有要求。

基于以上區(qū)別，認(rèn)知診斷測驗(yàn)的編制方法與傳統(tǒng)測驗(yàn)大不相同。國外學(xué)者從不同方面對其編制方法進(jìn)行了研究[20]，包括：認(rèn)知設(shè)計(jì)系統(tǒng)[21]、證據(jù)中心設(shè)計(jì)[22]及基于KL信息量的認(rèn)知診斷測驗(yàn)編制法[23]。在綜合了前人研究的基礎(chǔ)上，我們認(rèn)為編制一份優(yōu)良的認(rèn)知診斷測驗(yàn)應(yīng)該包含以下步驟：

1.確定認(rèn)知診斷評估的目標(biāo)和群體；

2.根據(jù)目標(biāo)，由專家界定出完成測驗(yàn)任務(wù)所需的認(rèn)知屬性，以及它們之間的層級結(jié)構(gòu)；

3.根據(jù)屬性層級結(jié)構(gòu)，利用Q矩陣?yán)碚摻⒁幌盗芯仃?，其中測驗(yàn)矩陣Qt陣十分重要，是認(rèn)知診斷的測驗(yàn)藍(lán)圖[9]；

4.根據(jù)Qt矩陣編制認(rèn)知診斷題目；

5.選擇合適的認(rèn)知診斷模型對題目參數(shù)和學(xué)生的知識狀態(tài)進(jìn)行評估；

6.對題目質(zhì)量進(jìn)行分析，例如，題目參數(shù)是否合理，Q矩陣質(zhì)量是否合格，界定是否完備；

7.根據(jù)第6步的結(jié)果對題目進(jìn)行修訂或增刪，以及對Q矩陣進(jìn)行重新標(biāo)定，之后重復(fù)2-7步驟，直到所有的題目均達(dá)到理想標(biāo)準(zhǔn)；

8.測驗(yàn)組卷。

四、認(rèn)知診斷測驗(yàn)的效度檢驗(yàn)

效度檢驗(yàn)不應(yīng)該僅局限于對測驗(yàn)本身是否達(dá)到預(yù)期測量目標(biāo)的范圍（內(nèi)容/結(jié)構(gòu)效度），還應(yīng)該包括補(bǔ)救和指導(dǎo)效果的考察（校標(biāo)效度）[24]。關(guān)于效度檢驗(yàn)，目前有以下兩派觀點(diǎn)。

（一）Messick框架

Messick提出的效度檢驗(yàn)框架[25]，關(guān)注的是由認(rèn)知診斷設(shè)計(jì)帶來的正向或負(fù)向結(jié)果，它強(qiáng)調(diào)認(rèn)知診斷設(shè)計(jì)與補(bǔ)救之間的聯(lián)系。Messick區(qū)分了認(rèn)知診斷結(jié)構(gòu)效度的7個方面：（1）內(nèi)容是否體現(xiàn)了認(rèn)知診斷的目標(biāo)領(lǐng)域；（2）學(xué)生是否運(yùn)用了相應(yīng)的認(rèn)知加工過程去完成測驗(yàn)任務(wù)；（3）評分是否反映了學(xué)生能力與目標(biāo)領(lǐng)域的交互作用；（4）認(rèn)知診斷得到的結(jié)果是否能預(yù)測期望的結(jié)果；（5）認(rèn)知診斷測驗(yàn)的結(jié)果是否公平可信；（6）認(rèn)知診斷測驗(yàn)是否有較好的聚合效度和區(qū)分效度；（7）測驗(yàn)結(jié)果的外推性如何，例如是否能夠推廣到不同時間、地點(diǎn)以及實(shí)測環(huán)境。

（二）荷蘭學(xué)者框架

Borsboom及其同事提出了認(rèn)知診斷效度檢驗(yàn)的三個主要概念[26]。（1）測量概念：認(rèn)知診斷評估需要關(guān)注的是那些可以被量化的研究側(cè)面，其中包括測量到的內(nèi)容與想要測量內(nèi)容的一致性、在不同情況下測量到的結(jié)果是否具有不變性，以及測量到的結(jié)果是否準(zhǔn)確。（2）決策概念：能夠用心理測量方法進(jìn)行量化研究，包括額外評估，以及根據(jù)經(jīng)驗(yàn)與診斷評估分?jǐn)?shù)相關(guān)聯(lián)的其他標(biāo)準(zhǔn)。強(qiáng)調(diào)對一個較穩(wěn)定特質(zhì)的測量結(jié)果是否能準(zhǔn)確預(yù)測未來，是否采用了最佳的測量方案等。（3）影響概念：量化基于診斷評估所進(jìn)行的決策評價(jià)，不能直接追溯到診斷評價(jià)的心理測量性質(zhì)本身，而應(yīng)該根據(jù)測量結(jié)果的變異性來考察效度。該概念包括測量的結(jié)果是否可以被接受，對不同人群測量是否公平等。

以上兩派觀點(diǎn)均是從理論出發(fā)，探討在認(rèn)知診斷中該如何對效度進(jìn)行檢驗(yàn)，以及應(yīng)該關(guān)注的方面。實(shí)踐中，一些學(xué)者采取具體措施對效度問題進(jìn)行了檢驗(yàn)。Tatsuoka和Tatsuoka將補(bǔ)救措施作為實(shí)證效度的證據(jù)[27]，他們對學(xué)生進(jìn)行前測后，根據(jù)診斷結(jié)果對學(xué)生實(shí)施了針對性的補(bǔ)救措施，然后在實(shí)施后測之后發(fā)現(xiàn)，93%的學(xué)生有了進(jìn)步，7%的學(xué)生發(fā)生了退步；Jang在對二語閱讀理解進(jìn)行診斷后將結(jié)果反饋給教師和學(xué)生發(fā)現(xiàn)，所有的教師認(rèn)為診斷信息十分有效，能夠使學(xué)生了解未掌握的屬性有哪些，并有效指導(dǎo)教師教學(xué)，有39%的學(xué)生經(jīng)常使用反饋的診斷信息來指導(dǎo)自己學(xué)習(xí)，50%的學(xué)生偶爾使用反饋信息[28]。Embretson和Yang還提出建立項(xiàng)目難度對認(rèn)知屬性的回歸檢驗(yàn)，來測量認(rèn)知屬性對題目難度的解釋量，以此來驗(yàn)證Q矩陣的內(nèi)部效度[29]。

五、認(rèn)知診斷在實(shí)踐中的應(yīng)用

認(rèn)知診斷在實(shí)踐中得到了廣泛的運(yùn)用，概括起來，主要包含兩個領(lǐng)域：教育領(lǐng)域和臨床診斷領(lǐng)域。其中第一個領(lǐng)域的研究頗豐。

（一）認(rèn)知診斷在教育領(lǐng)域的應(yīng)用

在數(shù)學(xué)學(xué)科方面，余嘉元運(yùn)用RSM對江蘇省中學(xué)生解不等式題進(jìn)行了診斷研究，這是RSM在國內(nèi)的首次應(yīng)用[30]。范士青用RSM，采用任務(wù)分析的方法歸納出加減法運(yùn)算的屬性及其層級結(jié)構(gòu)，以此編制測驗(yàn)，調(diào)查了268名小學(xué)二、三年級學(xué)生對整數(shù)減法計(jì)算的掌握情況，研究發(fā)現(xiàn)，有87%的學(xué)生被成功劃歸到18個理想反應(yīng)模式中[31]。

在語言研究方面，Hartz等人運(yùn)用融合模型對小學(xué)三年級學(xué)生的閱讀評估測驗(yàn)及PSAT測驗(yàn)進(jìn)行了研究[32]；劉慧以現(xiàn)代漢語普通話六個基本顏色詞為對象，運(yùn)用RSM對漢語非母語者對這些顏色詞的認(rèn)知模式作出判別，并對他們的掌握情況作出診斷性描述，這是RSM在漢語語言測試中的首次應(yīng)用[33]。王靜用RSM對857名被試進(jìn)行了C.TEST閱讀理解測驗(yàn)的診斷性評價(jià)研究，將90.57%的被試成功地劃歸到50個理想反應(yīng)模式中[34]；趙雪晶用RSM對289名以漢語為第二語言學(xué)習(xí)者進(jìn)行了量詞掌握模式的診斷研究，有95.16%的被試得到了成功歸類[35]；蔡艷、丁樹良和涂冬波根據(jù)高考英語數(shù)據(jù)，采用AHM方法對82000名考生作了認(rèn)知診斷分析，探明了目前高中生在英語閱讀問題解決的認(rèn)知特征及存在的問題，為教學(xué)指導(dǎo)及評估提供了豐富信息[36]。

在認(rèn)知能力測驗(yàn)方面，康春花和戴海琦用LLTM對空間折疊能力（心理旋轉(zhuǎn)）進(jìn)行了實(shí)證研究，取得了良好的效果[37]。戴海琦和劉聲濤還用LLTM對影響瑞文測驗(yàn)項(xiàng)目認(rèn)知難度因素進(jìn)行了實(shí)證研究[38]。余嘉元用RSM編制了40道題目，對南京市中學(xué)生進(jìn)行測量，發(fā)現(xiàn)其中有318人存在不同程度的認(rèn)知缺陷，他們能夠被劃歸到16種不同的理想反應(yīng)模式中[39]。趙頂位將AHM運(yùn)用于三段論推理測驗(yàn)編制及個體知識狀態(tài)的判別中[40]。趙頂位和戴海琦用高階DINA模型對江西省三所中小學(xué)4-8年級學(xué)生的幾何類比推理問題解決能力進(jìn)行了診斷評估，探明了目前學(xué)生在解決幾何類比推理問題中所存在的問題，進(jìn)而為提出針對性的補(bǔ)救措施提供依據(jù)，使學(xué)生能夠更好地掌握知識[41]。

在其他學(xué)科中的應(yīng)用方面，劉啟亮用RSM作了初中化學(xué)認(rèn)知診斷的研究，將91.46%的被試判歸為21種理想屬性反應(yīng)模式，然后就根據(jù)診斷結(jié)果該如何進(jìn)行補(bǔ)救進(jìn)行了相關(guān)探討，從班級和個體兩個層面從理論上提出了一些補(bǔ)救方案[42]。黎嬌以歐姆定律學(xué)習(xí)為例，運(yùn)用RSM進(jìn)行了中學(xué)物理教學(xué)評價(jià)中的實(shí)證研究[43]。徐光建用高階DINA模型編制了高一物理認(rèn)知診斷測驗(yàn)[44]。

（二）認(rèn)知診斷在臨床診斷領(lǐng)域的應(yīng)用

Templin等人運(yùn)用DINO模型對593名被試在病理性賭博方面進(jìn)行了臨床診斷研究，按照《精神障礙診斷與統(tǒng)計(jì)手冊》（DSM-IV-TR）給出的10條標(biāo)準(zhǔn)，估計(jì)出了每個被試在各條標(biāo)準(zhǔn)上的“掌握程度”，從而判斷該被試是否存在病理性賭博傾向[16]。

此外，Reif等人認(rèn)為以往人格問卷的編制缺乏直觀性，并且題目的難度均是由實(shí)證研究所決定。為了增加問卷題目的結(jié)構(gòu)效度，他們使用LLTM編制了人格問卷[45]。

六、結(jié)語

未來認(rèn)知診斷的發(fā)展不僅需要關(guān)注對測量模型的研究，更需要加強(qiáng)理論建設(shè)（Q矩陣?yán)碚摚?，只有兩者齊頭并進(jìn)，才能更好地壯大認(rèn)知診斷理論。正如Leighton等人曾說：“認(rèn)知診斷評價(jià)還處于嬰兒期，但它的起源是非常牢固的?！盵5]最后，希望更多的心理學(xué)工作者能夠加入到認(rèn)知診斷研究中，共同推進(jìn)該測量理論的發(fā)展。

參考文獻(xiàn)：

[1]Glaser， R.， The future of testing： A research agenda for cognitive psychology and psychometrics[J]. American Psychologist， 1981， 36（9）： 923.

[2] Nichols， P.D.， A framework for developing cognitively diagnostic assessments[J]. Review of Educational Research， 1994， 64（4）： 575-603.

[3] Stout， W.， Psychometrics： From practice to theory and back[J]. Psychometrika， 2002， 67（4）： 485-518.

[4] Leighton， J. and M. Gierl， Cognitive diagnostic assessment for education： Theory and applications[M]. Cambridge University Press， 2007.

[5] Tatsuoka， K.K.， Cognitive assessment： An introduction to the rule space method[M]. Routledge New York， NY，2009.

[6]Rupp， A.， J. Templin， and R. Henson， Diagnostic measurement： Theory， methods， and applications[M]. Guilford Press， 2010.

[7]Tatsuoka， K.K.， Architecture of knowledge structures and cognitive diagnosis： A statistical pattern recognition and classification approach[J]. Erlbaum： Hillsdale， 1995： 327-359.

[8]丁樹良，王文義，羅芬. 認(rèn)知診斷中Q矩陣和Q矩陣?yán)碚揫J].江西師范大學(xué)學(xué)報(bào)：自然科學(xué)版， 2012， 36（5）： 441-445.

[9]丁樹良，汪文義，楊淑群. 認(rèn)知診斷測驗(yàn)藍(lán)圖的設(shè)計(jì)[J].心理科學(xué)， 2011，34（2）： 258-265.

[10]楊淑群，蔡聲鎮(zhèn)，丁樹良，林海菁，丁秋林. 求解簡化Q矩陣的擴(kuò)張算法[J].蘭州大學(xué)學(xué)報(bào)：自然科學(xué)版， 2008，44（3）： 87-91.

[11]丁樹良，楊淑群，汪文義. 可達(dá)矩陣在認(rèn)知診斷測驗(yàn)編制中的重要作用.江西師范大學(xué)學(xué)報(bào)：自然科學(xué)版， 2010，34（5）： 490-494.

[12]辛濤，樂美玲，張佳慧. 教育測量理論新進(jìn)展及發(fā)展趨勢[J].中國考試， 2012， 5： 002.

[13] Fischer， G.H.， The linear logistic test model as an instrument in educational research[J]. Acta psychologica， 1973，37（6）： 359-374.

[14]韓裕，張敏強(qiáng). AHM分類方法的改良[J].華南師范大學(xué)學(xué)報(bào)（自然科學(xué)版）， 2012.

[15]Junker， B.W. and K. Sijtsma， Cognitive assessment models with few assumptions， and connections with nonparametric item response theory[J]. Applied Psychological Measurement， 2001， 25（3）： 258-272.

[16] Templin， J.L. and R.A. Henson， Measurement of psychological disorders using cognitive diagnosis models[J]. Psychological Methods， 2006， 11（3）： 287.

[17]涂冬波，蔡艷，戴海琦，漆書青. 現(xiàn)代測量理論下四大認(rèn)知診斷模型述評[J].心理學(xué)探新， 2008. 28（2）： 64-68.

[18] Hartz， S.M.， A Bayesian framework for the unified model for assessing cognitive abilities： Blending theory with practicality[D]. Unpublished doctoral dissertation， University of Illinois at Urbana-Champaign， Urbana-Champaign， IL.， 2002.

[19]漆書青，戴海崎，丁樹良，現(xiàn)代教育與心理測量學(xué)原理[M].北京：高等教育出版社. 2002.

[20]蔡艷，涂冬波，丁樹良，認(rèn)知診斷測驗(yàn)編制的理論及方法[J].考試研究， 2010（003）： 79-92.

[21] Embretson， S.E.， A cognitive design system approach to generating valid tests： Application to abstract reasoning[J]. Psychological Methods， 1998， 3（3）： 380-396.

[22] Mislevy， R.J.， L.S. Steinberg， and R.G. Almond， On the role of task model variables in assessment design. In Siring & P. Kyullonene （ Eds. ）， Generating items for cognitive tests： Theory and practice[M]. Hillsdale， NJ： Erlbaum， 2003.

[23] Henson， R. and J. Douglas， Test construction for cognitive diagnosis[J]. Applied Psychological Measurement， 2005， 29（4）： 262-277.

[24]王卓然，郭磊，邊玉芳，從與標(biāo)準(zhǔn)測驗(yàn)理論差異談?wù)J知診斷的特征[J].考試研究， 2012， 32（3）： 10-20.

[25]Messick， S.. Validity. In R. Linn （Ed.）， Educational measurement （ 3rd ed.， pp. 13-103） [M].NewYork： Macmillan，1989.

[26]Borsboom， D.， &Mellenbergh， G. J..Testvalidity in cognitive assessment.In J. P. Leighton&M. J. Gierl （Eds.）. Cognitive diagnostic assessment for education：Theory andapplication（pp. 85-118） [M]. Cambridge， UK：Cambridge University Press，2007.

[27] Tatsuoka， K.K. and M.M. Tatsuoka， Computerized cognitive diagnostic adaptive testing： effect on remedial instruction as empirical validation[J]. Journal of Educational Measurement， 1997，34（1）： 3-20.

[28] Jang， E.E.， Cognitive diagnostic assessment of L2 reading comprehension ability： Validity arguments for Fusion Model application to LanguEdge assessment[J]. Language Testing， 2009，26（1）： 31-73.

[29]Embretson， S.E.， & Yang， X.. Construct validity and cognitive diagnostic assessment.In J. P. Leighton.， & M. Gierl （Eds.）， Cognitive Diagnostic Assessment for Education[M]. New York： Cambridge University Press，2007.

[30]余嘉元. 運(yùn)用規(guī)則空間模型識別解題中的認(rèn)知錯誤[J].心理學(xué)報(bào)， 1995，27（2）： 196-203

[31]范士青. 小學(xué)生加減法計(jì)算錯誤的分類與認(rèn)知分析[D]，華中師范大學(xué)碩士學(xué)位論文，2008.

[32]Hartz， S.， L. Roussos， and W. Stout， Skills diagnosis： Theory and practice[J]. User Manual for Arpeggio software. ETS， 2002.

[33]劉慧.規(guī)則空間模型在留學(xué)生漢語顏色詞掌握模式診斷中的應(yīng)用[D]，北京語言大學(xué)碩士學(xué)位論文，2006.

[34]王靜.C. TEST 閱讀理解測驗(yàn)的診斷性評價(jià)研究[D]，北京語言大學(xué)碩士學(xué)位論文，2008.

[35]趙雪晶. 漢語作為第二語言學(xué)習(xí)者量詞掌握模式診斷研究[D]，北京語言大學(xué)碩士學(xué)位論文，2009.

[36]蔡艷，丁樹良，涂冬波。英語閱讀問題解決的認(rèn)知診斷[J].心理科學(xué)， 2011，34（2）： 272-277.

[37]康春，戴海崎. 采用LLTM作測量與認(rèn)知結(jié)合研究的初步探討[J].心理科學(xué)， 2001，24（5）： 569-572.

[38]戴海崎，劉聲濤. 瑞文測驗(yàn)項(xiàng)目認(rèn)知難度因素分析及LLTM擬合驗(yàn)證[J].心理與行為研究， 2004，2（2）： 411-414.

[39]余嘉元. 關(guān)于新課程改革中的診斷性測驗(yàn)研究[J].教育探索， 2006. 5： 24-25.

[40]趙頂位. 屬性層次方法下的三段論推理測驗(yàn)制及個體屬性掌握模式的判別[D]，江西師范大學(xué)碩士學(xué)位論文，2007.

[41]趙頂位，戴海琦. 基于認(rèn)知設(shè)計(jì)系統(tǒng)的幾何類比推理測驗(yàn)的編制及認(rèn)知模型分析[J].心理學(xué)探新， 2011，31（3）： 278-283.

[42]劉啟亮. 規(guī)則空間模型在初中生化學(xué)知識學(xué)習(xí)診斷與補(bǔ)救中的應(yīng)用研究[D]，江西師范大學(xué)碩士學(xué)位論文，2008.

篇9

高等職業(yè)教育是高等教育的重要組成部分，其教學(xué)過程和培養(yǎng)目標(biāo)有三個顯著特點(diǎn)：一是注重崗位能力培養(yǎng)，根據(jù)“按需施教、學(xué)以致用”的原則，組織課程教學(xué)和實(shí)習(xí)實(shí)訓(xùn)；二是強(qiáng)調(diào)課程體系的針對性，課程設(shè)置不是從學(xué)科出發(fā)，而是從職業(yè)崗位需要出發(fā)；三是突出實(shí)踐環(huán)節(jié)教學(xué)，主動適應(yīng)地方社會經(jīng)濟(jì)建設(shè)發(fā)展要求。因此，要對整個教學(xué)過程進(jìn)行全面、系統(tǒng)、公正地評價(jià)，就要從考試內(nèi)容、形式、成績構(gòu)成等方面進(jìn)行系統(tǒng)規(guī)劃與分析，力求探索出相對完整、切實(shí)可行的能充分發(fā)揮考試功能和實(shí)現(xiàn)高職教育教學(xué)目的的考試方法和手段，從而實(shí)現(xiàn)高職教育教學(xué)目的。

高職院校工程測量技術(shù)專業(yè)專業(yè)課程主要包括《地形測量》、《控制測量》、《工程測量》、《GPS測量技術(shù)》、《數(shù)字測圖》、《測量平差》、《攝影測量》等，各專業(yè)課程的考試均應(yīng)具有顯示功能、反饋功能和導(dǎo)向功能，因此要結(jié)合現(xiàn)有工程測量技術(shù)專業(yè)專業(yè)課程考試存在的弊端，構(gòu)建新的考試機(jī)制，同時促進(jìn)數(shù)字化校園的建設(shè)?，F(xiàn)有的考試模式存在著很多問題，如形式單一、考試目標(biāo)的模糊等情況，造成學(xué)生創(chuàng)造力的抵制，綜合能力的下降，具體分析主要包括是以下幾個方面的問題：

1、考試目標(biāo)僵化?？荚囀且粋€學(xué)習(xí)過程，這應(yīng)該是一個考試的主題教育管理論文，其目的是促進(jìn)學(xué)生更好、更全面、更深入學(xué)習(xí)的手段，是為了對所學(xué)知識的一種提升，為今后的運(yùn)用打下堅(jiān)實(shí)基礎(chǔ)，從而拓寬思路，成為創(chuàng)新人才的起步。而現(xiàn)在考試形式促使學(xué)生考試目標(biāo)僵化，態(tài)度不明確，認(rèn)為考試是學(xué)習(xí)的終結(jié)者。

2、考試方式過于單一。目前高職院校大部分學(xué)科考試主要是是采取終結(jié)式考核, 即教師出各種題型的試題，學(xué)生在規(guī)定時間內(nèi)閉卷筆試，教師按標(biāo)準(zhǔn)答案進(jìn)行閱卷，給出學(xué)生的期末考試成績，結(jié)合學(xué)生平時成績，做出學(xué)生該門課程的期末總評成績?？荚嚨膯我恍?，使學(xué)生學(xué)習(xí)一門課程之前便習(xí)慣性產(chǎn)生為了考試而學(xué)習(xí)的慣性思維。不光答題紙張耗材，教師閱卷、試卷回收也耗時。

3、考試內(nèi)容主觀性過強(qiáng)。目前考試內(nèi)容大多由任課教師或?qū)I(yè)教師自主出題，自主閱卷。老師出卷自由度小，試卷質(zhì)量低。多數(shù)老師在出卷時都只會側(cè)重大綱中的重難點(diǎn)，而忽略或者說是無法把各科知識進(jìn)行鏈接，也無法區(qū)別對待，從而測試出個體真實(shí)的成績論文服務(wù)。導(dǎo)致學(xué)生為考試而學(xué)，教師為考試而教。教師在授課過程中注重強(qiáng)調(diào)考試內(nèi)容，便會導(dǎo)致理論知識的傳授過于傾斜。試題內(nèi)容的泄露，批改閱卷過程中存在的主觀判錯、計(jì)算錯誤等現(xiàn)象都會促使最后結(jié)果失去客觀真實(shí)性、公平性。不能客觀、真實(shí)地反映出學(xué)生的能力水平，同時又有測試內(nèi)容不全面的因素，因此考試形式的改革和創(chuàng)新是迫在眉捷事宜，只有改革考試模式才能夠真正激發(fā)學(xué)生的創(chuàng)新意識，培養(yǎng)其創(chuàng)新能力。

4、考試評價(jià)方法片面。目前期末總評成績中，期末考試成績是主要的決定因素，而期末考試往往是書面閉卷形式，這就給學(xué)生造成了很大壓力和僥幸心理，有的同學(xué)在考前搞題海戰(zhàn)術(shù)，有的同學(xué)把“投機(jī)取巧”的功夫用在考場上，同時也不利于學(xué)生創(chuàng)造性和主動性的發(fā)揮，阻礙了創(chuàng)新思維的培養(yǎng)與發(fā)展。為培養(yǎng)學(xué)生學(xué)習(xí)的自主性、自覺性和創(chuàng)造性，促使學(xué)生充分利用平時時間努力學(xué)習(xí)，就必須對傳統(tǒng)的考試模式進(jìn)行改革，建立一個真正全面、客觀、合理的課程考核體系。

5、考試反饋機(jī)制缺乏。由于考試是期末一次性終結(jié)考試，學(xué)生考試結(jié)束，就意味著本門課程學(xué)習(xí)的終結(jié)?？荚囍写嬖诘膯栴}，教師不能與學(xué)生進(jìn)行及時的反饋與交流。這樣的考試模式有可能將學(xué)生引向一種僵化、死板的學(xué)習(xí)軌道。

這些弊端的出現(xiàn)都會降低學(xué)生學(xué)習(xí)的積極性、自主性、創(chuàng)新性以及個體綜合素質(zhì)的全面發(fā)展，同時還導(dǎo)致高職教育教學(xué)目的失去重心。

現(xiàn)代科技的發(fā)展教育管理論文，信息技術(shù)廣泛應(yīng)用，計(jì)算機(jī)已滲透到各行各業(yè)。其中，憑借計(jì)算機(jī)的考試系統(tǒng)以方便快捷等優(yōu)點(diǎn)得到了充分的肯定。駕駛理論考試就是運(yùn)用計(jì)算機(jī)考試的一個實(shí)際應(yīng)用，它實(shí)現(xiàn)了理論考試的無紙化，以往出題、印試卷、批改試卷等繁瑣的工作也隨之被計(jì)算機(jī)所替代?？荚囀墙虒W(xué)過程中的重要環(huán)節(jié)，它擔(dān)負(fù)著因材施教、選拔人才、評價(jià)教學(xué)等眾多功能。隨著時代變遷，這種計(jì)算機(jī)無紙化考試系統(tǒng)由于安全性高、便于組卷和評閱、資源消耗低、自動化程度高、可以實(shí)現(xiàn)遠(yuǎn)程考試等特點(diǎn)，在學(xué)歷考試、各種職稱考試、證書考試中已被廣泛使用。

工程測量技術(shù)專業(yè)專業(yè)課程考試模式改革應(yīng)首先通過對專業(yè)考試現(xiàn)狀的分析，收集資料建設(shè)試題庫，同時與計(jì)算機(jī)編程技術(shù)人員合作構(gòu)建考試模擬系統(tǒng)。因此，核心內(nèi)容便是依托建立的考試模擬系統(tǒng)，其原理應(yīng)同駕校理論考試一致，可以隨機(jī)抽取題庫試題組卷、計(jì)算機(jī)智能閱卷評分和試卷分析等功能于一身，更能體現(xiàn)客觀、公平、公正的考試特點(diǎn)，且不受時間和空間的限制，隨時隨地進(jìn)行測試更適合信息時代的考試要求，也切合了高校數(shù)字校園的建設(shè)。采用此考試模式，不僅使得教學(xué)管理部門不再面臨人工印刷試卷的艱巨任務(wù)，也讓教師從此告別了出題、組卷、人工閱卷、評分、試卷分析、登記分?jǐn)?shù)等繁瑣的工作，節(jié)省大量的人力物力，因此考試模擬系統(tǒng)代替?zhèn)鹘y(tǒng)的考試已經(jīng)成為必然趨勢。以下從多方面對其特點(diǎn)進(jìn)行分析探討：

1、隨機(jī)抽題功能，降低了考生作弊的可能性，達(dá)到公平、公正性。支持隨機(jī)組合卷，可以從指定的若干試卷中按要求隨機(jī)抽取考題進(jìn)行考試，或從試題庫中隨機(jī)抽題供考生作答，保證每個考生的試卷都不一樣。用于考生平時自測也十分方便。由于試題是隨機(jī)抽取的，所以考生試卷的試題順序是不同的，這極大降低了考生作弊的可能性，有效防止相互抄襲行為，也確保了考試的公平性。

2、題型可以豐富，自主選擇性強(qiáng)。教師可以在選擇單選、多選、簡答等題型的基礎(chǔ)上，如條件充裕，可以設(shè)計(jì)新增判斷題、不定項(xiàng)選擇題、填空題、計(jì)算題、識圖題、簡答題等題型。

3、考試過程自動控制，在規(guī)定的時間內(nèi)自動交卷、評分。整個考試過程由系統(tǒng)自動計(jì)時，時間到系統(tǒng)將自動提交試卷，避免了傳統(tǒng)考試中考試結(jié)束時，考生還不愿意停筆交卷的拖延現(xiàn)象論文服務(wù)。

4、成績分析功能，有效幫助教師了解教學(xué)情況?？忌峤辉嚲砗?，系統(tǒng)將立刻對試卷進(jìn)行自動評分，生成成績通知單。最終將整個班級學(xué)生的成績匯總教育管理論文，并按分?jǐn)?shù)段排列，形成分析報(bào)告。真正實(shí)現(xiàn)考生考完即刻知道考試成績的愿望，也體現(xiàn)出考試高效、快捷的特點(diǎn)。

5、可支持試題庫管理，方便錄入、導(dǎo)出試題，也可以在網(wǎng)上共享題庫資源。該系統(tǒng)可擁有簡單快捷的試題錄入模式，方便對試題庫的管理。試卷可以直接導(dǎo)出到WORD文檔或打印出來。可以把所有試題保存到數(shù)據(jù)庫，通過互聯(lián)網(wǎng)方便地進(jìn)行模擬考試，也允許設(shè)置為練習(xí)模式，讓學(xué)生考試過程自行判題。

6、考試模擬系統(tǒng)擴(kuò)展性強(qiáng)。其可以根據(jù)自己需求，在計(jì)算機(jī)技術(shù)基礎(chǔ)上增加各種功能。如新增考生身份檢查功能：對考生重考、二次登陸和考后查卷時進(jìn)行身份檢查，只有班級、考號、姓名和第一次考試輸入的信息一致方允許登錄，防止考生身份信息輸入出錯的情況。

7、界面可設(shè)計(jì)人性化，操作簡便。在實(shí)際使用中，從每一位學(xué)生到教師，在操作方面都沒有障礙，界面人性化，方便可行。

篇10

〔中圖分類號〕G44 〔文獻(xiàn)標(biāo)識碼〕A

〔文章編號〕1671-2684（2014）04-0004-03

心理健康（mental health）是指個體在適應(yīng)環(huán)境的過程中，生理、心理和社會性方面達(dá)到協(xié)調(diào)一致，保持良好的心理功能狀態(tài)[1]。它是影響人們幸福感的重要因素。然而，據(jù)美國衛(wèi)生局報(bào)告，我國精神疾病目前占所有疾病的14.3%，預(yù)計(jì)到2020年將上升到17.4%[2]，這表明我國心理健康問題形勢嚴(yán)峻。小學(xué)生情緒能力和認(rèn)知能力處于迅速發(fā)展的關(guān)鍵期，其心理健康狀況不僅影響其幸福感，更對其健康成長起著不可忽視的作用。對此，有學(xué)者就我國小學(xué)生的心理健康狀況進(jìn)行了調(diào)查，結(jié)果發(fā)現(xiàn)，小學(xué)生中有中度心理和行為問題的占16.4%，有嚴(yán)重心理問題的占4.2%[3]。這反映了我國小學(xué)生的心理健康問題堪憂。

越來越多的研究認(rèn)識到研究小學(xué)生心理健康問題不僅是學(xué)術(shù)議題，更是進(jìn)行小學(xué)生心理健康教育的必要基礎(chǔ)，因此大量的研究先后探究了小學(xué)生心理健康狀況。為了把握小學(xué)生心理健康研究的具體情況，本文對源自中國期刊網(wǎng)的453篇相關(guān)論文進(jìn)行文獻(xiàn)計(jì)量學(xué)分析，以深入了解小學(xué)生心理健康研究的具體開展情況，為今后的理論研究與應(yīng)用實(shí)踐提供參考。

一、研究方法

1.統(tǒng)計(jì)方法

文獻(xiàn)計(jì)量法，以頻次、百分比為主。

2.文獻(xiàn)取樣

以中國期刊網(wǎng)為平臺，對2003年1月至2012年12月所發(fā)表的有關(guān)小學(xué)生心理健康方面的所有文獻(xiàn)進(jìn)行統(tǒng)計(jì)，發(fā)現(xiàn)有453篇包含“小學(xué)生心理健康”的文章題錄。

3.分析類目與單元

在對代表性論文進(jìn)行參考的基礎(chǔ)上，對以下6個單元作統(tǒng)計(jì)分析：年代分布、受資助狀況、合作者人數(shù)、內(nèi)容分布、作者機(jī)構(gòu)及作者所在地區(qū)。

二、結(jié)果與分析

1.研究論文的年代分布

對2003～2012年發(fā)表的453篇小學(xué)生心理健康方面的文章進(jìn)行年代分布統(tǒng)計(jì)分析，如下頁表1所示。除2005年（4.4%）和2009年（10.2%）出現(xiàn)稍大的波動外，我國關(guān)于小學(xué)生心理健康研究的論文數(shù)量總體呈現(xiàn)增長趨勢。2003～2007年的論文數(shù)為159篇，2008～2012年的論文數(shù)為294篇，分別占總數(shù)的35.1%和64.9%，后者較前者增長了29.8個百分點(diǎn)，這說明近十年來小學(xué)生的心理健康問題越來越受到研究者的關(guān)注。

2.研究論文的受資助情況

對近十年來的453篇論文的受資助情況進(jìn)行分析，如表2所示，結(jié)果發(fā)現(xiàn)有84.1%不受任何項(xiàng)目資助，僅有15.9%的論文受資助。在受資助的文章中，最多的是省部級項(xiàng)目（9.5%），來自“相關(guān)協(xié)會”（1.1%）及“國家級”（1.3%）資助的項(xiàng)目相對較少。整體而言，受資助的研究數(shù)比例低且不同級別間數(shù)額差異很大。這給未來的研究以啟示：小學(xué)生心理健康研究的全面開展需更多資助，尤其是國家級項(xiàng)目及相關(guān)協(xié)會項(xiàng)目的支持。

3.研究論文的內(nèi)容

對453篇文章的內(nèi)容進(jìn)行具體分析（見表3），結(jié)果發(fā)現(xiàn)“現(xiàn)狀調(diào)查”（18.9%）、“相關(guān)研究”（21.9%）及“對策研究”（19.4%）這三項(xiàng)研究內(nèi)容所占比例相當(dāng)，但都低于“其他”內(nèi)容類別（37.1%）的研究論文，而這部分論文是作者基于小學(xué)生心理健康問題某角度而提出的一般性看法或陳述，缺乏科學(xué)研究的嚴(yán)謹(jǐn)性。“綜述研究”及“測量方法研究”則分別只占總體的0.9%、1.8%，這提示著綜述性與測量方法類研究目前呈現(xiàn)出一定困境，亟待突破。

4.研究論文的形式及其研究力量

對研究論文的合作形式和研究力量進(jìn)行分析（見

表4），結(jié)果發(fā)現(xiàn)，獨(dú)著論文數(shù)占論文總數(shù)的67.8%，合著論文僅占32.2%，且論文合著以兩人合作形式（17.2%）為主，課題組合作形式僅占0.7%。這表明研究者需加強(qiáng)各種形式的合作力度，組建課題組形式的專業(yè)研究團(tuán)隊(duì)，增強(qiáng)研究的系統(tǒng)性和全面性。

以第一作者的單位作為研究力量機(jī)構(gòu)分析的基礎(chǔ)，“其他（小學(xué)教師及協(xié)會等）”占研究力量的55.8%，其次為“師范類院?！保?7.7%），而來自其他單位的研究相對缺乏，見表5。這表明，小學(xué)教師及協(xié)會是最主要的者，這些發(fā)表者的研究內(nèi)容基本上是一般陳述性的研究，這與表3中關(guān)于研究內(nèi)容的數(shù)據(jù)結(jié)果（“其他”類別即一般性看法或陳述性研究占最大比重）契合。由此可以看出，專業(yè)研究團(tuán)隊(duì)參與力度的薄弱可能影響到研究內(nèi)容的的專業(yè)性與系統(tǒng)性，研究需更多專業(yè)力量的

投入。

為了進(jìn)一步了解研究力量的分布，本研究對研究力量的省份分布情況作了分析，分布總體來說呈不平衡狀。研究力量位列前五位的省份分別為：江蘇（11.0%）、山東（7.5%）、甘肅（7.5%）、浙江（7.1%）與吉林（5.1%），表明小學(xué)生的心理健康問題在我國較發(fā)達(dá)地區(qū)已經(jīng)普遍受到研究者的關(guān)注。位列后五位的省份分別為：青海（1.1%）、內(nèi)蒙古（1.1%）、（0.9%）、寧夏（0.5%）及新疆（0.5%），即我國偏遠(yuǎn)貧困地區(qū)的相關(guān)研究極度缺乏。

三、討論

1.拓展測量方法

本研究發(fā)現(xiàn)，近十年來關(guān)于小學(xué)生心理健康的研究數(shù)量較多，同時內(nèi)容涵蓋面較廣，包括現(xiàn)狀調(diào)查、相關(guān)研究、對策研究、綜述研究、測量方法研究及其他研究等，但關(guān)于測量方法的研究卻相對匱乏。目前國內(nèi)研究仍較多引進(jìn)國外的測量方法，易出現(xiàn)跨文化問題；此外，現(xiàn)有量表內(nèi)容多側(cè)重負(fù)面心理特質(zhì)，與小學(xué)生發(fā)展的實(shí)際有所偏離[4]。我國研究者也意識到這些問題，心理健康的評估工具已經(jīng)從單純引進(jìn)發(fā)展到自編問卷，量表內(nèi)容在向多領(lǐng)域延伸，也編制出了一些信效度較好的量表。但總體來看，我國心理健康量表的信效度普遍較低，自編量表有低水平重復(fù)現(xiàn)象，測量積極心理的量表少[5]。即我國仍需本土化的較為統(tǒng)一的科學(xué)測查工具和標(biāo)準(zhǔn)。廣大研究者需加強(qiáng)對研究方法的探索，改善測量工具，以便為更深入的研究奠定基礎(chǔ)。

2.研究者的全面調(diào)動

小學(xué)生心理健康問題的研究需要研究者的積極參與。首先，對研究者合作積極性的調(diào)動。研究形式合作化已經(jīng)是當(dāng)今科研形式的主流，合作帶來的團(tuán)隊(duì)資源整合有助于促進(jìn)研究途徑多樣化以及研究本身的完整性、全面性與創(chuàng)新性。但上述數(shù)據(jù)顯示，獨(dú)立研究形式仍是小學(xué)生心理健康研究的主流。獨(dú)立性研究在一方面保留了研究縱向的獨(dú)特性及系統(tǒng)性，但另一方面獨(dú)立性研究缺少橫向文化間的合作交流。這與以往的研究一致[6，7]，即跨文化、跨地區(qū)式大樣本研究缺乏。為此研究者應(yīng)當(dāng)積極尋找合作切入點(diǎn)，突破束縛，加強(qiáng)各種形式的合作以逐步完善研究維度。

其次，對經(jīng)濟(jì)落后地區(qū)研究者的調(diào)動。有研究者在關(guān)于西部民族地區(qū)中小學(xué)心理健康教育需求現(xiàn)狀的研究中發(fā)現(xiàn)，8.4%的中小學(xué)生認(rèn)為自己的心理健康狀況較差或很差，其中有28.7%為小學(xué)生[8]，這說明西部落后地區(qū)小學(xué)生對心理健康教育的需求非常強(qiáng)烈。但本文數(shù)據(jù)顯示，我國一些落后的偏遠(yuǎn)地區(qū)，如青海、內(nèi)蒙古、、寧夏及新疆等地關(guān)于小學(xué)生心理健康的研究極少，發(fā)展極慢，這也反映了落后地區(qū)小學(xué)生對于心理健康教育的需求遠(yuǎn)遠(yuǎn)得不到滿足，客觀經(jīng)濟(jì)條件的相對落后直接影響到理論研究與教育實(shí)踐的開展。同時研究工具的不完善、研究人力的不足等因素都妨礙了相關(guān)研究的發(fā)展。政府需增強(qiáng)支持，幫助其改善研究的物質(zhì)環(huán)境與人文環(huán)境，呼吁更多其他地區(qū)的研究者多進(jìn)行跨地域研究合作，提升研究意識，改善研究方法，加大研究力度。

最后，對各個單位研究力量的調(diào)動。本研究數(shù)據(jù)顯示，群體主要集中在小學(xué)教育者及有關(guān)協(xié)會方面，他們多以見解性、描述性的研究為主。這些研究與其自身教育實(shí)踐直接聯(lián)系，更具現(xiàn)實(shí)意義，且能為進(jìn)一步的研究提供啟發(fā)與思考，但這類研究缺乏專業(yè)性、科學(xué)性與系統(tǒng)性。由此，對來自不同研究單位的研究力量的全面調(diào)動可以融合多種研究優(yōu)勢，實(shí)現(xiàn)不同單位研究力量之間的互補(bǔ)，以便研究成果能更高效地應(yīng)用于

實(shí)踐。

3.展望

心理健康問題的低齡化趨勢已經(jīng)受到社會的普遍關(guān)注，有關(guān)小學(xué)生心理健康的研究總體上正在不斷地深入和拓展。針對目前研究呈現(xiàn)的不足，未來的研究需要考慮以下幾方面：（1）加強(qiáng)研究的問題解決指向性，增加對策研究，將理論積極運(yùn)用于實(shí)踐；（2）實(shí)證研究有待強(qiáng)化，研究方法需不斷改進(jìn)，尤其是測量工具的改進(jìn)；（3）研究要邁向全面化合作，突破孤立局限，嘗試跨單位、跨地域、跨文化研究；（4）研究可多圍繞具體、典型的心理健康問題展開，增加個案研究并綜合群體研究以增強(qiáng)研究的臨床應(yīng)用性。

參考文獻(xiàn)：

[1] 姚本先.學(xué)校心理健康教育概論[M].北京：高等教育出版社，2010：3-9.

[2] 肖旻嬋.中小學(xué)心理健康教育研究[D].上海：華東師范大學(xué)，2005：1-2.

[3] 沃建中，馬紅中，劉軍.走向心理健康（發(fā)展篇）[M].北京：華文出版社，2002：9-10.

[4] 鄭日昌，張穎，劉視湘.小學(xué)生心理健康的結(jié)構(gòu)和量表編制[J].教育測量與評價(jià)（理論版），2008，（2）：30-34.

[5] 廖全明，蘇丹，黃希庭.目前國內(nèi)常用心理健康量表的回顧與反思[J].心理學(xué)探新，2007，27（4）：74-77.

[6] 楊宏飛.我國中小學(xué)心理健康研究的回顧[J].中國心理衛(wèi)生雜志，2001，15（4）：289-290.

相關(guān)范文

熱門文章

期刊推薦