第122章 《「啟智」AI輔助教學試點實施方案》【3/4】
第122章 《「啟智」AI輔助教學試點實施方案》【3/4】
初步測試成功讓周的心中湧現出一股久違的興奮感,畢竟這麼長時間的研究終於有了成果,不過這樣一個簡單的測試還不夠。
在他的設想中,這個智能體應該能服務於整個義務教育階段的所有科自,現在只測試了一門數學,而且還只是高中的三角函數部分,接下來要測試的東西還多著呢。
「任重而道遠啊。」周的輕輕呼出一口氣,繼續智能體的測試,同時還在寫著項目的技術文檔,專利申請書。
論文投稿他懶得弄了,先發到arXiv上占個坑就好,等後續陳默有時間了讓他整理整理看看投幾個會議就好,他粗略估計整理出來三篇論文不是問題。
對周的來說,單純的論文數量也就對他的考核有點作用,不然這些論文他都不想搞。
要測試的東西很多,耗費了大概有一個多月,時間來到了八月份。
這期間,周的測試了語數英科物化生政史地,一共十門科目,文科對比理科的表現相對較差,如果拿一份高考卷子讓智能體去考,語文英語大概都能在130分以上,數學能達到140,而其他六門裡,文科一般都能達到85分以上,理科更是普遍能到90分以上,理科得不到的分數純屬是因為那幾道壓軸題太超標了,現在大模型的理解能力還沒達到這個層次。
通過測試能看得出來,智能體的優勢和缺點都很明顯,對於有標準答案、邏輯結構清晰的知識點,比如數理化就處理得非常好,解釋清晰到位,但是對於需要深度理解、開放性較強的內容,比如語文的深層寓意、歷史事件的不同解讀視角,智能體的回答雖然能抓住大部分要點,但顯得有些模板化,在一次閱讀理解的測試中,對於「作者想表達怎樣的情感」這一問題,智能體的分析就比較一般,不過周的覺得這可能是題自的問題,因為他也不知道作者到底想表達什麼情感。
但是現在這種程度,周的覺得已經很不錯了,加起來六百五到六百七的水平,妥妥的學霸水準。
而陳默這邊,經過了一個多月的研究也算是有點進展了。
周的也不催他,只是偶爾指導一下,讓他在整體的大方向上不會出錯,同時也在做著一些算子重寫的工作,不過因為需要重寫的算子太多,他的進度也不快,還是人太少了,想快也快不起來。
做完手頭上的工作,周的起身來到實驗室外,坐在走廊的椅子上,他這個項目是申報了教育部產學研創新基金的,項目早就申報成功了,資金也批下來了,對方也有一個負責人,他拿出手機,給教育部的負責人打了個電話。
電話很快被接通:「喂,你好,我是李振華。」
「李處長,您好,我是錢塘大學的周的,產學研創新基金『啟智」項目的負責人。」
啟智』就是這個教師智能體的名字。
對方想了一會兒才回話,雖然周的這個名字他記不太清了,但這個『啟智」項目他印象很深。
李振華的聲音帶上了笑意:「項目進展怎麼樣了?有什麼困難嗎?」
「資金方面沒什麼問題,不過有個事還真得靠您幫忙,項目經過我們的內部檢驗,已經達到了驗收標準,所以我希望申請學校作為試點。」
「哦?達到驗收標準了?」李振華先沒管周的的請求,這事情不是他一個人說了算的,反倒是周的能在這麼短的時間裡完成項目讓感到有些驚訝。
在他印象里,這個項目的難度好像不小:「這才沒多久吧?效率很高嘛,先說說看,具體什麼情況?我才能給你答覆。」
周的也知道對方想聽什麼,於是言簡意地說明了一下情況:「李處長,我們完成了智能體對義務教育階段主要科目的全覆蓋測試並且使用了多套高考試卷進行盲測,綜合得分穩定在六百五到六百七左右,尤其是在有標準答案的理科方面,表現更加優秀。」
至於技術什麼的,他就沒細說,反正說了也聽不懂。
電話那頭沉默了兩三秒,顯然『六百五到六百七』這個具象化的數字讓對方感到非常意外:「你確定?」
「確定,所以智能體的教學能力完全不用擔心,至少不會出現誤人子弟的情況,這也是為什麼我敢打這個申請。」
李振華沒有立刻回答,似乎在思考,片刻後,他開口道:「小周啊,你們這個成果確實有點出乎我的意料,當初批這個項目,是看好你們的方向和潛力,沒想到這麼快就拿出了這麼優秀的成果不過教育無小事,涉及到孩子和學習,我們必須慎之又慎,電話里我也不可能直接給你答覆,這樣吧,我組織一下,你看什麼時候方便,來一趟教育局,咱們開個會商討一下,你那邊把相關資料整理整理,到時候做個匯報。」
「好的,李處長,我們隨時都可以,看您安排。」周的立刻應承下來,能安排會議商討,就意味著事情成功了一半,至少對方給予了高度重視。
這也是他當初選擇申報教育部產學研創新基金的原因。
「那行,我讓秘書協調一下時間,確定好了我再通知你,你們準備得充分一點,報告、數據、演示,都做好,到時候參會的可能還有基礎教育處、教育信息化推進辦的同事,以及我們教育領域的專家,時間上,我爭取一周內給你答覆。」
「沒問題。」這種匯報,周的已經是駕輕就熟了,領導們想看什麼,他也心知肚明。
開會的事情周的沒麻煩陳默,他正在做他的第一個課題,還是不要讓他分心的好,所有資料都是自己親自整理的。
這幾天周的連夜寫了一份《「啟智」AI輔助教學試點實施方案(草案)》,詳細說明了智能體對教學的促進作用,還有試點目標、試點範圍、實施步驟、風險控制以及預期成果。
初步測試成功讓周的心中湧現出一股久違的興奮感,畢竟這麼長時間的研究終於有了成果,不過這樣一個簡單的測試還不夠。
在他的設想中,這個智能體應該能服務於整個義務教育階段的所有科自,現在只測試了一門數學,而且還只是高中的三角函數部分,接下來要測試的東西還多著呢。
「任重而道遠啊。」周的輕輕呼出一口氣,繼續智能體的測試,同時還在寫著項目的技術文檔,專利申請書。
論文投稿他懶得弄了,先發到arXiv上占個坑就好,等後續陳默有時間了讓他整理整理看看投幾個會議就好,他粗略估計整理出來三篇論文不是問題。
對周的來說,單純的論文數量也就對他的考核有點作用,不然這些論文他都不想搞。
要測試的東西很多,耗費了大概有一個多月,時間來到了八月份。
這期間,周的測試了語數英科物化生政史地,一共十門科目,文科對比理科的表現相對較差,如果拿一份高考卷子讓智能體去考,語文英語大概都能在130分以上,數學能達到140,而其他六門裡,文科一般都能達到85分以上,理科更是普遍能到90分以上,理科得不到的分數純屬是因為那幾道壓軸題太超標了,現在大模型的理解能力還沒達到這個層次。
通過測試能看得出來,智能體的優勢和缺點都很明顯,對於有標準答案、邏輯結構清晰的知識點,比如數理化就處理得非常好,解釋清晰到位,但是對於需要深度理解、開放性較強的內容,比如語文的深層寓意、歷史事件的不同解讀視角,智能體的回答雖然能抓住大部分要點,但顯得有些模板化,在一次閱讀理解的測試中,對於「作者想表達怎樣的情感」這一問題,智能體的分析就比較一般,不過周的覺得這可能是題自的問題,因為他也不知道作者到底想表達什麼情感。
但是現在這種程度,周的覺得已經很不錯了,加起來六百五到六百七的水平,妥妥的學霸水準。
而陳默這邊,經過了一個多月的研究也算是有點進展了。
周的也不催他,只是偶爾指導一下,讓他在整體的大方向上不會出錯,同時也在做著一些算子重寫的工作,不過因為需要重寫的算子太多,他的進度也不快,還是人太少了,想快也快不起來。
做完手頭上的工作,周的起身來到實驗室外,坐在走廊的椅子上,他這個項目是申報了教育部產學研創新基金的,項目早就申報成功了,資金也批下來了,對方也有一個負責人,他拿出手機,給教育部的負責人打了個電話。
電話很快被接通:「喂,你好,我是李振華。」
「李處長,您好,我是錢塘大學的周的,產學研創新基金『啟智」項目的負責人。」
啟智』就是這個教師智能體的名字。
對方想了一會兒才回話,雖然周的這個名字他記不太清了,但這個『啟智」項目他印象很深。
李振華的聲音帶上了笑意:「項目進展怎麼樣了?有什麼困難嗎?」
「資金方面沒什麼問題,不過有個事還真得靠您幫忙,項目經過我們的內部檢驗,已經達到了驗收標準,所以我希望申請學校作為試點。」
「哦?達到驗收標準了?」李振華先沒管周的的請求,這事情不是他一個人說了算的,反倒是周的能在這麼短的時間裡完成項目讓感到有些驚訝。
在他印象里,這個項目的難度好像不小:「這才沒多久吧?效率很高嘛,先說說看,具體什麼情況?我才能給你答覆。」
周的也知道對方想聽什麼,於是言簡意地說明了一下情況:「李處長,我們完成了智能體對義務教育階段主要科目的全覆蓋測試並且使用了多套高考試卷進行盲測,綜合得分穩定在六百五到六百七左右,尤其是在有標準答案的理科方面,表現更加優秀。」
至於技術什麼的,他就沒細說,反正說了也聽不懂。
電話那頭沉默了兩三秒,顯然『六百五到六百七』這個具象化的數字讓對方感到非常意外:「你確定?」
「確定,所以智能體的教學能力完全不用擔心,至少不會出現誤人子弟的情況,這也是為什麼我敢打這個申請。」
李振華沒有立刻回答,似乎在思考,片刻後,他開口道:「小周啊,你們這個成果確實有點出乎我的意料,當初批這個項目,是看好你們的方向和潛力,沒想到這麼快就拿出了這麼優秀的成果不過教育無小事,涉及到孩子和學習,我們必須慎之又慎,電話里我也不可能直接給你答覆,這樣吧,我組織一下,你看什麼時候方便,來一趟教育局,咱們開個會商討一下,你那邊把相關資料整理整理,到時候做個匯報。」
「好的,李處長,我們隨時都可以,看您安排。」周的立刻應承下來,能安排會議商討,就意味著事情成功了一半,至少對方給予了高度重視。
這也是他當初選擇申報教育部產學研創新基金的原因。
「那行,我讓秘書協調一下時間,確定好了我再通知你,你們準備得充分一點,報告、數據、演示,都做好,到時候參會的可能還有基礎教育處、教育信息化推進辦的同事,以及我們教育領域的專家,時間上,我爭取一周內給你答覆。」
「沒問題。」這種匯報,周的已經是駕輕就熟了,領導們想看什麼,他也心知肚明。
開會的事情周的沒麻煩陳默,他正在做他的第一個課題,還是不要讓他分心的好,所有資料都是自己親自整理的。
這幾天周的連夜寫了一份《「啟智」AI輔助教學試點實施方案(草案)》,詳細說明了智能體對教學的促進作用,還有試點目標、試點範圍、實施步驟、風險控制以及預期成果。