亚洲欧美色一区二区三区,日韩欧美国产v一区二区三区,精品久久久久久综合日本,jap,免费观看片,2020每日更新国产精品视频

思杰拓才匯云

放棄通用模型自研“數(shù)學(xué)GPT”,好未來(lái)一著險(xiǎn)棋?|教育觀察

放棄通用模型自研“數(shù)學(xué)GPT”,好未來(lái)一著險(xiǎn)棋?|教育觀察

 

要放棄現(xiàn)有LLM,學(xué)而思自研MathGPT能否成立,又能否超越不斷進(jìn)化的通用LLM?

       國(guó)內(nèi)教育企業(yè)“GPT競(jìng)賽”仍處進(jìn)行時(shí)。在網(wǎng)易有道披露國(guó)內(nèi)首個(gè)教育場(chǎng)景下類(lèi)ChatGPT模型“子曰”研發(fā)計(jì)劃后,好未來(lái)(NYSE: TAL)近日宣布,學(xué)而思正在進(jìn)行數(shù)學(xué)大模型——MathGPT的研發(fā),將于年內(nèi)推出基于該自研大模型的產(chǎn)品級(jí)應(yīng)用。

  若如期推出,這將是國(guó)內(nèi)首個(gè)專(zhuān)攻數(shù)學(xué)領(lǐng)域的類(lèi)ChatGPT產(chǎn)品。據(jù)悉,學(xué)而思已將MathGPT作為公司核心項(xiàng)目,由CTO田密負(fù)責(zé)。項(xiàng)目團(tuán)隊(duì)建設(shè)、數(shù)據(jù)、算力準(zhǔn)備和技術(shù)研發(fā)在今年春節(jié)前已啟動(dòng)。

  值得注意的是,學(xué)而思明確,將“不基于現(xiàn)有LLM(大型語(yǔ)言模型)做微調(diào)和接口調(diào)用、不做通用LLM,而是自研基于專(zhuān)業(yè)領(lǐng)域的數(shù)學(xué)大模型MathGPT”。

  為何放棄現(xiàn)有大預(yù)言模型?學(xué)而思解釋?zhuān)琇LM大模型來(lái)自對(duì)海量語(yǔ)言文本的訓(xùn)練,因此最擅長(zhǎng)語(yǔ)言處理。行業(yè)內(nèi)偏向基于LLM大模型做閱讀、寫(xiě)作類(lèi)應(yīng)用,但如果想要在數(shù)學(xué)能力上有突破,就需要研發(fā)新的大模型。當(dāng)前通用語(yǔ)言模型更像一個(gè)“文科生”:解答數(shù)學(xué)問(wèn)題經(jīng)常出錯(cuò),或一些數(shù)學(xué)問(wèn)題雖然能解決,但方法更偏成年人,難以適配學(xué)生的知識(shí)結(jié)構(gòu)和認(rèn)知水平。

  “自研數(shù)學(xué)GPT”在國(guó)內(nèi)頗具開(kāi)創(chuàng)意義,但挑戰(zhàn)艱巨:如今,GPT-4在數(shù)學(xué)任務(wù)上已比此前的3.5版本性能更好;學(xué)而思自研MathGPT能否成立,又能否超越不斷進(jìn)化的通用LLM?

  在學(xué)而思之前,國(guó)外已有一批教企攜手GPT-4,嘗試讓通用LLM“更懂?dāng)?shù)學(xué)”。今年3月14日,可汗學(xué)院推出了由GPT-4驅(qū)動(dòng)的AI學(xué)習(xí)平臺(tái)Khanmigo,其DEMO便展示了“輔導(dǎo)數(shù)學(xué)”的過(guò)程:在一道數(shù)學(xué)題中,Khanmigo不僅能檢測(cè)出學(xué)生的答案是對(duì)是錯(cuò),還能檢測(cè)出他們?cè)谕评磉^(guò)程中可能走錯(cuò)的地方,表現(xiàn)已頗為“循循善誘”。

  更重要的是,相比分散的模型開(kāi)發(fā)方式,“接口統(tǒng)一大模型”將顯著縮短具體應(yīng)用的開(kāi)發(fā)周期,減少所需人力投入。GPT-4允許在特定領(lǐng)域的知識(shí)上對(duì)模型進(jìn)行微調(diào),或通過(guò)API“引導(dǎo)”語(yǔ)言模型,為特定應(yīng)用設(shè)置語(yǔ)言模型的基調(diào)。例如,只要在API參數(shù)中,要求GPT-4扮演不能直接回答答案的數(shù)學(xué)輔導(dǎo)老師,則不論學(xué)生如何提問(wèn)、或試圖以特定指令“越獄”,也難以直接得到答案。

  相較之下,“自研”在數(shù)據(jù)采集和處理、訓(xùn)練資源和時(shí)間、算法和模型架構(gòu)、模型評(píng)估和調(diào)優(yōu)上,都需要企業(yè)投入大量的時(shí)間和資源。

  不過(guò),“彎道超車(chē)”并非沒(méi)有可能——“準(zhǔn)確性”仍然是現(xiàn)有LLM的一大痛點(diǎn)。IEEE人工智能標(biāo)準(zhǔn)委員會(huì)主席佟佳睿在一篇Khanmigo評(píng)測(cè)文章中提及,Khanmigo非常善于通過(guò)提出問(wèn)題、激發(fā)批判思維、表達(dá)數(shù)學(xué)公式和解題思路來(lái)輔導(dǎo)學(xué)生,但還存在一個(gè)致命問(wèn)題——答案不值得信賴(lài)。“即使是小學(xué)數(shù)學(xué),我也遇到過(guò)不正確的答案。對(duì)于需要更多計(jì)算的進(jìn)階數(shù)學(xué)或物理問(wèn)題,Khanmigo就更糟糕了。”

  事實(shí)上,盡管LLMs已經(jīng)可以將一種自然語(yǔ)言翻譯成另一種語(yǔ)言,但從數(shù)學(xué)到代碼的翻譯是更難的挑戰(zhàn);同時(shí),要想AI不僅正確回答一個(gè)數(shù)學(xué)問(wèn)題,還能檢查它所遵循的步驟是否可靠,則不但需要有效結(jié)合LLM和強(qiáng)化學(xué)習(xí),還取決于具體的實(shí)現(xiàn)方式和數(shù)據(jù)質(zhì)量。

  “數(shù)據(jù)”,或許是學(xué)而思敢于走更大投入、更高風(fēng)險(xiǎn)“另一條路”的核心原因。學(xué)而思稱(chēng),其“以數(shù)學(xué)起家”,積累了龐大的數(shù)學(xué)相關(guān)數(shù)據(jù),這些數(shù)據(jù)是進(jìn)行MathGPT訓(xùn)練的必備物料。而“題目要解對(duì)”和“解題步驟要穩(wěn)定、清晰”,正是MathGPT希望彌補(bǔ)和攻克大語(yǔ)言模型的兩個(gè)首要問(wèn)題。

  從技術(shù)積累上看,學(xué)而思在2017年已創(chuàng)立AI lab人工智能實(shí)驗(yàn)室,并在NeurlPS 2020、EMNLP 2020等機(jī)器學(xué)習(xí)和自然語(yǔ)言處理頂會(huì)上獲獎(jiǎng)。不過(guò),考慮到學(xué)而思AI lab此前更多著力圖像分類(lèi)、物體檢測(cè)、人臉識(shí)別、人體分析等計(jì)算機(jī)視覺(jué)相關(guān)創(chuàng)新,其自研MathGPT上的“技術(shù)力”仍待考驗(yàn)。

  “招兵買(mǎi)馬”因此也成當(dāng)務(wù)之急:學(xué)而思宣布,啟動(dòng)在美國(guó)硅谷的團(tuán)隊(duì)建設(shè),計(jì)劃成立一支海外算法和工程團(tuán)隊(duì),在全球范圍內(nèi)招募人工智能專(zhuān)家。

  對(duì)國(guó)內(nèi)一眾教育科技企業(yè)而言,能否盡快搭上“大模型技術(shù)”這輛車(chē),或?qū)⒊蔀橛绊懫湮磥?lái)發(fā)展前景的重要分野。網(wǎng)易有道(NYSE: DAO)CEO周楓在個(gè)人公眾號(hào)中評(píng)述,與之前眾多的自然語(yǔ)言處理技術(shù)相比,大語(yǔ)言模型至少具有三項(xiàng)根本性新能力,包括涌現(xiàn)能力、作為基座模型支持多元應(yīng)用的能力、支持對(duì)話作為統(tǒng)一入口的能力。“這些大模型技術(shù)的特點(diǎn)已經(jīng)改變了我們對(duì)業(yè)務(wù)和產(chǎn)品規(guī)劃的思考方式,也會(huì)改變很多產(chǎn)品的經(jīng)濟(jì)模型。”他說(shuō),“這正是一個(gè)令人興奮的時(shí)代。”

  在學(xué)而思公布MathGPT研發(fā)計(jì)劃的同一天,網(wǎng)易有道官方發(fā)布了基于類(lèi)ChatGPT模型“子曰”開(kāi)發(fā)的AI口語(yǔ)老師劇透視頻。次日,科大訊飛( 002230.SZ )在合肥向公眾展示其大模型產(chǎn)品“星火認(rèn)知大模型”,明確將通用AI大模型的能力推向?qū)W習(xí)機(jī)、錄音轉(zhuǎn)寫(xiě)工具“訊飛聽(tīng)見(jiàn)”等產(chǎn)品。這場(chǎng)AI 2.0時(shí)代的教育“軍備競(jìng)賽”的烽火正滾滾而來(lái)。

 

本文轉(zhuǎn)自于   財(cái)新網(wǎng)

以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“才匯云網(wǎng)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
0條評(píng)論
評(píng)論