1300億參數(shù)，國(guó)內(nèi)首個(gè)數(shù)學(xué)大模型MathGPT上線！多項(xiàng)基準(zhǔn)趕超GPT-4

沃卡惠
行業(yè)資訊
2023-08-25 09:25:46
574

數(shù)學(xué)AI大模型，或許會(huì)改變這個(gè)領(lǐng)域的未來(lái)。

今天，國(guó)內(nèi)首個(gè)數(shù)學(xué)領(lǐng)域千億級(jí)大模型MathGPT正式上線并開(kāi)啟公測(cè)！

這背后，是深耕數(shù)學(xué)領(lǐng)域20年的公司「好未來(lái)」團(tuán)隊(duì)自研，面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu)，以解題和講題算法為核心的數(shù)學(xué)垂直領(lǐng)域的大模型。

MathGPT，是國(guó)內(nèi)首個(gè)專為數(shù)學(xué)打造的大模型。

僅需要通過(guò)文字或圖片上傳數(shù)學(xué)題，即可得到對(duì)話式的解答反饋。

另外，你也可以通過(guò)「隨機(jī)來(lái)一題」的選項(xiàng)，隨機(jī)生成數(shù)學(xué)題目并由系統(tǒng)給出解答。

目前，MathGPT支持中文、英文版本的PC端和移動(dòng)端體驗(yàn)。

1300億參數(shù)，國(guó)內(nèi)首個(gè)數(shù)學(xué)大模型MathGPT上線！多項(xiàng)基準(zhǔn)趕超GPT-4

領(lǐng)先的數(shù)學(xué)解題能力

其實(shí)，早在今年5月，好未來(lái)就曾公布正在進(jìn)行自研數(shù)學(xué)大模型的研發(fā)，命名為MathGPT。

據(jù)CTO田密介紹，MathGPT匯集了好未來(lái)多年教育教研數(shù)據(jù)積累，專注于數(shù)學(xué)領(lǐng)域。

其中，千億級(jí)大模型的訓(xùn)練、推理、部署框架，為模型賦予了強(qiáng)大能力。而優(yōu)質(zhì)教育數(shù)據(jù)，實(shí)現(xiàn)了題目計(jì)算、講解、問(wèn)答等多任務(wù)持續(xù)訓(xùn)練和有監(jiān)督微調(diào)，呈現(xiàn)出卓越表現(xiàn)。此外，借助人類反饋對(duì)齊，模型的綜合素養(yǎng)也得到進(jìn)一步提升。

從評(píng)估結(jié)果來(lái)看，MathGPT在解題準(zhǔn)確率、穩(wěn)定性及用戶體驗(yàn)方面均有明顯的優(yōu)勢(shì)。

1300億參數(shù)，國(guó)內(nèi)首個(gè)數(shù)學(xué)大模型MathGPT上線！多項(xiàng)基準(zhǔn)趕超GPT-4

MathGPT官網(wǎng)顯示，MathGPT的數(shù)學(xué)計(jì)算能力已覆蓋小學(xué)、初中、高中的數(shù)學(xué)題，題目類型涵蓋計(jì)算題、應(yīng)用題、代數(shù)題等多個(gè)類型，還可以針對(duì)題目進(jìn)行追問(wèn)，不過(guò)還暫未開(kāi)放數(shù)學(xué)之外的問(wèn)答互動(dòng)。

MathGPT技術(shù)報(bào)告

MathGPT技術(shù)報(bào)告顯示，在CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考數(shù)學(xué)和Math401等6個(gè)公開(kāi)數(shù)學(xué)評(píng)測(cè)集合的測(cè)試結(jié)果中，好未來(lái)的MathGPT取得了多項(xiàng)測(cè)試的最高分?jǐn)?shù)。

同時(shí)，MathGPT在C-Eval的初高中的全科測(cè)試集合上也均有不錯(cuò)的表現(xiàn)。

1300億參數(shù)，國(guó)內(nèi)首個(gè)數(shù)學(xué)大模型MathGPT上線！多項(xiàng)基準(zhǔn)趕超GPT-4

MathGPT在C-Eval榜單初高中各科成績(jī)

在解題穩(wěn)定性、講解友好度方面，MathGPT基于海量名師解題過(guò)程的數(shù)據(jù)進(jìn)行模型訓(xùn)練，模型的解題步驟專業(yè)清晰。

以一道數(shù)列題為例，MathGPT給出的答案包含「分析」、「詳解」、「點(diǎn)睛」三個(gè)部分，比通用大模型的粗略講解方式更為細(xì)致。

其中，「分析」提供了題目的解題思路、思考方式，幫助用戶更好地理解題目，「詳解」則給出具體的計(jì)算方式和答案，最后「點(diǎn)睛」的環(huán)節(jié)，對(duì)題目的考點(diǎn)、難點(diǎn)、關(guān)鍵點(diǎn)進(jìn)行提示，幫助用戶回顧反思出題意圖、舉一反三。

1300億參數(shù)，國(guó)內(nèi)首個(gè)數(shù)學(xué)大模型MathGPT上線！多項(xiàng)基準(zhǔn)趕超GPT-4

對(duì)于使用者而言，研究數(shù)學(xué)問(wèn)題不僅在于得到答案本身，更在于答案背后的解題原理、思路邏輯。

與其他通用大模型相比，MathGPT能實(shí)現(xiàn)更高準(zhǔn)確度的解題，也能把答案解析得更清楚、講解得更明白，更好地滿足用戶使用AI產(chǎn)品解答數(shù)學(xué)問(wèn)題的核心需求。

此外，在MathGPT發(fā)布同時(shí)，好未來(lái)也在官網(wǎng)更新了一個(gè)具有代表性和挑戰(zhàn)性的數(shù)學(xué)任務(wù)評(píng)測(cè)集，供全球人工智能專家、數(shù)學(xué)愛(ài)好者體驗(yàn)和測(cè)評(píng)。

田密介紹，希望讓MathGPT在數(shù)學(xué)教育領(lǐng)域發(fā)揮更大作用，好未來(lái)愿意把基于大規(guī)模、高質(zhì)量的內(nèi)容的千億級(jí)大模型研發(fā)經(jīng)驗(yàn)方法和業(yè)內(nèi)分享，和行業(yè)共同進(jìn)步。

好未來(lái)AI的厚積薄發(fā)

在AI浪潮的推動(dòng)下，今年以來(lái)多家科技公司宣布推出通用大語(yǔ)言模型產(chǎn)品，而好未來(lái)選擇了另一個(gè)方向，不基于將現(xiàn)有大語(yǔ)言模型做微調(diào)和接口調(diào)用、不做通用大語(yǔ)言模型，而是深入數(shù)學(xué)的垂直領(lǐng)域研發(fā)大模型，致力于打造自主、穩(wěn)定、可持續(xù)、高質(zhì)量的數(shù)學(xué)解決方案。

通用大模型「重文輕理」，在數(shù)學(xué)問(wèn)題的解決、講解、問(wèn)答和推薦方面則存在明顯的短板。而在另一個(gè)層面，在通往通用人工智能的路上，數(shù)學(xué)推理能力很重要，全球有很多大型公司在做這方面的研究。

「好未來(lái)在數(shù)學(xué)的數(shù)據(jù)和業(yè)務(wù)上有20年的積累，有大量的教育數(shù)據(jù)的積累和持續(xù)生產(chǎn)教育數(shù)據(jù)的能力，所以選擇做這個(gè)難而正確的事情。」田密稱，好未來(lái)希望用自己在數(shù)學(xué)和AI上的多年積累，做好AI大模型時(shí)代的數(shù)學(xué)基礎(chǔ)工作。

早在2017年，好未來(lái)便成立了AI lab人工智能實(shí)驗(yàn)室?；谥腔劢逃斯ぶ悄荛_(kāi)放創(chuàng)新平臺(tái)助力，好未來(lái)AI lab獲得各類頂級(jí)學(xué)術(shù)會(huì)議比賽冠軍16項(xiàng)，亞軍6項(xiàng)，發(fā)表國(guó)際期刊和會(huì)議高水平學(xué)術(shù)論文近百篇。

2019年，科技部宣布依托好未來(lái)建設(shè)智慧教育國(guó)家新一代人工智能開(kāi)放創(chuàng)新平臺(tái)，好未來(lái)成為教育行業(yè)首批唯一一家人工智能“國(guó)家隊(duì)”成員，在人工智能領(lǐng)域有多年深入研究。多年來(lái)，好未來(lái)以教育行業(yè)重大需求為牽引，構(gòu)建了面向教育的人工智能算法能力、應(yīng)用解決方案、基礎(chǔ)軟硬件體系和開(kāi)源開(kāi)放服務(wù)的國(guó)家教育科技創(chuàng)新平臺(tái)。

好未來(lái)也在積極參與推動(dòng)大模型標(biāo)準(zhǔn)體系建設(shè)，先后作為核心單位參與了由國(guó)家人工智能標(biāo)準(zhǔn)化總體組組織的大模型系列國(guó)家標(biāo)準(zhǔn)、中國(guó)信通院牽頭編制的「大模型預(yù)訓(xùn)練模型技術(shù)和應(yīng)用評(píng)估方法」系列團(tuán)體標(biāo)準(zhǔn)，以及教育部教育信息化技術(shù)標(biāo)準(zhǔn)委員會(huì)暨全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)主導(dǎo)的「教育通用大模型」系列標(biāo)準(zhǔn)編制工作。

近期，好未來(lái)正作為牽頭單位與中國(guó)信通院、復(fù)旦大學(xué)、科大訊飛、百度等行業(yè)領(lǐng)先科研機(jī)構(gòu)、高校、企業(yè)一同編制教育大模型團(tuán)體標(biāo)準(zhǔn)，從覆蓋場(chǎng)景、應(yīng)用成效、服務(wù)可靠等維度全面評(píng)估教育大模型能力，為教育大模型應(yīng)用落地提供參考與指導(dǎo)。

用AI實(shí)現(xiàn)大規(guī)模因材施教

隨著大語(yǔ)言模型的興起，如何用AI技術(shù)服務(wù)各行各業(yè)是社會(huì)關(guān)注的焦點(diǎn)。教育行業(yè)是最早開(kāi)始布局AI領(lǐng)域的行業(yè)之一，AI能為教育生態(tài)帶來(lái)何種變化一直備受關(guān)注。

「AI帶來(lái)了重新定義教育行業(yè)的機(jī)會(huì)，大模型技術(shù)使得大規(guī)模的因材施教真正有了實(shí)現(xiàn)的可能?！固锩芙榻B，20年來(lái)，好未來(lái)一直在探索個(gè)性化學(xué)習(xí)，從線下小班到線上大班，再到AI課，形式不斷進(jìn)化，但教的內(nèi)容始終是固定的、學(xué)生和老師互動(dòng)較少、顆粒度只能到題目級(jí)別。

田密認(rèn)為，大模型的本質(zhì)，是一種更高效的、從數(shù)據(jù)中學(xué)習(xí)知識(shí)并加以應(yīng)用的方式。

在AI能力的加持下，「學(xué)生自學(xué)+AI答疑」的新型學(xué)習(xí)方式成為廣泛的可能。學(xué)習(xí)者獲得優(yōu)質(zhì)教學(xué)內(nèi)容的門檻、成本降低，獲得的教學(xué)內(nèi)容個(gè)性化、精細(xì)化程度持續(xù)升高，可以實(shí)現(xiàn)千人千面的AI教學(xué)和答疑輔導(dǎo)，每個(gè)學(xué)生都能得到最適合自己的學(xué)習(xí)內(nèi)容。

以MathGPT為基礎(chǔ)，好未來(lái)將不斷探索AI環(huán)境下的學(xué)習(xí)方式，更好地服務(wù)于全球的學(xué)習(xí)者、數(shù)學(xué)愛(ài)好者，并將經(jīng)驗(yàn)及時(shí)與行業(yè)分享，通過(guò)AI技術(shù)助力教育科技的積極改變。

據(jù)田密介紹，隨著公測(cè)的順利進(jìn)行，MathGPT的解題能力將得到持續(xù)提升，基于MathGPT的產(chǎn)品級(jí)應(yīng)用也正在加速研發(fā)中，將于近期發(fā)布。

上一篇：人工智能為智能家居帶來(lái)哪些好處？

下一篇：什么是占用傳感器？