新榜訊 4 月 10 日,字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)重磅開(kāi)源首個(gè)多語(yǔ)言類 SWE 數(shù)據(jù)集——Multi-SWE-bench。該數(shù)據(jù)集能夠用于評(píng)估并增強(qiáng)大模型“自動(dòng)修 Bug”的能力。在 SWE-bench 的基礎(chǔ)之上,Multi-SWE-bench 開(kāi)創(chuàng)性地涵蓋了除 Python 之外的 7 種主流編程語(yǔ)言,成為名副其實(shí)面向“全棧工程”的評(píng)測(cè)基準(zhǔn)。其數(shù)據(jù)全部源自 GitHub issue,歷經(jīng)近一年時(shí)間精心構(gòu)建,旨在盡可能精準(zhǔn)地測(cè)評(píng)及提升大模型高階編程的智能水平。
掃描二維碼
手機(jī)瀏覽
字節(jié)跳動(dòng)豆包大模型團(tuán)隊(duì)正式開(kāi)源首個(gè)多語(yǔ)言類SWE數(shù)據(jù)集
分享文章鏈接
上一篇

周鴻祎:企業(yè)落地AI不要追求宏大敘事 要敏捷迭代 小步快跑
新榜訊 2025 中國(guó)移動(dòng)云智算大會(huì)上,360 創(chuàng)始人周鴻祎指出,企業(yè)無(wú)需構(gòu)建繁雜的 AI 戰(zhàn)略,不必企圖憑借一個(gè)大模型來(lái)化解企業(yè)的全部問(wèn)題,而應(yīng)精選場(chǎng)景,讓一個(gè)模型應(yīng)對(duì)一個(gè)問(wèn)題。
下一篇
抖音:攔截下架違規(guī)微短劇476部
新榜訊 4 月 10 日,抖音安全中心出臺(tái)《抖音關(guān)于打擊違規(guī)微短劇的公告》。

相似推薦
跳動(dòng).jpeg)
字節(jié)跳動(dòng)開(kāi)源長(zhǎng)文本處理模型Seed-OSS-36B
新榜訊 字節(jié)跳動(dòng)Seed團(tuán)隊(duì)重磅開(kāi)源Seed - OSS - 36B系列大模型!該系列大模型專為長(zhǎng)上下文、推理、Agent及通用場(chǎng)景量身打造,其最大上下文長(zhǎng)度能夠達(dá)到512k tokens。

字節(jié)跳動(dòng)開(kāi)源一款Deep Research項(xiàng)目
新榜訊 5 月 10 日,字節(jié)跳動(dòng)技術(shù)團(tuán)隊(duì)宣稱,依托 LangStack 的全新 Deep Research 開(kāi)源項(xiàng)目——DeerFlow,已于 ByteDance 的 GitHub 官方組織實(shí)現(xiàn)開(kāi)源。

富士康推出首個(gè)大語(yǔ)言模型
新榜訊 昨日,富士康母公司鴻海集團(tuán)重磅宣布推出首個(gè)大語(yǔ)言模型“FoxBrain”。
上一篇

周鴻祎:企業(yè)落地AI不要追求宏大敘事 要敏捷迭代 小步快跑
新榜訊 2025 中國(guó)移動(dòng)云智算大會(huì)上,360 創(chuàng)始人周鴻祎指出,企業(yè)無(wú)需構(gòu)建繁雜的 AI 戰(zhàn)略,不必企圖憑借一個(gè)大模型來(lái)化解企業(yè)的全部問(wèn)題,而應(yīng)精選場(chǎng)景,讓一個(gè)模型應(yīng)對(duì)一個(gè)問(wèn)題。
下一篇

抖音:攔截下架違規(guī)微短劇476部
新榜訊 4 月 10 日,抖音安全中心出臺(tái)《抖音關(guān)于打擊違規(guī)微短劇的公告》。