“书生・浦语”2.0大语言模型开源 200K上下文

IT之家今日（1月17日）消息，商汤科技与上海 AI 实验室联合香港中文大学和复旦大学今日发布了新一代大语言模型书生・浦语 2.0（InternLM2）。据介绍，InternLM2 是在 2.6 万亿 token 的语料上训练得到的。沿袭第一代书生・浦语（InternLM）设定，InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本，继续开源，提供免费商用授权。目前，浦语背后的数据清洗过滤技术已经历三轮迭代升级，号称仅使用约 60% 的训练数据即可达到使用第二代数据训练 1T tokens 的性能表现。与第一代InternLM相比，InternLM2在大规模高质量的验证语料上的Loss分布整体左移，表明其语言建模能力增强。通过拓展训练窗口大小和位置编码改进，InternLM2支持20万tokens的上下文，能够一次性接受并处理约30万汉字（约五六百页的文档）的输入内容。下面表格对比了InternLM2各版本与ChatGPT（GPT-3.5）以及GPT-4在典型评测集上的表现。可以看到，InternLM2在20B参数的中等规模上，整体表现接近ChatGPT。

李芷晴

Jan 17, 2024 - 15:00

0 19

“书生・浦语”2.0大语言模型开源 200K上下文

IT之家今日（1月17日）消息，商汤科技与上海 AI 实验室联合香港中文大学和复旦大学今日发布了新一代大语言模型书生・浦语 2.0（InternLM2）。

“书生・浦语”2.0大语言模型开源 200K上下文

据介绍，InternLM2 是在 2.6 万亿 token 的语料上训练得到的。沿袭第一代书生・浦语（InternLM）设定，InternLM2 包含 7B 及 20B 两种参数规格及基座、对话等版本，继续开源，提供免费商用授权。

目前，浦语背后的数据清洗过滤技术已经历三轮迭代升级，号称仅使用约 60% 的训练数据即可达到使用第二代数据训练 1T tokens 的性能表现。

“书生・浦语”2.0大语言模型开源 200K上下文

与第一代InternLM相比，InternLM2在大规模高质量的验证语料上的Loss分布整体左移，表明其语言建模能力增强。

“书生・浦语”2.0大语言模型开源 200K上下文

通过拓展训练窗口大小和位置编码改进，InternLM2支持20万tokens的上下文，能够一次性接受并处理约30万汉字（约五六百页的文档）的输入内容。

下面表格对比了InternLM2各版本与ChatGPT（GPT-3.5）以及GPT-4在典型评测集上的表现。可以看到，InternLM2在20B参数的中等规模上，整体表现接近ChatGPT。

“书生・浦语”2.0大语言模型开源 200K上下文

標籤:

《仙剑六祈今朝》电视剧首个预告男帅女甜剧情精彩

《火影忍者：终极风暴羁绊》首位DLC角色“大筒木羽衣”公布上线时间待定

0

Like

0

Dislike

0

Love

0

Funny

0

Angry

0

Sad

0

Wow

李芷晴 https://tszching.uk

相關貼文

《家有儿女之神犬当家》定档预告 1月20日内地上映

《家有儿女之神犬当家》定档预告 1月20日内地上映

李芷晴 Jan 3, 2024 0 4

杰洛特演员再次重申将参与《巫师4》，但不是主角

杰洛特演员再次重申将参与《巫师4》，但不是主角

李芷晴 Aug 12, 2024 0 5

暴雪申请国内多个魔兽商标被驳回国服真要完了？

暴雪申请国内多个魔兽商标被驳回国服真要完了？

李芷晴 Feb 29, 2024 0 3

如果有個機會可以改變性別，你還會保留現在的性別嗎？

會

不會

Please select an option!

你之前已經投過票了

如果有個機會可以改變性別，你還會保留現在的性別嗎？

總投票: 21

會

19 %

不會

81 %

你現在還是單身嗎？

是

否

Please select an option!

你之前已經投過票了

你現在還是單身嗎？

總投票: 19

是

78.9 %

否

21.1 %

本網站使用 Cookies，繼續瀏覽網站，即表示您同意使用Cookies