开云kaiyun.com让 Yi-Lightining 秀了一把肌肉-kaiyun网页版登录入口
文|周鑫雨
裁剪|苏建勋
"零一万物毫不烧毁预磨练。"
2024 年 10 月 16 日,AI 独角兽零一万物独创东说念主兼 CEO 李开复,公开立了军令状。也在合并天,零一万物发布了最新的 MoE(搀杂各人)架构的旗舰大模子:Yi-Lightning。
这亦然时隔 5 个月后,零一万物再次更新模子的新动态。
李开复示意,Yi-Lightning 的磨练只用了 2000 张 GPU,磨练周期仅一个半月,本钱唯有 300 多万好意思元,是埃隆 · 马斯克的 xAI 本钱的 1%、2%。
磨练本钱天然低,但 Yi-Lightning 的性能并莫得打扣头。在加州大学伯克利分校 LMSYS 团队的 Chatbot Arena(聊天机器东说念主竞技场)总榜单上,Yi-Lightning 的性能与 xAI 的 Grok-2-08-13 模子比肩第 6,何况罕见了 OpenAI 的 GPT-4o-2024-05-13。

LMSYS 团队的 Chatbot Arena(聊天机器东说念主竞技场)大说话模子详尽能力总榜单。图源:零一万物
值得小心的是,在中语能力上,Yi-Lightning 与 OpenAI 的最新模子 o1-mini 版块比肩获得了第二;在数学能力上,Yi-Lightning 和 Gemini-1.5-Pro-002 比肩第 3,仅次于在数学、逻辑推理见长的 o1。
在订价上,Yi-Lightning 也创了零一万物模子的最低订价:0.99 元 / 百万 Token。

零一万物模子订价。图源:零一万物官网
天然,榜单名次并不料味着模子在职务场景下的能力。在发布会上,零一万物正式在实用性上,让 Yi-Lightining 秀了一把肌肉。
比如,Yi-Lightining 比拟 2024 年 5 月发布的 Yi-Large,首包时代(从领受到任务肯求到系统启动输出反映恶果之间的时代)裁汰了一半,最高生成速率耕种了近四倍。
具体到翻译场景,Yi-Lightining 比豆包、DeepSeek、通义千问最新旗舰模子的翻译速率更快,且翻译恶果愈加信达雅。

四个模子在疏导翻译任务上的阐扬。图源:零一万物
发布会上,李开复也揭秘了 Yi-Lightning 的磨练战略:
特有的搀杂珍眼光机制(Hybrid Attention):在经管长序列数据的经过中,大约提高性能的同期,还能责骂推理本钱;
动态 Top-P 路由机制:字据任务难度自动遴选最相宜的各人网罗组合;
多阶段磨练(Multi-stage Training):让模子在不同阶段汲取不同的常识,便捷 mixing 团队进行数据配比的调试职责,并能保证不同阶段的磨练速率和牢固性。
在 2024 年 5 月份的发布会上,零一万物在国内发布了 C 端的分娩力居品"万知"。时隔五个月,零一万物的 B 端买卖化领土也有了新的进展——聚焦零卖和电商等场景的 AI 2.0 数字东说念主。
AI 2.0 数字东说念主的背后,是电商话术大模子、脚色大模子、直播声息大模子的多模态协同磨练。当今,AI 2.0 数字东说念主还接入了 Yi-Lightning。用户只需要输入出售的商品、声息的性别和语调,就能生成相应的数字东说念主。

零一万物 AI 2.0 数字东说念主接入 Yi-Lightning 前后对比。图源:零一万物
如今,大模子发展也来到了工夫探索的深水区。即便立下了"毫不烧毁预磨练"的军令状,李开复也承认:"但不是每家公司皆不错作念这件事情,作念这件事情的本钱也比较高,以后有可能会越来越少的大模子公司磨练作念预磨练。"
不外,对如今六家大模子独角兽,李开复还是抱有乐不雅的魄力:
"据我所知,这六家公司融资额度皆是够的,咱们作念预磨练的 production run,磨练一次三四百万好意思金,这个钱亦然头部公司皆付得起,我认为中国的六家大模子公司只消有够好的东说念主才,思作念预磨练的决心,融资额跟芯片皆不会是问题的。"

宽饶交流!开云kaiyun.com

