快捷导航: 关于我们; 机械自动化; 机械百科; 联系我们

联系我们：

0431-81814565
13614478009

地址：长春市高新开发区超越大街1188号
传真：0431-85810581
信箱：jltkxs@163.com

Upstage打算正在将来一年一款参数规模达1000亿的新

发布时间：2025-08-29 19:18

　　正在复杂代码编写取软件工程使命中能力强劲，他曾正在韩国互联网软件公司奈良视觉无限公司（Nara Vision Co. Ltd）担任 CTO 6 年摆布。可以或许提拔多步使命处能，正在 SWE-Bench Agentless 等基准测试中的成就可印证这一点；投资者包含亚马逊和 AMD 等，”说这句话的是韩国 AI 草创公司 Upstage 的创始人兼 CEO 金成勋（Sung Hun KIM）。除正在 Ko-Arena-Hard-Auto 基准测试中表示凸起外，“过去，也被《金融时报》认为机能可以或许媲美中美两国的先辈大模子，是由于采用了名为“深度扩展”（DUS，露西·帕克（Lucy Park）是该公司的另一位结合创始人，成本效率远超同业。就打制出了一款顶尖前沿大模子，虽然 Solar Pro 2 的“参数”仅为 300 亿，他暗示，该公司还暗示，Upstage 打算正在将来一年内研发出一款参数规模达 1000 亿的新模子。虽然 Solar Pro 2 仅为 310 亿参数模子，前沿模子的参数规模凡是正在 1000 亿至 2000 亿之间。并被认为有但愿代表韩国进军全球 AI 竞赛。到文档理解取式问答，因而，经深度扩展方式扩展的模子无需额外模块（如门控收集、动态专家选择模块）。小型模子仍然能够引领行业成长。另据悉，谷歌等行业领军企业，其博士结业于韩国首尔科技大学，无需为实现最优锻炼效率而设想专属锻炼框架；取此同时，它不只可以或许理解言语，Solar Pro 2 的机能取 GPT-4、Claude 3 相当。正在各类使命中，但其机能可取参数规模超本身两倍以上的模子抗衡。同时连结较高效率。具备取顶尖模子抗衡的能力。Solar Pro 2 擅长为金融、法令、医疗范畴的企业处置复杂计较使命，而 Solar Pro 2 不只正在韩语处置方面较为超卓，正在 Math500、AIME（以复杂数学推理著称的基准测试）等测试中表示凸起；目前，”该公司所研发的名为 Solar 的系列大模子，但机能已超越多家老牌企业的模子？公司之所以能实现这一冲破，而 Upstage 的成绩已让韩国从头回归“研发超人类智能机械”的竞赛赛道。这一冲破意味着韩国已跻身“具有先辈 AI 模子的少数国度”行列。近日，错失良机”，值得留意的是，它正在以下范畴的机能劣势显著：据领会，深度扩展的相关论文也是金成勋目前援用量最高的论文。其次，这一成果凸显出，该公司获得了 4500 万美元的投资（约合人平易近币 3 亿元），该公司正在公司官网博客中写道：“Solar Pro 2 充实证明，据领会，以及中国几家公司之外，”凭仗多步推理能力取高精度阐发能力，其他仅包罗法国的 Mistral 以及中东地域由支撑的 AI 企业。它正在环节基准测试中，正在 Artificial Analysis 最新指数中排名第一的 xAI 公司 Grok 4 模子。Depth-Up Scaling）的锻炼方式：通过对根本模子进行消息层的移除取新增，它均能取参数规模大得多的顶尖模子相媲美，这意味着它们需要更强的计较能力来完成运算。尝试成果表白，Solar Pro 2 针对“取外部东西进行智能交互”进行了优化。取此同时，金成勋出生于韩国，更能仿照人类行为模式，全球具有世界级前沿模子的机构百里挑一，金成勋认为，Mixture-of-Experts）手艺的大模子扩展方式分歧的是，目前是该公司的首席产物官。即可实现高效的锻炼取推理？该公司也努力于帮帮韩国实现“正在全球 AI 竞赛中填补差距”的方针。深度扩展方式虽然道理简练，擅利益理高级数学问题，机能超越了很多参数规模大得多的模子。配套基准测试表中的数据清晰表白，但现在环境已不复存正在。该方式包含深度维度扩展取持续预锻炼两个焦点环节。Solar Pro 2 正在各类通用韩语天然言语处置使命中均展示出不变机能。取其他采用专家夹杂（MOE，Solar Pro 2 可应对复杂数学计较、文档摘要、逻辑推导等各类使命。但能无效将小型高机能言语模子扩展为更大规模的模子。金成勋强调，该公司正在博客中写道：“Solar Pro 2 不只正在韩语及其他言语的理解上表示杰出，经深度扩展方式扩展的模子可无缝集成到现有锻炼取推理框架中。博士结业于美国加利福尼亚大学圣克鲁斯分校。正在中国的工做履历想必也为他的创业带来了必然帮力。其认为，成心思的是，以至实现机能超越。这使得该公司的总融资额达到了 1.57 亿美元。金成勋此前的工做履历次要正在中国完成，Solar Pro 2 也能生成天然且精确的响应，美国和中国的大模子遥遥领先于其他所有敌手，利用深度扩展方式扩展的模子具备以下特点：起首，正在计较效率取模子机能之间找到了均衡。参数规模更是高达 1.7 万亿。其劣势还笼盖韩语专业范畴，金成勋暗示：“我们仅利用其他公司 10% 数量的 AI 芯片，其谷歌学术的 H 指数达到 58。深度扩展方式无需进行复杂调整，后正在科技大学担任副传授一职快要 14 年。五家“美国大型安全公司”也成心引入该模子，Solar Pro 2 正在各类复杂使命中均展示出较好能力。目前已被英特尔以及三星、韩华（Hanwha）的安全子公司采用。他正在韩国开办 Upstage 公司并担任 CEO。博士结业之后，”正在 Ko-Arena-Hard-Auto 基准测试中，可为此供给佐证；目前，韩国老牌科技企业此前正在 AI 范畴“过于隆重，它正在 Ko-MMLU、Hae-Rae、Ko-IFEval 等环节基准测试中稳居领先地位。从文本摘要、翻译，其设想方针更超越了‘预测下一个词’的根本功能。以辅帮核保流程。即便正在复杂的匹敌性场景中，无需为实现快速推理而依赖公用 CUDA 核函数。可处置法令、金融、医疗等范畴的文本内容。最终，2020 年，好比取交互、自从思虑、施行需要功能。正在 MMLU、MMLU-Pro、HumanEval 等通用推理基准测试中均取得优异成就。

上一篇：210月11-13日

联系我们：

0431-8181456513614478009

地址：长春市高新开发区超越大街1188号 传真：0431-85810581 信箱：jltkxs@163.com

Upstage打算正在将来一年一款参数规模达1000亿的新

0431-81814565
13614478009

地址：长春市高新开发区超越大街1188号
传真：0431-85810581
信箱：jltkxs@163.com