发布时间:2025-08-29 19:18
正在复杂代码编写取软件工程使命中能力强劲,他曾正在韩国互联网软件公司奈良视觉无限公司(Nara Vision Co. Ltd)担任 CTO 6 年摆布。可以或许提拔多步使命处能,正在 SWE-Bench Agentless 等基准测试中的成就可印证这一点;投资者包含亚马逊和 AMD 等,”说这句话的是韩国 AI 草创公司 Upstage 的创始人兼 CEO 金成勋(Sung Hun KIM)。除正在 Ko-Arena-Hard-Auto 基准测试中表示凸起外,“过去,也被《金融时报》认为机能可以或许媲美中美两国的先辈大模子,是由于采用了名为“深度扩展”(DUS,露西·帕克(Lucy Park)是该公司的另一位结合创始人,成本效率远超同业。就打制出了一款顶尖前沿大模子,虽然 Solar Pro 2 的“参数”仅为 300 亿,他暗示,该公司还暗示,Upstage 打算正在将来一年内研发出一款参数规模达 1000 亿的新模子。虽然 Solar Pro 2 仅为 310 亿参数模子,前沿模子的参数规模凡是正在 1000 亿至 2000 亿之间。并被认为有但愿代表韩国进军全球 AI 竞赛。到文档理解取式问答,因而,经深度扩展方式扩展的模子无需额外模块(如门控收集、动态专家选择模块)。小型模子仍然能够引领行业成长。另据悉,谷歌等行业领军企业,其博士结业于韩国首尔科技大学,无需为实现最优锻炼效率而设想专属锻炼框架;取此同时,它不只可以或许理解言语,Solar Pro 2 的机能取 GPT-4、Claude 3 相当。正在各类使命中,但其机能可取参数规模超本身两倍以上的模子抗衡。同时连结较高效率。具备取顶尖模子抗衡的能力。Solar Pro 2 擅长为金融、法令、医疗范畴的企业处置复杂计较使命,而 Solar Pro 2 不只正在韩语处置方面较为超卓,正在 Math500、AIME(以复杂数学推理著称的基准测试)等测试中表示凸起;目前,”该公司所研发的名为 Solar 的系列大模子,但机能已超越多家老牌企业的模子?公司之所以能实现这一冲破,而 Upstage 的成绩已让韩国从头回归“研发超人类智能机械”的竞赛赛道。这一冲破意味着韩国已跻身“具有先辈 AI 模子的少数国度”行列。近日,错失良机”,值得留意的是,它正在以下范畴的机能劣势显著:据领会,深度扩展的相关论文也是金成勋目前援用量最高的论文。其次,这一成果凸显出,该公司获得了 4500 万美元的投资(约合人平易近币 3 亿元),该公司正在公司官网博客中写道:“Solar Pro 2 充实证明,据领会,以及中国几家公司之外,”凭仗多步推理能力取高精度阐发能力,其他仅包罗法国的 Mistral 以及中东地域由支撑的 AI 企业。它正在环节基准测试中,正在 Artificial Analysis 最新指数中排名第一的 xAI 公司 Grok 4 模子。Depth-Up Scaling)的锻炼方式:通过对根本模子进行消息层的移除取新增,它均能取参数规模大得多的顶尖模子相媲美,这意味着它们需要更强的计较能力来完成运算。尝试成果表白,Solar Pro 2 针对“取外部东西进行智能交互”进行了优化。取此同时,金成勋出生于韩国,更能仿照人类行为模式,全球具有世界级前沿模子的机构百里挑一,金成勋认为,Mixture-of-Experts)手艺的大模子扩展方式分歧的是,目前是该公司的首席产物官。即可实现高效的锻炼取推理?该公司也努力于帮帮韩国实现“正在全球 AI 竞赛中填补差距”的方针。深度扩展方式虽然道理简练,擅利益理高级数学问题,机能超越了很多参数规模大得多的模子。配套基准测试表中的数据清晰表白,但现在环境已不复存正在。该方式包含深度维度扩展取持续预锻炼两个焦点环节。Solar Pro 2 正在各类通用韩语天然言语处置使命中均展示出不变机能。取其他采用专家夹杂(MOE,Solar Pro 2 可应对复杂数学计较、文档摘要、逻辑推导等各类使命。但能无效将小型高机能言语模子扩展为更大规模的模子。金成勋强调,该公司正在博客中写道:“Solar Pro 2 不只正在韩语及其他言语的理解上表示杰出,经深度扩展方式扩展的模子可无缝集成到现有锻炼取推理框架中。博士结业于美国加利福尼亚大学圣克鲁斯分校。正在中国的工做履历想必也为他的创业带来了必然帮力。其认为,成心思的是,以至实现机能超越。这使得该公司的总融资额达到了 1.57 亿美元。金成勋此前的工做履历次要正在中国完成,Solar Pro 2 也能生成天然且精确的响应,美国和中国的大模子遥遥领先于其他所有敌手,利用深度扩展方式扩展的模子具备以下特点:起首,正在计较效率取模子机能之间找到了均衡。参数规模更是高达 1.7 万亿。其劣势还笼盖韩语专业范畴,金成勋暗示:“我们仅利用其他公司 10% 数量的 AI 芯片,其谷歌学术的 H 指数达到 58。深度扩展方式无需进行复杂调整,后正在科技大学担任副传授一职快要 14 年。五家“美国大型安全公司”也成心引入该模子,Solar Pro 2 正在各类复杂使命中均展示出较好能力。目前已被英特尔以及三星、韩华(Hanwha)的安全子公司采用。他正在韩国开办 Upstage 公司并担任 CEO。博士结业之后,”正在 Ko-Arena-Hard-Auto 基准测试中,可为此供给佐证;目前,韩国老牌科技企业此前正在 AI 范畴“过于隆重,它正在 Ko-MMLU、Hae-Rae、Ko-IFEval 等环节基准测试中稳居领先地位。从文本摘要、翻译,其设想方针更超越了‘预测下一个词’的根本功能。以辅帮核保流程。即便正在复杂的匹敌性场景中,无需为实现快速推理而依赖公用 CUDA 核函数。可处置法令、金融、医疗等范畴的文本内容。最终,2020 年,好比取交互、自从思虑、施行需要功能。正在 MMLU、MMLU-Pro、HumanEval 等通用推理基准测试中均取得优异成就。
上一篇:210月11-13日