首页
推荐
快讯
解读
股市
港股通
视听
专题
行情
数据
公众号
APP
电子报
上市公司资讯第一平台
搜 索
综合
股票
资讯
公告
视频
共查询到
1
篇相关资讯
股票
股票名称
现价
涨跌
涨跌幅
振幅
最高
最低
成交金额
操作
共搜索到
0
只相关股票,点击查看更多
没有更多了...
资讯
第四范式SageOne IA一体机升级 支持模型弹性伸缩
记者7日从第四范式获悉,公司一体机解决方案SageOne IA日前进行了全新升级,推出“模型弹性伸缩”技术,来应对流量波动。第四范式是港股代表性AI公司。公司日前联合华为昇腾AI发布全新升级SageOne IA一体机解决方案,在支持DeepSeek V3/R1、QWen2.5、LLama3.3等主流大模型的基础上,企业可灵活在满血版和多个蒸馏模型之间切换。方案中集成了智能算力池化技术(vGPU)、大模型应用开发平台,以及开箱即用的AI应用套件。公司希望,通过构建从底层算力到上层应用的完整自主技术体系,为企业智能化转型提供新一代全栈式基础设施。当前企业一般采用传统扩缩容方案,即当应用负载增加时,通过人工干预或系统按既定规则扩展计算节点,保证服务可用;当负载减少时释放多余的计算节点,这一定程度上增加了算力成本和IT运维复杂度。“模型弹性伸缩”是系统根据负载状况,自动灵活切换同一系列下不同参数大小的模型提供模型服务,无需额外扩展计算节点,节省算力成本,提升资源使用效率的同时还大大降低运维工作量。公司相关人士举例说,在大模型推理场景下,负载较小时,满血版模型提供高精度的推理服务;进入高峰时段时,系统会自动将满血版降级为一个或多个蒸馏版/量化版模型实例,来处理大量并发请求。由此,结合模型预加载等技术,可避免模型服务切换时,导致服务中断或输出质量波动问题,做到用户无感知的平滑切换;当流量回归常态后,系统再自动升级到满血版模型服务,并释放多余的较小参数模型实例。同时,系统可预设多种基于负载的触发条件,如结合GPU使用率、请求队列长度、响应延迟等资源健康度指标,形成动态切换策略和任务路由机制,使弹性方案在实际应用中更贴近业务需求。
第四范式
模型弹性伸缩
AI
证券时报·e公司
王小伟
04-07 14:15
共搜索到
1
篇相关资讯,点击查看更多
没有更多了...
公告
共搜索到
0
篇相关公告,点击查看更多
没有更多了...
视频
共搜索到
0
篇相关视频,点击查看更多
没有更多了...
- 暂无数据 -
热门文章
马鞍山市智创股权投资基金登记成立
山鹰国际投资成立新公司 含生态环境材料业务
恒生指数早盘收涨0.12% 恒生科技指数涨0.81%
王毅会见泰国外长玛里
长虹美菱、四川长虹等投资成立智慧家居公司
更多
23:24
通威股份:2025年一季度净利润亏损25.93亿元
23:22
福建人才数字发展有限公司与支付宝达成合作
23:20
德冠新材:拟2000万元—4000万元回购公司股份
23:19
大家人寿新进成为兴业银行第五大股东
23:10
隆基绿能:股东HHLR拟换购ETF份额
23:04
国内商品期货夜盘收盘 纸浆跌超3%
22:48
义乌:对投保“短期出口信用保险”的企业 最高可给予80%补助
22:48
义乌:安排1亿元专项资金 支持3000余家参与对美贸易的市场商户出海拓市场、抢订单
22:47
华大智造:一季度净利润亏损1.33亿元 同比减亏
22:43
科汇股份:拟900万元—1600万元回购公司股份
22:42
义乌:构建国内仓、海外仓、国际物流专线“两仓一线”交付体系
APP
公众号
寻求
报道
帮助
反馈
回到
顶部
站长统计