中国科技巨头腾讯发布一款快思考模型,并称其输出答案的速度比深度求索(DeepSeek)的R1模型快。
综合证券时报网、彭博社和《21世纪经济报道》报道,腾讯星期四(2月27日)正式发布新一代基座模型混元Turbo S。
腾讯混元团队介绍,区别于DeepSeek-R1、混元T1等需要“想一下再回答”的慢思考模型,混元Turbo S能够实现“秒回”,更快速输出答案,吐字速度提升一倍,首字时延降低44%。
团队指出,混元Turbo S通过在架构上采用Hybrid-Mamba-Transformer融合模式,降低了训练和推理成本,部署成本随之大幅下降,“持续推动大模型应用门槛降低”。
在定价方面,混元Turbo S输入价格为每百万tokens0.8元(人民币,下同,0.15新元),输出价格为百万tokens2元,相比前代混元Turbo模型价格下降数倍。
腾讯还分享了数据,显示混元Turbo S在常用的人工智能(AI)测试中与DeepSeek的V3模型具有竞争力。
团队说,通过长短思维链融合,混元TurboS在保持文科类问题快思考体验的同时,基于自研混元T1慢思考模型合成的长思维链数据,显著改进了理科推理能力,实现模型整体性能明显提升。
DeepSeek上个月发布的AI大模型DeepSeek-R1,凭借低成本和高性能在全球引起广泛关注,也重振了人们对中国科技公司创新能力的信心。
中国科技巨头阿里巴巴旗下通义千问(Qwen)团队本周也发布最新推理模型深度思考(QwQ)预览版,可能与OpenAI和DeepSeek等行业领先对手竞争,让全球AI竞赛进一步升温。
您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。