您现在的位置是:鸿篇钜制网 > 百科

Kimi新模型来袭,发布即可上线!

鸿篇钜制网2026-01-04 18:16:55【百科】4人已围观

简介Kimi新模型来袭,发布即可上线!数学模型k0-math刚刚发布几天,k1视觉思维模型来了,很多思考推理测试都超过了Open AI o1。官方表示,基于加强学习,k1原生支持端到端图像理解和思维链技术

Kimi新模型来袭,新模型袭发布即可上线!发布

数学模型k0-math刚刚发布几天,上线k1视觉思维模型来了,新模型袭很多思考推理测试都超过了Open AI o1。发布

官方表示,上线基于加强学习,新模型袭k1原生支持端到端图像理解和思维链技术。发布

换句话说,上线K1可以深入图片信息,新模型袭层层推理,发布从而解锁包括几何图形题数学能力更全面。上线

模型思考答案的新模型袭全过程,belike:

而且k1的思维能力不仅局限于数学领域,所谓“学好数学、上线物理、化学,不怕走遍世界”。

官方晒出的数学化学基准测试中,Kimi k1-preview性能超过OpenAI o1、GPT-4o、Claude 3.5 Sonnect。

Kimi新模型的发布还是直接上线可玩的那种,APP或网页版找到“Kimi视觉思维版”就可以上传图片点击使用。

话不多说,这就赶紧来实测一波~

第一波数理化实测

先来一个考研数学真题小试牛刀,这个题目涉及曲面积分、高斯定理等知识点:

GPT-4o之前在量子位测量中被这个问题困住了。

经过一步一步的详细推理,Kimi视觉思维版第一次给出了正确的答案。

它自己也说检查没有错,“对这个答案很有信心”。

再来一个曾经测试过o1的数学概论题。

一个外星人来到地球后,第一天可以选择以下四件事中的一件来完成相等的事情:

自我毁灭;分为两个外星人;分为三个外星人;什么都不做。

从那以后,每个外星人每天都会做出一次选择,彼此独立,地球上最终没有外星人的概率。

Kimi视觉思维版一次就做对了:

看完数学能力,再试试物理题。

以下问题是大学物理中的光学问题:

波长在双缝干涉试验中λ=单色平行光550nm垂直射入缝间距a=2×10⁻⁴在m的双缝上,从屏幕到双缝的距离D=2m。寻求中央明纹两侧第10级明纹中心之间的间距。

成功回答Kimi视觉思维版。

事实上,它很早就给出了正确的答案,但它仍然严格地用不同的方法反复验证和确认。

最后,还有一道“化学题”(doge)

Candy, Happy, Bacon, Scary, Brain, House

Which is the odd one?

Hint: Chemistry

Kimi视觉思维版在推理过程中经历了几次曲折,但最终答案是正确的(happy)

K1背后的技术大方向除了发布新模型外,还被月之暗面公开。

基于强化学习的新一代推理模式

据报道,K1是他们基于强化学习技术的新一代模型,被称为思考模型,端到端的图像理解和思维能力在真正意义上得到了实现。

从模型训练的角度来看,分为两个阶段:通过预训练获得基础模型,然后在基础模型上加强学习后训练。

最重要的是,k1遵循强化学习Scaling Law,加强学习后的数据质量和训练进一步优化了学习效率。

传统的基于文本的推理模型,或不支持图像信息输入,或需要借助外部OCR/视觉模型进行转换,效果有明显损失。

由于Kimi视觉思维版是原生的端到端视觉推理模型,视觉思维版 可以直接理解图片信息,进行深度推理。

“噪音”场景,也就是说,在拍摄图片模糊、手写字迹潦草的情况下,性能损失也很小。


既然如此,把思路打开,除了让它做数学和化学推理,也许你还可以拿一堆图片来帮助它推理任何我想知道的东西。

比如把朋友的“歌单”截图发给它,让它给我分析一下这个朋友的MBTI。

不要说K1的推理是合理的。首先了解MBTI是什么,然后仔细分析图片中的曲目,像侦探一样进行分类,然后找出这些歌手和风格之间的相似之处。

它甚至会“平衡矛盾特征”,即使给出猜测,也会加一步“验证”。


最终会给出更合理的猜测。

另一个例子是,你也可以拿出这样一个潦草而模糊的手写手稿,让它帮助我理解是谁写的,笔记在说什么。

思路又被打开了。

最终不得不说,近几天国内外大型模式的新进展真的很多,以前有谷歌,现在有Kimi,OpenAI“圣诞直播12天”可谓是一次又一次的“狙击”。

你觉得Kimi新模型的表现如何?感兴趣的童鞋不妨亲自考试。~

来源:量子位

很赞哦!(1476)