ima 们的机会
现阶段知识库产品的核心卡点是?模型能力,幻觉?还是底层的 rag、ocr 等技 术? 目前的模型能力支持在知识库这个维度上完成内容检索和归类自动整理已经没有任何问题,知识库的 核心需求会是什么,目前主要包括内容的收集整理使用。 用户一旦把所有的知识内容,放在一个知识库里,模型只需对内容进行归类整理即可。核心是要对内 容进行理解,在用户需要的地方输出,当然,如果能够基于用户的支持库做进一步的提炼升级,帮助 用户完成从信息获取到信息使用的过程。这就是新一步的升级。从目前的技术进展来看,对于文本的 提取、归类和整理几乎不存在任何技术难度,也是较为成熟的技术体系。核心是对用户对知识库的使 用的需求。模型的能力已经完全符合要求,甚至可能在一定程度上都不需要能力来完成对内容的收 集。从现在的情况来看,经过多次推理之后,已经能很好地消除幻觉了。推理实际上是让适应多重维 度来对需求进行矫正,目前就知识库这条产品线的底层技术,基本上已经是不存在技术门槛,更多的 是还是产品应用上的创新。 如果模型能力足够强了,是不是就不需要单独的所谓知识库产品,我只需要把东 西喂给模型就可以?还是这个产品形态会变得更普适? 这个实际上会拆分成两种概念,一个是未来模型能力继续提升,基础的范畴够广,模型是能够囊括这 些知识体系的,但是中间会有一个专业领域的区分,所以的大模型一定程度上是做底层能力的框架, 但是到了具体特定领域的时候还是需要要有原有的知识体系做支持,今天很多垂直领域的小模型,也 是因为在里面灌进了很多特定的知识和场景完成一定的交付,所以如果普适性内容的话,在模型能力 进化到应程度上的时候应该能够解决,但是专业体系的内容还是需要知识的支撑和构建。 另外,知识库产品会容易被跟个人的数据中心混淆起来来看,从目前的维度来说,模型分两端,一端 理解内容,一端理解用户。理解内容不存在任何的技术门槛,但是理解用户这一端需要对用户的个人 信息积累,包括使用场景,工作习惯以及偏好性,这个是需要一定时间积累的。 未来有机会的话,当模型能力足够强或者场景足够综合的时候,这两个产品可能会出现结合的情况或 者更加普适,但不是到知识库的逻辑,而是会倾向于个人用户数据这一端,从这一端来看,这是接下 来一定程度不管是个人助手的产品,还是知识产品的输入壁垒或者竞争壁垒,甚至于 AI 产品下一阶段 的竞争壁垒,也会在用户的个人数据这一端。 ima 作为知识库产品蛮失败,知识库产品会是大厂赛道,还是小公司的切入?会 成为大模型产品的标配功能吗? 从目前的产品形态来说,他们还是在一个最舒适的阶段,甚至有可能接下来还会有大的迭代。 这一波知识库的产品,或者至少从腾讯这个产品上来说,一定程度上是也承接了一部分 DeepSeek 外 溢流量,把用户的需求洞察清楚,开始尝试。 另外从整个产品框架和定位来说,盲猜一定程度上会承接微信之前的文件传输助手的功能,只是把这 个功能单独拆分出来变成了一个产品,但我相信这个需求从微信后台是能看见文件传输助手使用量 的,如果按照数据角度去思考,他会是一个至少能做到 60 分的产品。 大厂做知识库产品会有一个问题是内容的底层框架,有优势也有劣势,优势在于大厂的平台基准和体 系化的触角,用户的内容数据分析触达更容易一些,他不管是在微信里的微博里的还是知乎 B 站,所 有的内容渠道一定程度上都会想向上下游做一次延展,这也是大厂要开始着手做的原因,但是可能每 家切入点和他对用户的理解洞察并不一样,从今天看起来未来有可能是用户生产存储分发是一体化 的,从这个维度来说,用户基数越大整个服务成本越低,且综合成本越低的公司做起来会有一定的竞 争力,如果是小公司的话,一定要找个非常垂直的场景,且这个领域的产品做足够好还是有机会的, 这个机会不至于做到一个超级独角兽,但是做到一个用户的某一垂类的数据中心还是有机会的。 模型平台一定程度上要做自己的知识库和内容中心,而且如果我们按照搜索范畴这个角度接入的话就 是会是个标配,核心的服务逻辑是用户在哪里获得,在哪里存储,在哪里生产,在哪里分发,最终会 是一体化的产品还是分拆,从个人助手的逻辑上来说,他们想切的是这个维度。