2024/12/98 分钟0 条评论

多模态落地的关键要素

多模态的落地有几个关键要素,第一个是模型的基础能力;第二个是场景的需求,不管是用户的日常场景还是垂直的使用场景;第三个是使用场景的延伸。可以从这几个维度思考。

模型能力

先看模型基础能力。如果从多模态这个维度去看,过去的进展是比较缓慢的。一方面是在多模态这个体系里面原有的那套训练逻辑可能会面临较大的数据瓶颈,文本数据在互联网上的量是非常丰富的,图片和视频数据也有,但相比于文本类实现质变的数据要求来说,图片和视频领域的数据量需求远远大于今天的供给。因此,一定程度上是整个数据体系的匮乏,导致模型的进度比想象的要慢,这一点上仍然需要一定的时间去补充模型的基础能力。在没有大规模的数据供给之前,或者找到更新的解决方案之前,还有一定时间的能力成熟期,还需要一个过程。

应用场景的附加值

🔒

订阅后继续阅读

解锁本文完整内容,以及所有历史文章
每周 2-3 次深度产品观察,构建你的产品思维

订阅解锁 ¥49/月

已订阅?登录