如何评价面壁新发布的端侧模型 MiniCPM-4,该模型有哪些技术亮点?
- 发表时间:2025-06-18 00:50:11
- 来源:
最近几年精力有限比较少在知乎上回答问题了,不过每次看到精彩的问题和回答还是会手痒。
趁这次MiniCPM-4模型发布,集中分享下最近一年多来的感悟和想法,也是最近跟同学朋友经常探讨的话题,抛砖引玉一起交流。
为什么做端侧模型 规模法则可持续发展问题。
大模型在规模法则(Scaling Law)的指引下,参数规模从2018年的千万量级发展到2024年的千亿量级(Llama3.1-405B)。
到了2024年下半年,逐渐出现规模法则是否可持续的大讨论…。
推荐资讯
- 2025-06-18 01:40:10北京日报点名批评“苏超”过度娱乐化,它是否管的太宽了?为什么无良媒体不会被查封取缔?
- 2025-06-18 02:50:09为什么小爱音箱只能播放qq音乐免费音乐?
- 2025-06-18 03:15:10为什么linux桌面那么丑?
- 2025-06-18 02:45:10cloudflare的1.1.1.1和warp有什么区别?
- 2025-06-18 02:40:10MacBook的诱惑在哪里?
- 2025-06-18 01:55:11以色列为什么突然敢打伊朗了?不怕被报复?
- 2025-06-18 02:05:10为什么 mac mini 的 m4 版本价格这么低呢?
- 2025-06-18 02:30:10在NAS上安装了什么应用,让你的生活体验有了巨大的提升?
- 2025-06-18 01:50:10618 有什么***椅值得入手,选购应该注意哪些方面?
- 2025-06-18 03:20:10为什么说男人至死都是少年?
推荐产品
-
深圳一房屋出现沉降和墙体开裂情况,已封控 25 栋房屋,为什么会出现这种情况?有哪些安全隐患?
工程上,为什么沉降是需要第三方鉴定机构去鉴定的,现在已经封控 -
如何评价连云港这座城市?
别的不熟悉,简单从人际关系这一块,说一下我遇到的连云港特色姓 -
count(*) count(1)哪个更快?
团队 code review 时,一位同事把 count(* -
妃子笑是荔枝中最难吃的品种吗?
分地方,在茂名:是的,妃子笑排最后。 在外地,妃子笑不知道
新闻动态
最新资讯

