全世界最懂大模型的两个产品经理,一起聊怎么做AI产品
你可以说"我想做这个,能给我写个评估样例吗",它给出的答案通常都不错。MikeKrieger:是的,这确实很有用。另外还有一点,如果你听过AndrejKarpathy等在这个领域深耕多年的人的观点,他们会说没有什么比研究数据更重要。人们经常纠结于已有的评估结果,比如新模型达到了80%而不是78%,觉得不能发布,或者觉得更糟。
月之暗面杨植麟:提升深度推理能力是AI产品的下一个重点
据介绍,月之暗面在未来一两周内将上线新一代数学推理模型k0-math,对标OpenAIo1系列可公开使用的两个模型:o1-mini和o1-preview。目前,在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过了OpenAIo1系列的o1-mini和o1-preview模型。在两个难度更大的竞赛级别的数学题库OMNI...
成本1亿上映1天就被判死刑,观众齐刷退票,这电影就是个笑话!
除了以上4位客人之外,民宿中有一个老板和服务员。一夜过后老板死在了自己的房间,屋外却没有任何的脚印。这说明凶手就在民宿中间的这几个人中产生。死者在临死之前,用鲜血画出了数个十字架,似乎在暗示着什么。4个客人互相猜,是不是其中一人杀了老板。可是按照正常逻辑,他们没有发现,电影开头的服务员消失...
大语言模型会推理吗?
对推理的研究有两个不同的学术传统。逻辑学和数学研究的是推理的规范性理论和模型,其目标是将推理的正确性(也称“有效性”)建立在一个体现理性的普适标准之上。传统的推理有效性标准是“保真”,即保证从真前提推出真结论,而一个逻辑系统就是由满足这个标准的推理规则组成的。这些规则是抽象的,只关乎于前提和...
国家出手禁止幼儿园超前学,这是好事,但这5件事,不抢跑真吃亏
他就能轻而易举推理出2+2=4,2+9=11的答案,而不是掰手指:我知道1+1等于2,2+2那就是两个1+1,所以等于4。我知道1+9=10,2比1多了一个1,所以等于2+9=11。超前学习一定不是超前学习教科书,用背诵、刷题、做卷子等机械枯燥的方式叠加学科知识。
十问月之暗面杨植麟:Kimi与字节豆包竞争,孰强孰弱??丨 科创100人
这个交互可能是两个维度的,一个是跟用户的交互,一个是跟客观世界的交互,我觉得都还有很大的提升空间(www.e993.com)2024年11月22日。当我们把这两个做好之后,留存也会进一步上升。问:OpenAIo1模型发布后,您曾提及大模型范式从训练的scaling转到推理的scaling,月之暗面在看到这个趋势后,在技术和产品上做了哪些调整?
十问月之暗面杨植麟:Kimi与字节豆包竞争,孰强孰弱?
这个交互可能是两个维度的,一个是跟用户的交互,一个是跟客观世界的交互,我觉得都还有很大的提升空间。当我们把这两个做好之后,留存也会进一步上升。问:OpenAIo1模型发布后,您曾提及大模型范式从训练的scaling转到推理的scaling,月之暗面在看到这个趋势后,在技术和产品上做了哪些调整?
写数百万字研究凶案,她从没对人性失望|极限女性第五期
一开始,有读者以为“何袜皮”是个男人。她分析、推理如此多命案、要案,轮番审视诸多记录、照片,资料涉及血腥与暴力,有时让人毛骨悚然。她得屏蔽恐惧,再屏蔽愤怒,将过程与证据冷静地写下来。前几年,何袜皮在公众号谈及日常,发了自己的生活照,有人惊讶:她怎么长着一张南方姑娘的脸?也有人毫不意外,...
两百万字,电影叙事,一部国产AVG怎么敢做到这个地步?
如果在一些危及性命的场合作出了错误的决策,玩家往往不会立刻迎来DEADEND,而是先得到一个高亮的死亡预警:危险。“危险”二字在提醒你,你刚才做出了一个致命的决定,你的性命已如风中残烛,而现在你还有最后的机会去弥补你犯的错误。如果在接下来的选项中,你能头脑清醒地根据游戏提供的信息认清局势,作出正确的决...
对话波形智能姜昱辰:用户一年写了200亿字,现在她要让这个AI自我...
EleanorJiang:这确实是两个完全不同的技术,长文本输入主要涉及理解和分析上下文的能力,不过准确的说现在模型只能分析上文,但是一个模型Transformer的固定长度就这么大,所以要增强输入的能力,本质上也是增大模型,也就是大模型公司思考的问题。而长文本输出则是指生成大量连贯、一致和有逻辑的文本内容。