用iPhone 快捷指令和 AI,我做了个更好用的「闪念胶囊」
新建一个快捷指令,命名为「闪念笔记」添加一个菜单,提供「文字输入」、「语音录入」和「剪贴板」三个选项。根据用户选择,设置响应的输入方式:文字输入:使用「要求输入」操作Whisper:添加「录音」操作剪贴板对于语音输入,添加调用WhisperAPI的脚本,将录音转换为文本:无论输入方式如何,都将得到的文本内容...
深度|对话Evernote CEO:生产力工具的未来,如何在用户需求与竞争中...
多年来,生产力工具领域最奇怪的事情是,没有人能开发出像Evernote一样好的网页剪辑工具。Evernote一直在这方面表现优于其他应用。现在,我们进入了一个关于个人知识管理和“第二大脑”的新兴兴趣时代,加上AI的介入,这种信息组织和管理的方式又重新焕发了活力。你对笔记的定义现在是多广泛或多狭窄?FedericoS...
何恺明新作出炉!异构预训练Transformer颠覆本体视觉学习范式,AI...
另一个观察结果是,使用分布式方法,在每个训练批中聚合尽可能更多的数据集,用更大的批大小来弥补异构训练中的较大方差。模型缩放如图7所示,固定数据集和轨迹数量,沿着模型大小(从1M到1B)进行缩放,并逐渐将批大小从256增加到2048(模型大小每增加一倍),并使用具有170k轨迹的更大数据集。可以观察到,当我们扩展...
《文本革命:利用AI成为超级作者》:AI实战演练——进阶提问-2
在上面这个案例中,我们就用到了角色扮演式提问和核心关键词提问两种方法。两种方法的结合,一是可以让AI调动海量数据库中有关北京旅游攻略的相关的专业性信息。二是,通过核心关键词,进行快速筛选定位,并对AI生成的内容进行范围限定,以确保AI给出的旅游攻略具有精准性。当然,有的人就会说了,网上有很多假期首都7...
智能体工作流推进Agentic AI,20个项目深入了解Agentic Workflow
低代码/无代码操作:通过拖放工具,可视化构建LLM应用程序,简化了开发流程,让不同背景的用户都能参与AI应用的开发。直观的界面:用户可以通过拖拽组件来构建自己的LLM应用程序,无需编写复杂的代码。开源项目:Flowise将永远免费供商业和个人使用,易于获取和修改以适应不同需求。
喝点VC|红杉资本对话英伟达Jim Fan:为类人机器人构建AI大脑,甚至...
这个项目的想法非常直接,我们想构建一个能够读取计算机屏幕像素并控制键盘和鼠标的AIAgent(www.e993.com)2024年10月9日。如果你想想这个界面,它实际上是一个非常通用的界面。我们在计算机上做的所有事情,比如回复邮件、玩游戏、浏览网页等,都可以通过这种映射像素到键盘和鼠标控制的方式来完成。这实际上是我第一次尝试AGI,也是我在OpenAI的AI...
BAAI:第一原理的脑和认知科学的人工智能,6大角度
这些一般原则是大脑提取、表示、操作和检索信息的标准规则,它们是大脑执行其他更高认知功能的基础。在某种意义上,它们是指导大脑运行的原则,我们称之为大脑的第一原则。本文收集了北京智源人工智能研究院(BAAI)“脑与认知科学AI”研究团队总结的六个第一原则。它们是吸引子网络、临界性、随机网络、稀疏编码、关系记忆...
Cursor创始团队最新访谈:如果Github整合o1,Cursor可能要倒闭了
我的观点是,即使AI已经足够智能,但你仍无法传递足够明确但意图来指引模型该做什么。有几种方法可以解决这种意图不明确定问题。一种是让模型问你:「基于你的查询,我不确定如何处理这些部分,你可以明确一下吗?」另一种方法可能是,如果有五六种可能的生成方式,「鉴于目前查询中的不确定性,不如我们把这些生成的结...
文心大模型赋能商业智能助手的探索与实践
文心大模型构建商业智能助手的几种模式接下来介绍我们如何利用文心大模型构建商业智能助手。1.检索增强技术(RAG)第一种模式就是利用检索增强技术,即检索一些文档用做知识增强。然而,单纯依赖RAG在商业场景下的局限性逐渐显现,尤其是在面对庞大商业知识库和复杂企业关系时,直接的网络文档检索往往无法提供准确、深...
2024年智能终端大战开启:Vision Pro?AI手机?还是?
我们在之前的视频中,就曾经说过AIpin就像现在的“小王”秘书一般。但是再深入研究一下,我们就能知道它所蕴含的概念性意义——环境计算。就像硬件光谱的另一个极端一样。环境计算,指的是计算技术在日常环境中无缝融入,以潜移默化的方式为用户带来智能支持与服务。与空间计算更侧重于空间数据的处理与分析不同,环境...