一些AI文生图的方法
后来让AI帮我查阅后才知道,AI绘图是大概念,它包括了用人工智能创建图形的所有方法;比如:用文字来生成图像,或者是改变图片的风格、编辑图片、修复细节、增强图像等。而文生图,指一种特定类型的绘图。这类产品、或能力,专门通过文字解析,并根据描述生成图像。我记得,当年文生图刚出来时,OpenAI的DALL-E和MidJourney...
如何给孩子定制个性化AI学习辅导?
基于这样的理念,结合了GPT-4的技术和可汗学院的素材,Khan和他的团队推出了一款AI助手——Khanmigo,取自西班牙语conmigo,意思是“和我一起”。目的就是希望孩子们能从“让AI全权代劳”转变为“引导学习”。在Khanmigo的应用上,我们能看到很多理想教育落地的模样。而Khanmigo并不唯一,它也只是诸多教育AI模型中的一...
...数字化战略咨询合伙人柳晓光:数字化转型是各行业围绕数据和AI...
我们的AI应用在特定场景上,这个场景对于整个公司来说它的重要性如何评价,AI带来的,如果控制变量有AI和没AI,小模型时代以及大模型时代,控制变量之后带来的价值分别如何量化,形成AI的效用评估。这样效用评估就确保我们投入的每一分钱可以用ROI方式去分析未来是否带来了可观、合理的回报,以此方式形成一个闭环。无论是在智...
设计向善的注脚,是创造属于“人”的发明
“创新,或者说创造,是人类一种发自本能的渴望。”钱青云认为,这种渴望也是人与AI的本质区别,“我们给手套也搭载了AI游戏用于康复训练,但它依然只是设计流中的一环,涉及用户的真正痛点,还是需要人去跟医生、患者实际沟通。我觉得要真正解决一些实际生活中的问题,还是得先从理解痛点出发,再去倒推研究我们所需要的技术...
AI医疗在成都:从门诊、筛查到手术,成都医生如此赋能
简单来说,与患者的沟通方式,从选择题变成对话框,可与患者进行自然、流畅地对话,从而实现了预问诊的精准度实现再提升。患者和AI门诊预问诊系统的对话方式不仅限于文字,包括部分方言在内的语音或者是图片都能识别,从而多元化地满足患者操作需求。该院信息管理部项目管理员林修宇,是这个系统的推动者。在从事信息管理...
微软亚洲研究院牵手“600号”,用人工智能干预阿尔茨海默症治疗
近日,微软研究院与上海市精神卫生中心(俗称“600号”)携手展开联合研究,基于微软AzureOpenAI服务中的多模态大模型,开发了个性化认知训练框架“忆我”(ReMe),扩展了自动化认知训练的训练范围,为数字化认知训练提供了新方法,有望帮助延缓认知下降(www.e993.com)2024年10月4日。微软亚洲研究院副院长邱锂力告诉第一财经记者,这一想法起源于今年4...
苹果玩了一个文字游戏,也掩饰了AI的本质
有意思的是,阿里投资了这6家里面的5家;腾讯投资了其中的3家,另外也投资了光年之外;手握光年之外的美团也投资了月之暗面和智谱AI;然后雷军系资本(金山、小米和顺为)则一样投资了光年之外、百川智能、Minimax、智谱AI和月之暗面;红杉和高瓴这些顶流基金也都在多头下注。
画个框、输入文字,面包即刻出现:AI开始在3D场景“无中生有”了
图4是与基线方法的比较。由结果可知,使用I-N2N会导致场景中的全局更改,并且这种改变是更改现有对象而不是创建新对象,例如I-N2N把4a中的乐高卡车变成了一个马克杯,把4b中厨房柜台上的物品变成了一个餐盘。
十问Gamma:断崖式AIPPT王者如何练成?(8000字)
(8000字)Gamma是AIPPT断档式的存在,为了更深度的理解这款最强产品,我特别约了即刻@余一聊了两次,和她专门也录了一期播客,比如这句话其实点出了Gamma并不是AIPPT的关键:AIPPT有两个赛道,一个是专注于怎么把PPT做的更好,另一个Gamma不是在做一个好的PPT,而是怎么更好的结构化可视化把我想要表达的东西更...
华为“天才少年”4万字演讲:现在的AI技术要么无趣,要么无用|钛...
因此AI能做的事就是在输出中插入动作提示,让3D模型一边说话一边做指定的动作。DeepFake、ImageAnimation和VideoDiffusion则是通用视频生成3条不同的技术路线。DeepFake是录制一个真人视频,随后利用AI把视频中的人脸换成指定的人脸照片。这种方法其实也是基于上一代深度学习的方法,它从2016年...