科大讯飞引领大模型规模化应用,200余项技术成果亮相1024科博展
在黑板上随手画出的简笔画,即刻在大屏中化为标准的几何体模型;轻挥手指,即可实现截面的变动、整体的旋转……在教育馆的“智慧教与学”展区,不少学生围坐在星火智慧黑板前,踊跃体验着各式各样的课堂活动。在本届1024科博展上,教育馆打造了“智慧教与学”和“自主学习”两大展区,展示讯飞星火大模型赋能教师教...
最强国产多模态大模型来了!硬刚GPT-4o,商汤现场演示实时音视频交互
最后,演示者进一步升级难度,他画了一幅简笔画问日日新5o这是什么,日日新5o立马称这是一只可爱的兔子。当演示者为兔子加上了表情和动作,日日新5o都立马识别并表述了出来,展现出极强的多模态理解能力。但商汤科技“杀招”不止于此,其还在AI视频生成模型领域大展身手。Sora热潮之后AI视频生成工具泛滥,很多工具都在...
后浪科学前来练摊!丨中国科学院科学节·北京主场活动预告
精致科学简笔画,带你品味科学之美。地点:分散在园区各地,等你来寻找~图片主题:1)天眼看地球展出单位:中国科学院空天信息创新研究院2)地球故事A展出单位:中国国家地理3)地球故事B展出单位:中国科学院地质与地球物理研究所、中国科学院地球化学研究所、中国科学、青藏高原研究所、《科学世界》杂志4)古...
细品“不务正业”的蔚来
蔚来智驾研发副总裁任少卿解释道,10年前2D/3D模型是粗糙简笔画,近两年的BEV、OCC是更精细的简笔画,但依然还是处于马赛克的阶段,而NWM能想象出更真实的道路环境。简单来说,NWM可以全量理解数据,具有长时序推演和决策能力,在0.1秒内推演出216种可能发生的场景,并找出最优的一条路线。你也可...
具身智能在重新定义人、AI 与城市空间的关系
我们为什么起了这么一个题,第一是研究的真问题,刚才我们发布的报告的封皮,这个封皮看起来是简笔画,不如现在GPT画的丰富。但它的灵感来自于马蒂斯的一幅创作《舞蹈》,主要讲的是人与环境的关系。这个蓝色和绿色的背景反映的是宇宙和大地,这个画充分反映了我们在创作过程中的困惑和思考,未来人机牵手之后人机的关系会...
6问世界人工智能大会|WAIC现场
功能方面,「日日新5o」能够识别毛绒玩偶的外表和穿戴并给出解读,也可以辨别工作人员画的简笔画兔子,打开书的任意一页,它也能识别图文内容并做总结(www.e993.com)2024年11月25日。不过相比之下,GPT-4o不仅能识别文字、人物,还能通过摄像头理解纸上的数学题,给出解题指导,这对模型的逻辑和推理能力要求更高。
不再只是一款办公软件,钉钉推出个人版,用户一键即可切换
比如,当某位用户在过马路时不小心被车撞了,且交警判定车辆驾驶人全责的情况下,用户可以利用法律助手获得相应的法律知识,并依据这些知识做出正确的决策。通义万相涂鸦作画:AI一键生成不同风格的个性画作利用通义万相的涂鸦作画工具,用户在手绘或上传简笔画、轮廓、素描、涂鸦之后,就能得到由AI生成的3D卡通、二次元...
再反转!谷歌Gemini又曝猛料,逐帧分析揭开复仇GPT-4的底牌
看着十分抽象的简笔画、几秒闪过的短视频,接收语焉不详的问题,Gemini却能立马明白用户的意图,给出正确的答案,并不动声色的展现出自己文理兼修的实力。这是如何实现的?背后离不开提示词的强大“助攻”。1、空间逻辑力了得,一眼看出天文知识Bug“这样排序正确吗?”“不,正确的顺序是太阳、地球、土星。”几...
商汤发布流式多模态交互大模型「日日新5.5」,国内首次对标GPT-4o
使用感受如同人类自己交流一样直接,可以直接见客户所见,理解客户所需。这种交互模式多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出。从场景理解分析、物体信息描述、书籍图文总结,甚至粗糙的简笔画、面部情绪,「日日新5o」都能精准拿捏,丝滑交互,还能言语俏皮的与人做互动。
Google 刚发布的 AI 模型 Gemini,这些特点值得关注-钛媒体官方网站
这不仅是AI模型有史以来第一次超越人类专家的测试结果,也超过了此前GPT-4同类测试中86.5%的结果。同时在九项独立基准测试中分别击败包括LLAMA-2GPT-4在内的一众竞争对手。Google也准备了几个演示场景,展示Gemini的多模态理解能力:视频中一位测试者正在用简笔画视频的方式,给Gemini输入信息,在演...