华中科技大学好不好?央媒再度聚焦:“AI小猴子”还能看图说话?
“ChatGPT”的出现,再一次刷新了众人对于人工智能技术的认知,与此同时,也让国内有关“人工智能”技术的动态持续受到网友关注。近日,新华社的一则报道引发热议,报道指出,华中科技大学这项最新“黑科技”让人工智能“小猴子”也能“看图说话”,人工智能版“孙悟空”有了“火眼金睛”。新华社报道中所描述的“小...
国产多模态大模型AI“小猴子”实现“看图说话”
12月11日,记者从华中科技大学获悉,该校软件学院白翔教授领衔的VLRLab团队正式发布多模态大模型——“Monkey(猴子)”。该模型具备“观察”世界的技能,可对图片进行深入问答交流和精确描述。图为团队将Monkey代码在全球最大的代码托管服务平台GitHub上开源。多模态大模型是一类可以同时处理和整合多种感知数据,如文本...
华科大团队研发出具备出色的“看图说话”能力的AI“小猴子”
白翔介绍,Monkey的一个显著特点是其出色的“看图说话”能力。在详细描述任务中,Monkey展现了对图像细节的感知能力,能够察觉到其他多模态大模型所忽略的内容。如对下图进行的文本描述中,Monkey正确地将其识别为埃菲尔铁塔的绘画,并提供了构图和配色方案的详细描述。而对左下角的文字,只有Monkey和GPT-4V能将其准确...
华科大发布AI小猴子 “看图说话”能力世界领先
00:00/00:00倍速当前设备不支持播放你可以刷新试试70017001.199-66967edbb8ed6ef07359e2ec848d1a5d华科大发布AI小猴子“看图说话”能力世界领先2023-12-1321:15发布于湖北|560观看1评论收藏分享手机看长江云新闻粉丝14.6万|关注2+关注...
早安洪山 · 厉害!华科大的这只“小猴子”能“看图说话”
华中科技大学的这项最新“黑科技”,让人工智能“小猴子”,也能“看图说话”。近日,该校软件学院白翔教授领衔的VLRLab团队,发布了多模态大模型“Monkey”,该模型能够实现对世界的“观察”,对图片进行深入问答交流和精确描述。多模态大模型是一类可以同时处理和整合多种感知数据(例如文本、图像、音频等)的AI架构,近年...
华科大研发出具备出色“看图说话”能力的人工智能“小猴子”
新京报讯(记者张建林)12月11日,记者从华中科技大学(以下简称“华科大”)获悉,该校软件学院白翔教授领衔的VLRLab团队近日发布了多模态大模型——“Monkey”(意为“猴子”)(www.e993.com)2024年12月20日。该模型能够实现对世界的“观察”,对图片进行精确描述。多模态大模型是一种可以同时处理和整合多种感知数据(例如文本、图像、音频等)的AI架...
小学生看图说话写话六大技巧之二:学会看图
这幅图主要写学校丰富的课外活动,我们可以从左到右,或者从右到左的顺序来观察。在写话时,可以先写最左边女同学跳绳,再写中间女同学踢毽子,最后写右边男同学打篮球。反之,也可以从右到左观察和写话。打开网易新闻查看精彩图片六一儿童节当然,每一幅图不仅仅是一种看图观察方法,有时候我们可以综合运用多种观...
华科大研发!这“只”AI“小猴子”有火眼金睛!
这“只”AI“小猴子”有火眼金睛!华科大这项最新“黑科技”让人工智能“小猴子”也能“看图说话”!近日,我校软件学院白翔教授领衔的VLRLab团队发布了多模态大模型“Monkey”该模型能够实现对世界的“观察”对图片进行深入问答交流和精确描述
如何指导二年级孩子完成看图写话
看图写话的画面是一个个静止的人或物,而且比较单调,我们在引导孩子仔细观察画面的同时,通过向孩子提问问题让孩子充分发挥自己的想像力,让画面变得生动鲜活起来。比如:画面上看到的是小猴子在吃香蕉。家长可以问:“小猴子是怎么抢到香蕉的?”孩子们就会通过假山上猴子不同的动作,想象猴子抢香蕉的场景,整个画面立马就丰...
特级教师忠告:小学六年不吃透这些,语文别想拿高分!
b)表示例举事物的省略。如:动物园里有白熊、大象、猴子……c)表示话没说完。如:指导员伤心地说:“我没有把你们照顾好,你们都瘦得……”d)表示声音断断续续。如:“我嘛……缝缝补补……风吼得这么凶,真叫人害怕。”书句号(《》):表示书籍、报刊、文章、影视剧等的名称出现在一个句子中的时...