这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试
这导致了VLMs在测试集中的得分很高,但这并不代表这个判断成立:VLM可以像人类一样感知图像吗?为了得到这个问题的答案,来自奥本大学和阿尔伯塔大学的研究者决定给VLMs「测测视力」。从验光师的「视力测试」处得到了启发,他们让:GPT-4o、Gemini-1.5Pro、Claude-3Sonnet和Claude-3.5Sonnet这四款顶级...
22岁小伙视力突然模糊 检查竟是脑垂体瘤!医生用机器人辅助切除
西安市人民医院(西安市第四医院)脑科病院刘卫平院长对张先生的病情深入分析,经过进一步检查确定是垂体瘤,于是刘卫平教授团队为张先生进行了神经外科手术机器人辅助经鼻内镜下垂体瘤切除术来揪出这个“隐形的小偷”。(术后影像资料)术后第2天,张先生的视力、视野很快得到了改善。03垂体瘤的真面目??什么是垂体...
游戏无障碍设计参考:听觉篇
当玩家听到附近存活玩家的音频时,屏幕左上角会出现文字提示,同时小地图上会有视觉提示(蓝色高亮小人)/图片:oneoddgamergirl但凡出现字幕,务必清楚易读(字幕)小得看都看不清,就算有5.0的视力也没用,而且背景还老是白色的,让人读起来更加困难——Ginji88,发布于SleepingDogsforums带黑色底色的文本,跟开场...
游戏无障碍设计参考游戏无障碍设计参考:听觉篇:视觉篇
当玩家听到附近存活玩家的音频时,屏幕左上角会出现文字提示,同时小地图上会有视觉提示(蓝色高亮小人)/图片:oneoddgamergirl但凡出现字幕,务必清楚易读(字幕)小得看都看不清,就算有5.0的视力也没用,而且背景还老是白色的,让人读起来更加困难——Ginji88,发布于SleepingDogsforums带黑色底色的文本,跟开场...
追问weekly | 过去一周,脑科学领域有哪些新发现?
纳米级精度检测癌症和病毒感染AI与临床医生决策差异揭示其整合挑战经过指令调整的大语言模型与人类的自然语言理解不一致受生物学启发的尖峰神经网络的研究进展和新范式机器学习潜力:下一代生物分子模拟的路线图深度持续学习中可塑性的丧失打破蛋白质相互作用预测瓶颈,AlphaSeq数据集引领新突破...
顶尖AI科学家李飞飞演讲:机器人进化离不开空间智能
但我们并不收集静态图像,而是开发了由三维空间模型驱动的模拟环境,使计算机能够在无限多样的可能性中学习行动(www.e993.com)2024年9月9日。你现在看到的是一个由我的实验室领导的Behavior项目中的机器人学习示例。我们还在机器人的语言智能方面取得了令人兴奋的进展。我的学生和合作者们是第一批在这方面取得进展的团队。利用基于大型语言模型的输入...
99年小姐姐亲身感受丽水近视手术,第二天视力就恢复到1.0
手术是在一台巨大的机器上完成的,这台机器就是德国蔡司全飞秒3.0设备,现在做全飞秒都是用的这一台机器。原本还很担心自己会眨眼,结果医生用一个撑子把我的眼睛撑开,想闭眼都闭不上哈哈哈。然后就是打激光的时候医生会提醒盯紧绿点,时间也不会太长。一台手术不到十分钟,全飞秒摘镜任务就算完成了。整个过程都不...
纵览机器学习前生今世,万字整理谷歌首席科学家 Jeff Dean 一小时...
谷歌现在都做了些什么工作?为了解答这个问题,谷歌首席科学家JeffDean于2月13日在美国莱斯大学进行了一场1小时12分钟的公开演讲,突出展示人工智能和机器学习领域中几个令人振奋的趋势,并介绍了谷歌在人工智能时代的过去、现在与未来所做的工作,还概述了大家都很感兴趣的Gemini系列多模态模型。
巴黎奥运会专题报道|一路向前,静待花开——访全国政协委员陶璐娜
陶璐娜(左)在指导运动员技术动作(图片由受访者提供)陶璐娜全国政协委员,上海射击射箭运动中心主任,悉尼奥运会女子10米气手枪冠军、中国体育代表团首金获得者。7月初的上海,气温近40℃。午后走进上海射击射箭运动中心,微风停滞,树叶缓落,仿佛连时间都在休憩,只有训练馆内密集的枪声毫不停歇。
安徽合肥学生视力筛查执行“走样”遭整改
(“庐阳区青少年视力保护基地”外景。摄于2021年。图片来源:合肥市相关部门官微)近期,合肥市多所中小学以不同形式动员学生到合肥市所谓的“区级儿童视力保护基地”进行免费视力筛查建档工作,并称基地检查项目与公立三甲医院相关检查项目一致。不过,《中国经营报》记者调查发现,上述所谓的区级儿童视力保护基地的运营主...