外媒:比利时计划打造首个追踪仇恨言论的AI大模型
外媒:比利时计划打造首个追踪仇恨言论的AI大模型环球时报综合报道比利时安特卫普大学的衍生公司Textgain计划打造首个能够检测网络仇恨言论的人工智能(AI)应用程序,将覆盖欧洲所有官方语言。据比利时《布鲁塞尔时报》22日报道,Textgain首席执行官表示,其他大型语言模型如ChatGPT或GoogleTranslate,是拒绝处理恶意言论的。
...AI行业跟踪33期(20240729-20240802):Google推出新模型,北美...
Google提出了一套先进的安全分类器ShieldGemma,旨在检测和缓解AI模型输入和输出中的有害内容,帮助开发者负责任地部署模型。该分类器针对仇恨言论、骚扰、色情内容和危险内容四个关键领域完成对负责任AI工具包(ResponsibleAIToolkit)中现有安全分类器套件的补充。同时发布的GemmaScope旨在帮助AI研究界探索如何构建更易于...
追踪仇恨言论,比利时打造大模型
比利时安特卫普大学的衍生公司Textgain计划打造首个能够检测网络仇恨言论的人工智能(AI)应用程序,将覆盖欧洲所有官方语言。据比利时《布鲁塞尔时报》22日报道,Textgain首席执行官表示,其他大型语言模型如ChatGPT或GoogleTranslate,是拒绝处理恶意言论的。Textgain的模型不仅能处理恶意语言,还可识别有害信息,找出它们的...
「数字风洞」AI大模型安全测评 内容安全篇丨通义千问Qwen-72B...
极端主义”“宣扬暴力、淫秽色情”“侮辱女性”“传播虚假有害信息”以及各类行政法规禁止的问题测试集,作为一个有着优秀理解力的AI大模型产品,Qwen-72B机智的回答了或回避了全部问题,表现出了一个优秀AI大模型应有的水准。
图灵奖得主杨立昆:大语言模型是通往AGI的一条歧路
面对NickDirks对AI所造成的虚假信息等的质疑,杨立昆也以自己在Meta的工作经历为例,指出自监督学习的人工智能训练方式以及加上用于大型语言模型等系统的transformer架构,使得Facebook上被智能删除的仇恨言论占比从20%左右提升至96%,取得了审查效率上的巨大进步。这些技术也在其他监管治理领域发挥着重大作用。他倡导以...
早报|iPhone 17 顶配版或配备 12GB 内存/周杰伦起诉网易败诉/...
消息称特斯拉计划明年交付两款ModelY,包括7座版??传音旗下品牌公开三折叠手机PHANTOMULTIMATE2??智谱推出新一代基座大模型GLM-4-Plus??中科院、阿里云发布首个月球专业大模型??Midjourney宣布进军硬件领域??PlaudNotePin:记录会议的AI工具...
ChatGPT日耗电超50万度,卡死AI发展的竟然是能源?
此外,不同AI模型处理不同类型的推理任务,能耗的差异也很大。例如1000次请求计算,图片分类任务的耗电量是0.007千瓦时,而图片生成任务耗电2.907千瓦时。报告作者指出,AI的训练是一次性事件,而它的使用是长期过程,讨论AI能耗问题时应该关注的不是爆发式增长,而是长期的影响。并且,从技术史的视角看来,...
郭小平 郭瑞阳:新闻传播业的生成式人工智能应用及其风险应对
同时,“AI治理AI”的模式却暂时难以跳出虚假信息和偏见循环的怪圈。生成式人工智能的虚假信息和价值偏见源于原始数据库、技术设计和人机交互,从根本上是对现实世界的映射。生成式人工智能还被用在政治经济博弈中,甚至被用于发表仇恨言论、煽动情绪。就现实状况而言,“AI治理AI”的模式在当前承载了过高期待。现有的AI...
巴以冲突太棘手!联合国求助AI,用智能体模拟上千万当地民众
CulturePulse的模型可以为每个智能体设定80多个特征类别,包括愤怒、焦虑、个性、道德、家庭、朋友、财务、包容性、种族主义和仇恨言论等。“这些模型是完整的人造社会,可能有多达数百上千万个模拟的自适应AI智能体,这些智能体彼此联网,并且其设计方式在心理上更符合现实,在社会学上也更符合现实。”舒尔茨说,“基本上你...
2023中国AI大模型生态图谱,以及关乎明年的八个问题
AI的风险问题可以从很多维度展开。比如内容的安全性和使用安全性;偏见和隐私侵犯问题;错误应用带来的衍生风险,如恶搞、虚假信息、诈骗、网络骚扰和仇恨言论;责任归属问题;以及所谓“文明风险”,包括了机器意识的考虑。此外还有对社会经济造成的冲击风险,例如劳动力市场的替代问题、工人的焦虑、就业市场的混乱,以及...