AAAI 2024 | 语义引导的生成式图像增广方法
我们应用各种数据增广(DA)方法作为基线,包括四种基于扰动的方法:RandomErasing(RE)、CutMix、MoEx和RandAugment(RA),以及三种生成式方法:Text2Img、SGID+DiverseCaption(SGID+DC)和SGID+InstructPix2Pix(SGID+IP)。所有生成式方法都使用相同的图像生成模型SD。3.2主实验结果在本文中,我们在三个backbones上使用七...
中联重科获得发明专利授权:“基于图像变换的数据处理方法、数据...
在传统数据增广方法的基础上,采用透视变换的方式对待处理图像中的数据进行进一步的数据增广,能够在考虑数据真实性的基础上,有效增大数据量,提高数据的全面性,同时增大数据的多样性,从而提高对图像的识别处理的精确性,满足用户的实际需求。今年以来中联重科新获得专利授权11个,较去年同期减少了59.26%。结合公司2023年中报...
ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练
文中构造了四个不同规模的数据集:CIFAR-10、HalfCIFAR-10(CIFAR-10的一半)、CIFAR-10+10万张生成图片、CIFAR-10+100万张生成图片,通过改变randomresizedcrop(RRC)来反应不同的数据增广强度。下图4中表明最优数据增广强度随着数据规模的增大而减小(HalfCIFAR-10:0.02,CIFAR-10:0.08,CIFAR-10+0.1M...
「LLM-数学」MathScale: 用于数学推理的指令调优扩展方法
应对这一挑战的一种有效方法是利用前沿LLM(如GPT-3.5和GPT-4)扩充现有的高质量数学数据集。例如,WizardMath引入了一系列操作,供GPT-3.5生成复杂程度更高的数学题目。MetaMat通过答案增广、问题重述、自我验证和FOBAR问题,对GSM8K和MATH中的题目进行了引导。这些方法生成的新示例与训练集中的原始示例存在大量相似...
《增广贤文》成书年代考辨
嘉靖帝的在位时间是1521—1567年,《增广贤文》成书时间的上限应为1521年。对其成书年代下限的推断检索中国国家图书馆“全国古籍普查登记基本数据库”、台湾“中央研究院瀚典全文检索系统”、孔夫子旧书网的书目信息可以发现,《增广贤文》至今未见到明刻本,现有的各种刻本均在清代之后。《增广贤文》的清代刻本,...
硝烟里的大模型,求变的机器视觉:「数据」决定天花板,「平台架构...
对于小样本来说,模型上面需要有极其严苛的适应性,数据上面要有很好的增广能力,要具备在样本少的情况下,增广样本给自己的模型做训练的能力(www.e993.com)2024年7月7日。寻找共性,是增广样本数量一个较为常用的办法。有一些缺陷,在某几个行业是相通的,比如中框、结构件的外观检测和手机整机的外观检测,再比如锂电和光伏的外观缺陷检测等,都存在...
CVPR 2023 | 数据驱动的解释对分布外数据具有鲁棒性吗?
解决这一问题具有挑战性,因为我们既无法获得所有分布的集合,又无法获得转换函数。替代方案可能需要解释的人工标注,即提供;或者通过数据增广获取人工合成分布之间的一对一映射,即提供。然而,如上文所论述的,在现实场景中这两种方法都不可行。因此,实现DRE的核心挑战在于监督信号的缺失。
汪涛 张宁丨中央经济工作会议和11月数据前瞻:增长动能偏弱
对于即将公布的11月经济数据,我们预计房地产销售和房地产投资将持续同比下降10%以上,固定资产投资增速基本持稳(年初至今同比增长2.7%)。低基数可能推动出口(同比0%)、社会消费品零售(同比增长12.5%)和工业生产(同比增长6.5%)同比增速改善。政府债券发行同比多增推动11月信贷增速进一步反弹至9.5%。CPI可能小...
Chronos: 将时间序列作为一种语言进行学习
数据增广TSMix通过组合两个以上的数据点,将Mixup数据增强概念(最初是为图像分类而开发的)扩展到时间序列数据。它从训练数据集中随机选择一些不同长度的时间序列,对它们进行缩放,并创建它们的凸组合。这种组合的权重是从对称狄利克雷分布中得出的。KernelSynth则使用高斯过程合成数据生成。KernelSynth组装GP核来创建新...
从“通用”到“应用”,大模型落「向下」扎根工业制造
此外,为了提高数据增广的有效性,微亿智造在数据仿真和可视化交互方面也做了许多工作,主要包括面向工业异常数据的可编辑内容生成、数据分布可视化等。在可编辑内容生成方面,针对缺陷样本收集难、数据标注成本高等问题,微亿智造通过自研贴图和合成工具“神笔马良”,利用可编辑的AI内容生成来精确生成不同位置和形状的高仿真...