...发明专利授权:“一种基于深度学习的电网停电检修计划编排方法”
其方案为:加载电网模型数据文件提取电网设备模型信息保存到文件中作为基础数据;获取停电检修计划相关信息作为样本数据的关键特征;构造原始检修申请作为深度学习的原始样本数据;对原始样本数据进行特征增广及预处理生成可以直接输入深度学习模型的特征数据;生成样本对应的标签数据;确定深度学习模型的输入层神经元个数构建深度学习...
...发明专利授权:“基于改进孪生网络的电力设备图像缺陷判别方法...
专利摘要:本发明公开了一种基于改进孪生网络的电力设备图像缺陷判别方法,其步骤包括电力设备图像采集、数据清洗、数据增广、构建图像判别数据集、判别模型训练、实时推理和数据集更新与模型迭代。针对因图像训练样本收集难、缺陷特征不一致的设备缺陷类型进行了分析,构建了基于孪生网络结构的缺陷图像判别模型,提出了数据集更新...
ICLR 2024 | 鸡生蛋蛋生鸡?再论生成数据能否帮助模型训练
文中构造了四个不同规模的数据集:CIFAR-10、HalfCIFAR-10(CIFAR-10的一半)、CIFAR-10+10万张生成图片、CIFAR-10+100万张生成图片,通过改变randomresizedcrop(RRC)来反应不同的数据增广强度。下图4中表明最优数据增广强度随着数据规模的增大而减小(HalfCIFAR-10:0.02,CIFAR-10:0.08,CIFAR-10+0.1M...
「LLM-数学」MathScale: 用于数学推理的指令调优扩展方法
应对这一挑战的一种有效方法是利用前沿LLM(如GPT-3.5和GPT-4)扩充现有的高质量数学数据集。例如,WizardMath引入了一系列操作,供GPT-3.5生成复杂程度更高的数学题目。MetaMat通过答案增广、问题重述、自我验证和FOBAR问题,对GSM8K和MATH中的题目进行了引导。这些方法生成的新示例与训练集中的原始示例存在大量相似...
蚂蚁营销推荐场景上的因果纠偏方法
增广模块生成的尾标;P-UI与1—P-UI是无偏的Teacher模型和融合模型在当前样本的倾向分数;fp就是用来学倾向性分数的一个函数,通过学习fp自适应结合无偏数据的Teacher模型与当前的有偏数据训练的模型,共同为增广样本生成伪标记;通过这种方法来学习更复杂的pattern信息,fp通过Metalearning的方式...
Chronos: 将时间序列作为一种语言进行学习
数据增广TSMix通过组合两个以上的数据点,将Mixup数据增强概念(最初是为图像分类而开发的)扩展到时间序列数据(www.e993.com)2024年10月23日。它从训练数据集中随机选择一些不同长度的时间序列,对它们进行缩放,并创建它们的凸组合。这种组合的权重是从对称狄利克雷分布中得出的。KernelSynth则使用高斯过程合成数据生成。KernelSynth组装GP核来创建新...
如何用 AI 大模型打造个性化内容页面展示,提升用户阅读体验和内容...
数据增强是指将数据进行扩充和变换,从而提高数据的数量和多样性。数据增强的方法有很多,例如,可以使用人工智能大模型的数据生成、数据增广、数据对抗等技术,来自动地生成和变换数据中的新的样本和场景。数据处理的目的是为了构建用户的个性化画像和内容的个性化画像,从而为用户提供最适合他们的内容页面展示。数据处理的原...
特约文章丨多模态视觉结构学习
表2与Strcu-ture3D数据集上现有方法进行比较结果最后得到的结果就是我们希望有一个文本提示,比如Abedroomwithwhitewallsandapinkbed,就是segmentation的文本提示。如图7所示,我们采用的方法最后生成的结果都非常好,可控性也比较好,可以做到直接生成全景图像,即不需要做二维图像直接在三维球形上...
如何用大模型打造个性化内容页面,提升阅读体验和内容传播效果
数据增强是指将数据进行扩充和变换,从而提高数据的数量和多样性。数据增强的方法有很多,例如,可以使用人工智能大模型的数据生成、数据增广、数据对抗等技术,来自动地生成和变换数据中的新的样本和场景。数据处理的目的是为了构建用户的个性化画像和内容的个性化画像,从而为用户提供最适合他们的内容页面展示。数据处理的原...
2024北京智源大会开幕,智源推出大模型全家桶及全栈开源技术基座...
三、全球最大的开源中英文多行业数据集IndustryCorpus为加速推进大模型技术的产业应用进程,智源研究院构建并开源了IndustryCorpus中英文多行业数据集,包含总计3.4TB预训练数据集,其中中文1TB,英文2.4TB,覆盖18类行业,分类准确率达到80%,未来计划增加到30类。