数模国赛超全备赛指南,有了这个秘籍,国一咱是手拿8攥
C题:一般为经管/运筹/统计/数据分析类问题,这类题目一般背景较贴近生活,理解起来较容易,相对于AB题简单,所以一般选择C题的人最多,那么想要用C题拿奖就会相对困难,除非论文非常出彩。运筹优化类问题一般没有严格最优解,结果合理即可。常用的模型有:评价类模型、预测类模型、线性/非线性规划、单目标/多目标规划、神...
大模型数据建设探索与实践
从训练数据中挑选出与示例数据集样本梯度相似度最高的部分。3.现有方法分类与特点在后训练数据筛选的过程中,可以将方法大致分为两大类:模型类方法与指标类方法。模型类方法:依赖外部模型能力,计算开销大。指标类方法:计算效率高,潜在误差大。4.理想指标的探索在现有筛选方法的基础上,探索更为理想的筛选...
常用的相似度度量总结:余弦相似度,点积,L1,L2
余弦相似度余弦相似度(cos(θ))值范围从-1(不相似)到+1(非常相似)。从下图可以看出,点A(1.5,1.5)和点B(2.0,1.0)在二维嵌入空间中距离很近。当计算余弦相似度时,得到0.948的值也可以确认两个向量非常相似。当较点A(1.5,1.5)和点C(-1.0,-0.5)的相似度时,余弦相似度为-0.948,表明两个向量不相似。
OpenAI翁荔提出大模型「外在幻觉」:万字详解抵抗办法产幻原因…
非参数概率(NP):通过掩码LM计算原子事实中标记的平均似然度,并用其进行预测检索→LLM+NP:两种方法的集成关于模型幻觉行为的一些有趣的观察:在传记生成任务中,越稀有的实体的错误率越高在生成内容中较晚提及的事实的错误率也较高使用检索来为模型生成提供基础可以显著帮助减少幻觉现象Wei等人2024年还提出了...
城投债分析新视角:区域相似性量化逻辑
常见维度有区域经济、区域财政、区域债务率等。常见衡量方法有,计算选定维度下,各区域间绝对数值或排序值的差异。该做法虽能覆盖全量区域,但常受制于维度单一,维度内指标间分布不可比,使得难以有效、全面考量区域间的相关性;类别三,在特定范围内综合衡量各区域在经济、财政、债务等维度的定量指标的相似度。常见于对...
OpenAI华人女科学家万字详解大模型「外在幻觉」
非参数概率(NP):通过掩码LM计算原子事实中标记的平均似然度,并用其进行预测检索→LLM+NP:两种方法的集成关于模型幻觉行为的一些有趣的观察:在传记生成任务中,越稀有的实体的错误率越高在生成内容中较晚提及的事实的错误率也较高使用检索来为模型生成提供基础可以显著帮助减少幻觉现象...
一文详谈RAG优化方案与实践
原始RAG是最早的研究范式,主要包括以下几个步骤:建立索引:这一过程通常在离线状态下进行,数据清洗并分块,将分块后的知识通过embedding模型产出语义向量,并创建索引。检索:用户的query问题,使用相同的embedding模型,计算问题嵌入和文档块嵌入之间的相似度,选择相似度最高的前K个文档块作为当前问题的增强上下文信息。
OpenAI Lilian Weng万字长文解读LLM幻觉:从理解到克服
SelfAware包含1032个不可解答问题(分成5大类)和2337个可解答问题。不可解答问题来自带有人类标注的网络论坛,而可解答问题则来自SQuAD、HotpotQA和TriviaQA并且是根据与不可解答问题的文本相似度选取的。一个问题不可解答的原因是多种多样的,比如没有科学共识、是对未来的想象、完全是主观臆断、可能...
哈尔滨国铁科技集团股份有限公司 关于使用部分超募资金永久补充...
监事会认为:公司2023年度利润分配方案充分考虑了公司盈利情况、现金流状态及资金需求等各种因素,不存在损害公司中小股东利益的情形,符合公司经营现状,决策程序符合相关法律法规、规范性文件和《公司章程》的有关规定。三、相关风险提示本次现金分红方案充分考虑了公司的行业特点、发展阶段和自身经营模式、经营发展计划、未...
高校学报及社科类综合刊2024年第1期法学要目汇编
抽象使用利益的损失应当为一种财产性利益损失,原因有三:第一,抽象使用损失的范围可以凭借主观计算方法确定,物的抽象使用价值可以凭借“商业价值理论”获得财产价值属性,且其确定性要求并非绝对,仅需达到“相对确定”标准即可;第二,应当同等评价营利物的使用损失和自用物的抽象使用损失,加害人的侵权行为阻碍了权利人实现...