《Python机器学习》作者科普长文:从头构建类GPT文本分

2024年10月28日 - 网易

num_classes=2model.out_head=torch.nn.Linear(in_features=BASE_CONFIG["emb_dim"],out_features=num_classes注意,在上述代码中,我们使用了BASE_CONFIG["emb_dim"],它的值在“gpt2-small(124M)”模型中为768。这样做的目的是为了让后续的代码更加通用,相同的代码也能处理其他型号的GPT...

详情

以图灵机为师:通过微调训练让大语言模型懂执行计算过程

2024年10月18日 - 新浪新闻

实验使用LLaMA3.1-8B预训练模型作为基础模型,在+、??、×、÷、==、>和<这7个运算符上和三个基准进行了比较:1)LLaMA3.1-8B预训练模型基于LoRA、在仅给出计算结果的数据集上直接微调得到的模型、2)LLaMA3.1-8B-Instruct、3)GPT-4o。表1.七种运算符的总体评估结果,“LLaMA3.1(L)...

详情

《储能科学与技术》推荐|万佳雨等:基于大语言模型RAG架构的电池...

2024年10月31日 - 新浪

他们以电池快充为例,通过文本嵌入技术将文本数据转化为向量表示,搭建电池快充数据库;将用户提问向量化,基于余弦相似度在快充数据库中检索相关信息,再通过Battery-GPT生成精确的答案。通过逐层增加输入提示词的精确度,Zhao等展示了Battery-GPT在应对强专业性垂直领域问题时回答的精确性和可信度,如图2中展示的负极材料设计...

详情

产品经理的AI基础,通俗理解 ChatGPT 的含义

2024年9月4日 - 腾讯新闻

1.GPT-1OpenAI的首个生成模型用于文本生成任务2.GPT-2(开源)继GPT-1之后的进一步发展特点是能够生成连贯的文本模型参数较少,但在当时表现出色已开源,允许研究者和开发者使用和修改3.GPT-3(生成式)可以给prompt(提示词),它负责补全(completion)。但是用于聊天不是很好用,因为本来就不是为聊...

详情

大模型自我奖励:Meta让Llama2自己给自己微调,性能超越了GPT-4

2024年1月20日 - 腾讯新闻

最近,来自Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,给人带来了一点新的震撼。在新方法中,作者对Llama270B进行了三个迭代的微调,生成的模型在AlpacaEval2.0排行榜上优于一众现有重要大模型,包括Claude2、GeminiPro和GPT-4。

详情

AI慢思考蒸馏进快思考,Llama2跃升至GPT-4水平,不写过程也能做对题

2024年7月12日 - 新浪新闻

可以看到,在两个数据集中,Llama-2的表现(人类一致性)分别从32.0%和28.1%,提高到了58.4%和72.4%,最高增幅达到了257%,比CoT方法更加有效(www.e993.com)2024年10月31日。而且,微调后的模型均超过了系统1版的GPT-4,甚至达到了GPT-4配合CoT的水准。同时(改变选项位置后的)不一致性也大幅降低,而且和系统2相比,Token数量少到几乎可以忽略不计...

详情

...复刻Sora,华人团队长文解构!996 OpenAI研究员:Sora是视频GPT-2...

2024年2月29日 - 腾讯新闻

01OpenAI研究员JasonWei表示,Sora代表着视频生成的GPT-2时刻,具有长期一致性、近乎完美的逼真度和创作有深度的故事情节。02华人团队发布37页技术报告,详细分析Sora的开发背景、所依赖技术、应用前景和面临的挑战。03然而,Sora的训练成本高达千万美元级别,目前各家公司尚未推出类似功能。

详情

一篇文章系统看懂大模型

2024年10月22日 - 腾讯新闻

1)能力差异上:Transformer架构是让模型具备理解上下文、处理大量数据、预测文本的能力,但是还不具备理解自然语言、生成自然语言的能力;而GPT在增加了自然语言的预训练之后,具备了理解和生成自然语言的能力;2)架构基础上:Transformer:原始的Transformer模型由一个编码器和一个解码器组成,编码器处理输入序列,生成中间表示...

详情

无需RLHF显著提升GPT-4/Llama2性能,北大团队提出Aligner对齐新范式

2024年2月7日 - 澎湃新闻

在RLHF框架下,针对不同模型(如Llama2,Alpaca)的微调不仅需要重新收集偏好数据,还需在奖励模型训练及RL阶段调整训练参数。而Aligner通过一次性训练,可以支持任意模型的对齐。例如,仅需要在修正数据集上训练一次,Aligner-7B可以对齐11种不同模型(包括开源模型、API模型如GPT),并在帮助性和安全性方面...

详情

微调大语言模型,科学家开发化学文本挖掘新方法

2024年6月15日 - 科学网

6月7日,中国科学院上海药物研究所研究员郑明月课题组在五项化学文本挖掘任务上对多个大语言模型的能力进行了全面综合的探究,展现了微调大语言模型成为一种通用高效的生成式文本挖掘方法,为大模型的落地应用提供参考。相关研究发表于《化学科学》。近两年,以ChatGPT为代表的大语言模型(LLM)引领了人工智能和自然语言处理...

详情

查看更多

gpt2 微调