“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B...
面壁智能官方公众号昨日(9月5日)发布博文,宣布推出开源MiniCPM3-4BAI模型,声称“端侧ChatGPT时刻到来”。IT之家附上MiniCPM3.0开源地址:httpsgithub/OpenBMB/MiniCPMhttpshuggingface.co/openbmb/MiniCPM3-4BMiniCPM3-4B是MiniCPM系列的第三代产品,整体性能超过了Phi-3...
全球3.5亿下载量破纪录! Llama家族暴涨10倍,开源帝国掀AI革命
GPT-4级别模型开源,最先带来的好处是,token的价格不断下降。AI大牛吴恩达在DeepLearning的博客中,算了一笔账:近期,OpenAI官宣降价后,GPT-4o的token成本,现在是每百万token4美元。(假设是80%输入和20%输入token混合率)还记得,2023年3月首发GPT-4时,每百万token的成本是36美元。博客地址:httpsdeep...
端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前
今年年初,面壁在初代面壁小钢炮发布时立下Flag:今年内让GPT-3.5水平的模型在端侧跑起来!没想到,面壁智能总是能给人惊喜,他们提前兑现了承诺,提前近4个月将其实现!MiniCPM3.0再次挖掘端侧模型的极致性能,仅4B参数,在包括自然语言理解、知识、代码、数学等多项能力上对GPT-3.5实现赶超,在Qwen2...
ChatGPT 发布近两年,4B 的端侧模型已经能够复刻当年的水平
发布之初曾经让无数人惊艳的ChatGPT3.5,目前已经能在端侧用40亿参数的小模型复刻了。9月5日,专注端侧模型的国内AI公司面壁智能,发布其最新的端侧基座模型。新模型参数仅仅4B,但是宣称性能超过ChatGPT-3.5Turbo,且长上下文表现优秀,函数调用(functioncalling)和RAG(检索增强生成技术)能力。端...
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
谷歌也来卷「小」模型了,一出手就是王炸,胜过了比自己参数多得多的GPT-3.5、Mixtral竞品模型。今年6月底,谷歌开源了9B、27B版Gemma2模型系列,并且自亮相以来,27B版本迅速成为了大模型竞技场LMSYSChatbotArena中排名最高的开放模型之一,在真实对话任务中比其两倍规模以上的模型表现还要好。
Meta发布最强开源AI模型,对标GPT4-o、Claude 3.5 Sonnet!英伟达...
Meta发布最强开源AI模型,对标GPT4-o、Claude3.5Sonnet!英伟达代工加持,扎克伯格:业内顶尖水准当地时间周二,美国科技巨头Meta发布了其最强开源人工智能(AI)模型Llama3.1,拥有三个不同的版本(www.e993.com)2024年10月17日。扎克伯格称其为“业内顶尖水准的”AI模型,并表示能够与OpenAI和谷歌等竞争对手的类似产品相抗衡。Meta的公告显示,...
最强国产多模态刚刚易主!腾讯混元把GPT-4/Claude-3.5都超了
国产大模型,多模态能力都开始超越GPT-4-Turbo了??权威榜单,中文多模态大模型测评基准SuperCLUE-V,新鲜出炉:特别是腾讯的hunyuan-vision、上海AILab的InternVL2-40B,分别成为国内闭源和开源界两大领跑者,甚至超过Claude-3.5-Sonnet和谷歌王牌Gemini-1.5-Pro。虽然这次都还是被GPT-4o压过,差距也确确实实...
...Llama 3.1 开源大语言模型:128K 上下文长度,405B 版可与 GPT-4...
Meta发布Llama3.1开源大语言模型:128K上下文长度,405B版可与GPT-4o和Claude3.5Sonnet媲美IT之家7月23日消息,Meta今晚正式发布Llama3.1开源大语言模型,提供8B、70B及405B参数版本。据介绍,Llama3.1系列改进了推理能力及多语言支持,上下文长度提升至128K,首次推出405B参数的...
还不如人类五岁小孩,难度为零的视觉测试,GPT-4o、Claude 3.5...
GPT-4o、Claude3.5Sonnet等具有视觉能力的大语言模型(LLM),是否能像人类一样感知图像?最新研究表明,在一套人类非常容易完成的7项视觉任务(比如两个圆是否重叠、两条线是否相交等)中,Claude3.5Sonnet等四种最先进的视觉语言模型(VLM)的平均准确率只有56.2%。它们似乎并不是在真正地“看”,而是在做...
力压GPT-4o!新王Claude 3.5 Sonnet来了,直接免费可用
Claude、GPT、Gemini三个模型迭代发布时间线。Anthropic称其目标是每隔几个月大幅度改进性能、速度和成本之间的权衡曲线。今年晚些时候将发布Claude3.5Haiku和Claude3.5Opus。除了开发下一代大模型之外,Anthropic正在开发新的模式和功能,以支持更多企业用例,包括与企业应用程序的集成。团队还在探索诸如...