从DTCC2013到2024--11年数据库之旅:2013至2015篇
特别是CCOE其他团队的中国同事,更能理解我的特色英语,简直不要太欢乐。不过还是要说明一下,我们数据库团队的同事,还是给了我极大的帮助。我们的LeaderXfang,极少数另我佩服的人,我极少遇到纯粹在技术上胜过我的人。Xfang是极少数人之一。广博的Alex,潇洒的Tao,霸气的Gui,还有两位Andy,都在各种会议中帮助我。
细读2024年煤炭行业社会责任报告
ESG是英文单词Environmental(环境)、Social(社会)和Governance(公司治理)的缩写,即从环境、社会和公司治理三个维度评估企业经营的可持续性与对社会价值观念的影响。中国煤炭工业协会近日发布的《煤炭行业社会责任蓝皮书(2024)》(以下简称蓝皮书)指出,可持续发展已成为国际共识,ESG受到的关注与日俱增,新时代新征程上,煤...
细读2024年煤炭行业社会责任报告
ESG是英文单词Environmental(环境)、Social(社会)和Governance(公司治理)的缩写,即从环境、社会和公司治理三个维度评估企业经营的可持续性与对社会价值观念的影响。中国煤炭工业协会近日发布的《煤炭行业社会责任蓝皮书(2024)》(以下简称蓝皮书)指出,可持续发展已成为国际共识,ESG受到的关注与日俱增,新时代新征程上,煤...
百万token上下文窗口也杀不死向量数据库?CPU笑了
Volume(体量):即使上下文窗口越发得长,但和全网庞大的非结构化数据相比就是小巫见大巫;尤其是企业级动辄GB、TB这种体量,还涉及众多私有数据的情形。Variety(多样性):现实世界的用例不仅涉及非结构化数据,还包括各种结构化数据,它们可能不容易被LLM捕获用来训练;而且企业场景中往往知识是需要实时变化的。相反,RAG因为...
百川智能发布超千亿参数大模型Baichuan 3,医疗能力逼近GPT-4
Baichuan3的医疗数据集Token数超千亿,医疗能力逼近GPT-4。为了给Baichuan3注入丰富的医疗知识,百川智能在模型预训练阶段构建了超过千亿Token的医疗数据集,包括医学研究文献、真实的电子病历资料、医学领域的专业书籍和知识库资源、针对医疗问题的问答资料等。该数据集涵盖了从理论到实际操作,从基础理论到临床应用等各个方面...
科研工具 | 赶紧收藏!45个英文论文写作神网站(论文+语法+数据库+...
22IBM专利数据库资源:httpsibm/ibm/licensing/23Kaggle的数据资源:httpskaggle/datasets24超好用的英文学术资源搜索引擎:httpssemanticscholar/25提升LaTeX效率的小工具:httpdetexify.kirelabs/classify.html...
软件测试员,做了这么多年测试,这些专业英文单词你都知道吗?
DataDrivenTest数据驱动测试DocumentationReview文档审查DatabaseIntegrityTesting数据库完整性测试DataFlowTesting数据流测试DecisionTesting判定测试DynamicTesting动态测试DecisionConditionTesting判定条件测试DistributedTesting分布式测试...
Pinecone:大模型引发爆发增长的向量数据库,AI Agent的海马体
因此如果我们认为AI应用=LLM+交互+记忆+多模态,那么在后二者的实现中向量数据库都将扮演非常重要的角色。03.OPStack的P,Pinecone的发展之路在AI应用的开发者中,OPStack的心智已经慢慢传开:OpenAI+Pinecone。Pinecone作为目前向量数据库的领先者,大模型记忆的第一选择,接下来就来介...
24 个必须掌握的数据库面试问题!你确定你还不收藏吗?
在HEAP表中,如果存储的数据重复度很低(也就是说基数很大),对该列数据以等值查询为主,没有范围查询、没有排序的时候,特别适合采用哈希索引,例如这种SQL:#仅等值查询selectid,namefromtablewherename='李明';而常用的InnoDB引擎中默认使用的是B+树索引,它会实时监控表上索引的使用情况。
能动英语:高效记单词是英语学习的“捷径”
建立英语单词词汇数据库。表音密码把2600英语单词编辑成了一个结构完整的英语单词词汇数据库。根据18个元音,课程把2600单词分成了18个组,每个组又根据26个不间断音分成了若干数据阵列,每个数据阵列又根据携带重音的不间断音的前后辅音分成了若干个数据板块。英语单词词汇数据库的出现,彻底改变英语单词在孩子大脑中的无序...