第一篇学术演讲准备两个月,去了谷歌却做不了深度学习,听Facebook...
从零道一:CMU也有很多专业、实验室可以选,当时是怎么决定选哪个组、关注哪个领域的?田:这个需要跟导师有很多的交流。在刚入学的时候,CMU有一个「marriageprocess」,就是说你要跟导师达成一个5年的协议。所以,你要跟很多导师聊,聊他们的研究方向、研究思路,还有就是跟学生去聊,问一下他们的出路,他们可...
机器学习8个核心概念
设(X,y)为向量X对应的y,同时假设机器学习获得了一个分类器的模型F,F的输入为向量X,输出为y'。则可以很自然地定义式(4-2)所示的误差函数。该误差函数的含义很明显,即当预测值等于真实值时,误差为0,否则为1。表示的是单个样例的损失,对于整个样本集的误差可表示为其求和。如果值很小或为0,则表示分类模...
新全球资产配置白皮书:半个世纪的历史回测带你看全球资产配置
资产配置应该是大部分投资人最应该要做的事:不管你的可投资资产是10,000元,还是100,000,000元,虽然做法肯定会不一样,但是道理都是相通的。特别是在过去的十几年间,伴随着中国经济的快速发展,投资人的财富累积效应十分明显。随着财富的增长,合理的保值和增值,就会越来越重要。但这是一个信息大爆炸的时...
陆磊:大数据、金融科技可能会加剧危机
根据最简单的国民收入决定三部门IS—LM—BP模型,所谓开放无非是在封闭模型下加一个条件——EX-IM(ε),其中,EX是出口,IM是进口,两者的差是净出口,取决于自变量ε——实际汇率。同时,在货币市场上,模型仍然把货币供给作为外生变量,货币需求则取决于国民收入和利率。我想说的是,这种理论抽象过于简化,与现实中...
绝对干货!NLP预训练模型:从transformer到albert
以数组为例,2个长度是len,均值是0,方差是1的数组点积会生成长度是len,均值是0,方差是len的数组。而方差变大会导致softmax的输入推向正无穷或负无穷,这时的梯度会无限趋近于0,不利于训练的收敛。因此除以len的开方,可以是数组的方差重新回归到1,有利于训练的收敛。
「Deep Learning」读书系列分享第二章:线性代数 | 分享总结
跟向量有关的两种运算,一种是内积,第二种是外积(www.e993.com)2024年8月5日。根据定义,内积会生成一个数,外积会生成一个向量;需要根据右手坐标系来定方向,保持手掌、四指与大拇指相互垂直,将手掌与四指分别对应两个向量,一比划,就得到大拇指的方向,大小就按照sin这个公式算出来。