万字长文解构中国如何复刻 Sora:模型架构、参数规模、数据规模...
2024年2月29日 - 腾讯新闻
当各种模态的数据都压缩到同一个隐含的空间后,模型需要在隐含空间进行对齐或转换。具体来说,训练时是对齐,推理时是转换。比如说文生视频,训练时主要是寻找文本和视频之间、以及视频内部在时空维度的对应关系,推理时是把文本Prompt转换成视频。这个步骤又有两个维度的选择:-网络框架(U-netvsTransformer):...
详情
如何用python破解pdf的密码
2020年10月12日 - 网易
下载pdf2john.py将受密码保护的PDF放在当前目录中,我的名为foo-protected.pdf,然后运行以下命令:root@bfw:~/pdf-cracking#python3pdf2john.pyfoo-protected.pdf|sed"s/::.*$//"|sed"s/^.*"|sed-r's/^.{2}//'|sed's/.\{1\}$//'>hash这会将PDF密码哈希提取...
详情
语言大模型100K上下文窗口的秘诀
2023年2月3日 - 腾讯新闻
为训练具有较大上下文长度Transformer,我们的解决方案是将其分为两个阶段进行训练:首先在2K个词元的上下文长度上训练基本模型,然后继续在更长的上下文中进行训练(微调),例如65K或100K。MosaicML就采用这种方法。但问题是,原始的Transformer架构无法直接实现这一点,因此需要使用一些技巧(请参阅后文的技巧1)。3多头注...
详情
太空辐射都杀不死的生物,被人类终结了|宇宙|熊虫|月球|地球|着陆...
2023年8月2日 - 网易
普通的气枪子弹速度通常不会超过500米/秒,但肯特大学的这台二级轻气枪,射速可以在0.3千米/秒到7.5千米/秒间任意调节。为了模拟宇宙中不同天体的环境,研究人员还能用液氮将子弹靶向的目标冷却到100K(约-173°C),或是加热到1000K(约727°C)。用这样高级的气枪发射体长不过1毫米的水熊虫,可真算得上是“大炮打蚊...
详情