萨摩耶云科技集团新专利:深度挖掘文本特征,推动金融高质量发展
深度挖掘文本特征,精准识别关键信息在移动互联网时代,我们的生活、学习和工作中会产生海量非结构化文本数据,为了向用户提供更好服务,需要通过机器学习分类模型进行分析。首先要将非结构化数据进行结构化,以提取特征。通常采用分词和One-Hot编码来获取词向量,构建高维稀疏矩阵。然后使用分类算法对分词分类并进行筛选降维,...
TextCNN(卷积神经网络用于文本)
一、主要特点1.词嵌入(WordEmbedding):将词汇映射到高维空间中的向量,这些向量能够捕捉词汇的语义信息。2.卷积层(ConvolutionalLayer):使用不同大小的卷积核在文本上滑动,以捕捉不同长度的局部特征。每个卷积核对应一个特征图(featuremap),可以捕捉到不同大小的n-gram特征。3.池化层(PoolingLayer):...
媒体融合中的新闻文体遮蔽:表现与规避
数字新闻业的特点是行业壁垒被打破、边界日渐模糊,媒体呈现出开放、互动、去中心化的特征,这对于专业媒体来说是把“双刃剑”,既要充分享用社交媒体平台的影响力,又要不被其反噬,在规范写作的同时,必须创新实操方法以坚守文体观念。如果专业媒体还是基于现在微信公众号普遍采用的“消息、视频号、服务”三大块分类,...
《传媒观察》|主流媒体新闻海报传播取决于哪些变量
许多研究都表明,内含悲剧视觉框架的新闻图片能引发负面情感,更容易引发新媒体用户的搜索和转发等互动行为;由于人物刻画的特点能揭露新闻海报生产者深层次的意识形态,包含人物形象的海报常常受到特别的关注;近年来,新媒体平台的标题生产也开始摆脱传统规则,大量使用感叹号、问号等带有主观情感倾向的标点符号,达到吸引用户的效果。
2023中国新闻业观察报告:重思数字新闻实践|《新闻界》
业态变迁、专业反思三个维度出发,归纳总结本年度中国新闻业的主要特征:专业媒体通过重大事件主题报道体现专业权威,还原多维现场呈现专业报道,持续打造矩阵化传播格局;自媒体、机构媒体持续开展多元内容生产实践;专业媒体影响力面临影响力减弱的风险,流量化和戏谑化内容广泛传播,大模型带来虚假新闻可能,这些问题促生了新的隐忧...
粉丝圈群的社会参与逻辑:文本产消与数据生产连结模式的比较研究
1.文本实践与自我动员模式我们通过访谈发现,粉丝文本实践对社会参与的影响机制体现出连结式自我动员的特征(www.e993.com)2024年11月16日。在数字时代,社交媒体使用者会受社交网络好友的态度和行为等外部因素影响,出于获得同侪认可、积累社会资本等目的,形成社会参与的自我动员。在数字平台时代,官方产制文本的中心性下降,粉丝在商业社交媒体平台聚集,消...
热搜代表民意?大众媒体对热点算法的合法性话语建构
1.文本分析与深度访谈为了回答RQ1,本研究搜集了微博发布的年度报告、新闻稿,以及“微博热搜榜”“微博搜索”“微博管理员”“微博客服”“微博小秘书”等官方账号发布的公开声明,从中找出与“热搜”“规则”“计算公式”等相关的内容。基于对上述材料的文本分析,并结合已有研究(王茜,2020),梳理热搜上榜规则和计算...
陈登坤对话海螺AI:大模型激活另类数据价值(上)
2.特征提取:1)深度学习:使用卷积神经网络(CNNs)处理图像数据,递归神经网络(RNNs)和长短期记忆网络(LSTMs)处理序列数据,如文本。2)NLP技术:如词嵌入(WordEmbedding)将词语转换为连续的向量表示,捕获词之间的语义关系。3.模型训练:1)预训练:在大规模数据集上训练模型,使其学习到丰富的特征表示。
崔凯:表达性与工具性:数字身份的起源与变迁|刘德寰|认同性|中国...
表达性数字身份为内在基底,意味着个体的数字内容和文本意义生产、象征资本、数字性格与人格魅力等质量属性;工具性数字身份是外在表征,意味着个体在社会空间获取资源的能力与权力地位,两者相互影响也相互转化。与数字社会身份类似,传统社会身份也体现出文化性与工具性一体两面的特征。沈艾娣对清末举人刘大鹏的研究表明,身份变...
郭全中 朱燕:主流媒体的年轻态表达方略
第一,警惕泛娱乐化和弱思想性带来的语态失态。适当选用网络新词能拉近主流媒体与年轻用户的距离,增强内容的互动感和社交感。但网络用语一般都具有泛娱乐化和弱思想性的特征,不加节制、不分场合地使用网络用语可能会破坏语言生态。而在面对严肃社会新闻、灾难新闻或敏感、有争议的新闻话题时,则更应谨慎使用。