商业模式不正当竞争诉讼的利益平衡司法裁判实践
在“软件及其用户评论数据”商业模式的“同花顺”软件数据不正当竞争案[4]中,同花顺公司和灯塔公司竞争的关键在于用户量和信息量及便利度,而信息量、用户量及便利度是互为增长、互相促进的关系,信息量越大、便利度越高,则吸引用户越多,而用户越多,信息量也越大,便利度也会增加。灯塔公司复制同花顺公司评论信息的行...
年轻人的苦,寺庙都清楚
从1月份到3月份,与“寺庙”相关的话题更是频频上微博热搜。以“年轻人寺庙”、“寺庙旅游”、“年轻人上香”、“寺庙咖啡”作为搜索关键词,在微博搜索出共计57条的微博话题,总阅读量达6.4亿,总讨论量达6.6万。当中,以“为何寺庙旅游在90后00后中爆火”为代表的4个话题更是获得了高热度、高关注。图2“寺庙...
我们开发了一个“微博评论脱水器”,给各位明星挤挤水
我们可以将此理解为流量明星“数据注水”行为的一部分。为了观察和研究微博上的“注水评论”,DATAMUSE选择了一些微博账号,爬取了他们各自微博下的10000条用户评论,计算出了他们每个人整体的微博评论“注水量”。你可以看到各类微博账号的“注水量”排名这里有流量明星,也有“正常”大V作为对比参考。相较于普通的...
分析30万条微博评论,看毕业生与翟天临的爱恨情仇
毕业临近,因为年初翟天临学术造假事件,很多学校将论文通过的难度由easy提升到hard,查重率由以往普遍的30%降为20%、15%甚至10%……为了降重,这届毕业生的扩句,倒装、同义词替换、句型转换等能力都得到了显著提升。为了探索这个有趣的现象和背后的问题,我们爬取了翟天临2月道歉微博下的30万余条评论。▍事不关...
民族地区探索计算传播学的应用实践——评《计算传播学与网络爬虫》
网站的数据采集详细步骤与过程等;第六章讲解使用八爪鱼软件实现基于关键词的微信公众号爬取,包括微信公众号名称、文章内容、标题等基本信息;第七章讲述使用八爪鱼爬取微博博文评论,包括微博用户、评论内容、转发数据等;第八章讲解如何使用谷歌开发者工具进行网页分析,使用八爪鱼对百度指数与百度搜索风云榜进行数据爬取。
我也想和世界说说话:从线上到线下,抑郁症患者的表达和行为
根据世界卫生组织发布的数据[1],2015年全球超过3亿人罹患抑郁症,约占全球人口的4.3%(www.e993.com)2024年11月17日。在中国,每100个人中,至少有3个抑郁症患者。我们在2019年11月15日爬取了新浪微博带有“抑郁症”关键词的5000条原创微博,以及“抑郁症超话”下的8982条原创微博,希望能读懂这些被抑郁症所困扰的人群对世界说的话。
没有红毯但有400万次线上讨论:数据解读这届上海电影节的特别气质
而“国际”和“疫情”也是热度较高的关键词。作为2020年首个A类国际电影节,本届上影节意味着中国电影市场走出漫长寒冬的开始,“疫情时期的电影价值”也是热议的话题。此外,还有展映、红毯、大师等高频词,体现了网友们对电影节最关切的,还是其本身丰富多彩的内容。
《中国焦虑图鉴》:你每天使用的App上都布满了网络爬虫
我是一个路人甲,我的微博没人关注,我用大量的爬虫,给自己做了十万人的僵尸粉,一群僵尸在我的微博下面点赞评论,不亦乐乎。我去找一个游戏厂商,跟他说:你看我有这么多粉丝,你在我这投广告吧。我帮你发一条游戏的注册链接,每有一个人通过我的链接注册了游戏,你就给我一毛钱。广告主说,不错,就这么办。
舆论影响力,适应性学习与货币政策有效性 ——基于公众预期管理的...
(为区分媒体信息和央行信息,媒体信息中剔除了对央行公布信息的原文转载类文本);通过文本处理获取上述新闻报道中有关未来预期变化的信息数量,包括物价上涨/下跌,通货膨胀压力/风险,通胀紧缩压力/风险,CPI同比上升/下降等相关报道及评论,得到媒体信息披露变量.爬取出的关键词根据出现的频率绘制成词云图如图3...
吃保健品“上瘾”的年轻人
人们在微博中对保健品的褒贬程度不相上下注:共统计微博正文593条,其中正面评价307条,负面评价286条以“保健品”为关键词检索微博,爬取593条微博内容进行情感分析,可以发现人们对保健品的作用评价中,正面与负面评价数量不相上下。吃保健品“上瘾”的年轻人,大都明白保健品的功效就像薛定谔的猫,但依旧说服自己去相...