商业模式不正当竞争诉讼的利益平衡司法裁判实践
针对数据传输、爬取商业模式,脉脉非法抓取微博用户信息案[11]中,该案的二审法院罕见地直接以脉脉通过用户上传手机通讯录展示非脉脉用户的微博信息,“损害了非脉脉用户的知情权和选择权”作为独立判断的依据,认定其行为构成不正当竞争。[12]在广州某信息科技有限公司与广州某科技有限公司深圳分公司等不正当竞争纠纷案[1...
熬夜会让人快乐么?_澎湃号·湃客_澎湃新闻-The Paper
这篇论文首先抓取了含特定关键词(如熬夜、修仙、夜猫子或生活、打卡、记录)的用户,并爬取用户们在2021年1月至12月之间所发布的全部微博,而后剔除如发言频率过低(总数小于20条)、注册时间过短(一年以下)、粉丝量过多(大于3000关注)的用户。最终获得了3448条一线城市用户发言数据与3754条其他城市发言数据。变量方面...
我也想和世界说说话:从线上到线下,抑郁症患者的表达和行为
我们在2019年11月15日爬取了新浪微博带有“抑郁症”关键词的5000条原创微博,以及“抑郁症超话”下的8982条原创微博,希望能读懂这些被抑郁症所困扰的人群对世界说的话。外面的世界:提到抑郁症时,我们都在说什么?当人们在微博上提到抑郁症时,他们在说什么?在微博,有人描述着抑郁症患病过程的种种情绪与经历;也...
吃保健品“上瘾”的年轻人_澎湃号·湃客_澎湃新闻-The Paper
以“保健品”为关键词检索微博,爬取593条微博内容进行情感分析,可以发现人们对保健品的作用评价中,正面与负面评价数量不相上下。吃保健品“上瘾”的年轻人,大都明白保健品的功效就像薛定谔的猫,但依旧说服自己去相信这是一项对身体的长期投资,五年、十年、二十年后,总有一天它会显示出神奇的魔力。半年前,吴沛成功...
我们在谈论“内卷”时 究竟在谈论什么?
我们以“内卷”为关键词,爬取了微博综合搜索下的最新50页内容、知乎问题“什么是社会内卷化?”以及豆瓣话题“你所在专业或从事行业有哪些‘内卷’现象”的所有回答(数据说明见下图备注),尽管带着“万物皆可卷”的预设,但完成词频统计后,话题延展的广度仍让我们感到吃惊...
没有红毯但有400万次线上讨论:数据解读这届上海电影节的特别气质
而“国际”和“疫情”也是热度较高的关键词(www.e993.com)2024年11月17日。作为2020年首个A类国际电影节,本届上影节意味着中国电影市场走出漫长寒冬的开始,“疫情时期的电影价值”也是热议的话题。此外,还有展映、红毯、大师等高频词,体现了网友们对电影节最关切的,还是其本身丰富多彩的内容。
《中国焦虑图鉴》:你每天使用的App上都布满了网络爬虫
你想想看,如果我能随心所欲地指挥一帮机器人,打开某人的微博,然后刷到某一条,然后疯狂关注、点赞或者留言,这不就是标准的僵尸粉上班儿的流程么。。。其实,僵尸粉都只是爬虫的常规操作,更骚的来了:我是一个路人甲,我的微博没人关注,我用大量的爬虫,给自己做了十万人的僵尸粉,一群僵尸在我的微博下面点赞...
爬虫最爱扒的50家网站:一份赤裸裸的《中国焦虑图鉴》
1、我是一个路人甲,我的微博没人关注,我用大量的爬虫,给自己做了十万人的僵尸粉,一群僵尸在我的微博下面点赞评论,不亦乐乎。2、我去找一个游戏厂商,跟他说:你看我有这么多粉丝,你在我这投广告吧。我帮你发一条游戏的注册链接,每有一个人通过我的链接注册了游戏,你就给我一毛钱。广告主说,不错,就这...