模因传播动力学模型:解析网络文化基因的传播机制

2024-08-03 07:01:24

模因卡片组 | ©.cards

介绍

模因(又译为迷因、梗),俗称“梗”,是指依赖宿主、像基因一样复制传播的“文化基因”。今年有一篇论文构建了模因在互联网上传播的驱动力。本文将详细介绍这项工作。

目录

1 传统疾病传播模型概述

2 模因如何传播

3 模因传播的基本模型

4 模因传播的混合通用模型

5 验证数据集概述

6 参数拟合

7. 预测表情包的流行程度

8 与疾病模型的比较

自从《自私的基因》中首次出现以来,模因(meme)这一概念逐渐演变成广泛传播的迷因。与生物基因相比,模因是指文化中具有固定传播功能的成分。正如霍夫施塔特所说,它就像大脑间跳跃的火花,引人关注、不断传播。例如艺术中的哥特风格,电影类别中的僵尸电影。​​在互联网上,模因可以是一种观点,一部电视剧的热潮,或突然流行的表情符号或流行语。

过去,互联网上信息传播研究最多的话题是疾病的传播。然而,由于 meme 背后的传播机制不同,其在社交网络上的传播呈现出不同的规律。本文建立了 meme 传播的数学模型,并在豆瓣、微博等数据集上验证了模型的预测精度。本文将以此篇论文为背景,向读者介绍 meme 传播背后的规律。

基于人类的模因模型

模因_模拟定位助手_模拟

1 传统疾病传播模型

模拟定位助手_模拟_模因

图 1:四种疾病传播模型的说明。

S-易感人群()

I-感染人口()

E- 暴露于抗原环境的人()

R-抗体群恢复率()

现有的疾病传播模型可以为我们研究迷因传播提供灵感和工具。图1展示了如何从简单到复杂一步步建模疾病传播的过程。图中的S为易感人群(),代表可能被感染的总人数。其中,β%的人被感染(),然后μ%的人被治愈,治愈的人体内有抗体,不再被感染,这是SIR模型所描述的情况,如果所有的人都能被治愈,那么就是SIS模型。如果感染的人有一定概率抗体消失,重新进入易感人群,那么就属于SIRS模型。SEIR模型在SIR模型的基础上增加了暴露()这一步骤,用来描述并不是所有的易感人群都会接触到病毒。

在上述疾病模型下,人群中感染过病毒的人数占比会呈现图2所示的趋势,最初疾病随机小规模爆发和消退,随后进入指数增长阶段,之后在SIS模型中,大部分人都曾感染过流感病毒等,最终会康复;在SIR模型中,指数增长之后,随着越来越多的人获得抗体,感染病毒的人数会逐渐减少,回到0点,比如人类最终通过疫苗消灭了天花病毒。

模拟定位助手_模拟_模因

图 2:SIS 和 SIR 模型中感染个体随时间变化的示意图 | ©

2 模因的传播有何不同

模拟定位助手_模拟_模因

图 3:模因传播与基因进化的区别

模因和电影数据

图 3 出自今年 5 月发表的一篇论文,该论文主要探讨了 meme 的演化动态及其在电影风格中的应用。这里借用它是为了说明 meme 与基因演化的三个区别:

任何模因都有一个或多个“父母”,而不仅仅是两个;模因突变不是来自罕见的点突变或父母之间的单纯重组,而是来自连续的、大规模的变化;基因的传播可以跳过父母这个中间层,直接从第一代传播到第三代。

这三点说明,模因的进化更像微生物的进化,可以有水平的基因交换,一种细菌可以直接“借用”另一种细菌有用的基因片段。

由于迷因的演化与微生物的演化较为相似,因此迷因流行度的建模也应优先考虑已有的微生物群落建模,由于重点在于迷因的传播和流行度,后续的模型将不会考虑迷因本身的变化,这里的解释是为了让不熟悉迷因的读者对这个概念有一些直观的认识。迷因可以复制、传播和演化。

3 模因传播过程的三个状态

用微生物的进化过程来模拟模因的传播,从而构建出一个不同于疾病传播的基本模型,下面会详细阐述。

模因_模拟定位助手_模拟

图 4:细胞和模因的生命周期比较

上图是从微生物“传播”模型到迷因传播模型的仿生过程示意图。红色描述了细菌群落的演变过程。细菌分裂成多个细胞,然后一些细胞存活,一些细胞死亡。以迷因为例,电视节目的谣言和推荐最初也是由一小部分人转发的。一些人随后成功受到迷因的影响,而另一些人则无法受到它的影响()。

以一个 7 人群体为例,图 5 和图 6 展示了四个模因 M1、M2、M3、M4 在他们之间的传播情况。

模拟_模拟定位助手_模因

图 5:模因传播示意图

图 5b 显示了四个 meme 在七个用户身上的生命周期,图 a 显示了在此模拟时间段内哪些用户受到了 meme 1-4 的影响。图 b 是图 a 的详细图,其中六边形表示用户传播 meme 的行为。

如图5c所示,对于每个模因,都有三种可能性,这个人要么在下一刻以PF的概率传播该模因,要么以PW的概率否认该模因。在PW中,这个人仍然相信该模因,但不传播它的概率。图d和图b都描述了模因的状态,但它们从用户的视角切换到了模因自身生存的视角。图d显示了上述4个模因在7个用户心中随时间变化的总状态。此图可以类比为微生物模型中的分裂、生存和死亡。

4 社交网络对模因传播的影响

模因_模拟_模拟定位助手

图 6:表情包在社交网络上的传播

上述基于代理的模型只是基础模型,没有考虑社交网络中人际互动的影响。只有进一步加入网络动态建模,才能构建预测 meme 流行度的混合通用模型。如图 6 所示,研究者考虑了群体间分离的影响,提出了关于 meme 传播的三个基本假设:

用户被某个 meme 影响(比如读一本书)的过程叫做激活。这个人被激活的概率是围绕他身边激活人群比例的函数分布。当只有少数人追剧时,很难被播种,随着比例增加,概率增加,当人数增多,所有用户都已经被覆盖,meme 的传播进入平台期。(左图)如图所示,某个用户两次活跃时间的间隔呈现幂律分布,也就是对于某个用户来说,他在 20% 的时间段极其活跃,参与的 meme 传播或接收动作次数占到总数的 80%(以 80% 为类比),其余时间基本不参与 meme 的传播。当一个用户传播一个 meme 时,有一定概率 p 会传播他之前接收过的 meme,并以 1-p 的概率重播旧 meme。

在这三个假设中,最重要的是第一个假设,它描述了人际传播对模因传播影响的非线性增长。函数是描述非线性增长最常用的函数。在这个模型中,对函数变体

公式 1:功能改进

从数学角度看,对于某一模型,特定的参数B和C分别决定了函数的陡度和横轴上偏移量的大小。从模型的实际意义来看,可以形象地理解为:B为传播时间,值越小,模因达到传播速度最高点所需的时间越长,值越大,模因传播模式越接近爆发式增长;当时间到达C点时,模因正以最快的速度传播,模因正处于巅峰时期。C值越大,模因酝酿的时间越长,C值越小,爆发点到来得越早。

模拟定位助手_模拟_模因

图7:整个建模过程示意图

5. 具体数据中的模因

在这篇预印本论文中,使用了三种不同类型的数据集:美食推荐网站,豆瓣图书、电影和音乐,以及微博上的转发数据。对于美食网站,收藏一家餐厅被认为是一次传播 meme;对于豆瓣,给一本书/一部电影/一首音乐打分被认为是一次传播 meme;而微博上的转发被认为是一次传播 meme。如果再次提及,就相当于这个 meme 被一个新的 meme 覆盖了。

模因_模拟_模拟定位助手

表 1:数据集的基本属性

上表显示了所用数据集的大小和特征。对于不同时长的数据集,研究人员对其进行了标准化,以方便分析。这个数据集最令人吃惊的是用户数量:用户数量比读书和音乐少一个数量级,但 meme 的数量,也就是包含的电影数量最多,电影记录数量也是最多的,这表明豆瓣电影用户是更为重度的用户。豆瓣网站的用户数量比豆瓣高出 2 个数量级,但在网络中传播的 meme 数量却处于相似的水平。这表明这些数据集不仅在内容上存在差异,而且在网络的结构(例如稀疏性)上也存在差异。

6 从真实数据估计模型参数

有了模型和数据,接下来就是从真实数据中拟合出模型的参数,下表是不同数据集拟合出的参数。

模拟_模拟定位助手_模因

表2:模型训练后的参数

这里美食网站有两个操作:将餐厅加入收藏夹和从收藏夹中移除该餐厅,所以就有对应的两个B和C。我们先来看α和ρ,它们是决定用户分享频率和优先级的参数。假设转发时间间隔呈幂律分布,α是幂律函数中唯一的参数,α越大,转发越频繁。ρ是人们转发新消息的概率,ρ越接近1,人们越倾向于传播新信息。

民以食为天,美食类网站用户两次活跃间隔时间平均是所有网站中最短的;豆瓣电影用户量大,活跃间隔时间第二短;读书需要的时间较长,用户活跃间隔时间也相对较长,符合预期。

另一个有趣的发现是,豆瓣网站的B值和C值比较接近,也就是说,无论是电影、书籍还是音乐,艺术作品和文学作品背后的模因的传播模式平均来说比较类似,而且是以一种比较温和的方式进行。

最让人意外的是,微博与美食网站拟合的B均为0.24,这意味着美食网站和微博上的表情包传播更具爆发力,美食和短信的吸引力更大,更容易吸引人们传播。虽然微博上也有一些网红餐厅,但其主流是以娱乐资讯为代表的实时新闻,两者的触发点是一样的,或许这可以用进化心理学来解释,人们评价新闻是否值得转发,而评价美食好坏背后的动机也类似。美食网站有将餐厅从收藏夹中移除的选项,数据拟合的B和C值分别为0.4和0.8,也就是说,当人们开始对一家餐厅失去兴趣时,会以更快的速度放弃它。

由此我们可以知道,当一个社交网络中大约有50%的用户都在传播伪科学、假新闻等无效信息时,那么这个社交媒体就会开始快速失去用户,从最早的天涯到后来的人人网都是如此。

7 模型预测结果及其含义

模因_模拟_模拟定位助手

图 8:模因流行度预测

图8中横轴为归一化后的时间,纵轴为某个meme流行起来的潜力。当P等于1时,意味着在数据集覆盖的时间段内,meme的传播量和用户数量以1/100的流出量达到均衡。图中,无论是黑色虚线代表的模拟结果,还是理论计算出来的蓝色虚线,根据数据拟合的参数对Pn的预测几乎没有误差,这说明模型包含了对影响meme传播的全部因素的研究,并且适用于各种截然不同的网络。

Pn 的计算公式如下,St 为某一时刻该 meme “存活” 的用户数量,Wt 为收到该 meme 但未受影响的人数(),Ft 为正在传播该 meme 的人数。当 Pn 的分母为最大值(趋近于 1)时,意味着传播该 meme 的人数最少(趋近于 0),即该 meme 已经过时。

公式2:表情包热度与时间关系计算公式

通过对三类不同网络的对比,我们可以看出梗传播规律的相同点和不同点。梗无论内容如何,​​都会有过期现象。对于文学作品而言,其传播相对线性,而在微博上,梗的爆发则更具突发性。

8 疾病传播模型比较及总结

相比疾病的传播,迷因在传播机制上并不是非黑即白的,我们必须考虑人类的行为——同侪压力(比如大家都看《权力的游戏》,我不看就会显得不合群),还需要考虑人际交流的频率服从幂律分布。因此,我们不能简单地修改一个疾病传播模型,而是需要从微生物群落的繁殖中汲取灵感,将社会机制引入网络。数据看似有显著差异,但在本文讨论的模型下,数据的差异可以通过拟合的不同参数来解释,再利用这些参数来预测迷因流行度的统计指标。模型的准确预测意味着在微观层面上,这些网络具有相同的生成机制。虽然无法预测一部电影是否会流行,但可以帮助解决社交网络的分类问题、网络的鲁棒性问题以及网络中迷因的控制问题。机制设计有所帮助。

标签: 模因
首页
欧意注册
欧意下载
联系