说完,把牛皮纸袋打开,抽出几张类似目录的表格,递给两人,“这是我带来的一些我们在复大搜集整理的资料目录,部分初步的分析报告,还有几篇相关的子论文初稿,请二位不吝指教。”
张曼曼一听数据来了精神,凑过去看。梁灿也饶有兴致地俯身。
邹杰开始讲解他的数据来源、清洗过程和分析思路。这一次,他的讲述明显比在巴塞罗那时扎实了许多,少了许多空泛的理论嫁接,多了对数据细节和局限性的坦诚。
张曼曼一边听着,当翻到数据目录部分,手指点着上面一行行条目,“邹老师,你们这个华东地区高校BBS社群结构演化追踪的数据跨度有三年?抽样频率是按周还是按月?”
“目前主要是月度抽样,”邹杰身体微微前倾,看了眼张曼曼点的地方,解释道,“我们尝试捕捉寒暑假带来的周期性波动对社群活跃度和结构的影响。不过,在关键节点,比如重大校园事件或社会热点爆发期,会进行周级别的密集追踪。”
梁灿则对理论部分更感兴趣,他拿起一篇综述,一撩额前的长发,“邹老师,刚才你说,这里尝试用结构洞理论来解释网络社群中信息掮客的形成,这个切入点很有意思。”
“不过,您是如何操作化信息控制能力这个变量的?是直接用中间中心度,还是结合了内容分析,看其转发信息的独家性和时效性?”
邹杰眼睛一亮,这种一句话就直指关键核心点的感觉,是自己在复大,即便和一些老教授沟通时都没有的,心里一时升起找到同伙的轻快,“啊,我们最初确实用的是中间中心度,但后来发现不够精确。”
“现在尝试结合内容分析,给经过特定节点的信息流打上独家性和首发性标签,加权计算一个信息控制指数。当然,这个方法还在完善中,信效度检验刚做了一轮.....”
张曼曼一边听着,一边已经麻利地打开了自己的电脑,调出几个庞大的数据文件和分析程序,“巧了不是,我们这边也做过类似的分析,不过我们抓取的范围更杂,从早期的天涯海角论坛、瞄扑到现在的球球空间和铁吧都有涉猎。”
“我们用的是动态网络分析,结合了自然语言处理,尝试自动识别信息类型和传播路径中的关键转折点....你看这个图,”张曼曼把屏幕转向邹杰,“这是我们基于球球群聊数据构建的某个时段高频词共现网络,试图还原特定议题的发酵过程。”
邹杰凑近屏幕,只见复杂的网络图谱上,节点密集,连线纵横,不同的颜色和大小代表着不同的用户影响力和话题关联度。
眼中闪过一丝惊讶,这数据的规模和处理的精细程度,远超他的预想。他忍不住问,“这种,球球内部的数据,你们真能....”
他想起李乐在巴塞罗那轻描淡写地说“和国内几家大平台有合作”,当时还以为多少有些夸大其词,此刻亲眼所见,才知所言非虚。这已经不是一般意义上的“合作”了,这简直是拿到了平台的后门钥匙。
梁灿在一旁嘿嘿一笑,接过话头,“怎么样,秃子乐没吹牛吧?我们跟那边,确实有点不一般的合作关系。”一仰头,示意张曼曼,“他昨天还和泡你马聊到半夜。诶,他答应咱的客户行为分析商业指导的费用啥时候结?”
“就这几天,回头我催他,学术民工也是民工,不能拖欠工资。”张曼曼点点头。
梁灿转过脸,冲邹杰笑道,“当然了,所有数据都是严格脱敏、符合伦理规范的。说白了,我们帮他们理解用户行为,他们提供一些不涉及个人隐私的宏观数据支持,互利互惠嘛。”
“就像我们搞那个控制镜像模型,不是瞎琢磨,是有实实在在的数据支撑的。”
邹杰看着屏幕上那些他之前只能靠有限问卷和公开信息推测的现象,此刻被清晰、大规模的数据直观呈现,心中五味杂陈,既有震撼,也有一丝豁然开朗。
李乐这个团队不仅理论框架领先,方法论前沿,连最核心、最难得的数据资源,也早已打通了关节,走到了令人望尘莫及的前面。
自己之前那种闭门造车、试图靠“整合”和“借鉴”快速出成果的想法,显得何其可笑。
更让他触动的是,张曼曼和梁灿对于这些珍贵的数据和分析方法,展现出的是一种近乎理所当然的分享态度,并无多少藏私之意。之后,又热情地给他看了他们整理的历年BBS热帖存档、网络流行语变迁数据库、以及针对几个典型网络事件的深度个案分析编码手册。
于是,邹杰对自己的研究内容的讲述,也更加的开放。
张曼曼时不时插嘴问一些技术性问题,比如数据抓取的工具、编码的信度检验方法,邹杰都一一认真回答。
梁灿则更关注他理论框架和分析概念的应用,偶尔会提出一些哲学层面的质疑,比如“你这个社群认同的操作化定义,是否隐含了某种本质主义的预设?”让邹杰陷入沉思。
本小章还未完,请点击下一页继续阅读后面精彩内容!