普渡大学用WiFi数据分析学生行程 隐私或许是个问题

日期:11-24
数据分析普渡隐私

作者:左琳

接入WiFi,你的定位就会被标记下来,再用人工智能(AI)加以分析,就能了解你每天都去了哪里、什么时间去的,美国普渡大学正在用这个方法对学生们的每日行程进行分析。

项目的研究人员称,以往人们去餐馆或是其他娱乐场所,会喜欢在社交软件上发送定位来分享状态,因此,这些数据十分丰富,可供个人或机构用以分析休闲相关的数据。但这些数据也不准确,因为这往往是用户自愿签到,偶然性很大。

除此之外,那些生活中平淡无奇的时刻——比如回到宿舍,或是去图书馆——却鲜有被分享,因此数据几乎一片空白,占据了人们大半时光的日常生活反而不被人所知。很少有用户愿意回到宿舍还要打卡分享,即使有也只是偶尔一两次,得出的结论也难免会出现偏差。

为了得出更为准确的结果,从而针对不同学生的需求进行个性化教育,以及更好地了解学生对校园设施的使用情况,学校打算用WiFi来进行数据统计,并用AI对搜集到的结果进行分析。这样,学生们只要接入某一地点的WiFi,他/她的行程就会被自动记录下来。

研究人员在报告中写道,“可以通过用户行为数据来模拟出用户在不同位置、不同时间的活动,从而根据他们的背景对用户的兴趣点(POI)进行预测,或对相关场所提出恰当的建议。”

他们选取了2016-2017年入学的新生作为研究样本。当新生们的无线设备接入WiFi、发送或接收信号时,就能与场地信息配对,从而产生数据。相比通过社交网络打卡收集而来的数据,这些数据包含了更多和更活跃的用户、更丰富的日常活动(例如学习、锻炼、休息),以及更专一的空间(仅限校园内)。

这些数据也非常庞大,足有376GB。个人设备接入WiFi一次,机器就将之标记为一个条目,在这个项目中,包含了超过10亿个条目。

研究者将每个条目分出四项信息:用户、兴趣点、兴趣点所具有的功能(例如:居住或娱乐)和时间跨度(在给定位置所耗时长)。

分析出的结果也确实揭示出了一些趋向。比如在工作日时,学生们习惯在中午12点和下午6点前往餐厅,并在晚上8点左右去健身房。可以预见的是,新生很快(在前2—3周内)就熟悉了校园,且行程偏好因专业而异。比如,虽然计算机科学专业的学生会经常和药学专业的学生同时用餐,但后者在中午11点到12点之间更多地是上课,前者却是在图书馆温书。

对信息进行额外的处理后,研究人员按照时间顺序,用前80%的条目创建机器学习模型,保留了剩下的20%用于测试。这个人工智能系统经过学习,能够较为准确地推测出学生喜欢访问的前三个位置,准确率最高能到90%。

不仅如此,研究者还可以通过数据推测出谁和你是朋友。当两名学生多次同时在同一个地方时,研究者就将它们标记为潜在的朋友关系,对学生的社交情况也会有所掌握。

这听起来很恐怖,但这样分析技术其实早就不新鲜了。

2016年时,丹麦技术大学的研究人员就表示,他们已经研究出了一个新的系统,可以用来记录用户位置,并根据WiFi信号的强弱,推测出你身边是否还有其他人。尽管现在手机程序想要读取WiFi连接信息都要先经过用户许可,但平时出门还是要谨慎连接WiFi。

安卓收费狼来了 中国自主车企感到寒意 马斯克:特斯拉计划在明年初推出新一代超级充电桩
相关阅读: