公司新闻

当前位置:官网首页 > 公司新闻 >

AI如何把你“扒光光”:从学术能力开始,社交网络帖子暴露你的一切

时间:2020-10-26 07:50    作者:     点击:

AI

HSE大学教育研讨所核算社会科学实验室科学家创建了一个核算机模型,只需求看看你在交际媒体上发布的内容,就能判别你学术才能的凹凸。

每个词都有不同的权重。科学和文明主题、英语单词以及长单词、长帖子的权重很高,能够作为杰出学习成果的方针。许多的表情符号、大写字母的单词或完好短语,以及与星座、驾驭和兵役相关的词汇都标明校园的成果较低。

研讨运用了来自HSE大学纵向行列小组研讨“教育和工作轨道”(TrEC)的代表性数据样本。这项研讨追寻了俄罗斯42个区域4400名参加PISA(世界学生评价项目)的学生的工作路途,以及部分学生VK账户的数据(3483名学生参加者赞同供给此信息)。

VK渠道的帖子被用作练习样本,其间包含2012年2468名PISA测验受试者的130575个帖子。这项测验使研讨人员能够评价学生的学术才能以及他们将常识应用于实践的才能。

在开发和测验PISA测验的模型时,学生总共要承受3个测验:阅览、数学和科学,但只要学生的阅览成果被用作学术才能的方针。PISA将阅览素质界说为“了解、运用、反思和参加书面文本,以完成个人方针,开展自己的常识和潜力,并参加社会。”

该考试有6个水平。得2分的学生被以为只契合根本的最低水平,而那些5分或6分的学生被以为是优异的学生。

本研讨在VK后语料库(合计19亿个单词,250万个仅有单词)进步行了根据词向量表明的无监督机器学习。它与一个更简略的有监督的机器学习模型相结合,该模型在各个方位进行练习,最终方针是猜测PISA分数。

这个“猜测”并不是指对未来的猜测,而是指核算成果与学生在PISA考试中取得的实在分数之间的相关性。在初步阶段,模型学习了怎么猜测PISA数据。在最终的模型中,核算成果与高中毕业生和大学重生的运用成果进行了比照。

当然,成果也需求验证。因而该模型随后被应用于914所俄罗斯高中(坐落圣彼得堡、萨马拉和托木斯克;这套体系包含近3.9万名用户,共创建了110万个帖子)和100所俄罗斯最大的大学(11.58万人,共发帖650万)来衡量这些组织学生的学习成果。

成果显现,模型的猜测成果和实际成果类似,二者之间的相关性在0.49-0.6。如果是对高中事例,其间的相关性高达0.83。

这种模型能否应用于其他交际媒体网站?研讨人员表明,应用在推特上时,模型的质量并没有明显下降,但由于只要大学相关内容有满足的数量,因而剖析仅在这一组进步行。重要的是,该模型成功地应用于不同交际媒体网站的数据集,然后证明了其在不同环境下的有效性。

研讨人员表明,该模型能够用在许多天壤之别的方面,比学习成果、收入甚至郁闷状况。

译/前瞻经济学人APP资讯组

参考资料:

[1]https://techxplore.com/news/2020-10-artificial-intelligence-students-outcomes-based.html

[2]https://epjdatascience.springeropen.com/articles/10.1140/epjds/s13688-020-00245-8

咨询中心