您现在的位置:新闻首页>民生

美国研究人员训练技术工具从书面对话中寻找关系线索

2020-04-26 14:07编辑:admin人气:


  密歇根大学和诺基亚贝尔实验室的最新研究利用众包和一种技术工具来检测日常语言中书面语言的特征如何表达以及它们如何影响社会动态。通过检查1.6亿条Reddit消息,来自已失效的安然公司的290,000条电子邮件消息以及电影中的30万条对话,研究人员能够识别书面交流中的10个特征:知识,力量,地位,信任,支持,浪漫,相似,身份,乐趣和冲突。900多个众包注释者在Reddit帖子中标记了7,855个句子,在电影界中标记了400个,在Enron电子邮件中标记了436个,这表明了这10个特征的存在。然后,研究人员训练了一种深度学习分类工具,以查找这些特征及其在所有Reddit和Enron消息以及电影对话中所表现的关系。他们还使用了来自Tinghy.org(一项游戏化的心理测验)的数据,该测验使用10个维度来衡量Twitter用户对他们在线关系的看法,并研究了1,406个独特个人之间的1,772个关系。除了确定信息中已知的维度外,研究人员还发现知识是教育水平和收入的最重要的重要预测因子。支持和不信任是自杀率的两个最重要的预测指标;人口密度影响自杀率,城市地区越富裕,受教育程度越高,发生的病例就越少;同一性表达较少的州自杀率更高。这项研究在本周公布于大学网站上的研究还发现,受高等教育程度较高的州的冲突程度较低,与财富相关的表达数量减少,表明观点之间存在相似之处,这可能是结构和文化上的迹象。多元化的社区。该大学商学院的博士生Minje Choi说:“对于拥有这些对话数据并希望衡量其水平或维度变化(例如社交支持或数据冲突)的研究人员,它可以用作分析工具。”进行研究的信息。“它可以用来寻找时间变化或社区差异。” 结束语

(来源:未知)

织梦二维码生成器
已推荐
0
  • 凡本网注明"来源:的所有作品,版权均属于中,转载请必须注明中,http://www.e-forensics.cn。违反者本网将追究相关法律责任。
  • 本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
  • 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。




  • 推荐专题上方


图说新闻

更多>>
京张高铁周一开通

京张高铁周一开通



返回首页