Utopia人工智能可判断不同社交平台上的仇恨言论数量

2021年04月23日 16:19:55  [来源:]  [作者:]  [责编:admin]
字体:【

赫尔辛基--(美国商业资讯)--据芬兰司法部委托Utopia Analytics进行的一项研究,网上仇恨言论最容易出现在论坛上。该报告发现,97%的已识别仇恨言论信息来自于论坛。随后的平台类型是占2.5%的Twitter信息和占0.2%的Instagram信息。而博客、新闻评论和公开的Facebook信息占所有已识别仇恨言论的比例不到0.02%。这些数据集不包括私人讨论,如Facebook组或帐户。

该项目是芬兰司法部 “Facts Against Hate”计划的组成部分,旨在测试人工智能在网络环境中识别仇恨言论的能力。该方法将人类评估与机器学习相结合。项目的一个关键目标是找到仇恨言论的主要渠道,并识别平台之间的差异。

仇恨言论的定义基于社会科学的学术研究结果。该定义通过如下过程完成:首先确定仇恨言论的类别,然后使用类别数据在网络信息数据集中人工识别出仇恨言论的例子。这些标注随后被用作Utopia AI Moderator的训练数据,这是一个利用文本分析和机器学习且与语言无关的工具。该项目的数据集由2020年9月至10月以芬兰语发表的1,200万条在线评论和帖子构成。

结果显示,芬兰公开的社交媒体平台上每月出现大约15万条包含仇恨言论的信息,约占所有信息的1.8%。

在国际公共社交媒体平台中,Twitter似乎最为突出,有7,450条信息被认定为仇恨言论,占所有推文的0.14%。转发在传播这些信息中发挥了重要作用:所有仇恨言论推文中有39%是重复的。

Utopia首席执行官Mari-Sanna Paukkeri博士表示:“尽管数据集主要由芬兰语消息构成,但其他语言中的结果也会非常相似。例如,芬兰仇恨言论的主要平台Ylilauta其实就是大家都熟知的4chan的芬兰版。此外,只需要两周,我们就可以建立一个类似的人工智能模型来识别其他任何语言中的仇恨言论。只需要一位具备相关技能的专业人员告诉我们对应文化和语言中如何定义仇恨言论即可,另外我们还需要具体数据来进行分析。”

媒体库/照片:https://utopiaanalytics.com/media-library

原文版本可在businesswire.com上查阅:https://www.businesswire.com/news/home/20210422005039/en/

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

联系方式:

Janne Huuskonen
总监
janne.huuskonen@utopiaanalytics.com
+358 50 444 0941
utopiaanalytics.com

本网网友:伤好了痕还在
评论:挣钱是一种能力,花钱是一种技术,我能力有限,技术却很高。

百度网友:自戀的病源
评论:笑容是馈赠别人的见面礼,眼泪是洗涤自我的沐浴露。

淘宝网友:烟祭 smoke
评论:世界上只有骗子是真心的,因为他是真心骗你的

天猫网友:時間不會等待
评论:所谓长大、就是把原本看重的东西看轻一点、原本看轻的东西看重点...

网易网友:谢谢你给的痛
评论:装傻这事,如果干的好,叫大智若愚

天涯网友:請讓我們相遇
评论:白天睡觉觉,晚上打闹闹,有事死翘翘。

腾讯网友:以死换温柔◇
评论:我也想做一个优雅的淑女,是生活把老娘逼成了泼妇.

其它网友:风筝不会断线
评论:木纳这事,如果干的好,叫深沉

凤凰网友:只傷身不傷心
评论:人生如同故事,重要的并不是有多长,而是在有多好。

猫扑网友:斑驳 wounded
评论:连贝克汉姆都不知道,你丫还有什么资格敢跟我谈篮球

相关新闻
关于我们 | 广告服务 | 浙江热线 | 旗龙网 | 听鱼网 | 2349 | 法律声明 | 联系我们
站务及信息报错:13757197494 (非诚勿扰) | QQ:1160322105 版权所有:上海经济新闻网 未经授权禁止复制或建立镜像
相关作品的原创性、文中陈述文字以及内容数据庞杂本站无法一一核实,如果您发现本网站上有侵犯您的合法权益的内容,请联系我们,本网站将立即予以删除!
中国互联网违法和不良信息举报中心  全国新闻记者证管理及核验网络系统  网络警察报警岗亭