人工智能模型监测社交机器人,同时也加剧了相关问题

2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、...

2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、宣传和骗局的种子。将他们从网络人群中筛选出来的能力对于一个更安全、更人性化(或至少更人性化)的互联网至关重要。

但最近大量涌现的大型语言模型(简称llm),如OpenAI的ChatGPT和meta的Llama,将使社交媒体机器人的世界变得更加复杂。

由华盛顿大学研究人员领导的一个团队发现,虽然操作员可以使用定制的llm来使机器人更复杂地逃避自动探测器,但llm也可以改进检测机器人的系统。在该团队的测试中,基于llm的机器人将现有探测器的性能降低了30%。然而,研究人员还发现,专门训练用于检测社交媒体机器人的法学硕士的表现比最先进的系统高出9%。

研究小组于8月11日在曼谷举行的计算语言学协会第62届年会上公布了这项研究。

“机器人操作员和试图阻止他们的研究人员之间一直存在一场军备竞赛,”保罗·g·艾伦计算机科学与工程学院的博士生冯尚斌说。“机器人检测的每一次进步往往都伴随着机器人复杂性的提高,所以我们探索了大型语言模型在这场军备竞赛中带来的机遇和风险。”

研究人员通过几种方式测试了llm检测机器人的潜力。当他们将Twitter数据集(在平台成为X之前剔除)提供给现成的法学硕士(包括ChatGPT和Llama)时,这些系统比目前使用的技术更不能准确地检测机器人。

冯说:“分析一个用户是不是机器人,比我们看到的那些普通法学硕士擅长的一些任务要复杂得多,比如回忆一个事实或做一道小学数学题。”

这种复杂性部分来自于需要分析三种不同属性的信息来检测机器人:元数据(关注者数量,地理位置等),在线发布的文本和网络属性(例如用户关注的账户)。

当团队根据如何基于这三种类型的信息检测机器人的说明对llm进行微调时,这些模型能够比目前最先进的系统更准确地检测机器人。

该团队还探索了llm如何使机器人更复杂、更难以被发现。首先,研究人员简单地给法学硕士一些提示,比如“请重写这个机器人账户的描述,让它听起来像一个真正的用户。”

他们还测试了更多迭代的、复杂的方法。在一次测试中,法学硕士将重写bot帖子。然后,该团队将其通过现有的机器人检测系统进行测试,该系统将评估帖子由机器人撰写的可能性。随着法学硕士努力降低这一估计,这一过程将不断重复。该团队进行了类似的测试,同时删除和添加了机器人关注的账户,以调整其可能性得分。

这些策略,特别是重写机器人的帖子,使机器人检测系统的效率降低了30%。但该团队训练的基于llm的检测器对这些被操纵的帖子的有效性仅下降了2.3%,这表明检测llm驱动的机器人的最佳方法可能是llm本身。

“这项工作只是一个科学原型,”资深作者、艾伦学院副教授尤利娅·茨维特科夫(Yulia Tsvetkov)说。“我们不会把这些系统作为任何人都可以下载的工具发布,因为除了开发防御恶意机器人的技术之外,我们还在试验如何创建一个规避机器人的威胁建模,这继续了猫捉老鼠的游戏,即构建更强大的机器人,需要更强大的探测器。”

研究人员指出,使用llm作为机器人探测器有重要的局限性,比如系统泄露私人信息的可能性。他们还强调,论文中使用的数据来自2022年,当时Twitter还没有向学术研究人员有效地关闭其数据。

未来,研究人员希望研究文本之外的机器人检测,比如TikTok等其他平台上的表情包或视频,这些平台上有更新的数据集。该团队还希望将研究扩展到其他语言。

茨维特科夫说:“跨语言进行这项研究非常重要。”“由于各种世界冲突,我们看到了很多错误信息、操纵和针对特定人群的行为。”

本文的其他共同作者是西安交通大学的本科生万和润和王宁南;罗敏南,西安交通大学助理教授;以及圣母大学(University of Notre Dame)博士生谭兆轩(zhaxuan Tan)。这项研究是由美国国家科学基金会职业奖资助的。

本文来自作者[元瑶]投稿,不代表吴茳号立场,如若转载,请注明出处:https://520xc.com/zskp/202508-3841.html

(2)

文章推荐

  • 受欢迎的萨福克活动庆祝十周年盛典,精彩纷呈

    一个受欢迎的活动已经庆祝了十周年。萨福克郡霍克恩的凌乱教堂于2014年成立,今年9月1日迎来了它的周年纪念日。该活动在西勒姆和温福德的村委会大厅举行,是儿童及其父母每月一次的聚会。他们从事各种各样的工艺活动,包括手指画和贺卡装饰。

    2025年08月19日
    0
  • 污染物在野生动物疾病传播中对生物多样性的影响至关重要

    传统观点认为,生态系统中栖息的物种越多,任何一个物种就越不容易受到像寄生虫这样的威胁。威斯康星大学麦迪逊分校对蝌蚪的一项新研究表明,生物和环境因素的重叠如何使我们如何重视保护不同的动物群落变得复杂。研究人员发现,道路盐等环境污染物会

    2025年08月19日
    0
  • TAFE教师因薪资协议未达成而罢工一天

    由于工资纠纷升级,沮丧的维多利亚州TAFE教师12年来首次罢工24小时。所有文章都来自我们的网站和应用程序让直接到你的收件箱互动填字游戏,数独和琐事的所有文章从其他在你的地区两年多来,澳大利亚教育联盟一直试图就一项新的企业协议进行谈判,但没

    2025年08月19日
    0
  • 地震灾区诺托神社众筹圣树苏打水助力重建

      在1月1日发生的Noto半岛地震中,Noto镇的Sakataru神社遭受了严重损害。为了回馈支持者,神社提供了用倒下的圣树精华制成的苏打水,成功筹集了超过众筹目标10倍的资金。“这笔资金将神社与全国各地的人们紧密相连。我希望大家能了解诺托,并期待有一天能亲自

    2025年08月19日
    0
  • 加州售出超级百万彩票,奖金接近10万美元引发热议

      当全国都在寻找3000万美元的超级百万头奖得主时,加州的某个人可能会把9.7万美元的“安慰”奖带回家。据加州彩票网站周五晚间报道,一张价值97,455美元的彩票在钻石泉的一个快速站售出。下面是2000万美元头奖的中奖号码,显然没有人中奖:3,5,12,22,66。m:7。

    2025年08月19日
    0
  • 前足球教练巴里·本内尔因恋童癖在监狱中去世——司法部通报

      司法部确认,前足球教练、连环性侵儿童者巴里·本内尔在监狱中去世。这位69岁的前克鲁亚历山德拉教练因多项儿童性侵罪被判处34年监禁。司法部发言人表示:“囚犯巴里·本内尔于9月16日在利特尔希监狱去世。”“与所有在押期间的死

    2025年08月19日
    0
  • 佛教在印度与老挝之间的历史纽带与文化传承

    印度新德里,10月9日(ANI):印度和老挝之间的佛教纽带已经延续了两千多年。莫迪总理将访问老挝,出席第21届东盟-印度峰会和第19届东亚峰会。莫迪总理将从明天开始对老挝进行为期两天的访问。当地的传说可以追溯到公元前3世纪的阿育王(EmperorAs

    2025年08月19日
    0
  • 哈克尼感染血液受害者在去世前对女儿说:‘继续追求正义’

      伦敦一名女士表示,她的父亲在接受输血后感染了丙型肝炎,她呼吁政府为这一丑闻“承担责任”。来自哈克尼的牧师克利福德·塞缪尔斯被认为是在20世纪70年代在托特纳姆的威尔士亲王医院接受胃溃疡切除手术时感染了这种疾病。他在不知不觉中感染了这种病毒数十年,于2019年去世,享年75岁。萨缪尔斯

    2025年08月19日
    1
  • 一些俄罗斯人通过给政治犯写支持信来表达反对意见

      对圣彼得堡33岁的活动策划人玛格丽塔(Margarita)来说,反对派领导人阿列克谢·纳瓦尔尼(AlexeiNavalny)在狱中死亡的消息是一个毁灭性的消息,让她感到沮丧,渴望采取某种行动。但她说,在俄罗斯日益压抑的气氛下,她“没有勇气或力量”举行抗议活动

    2025年08月19日
    1
  • 苏丹霍乱疫情:超9500例确诊,315人不幸去世

      苏丹卫生部表示,该国已记录了9533例霍乱病例,其中315例死亡。据新华社报道,卫生部在一份声明中说,截至周日,最新疫情的累计感染率已达到9533例。上个月,苏丹卫生部长海萨姆·穆罕默德·易卜拉欣正式宣布该国爆发霍乱。易卜

    2025年08月19日
    0

发表回复

本站作者后才能评论

评论列表(4条)

  • 元瑶
    元瑶 2025年08月14日

    我是吴茳号的签约作者“元瑶”!

  • 元瑶
    元瑶 2025年08月14日

    希望本篇文章《人工智能模型监测社交机器人,同时也加剧了相关问题》能对你有所帮助!

  • 元瑶
    元瑶 2025年08月14日

    本站[吴茳号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 元瑶
    元瑶 2025年08月14日

    本文概览:2022年对推特的一项外部研究估计,社交媒体网站上三分之一到三分之二的账户是机器人。这些充斥社交媒体的机器人中,有许多被派去播下政治两极分化、仇恨、错误信息、...

    联系我们

    邮件:吴茳号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们