写作绅士,读作丧尸 X岛揭示板
顺猴者昌 逆猴者亡 首页版规 |用户系统 |移动客户端下载 | 丧尸路标 | | 常用图串及路标 | 请关注 官方公众号:【X岛揭示板】 官方微博: 【@X岛极速版】| 人,是会思考的芦苇
常用串:·豆知识·跑团板聊天室·公告汇总串·X岛路标

No.67969555 - 无标题 - 技术宅


回应模式
No.67969555
名 称
E-mail
标题
颜文字
正文
附加图片
•程序语言、压制投稿、视频制作以及各计算机领域的技术问题
•我觉得还是CSDN靠谱一点
•本版发文间隔为15秒。

无标题 无名氏 2026-01-30(五)00:53:47 ID:aEQh6hJ [举报] [订阅] [只看PO] No.67969555 [回应] 管理
网安肥睡前迷思( ゚∀。)

对于语言大模型,是否存在某种“木马”,以某种隐蔽的方式添加进公开发布的数据当中,使自动爬虫爬取到这一节数据,喂给大模型之后会让大模型生成无效内容…
Tips 无名氏 2099-01-01 00:00:01 ID:Tips超级公民 [举报] No.9999999 管理
( `д´)就不能学学动画版的萌豚,多看看动画片
无标题 无名氏 2026-01-30(五)01:02:52 ID:aEQh6hJ (PO主) [举报] No.67969596 管理
进一步发散下思维,现在ai逆向分析的本领已经十分高强

能否实现某种特定“花指令”,使其一遇到这段特定汇编代码段就“发疯”,生成错乱内容或者ai幻觉,达成干扰逆向分析的目的
无标题 无名氏 2026-01-30(五)01:06:15 ID:aEQh6hJ (PO主) [举报] No.67969612 管理
好吧,问了下ai,原来ai已经知道这招了( ゚∀。)

数据投毒攻击
无标题 无名氏 2026-01-30(五)01:08:35 ID:Q3RpJND [举报] No.67969623 管理
某国内知名论坛的官方近几年就在大量投放弱智ai,试图通过灌水提问利用用户训练模型,正义群众的已读乱回把ai成功搅成一坨大的σ`∀´)
无标题 无名氏 2026-01-30(五)10:16:35 ID:XvElpoM [举报] No.67971852 管理
potato!
无标题 无名氏 2026-01-30(五)10:40:15 ID:aNdkTOP [举报] No.67972490 管理
根据神经网络的底层原理来说,其实有非常大的概率,会存在若干个(而且可能是大量)人类看起来毫无意义的“魔法输入”(比如aNdkTOP),能够让模型在处理后输出一个有意义的结果( ゚ 3゚)
无标题 无名氏 2026-01-30(五)11:47:45 ID:VismPnK [举报] No.67974180 管理
>>No.67969612
有的哥们有的,之前参加数据安全竞赛就有个板块专门是数据投毒,好久不搞数安忘差不多了。
比如外卖app评论爬虫,它每个关键词都有一定权重,可以理解为出现某个词就大概率是好评/差评。打个比方,“好吃”可能是1,“还行”可能是0.2,“差”可能是-1…然后我们数据投毒就是让他的这个权重彻底乱掉,比如我大量注入“差”但是标记为好评,这样他就会跟原本的结论出现偏差。
得分是按前后偏差值计算的,偏差越大分越高。偏差最大的做法就是让权重全反,正的变负负的变正。
无标题 无名氏 2026-01-30(五)12:47:54 ID:aEQh6hJ (PO主) [举报] No.67974971 管理
>>No.67972490
类似两个天差地别的字符串经过哈希运算,正好被判断成为一个结果是吗( ゚∀。)
无标题 无名氏 2026-01-30(五)15:48:28 ID:aNdkTOP [举报] No.67976163 管理
>>No.67974971

UP主: