•欢迎各路学霸考王互触
•可以询问备考问题、日西考试成绩
•本版发文间隔15秒
无标题无名氏No.67118637
2025-09-27(六)23:58:17 ID: XuNc1k5 回应
计算机找工作打卡
总之继续吧
无标题无名氏No.67134418
2025-09-30(二)00:47:06 ID: XuNc1k5 (PO主)
呃,半夜醒了没睡好,今天下午纯应付作业了。
然后晚上本来想赶redis的,去看白非立上进记了....有看到自己的影子(没社交、不会向人寻求帮助云云)
无标题无名氏No.67141940
2025-10-01(三)00:01:25 ID: XuNc1k5 (PO主)
呃,今天开摆了,一节课没上,但是只是做了点leetcode。感觉和我不分主次以及不会在累的时候换别的事做有关。
结果放假开始学吗....有点惨。至少别带着逆袭的心理天天打游戏就好。
无标题无名氏No.67486168
2025-11-22(六)22:08:46 ID: XuNc1k5 (PO主)
开摆了2个月左右。面对现实有点沮丧。
今天看牛客,大概了解一些近况。今天就纯整了个简历,明天开始努力学吧,加油
考研倒计时30天( ゚∀゚)无名氏No.67460137
2025-11-19(三)07:23:40 ID: 2jzaPd2 回应
效仿先贤,30天考研完全够嘛,大家继续加油!
考数学的可以不用加油了,这个时间才拿起数学已经来不及了,赶紧抓紧时间玩吧!
( ゚∀。)
咖啡,茶叶与作息表已加入支援!
最后的冲刺( `д´)
无标题无名氏No.67461049
2025-11-19(三)11:09:50 ID: 2jzaPd2 (PO主)
完犊子,上午啥也没干,教训是如果背不下去先做题,不能刷手机,困也不能,提神找别的事情
无标题无名氏No.67463564
2025-11-19(三)18:46:43 ID: neps1eJ 回应
距离考研还有一个月,肥肥我啊,终于做对了一整篇英语阅读(=゚ω゚)=
回应有 5 篇被省略。要阅读所有回应请按下回应链接。无标题无名氏No.67464411
2025-11-19(三)20:51:37 ID: M7TQmIn
>>No.67464398
( ゚∀。)不一定能帮上肥哥,也不清楚肥哥阅读已经到了什么水准
[h]( ;`д´; )如果没用的话卜要说我哇[/h]
无标题无名氏No.67464457
2025-11-19(三)20:57:44 ID: M7TQmIn
>>No.67464418
( ゚∀。)这会儿正是做真题的时间啊……现在先做一遍,然后再做预测卷,最后几天再做真题找回手感。
无标题无名氏No.67468409
2025-11-20(四)13:01:32 ID: Kw89VSy 回应
从高数不及格开始的真正大学生活记录串
如题,po正在被数学暴击中(;´Д`),此串将记录肥肥的大学学习生活和课余生活
本学期小目标:所有的数学课不挂科( ゚ 3゚)
无标题无名氏No.67468831
2025-11-20(四)14:11:15 ID: Kw89VSy (PO主)
>>No.67468431
( ;`д´; )我线代也才勉强及格。为什么要让傻子学工科。
无标题无名氏No.67453229
2025-11-18(二)06:57:21 ID: gFU0ghr 回应
#墨墨背单词#【墨墨背单词】东风谷早苗喵:与我组队背单词,复制此口令打开墨墨背单词 a:/¥2BgR0HD7f2¥
(つд⊂)来个肥肥卿卿和我组队吧
无标题无名氏No.67089397
2025-09-23(二)22:43:22 ID: fILFtkQ 回应
开办一个学术打卡串,挑战每天更新一篇论文
回应有 1 篇被省略。要阅读所有回应请按下回应链接。无标题无名氏No.67243318
2025-10-17(五)00:00:05 ID: fILFtkQ (PO主)
cdq的language models that think,chat beeter
基于奖励的强化学习RLVR很难应用到对话中去,而基于人类反馈的强化学习RLHF,很难先思考再回答的规划过程。
本文提出的RLMT框架,简化训练流程,泛化思考的应用场景。
强制思考,使用通用的,基于人类偏好的奖励模型来评估最终答案的质量。
除了可选的有监督微调预热,流程通过通用Prompt用模型生成包含思考过程和最终回答的完整输出,而奖励模型只评估最终答案,使用在线强化学习方法最大化奖励模型的期望得分。其中GPRO算法最佳。SFT预热不重要。
看的我云里雾里,感觉只是个a+b啊
无标题无名氏No.67249754
2025-10-17(五)23:23:59 ID: fILFtkQ (PO主)
迈向大语言模型后训练的统一视角
清华的一篇论文
通过一个参数,实时地反馈确定该选择sft还是rt,而这个性能值参数P的阈值由不同的基础模型决定。
无标题无名氏No.67442803
2025-11-16(日)19:32:51 ID: fILFtkQ (PO主)
虽然天天读论文,但是打卡没那么频繁,倒显得我一个月才读一篇论文
今天分享的是,在巨人的肩膀上,重编程视觉-语言大模型的通用深度伪造检测
南方科技大学的aaai2025
重编程是一种训练后的方法,不微调参数,使得数据能够迁移适配深度检测伪造任务的通用与高效性
clip方法是一种视觉语言模型,能够预测图像是否与文本描述匹配
在此之前都是使用了PEFT,来处理深度伪造方法,而本文提出repdfp,将输入图像调整为较小尺寸,与视觉提示词合并,然后通过最大化预测正确标签的似然值,来调整对伪造图像的鉴定
主要的优点就是重编程的参数量调整小,检测效果好
无标题无名氏No.67443555
2025-11-16(日)21:20:13 ID: fILFtkQ (PO主)
导师突然发了篇神秘论文,让我水一水更新吧
谷歌深度思考团队的深度伪造检测的缩放效应
主要工作似乎是提供了个scaledf的数据集
采用了随机图像质量压缩和随机扰动作为数据增强
得出结论,clip小规模数据集性能好,但是超大数据集没什么用,所有预训练模型都一样
即便1400万张图像,数据增强也喜欢重要(OMG)
但是对于没有学习过的伪造方法,泛化能力依旧相当有限(或许可以解释为什么数据增强有用)缩放不是万能的
无标题无名氏No.67453617
2025-11-18(二)09:16:46 ID: fILFtkQ (PO主)
联邦学习中的可溯源黑盒水印
白盒水印往往需要模型参数的访问权限
而黑盒水印无法验证是哪个客户端泄露的模型
将模型参数区分为主任务区域和水印区域,水印只注入到特定的,对主任务不重要的参数中
在服务器录个模型时,不聚合特有的水印区域参数,防止水印在聚合中混合消逝
为每个客户端分配不同的触发集和目标输出,确保水印互不冲突
考研打卡串,堂堂连载!无名氏No.67379813
2025-11-07(五)17:33:38
ID: zTz5AGz 回应
又回来了,欢迎各位肥哥一起讨论聊天
回应有 4 篇被省略。要阅读所有回应请按下回应链接。无标题无名氏No.67416819
2025-11-13(四)00:00:53 ID: zTz5AGz (PO主)
day6,今天状态不错,但上午扔小摸了下鱼( `_っ´),下午鼓起斗志继续前进
明天估计会比较难受,有门考试,时间要被狠狠压榨了
无标题无名氏No.67423677
2025-11-13(四)23:38:17 ID: zTz5AGz (PO主)
day7打卡,今天加油!终于考完了一门四风考试,晚上小加了下班完成了开题报告一些东西,今天总体任务基本完成了,不断加油!(〃∀〃)
无标题无名氏No.67430815
2025-11-14(五)23:22:50 ID: zTz5AGz (PO主)
day8打卡,依旧充实的一天( `_っ´)
就是有点累成大厦b了,今天没有午睡,中午有点沉迷刷岛了( ›´ω`‹ )
无标题无名氏No.67436475
2025-11-15(六)21:07:20 ID: zTz5AGz (PO主)
day9 今天是整理日,已经一点精力都没有了……( ›´ω`‹ )( ›´ω`‹ )
成果比较斐然,除了415的大题以外,基本全整理完了,累得够呛……
不过明天终于就是休息日了,伟大的休息日,依然要忙碌同时焦虑的休息日(;´ヮ`)7
不过可以吃烤肉,也算是有盼头了ᕕ( ᐛ )ᕗ
无标题无名氏No.67451941
2025-11-17(一)23:07:11 ID: zTz5AGz (PO主)
我感觉我似乎想起来为啥要离岛了( ゚∀。)
前两年没日没夜的刷刷刷,最近排除了一切干扰,又开始忍不住刷刷刷
肥适之啊肥适之,你怎么能这样?
对不起了岛,我估计后面不会天天打卡,但努力永远不会停止!等我的好消息吧!₍₍(ง`ᝫ´ )ว⁾