无标题无名氏No.64487701 只看PO
2024-11-24(日)07:04:18 ID:LhWkRsO 回应
Thinking Claude —— 从机械推理向模拟人类的跨越:人工智能提示词工程界碑
无标题无名氏No.64488469
2024-11-24(日)10:41:18 ID: QBcxlys
一个prompt engineering,我对他的可行性持怀疑态度,但是起码他真的很会宣发( ゚∀。)
无标题无名氏No.64489167
2024-11-24(日)12:19:18 ID: LhWkRsO (PO主)
o1标志着生成式AI时代转向推理式AI时代
Thinking claude呈现出的思路能作为该二者的“桥梁”之一,而且它是开源的,这就是为什么我放出了这个暴论。
无标题无名氏No.64489392
2024-11-24(日)12:49:20 ID: 22b93o1
充其量就是一个改善QoL的小工具,没有涉及到复杂任务的解决,没有指标证明它的有效性,没有论文,没有涉及到模型架构的改动,相比CoT来说创新点乏善可陈,研究的还是AI学术界最不关心的prompt engineering里最不关心的人机交互
身为一个17岁学生的作品来说还是能让人眼前一亮的,如果都是自己做的话,这个人行动力是很不错的,但过度吹就没必要了
无标题无名氏No.64490266
2024-11-24(日)14:52:34 ID: EvNfMrb
经典llm领域任何东西都能一通乱吹
也就算个还不错的prompt吧,别的没了
o1也是,的确是提高了对数学和编程方面语料的提取效率(虽然我个人觉得编程没claude3.5好用),但有时一套“思考”下来结果却能和推理得出的结论截然不同,而且在FrontierMath里与其他模型拉不开差距甚至还不如,也不免让人怀疑有背题的嫌疑。