No.64487701 - X岛揭示板

回应模式 - No.64487701

No.64487701 - 科学

无标题无名氏No.64487701 只看PO

2024-11-24(日)07:04:18 ID:LhWkRsO 回应

Thinking Claude —— 从机械推理向模拟人类的跨越：人工智能提示词工程界碑

无标题无名氏No.64488397

2024-11-24(日)10:31:01 ID: 22b93o1

>>No.64487716
你想多了，prompt engineering的技术含量普遍太低了

无标题无名氏No.64488469

2024-11-24(日)10:41:18 ID: QBcxlys

一个prompt engineering，我对他的可行性持怀疑态度，但是起码他真的很会宣发( ﾟ∀。)

无标题无名氏No.64488555

2024-11-24(日)10:49:28 ID: 6SxeYAj

有点好笑

无标题无名氏No.64488738

2024-11-24(日)11:18:16 ID: HbZkZqK

谢谢，午饭省下来了

无标题无名氏No.64489167

2024-11-24(日)12:19:18 ID: LhWkRsO (PO主)

o1标志着生成式AI时代转向推理式AI时代

Thinking claude呈现出的思路能作为该二者的“桥梁”之一，而且它是开源的，这就是为什么我放出了这个暴论。

无标题无名氏No.64489198

2024-11-24(日)12:22:25 ID: AoKCAi3

>>No.64488738
请问这是什么论坛，想找点ai和大数据方面的社区看看(｀･ω･)

无标题无名氏No.64489392

2024-11-24(日)12:49:20 ID: 22b93o1

充其量就是一个改善QoL的小工具，没有涉及到复杂任务的解决，没有指标证明它的有效性，没有论文，没有涉及到模型架构的改动，相比CoT来说创新点乏善可陈，研究的还是AI学术界最不关心的prompt engineering里最不关心的人机交互

身为一个17岁学生的作品来说还是能让人眼前一亮的，如果都是自己做的话，这个人行动力是很不错的，但过度吹就没必要了

无标题无名氏No.64489781

2024-11-24(日)13:45:32 ID: LhWkRsO (PO主)

>>No.64489392
你说的对

果然放暴论能迅速吸引到人答疑( ´∀`)

无标题无名氏No.64490266

2024-11-24(日)14:52:34 ID: EvNfMrb

经典llm领域任何东西都能一通乱吹
也就算个还不错的prompt吧，别的没了
o1也是，的确是提高了对数学和编程方面语料的提取效率（虽然我个人觉得编程没claude3.5好用），但有时一套“思考”下来结果却能和推理得出的结论截然不同，而且在FrontierMath里与其他模型拉不开差距甚至还不如，也不免让人怀疑有背题的嫌疑。