回应模式 - No.64487701


No.64487701 - 科学


无标题无名氏No.64487701 只看PO

2024-11-24(日)07:04:18 ID:LhWkRsO 回应

Thinking Claude —— 从机械推理向模拟人类的跨越:人工智能提示词工程界碑

Tips无名氏No.9999999

2099-01-01 00:00:01 ID: Tips

(`ヮ´ )σ`∀´) ゚∀゚)σ

无标题无名氏No.64488397

2024-11-24(日)10:31:01 ID: 22b93o1

>>No.64487716
你想多了,prompt engineering的技术含量普遍太低了

无标题无名氏No.64488469

2024-11-24(日)10:41:18 ID: QBcxlys

一个prompt engineering,我对他的可行性持怀疑态度,但是起码他真的很会宣发( ゚∀。)

无标题无名氏No.64488555

2024-11-24(日)10:49:28 ID: 6SxeYAj

有点好笑

无标题无名氏No.64488738

2024-11-24(日)11:18:16 ID: HbZkZqK

谢谢,午饭省下来了

无标题无名氏No.64489167

2024-11-24(日)12:19:18 ID: LhWkRsO (PO主)

o1标志着生成式AI时代转向推理式AI时代

Thinking claude呈现出的思路能作为该二者的“桥梁”之一,而且它是开源的,这就是为什么我放出了这个暴论。

无标题无名氏No.64489198

2024-11-24(日)12:22:25 ID: AoKCAi3

>>No.64488738
请问这是什么论坛,想找点ai和大数据方面的社区看看(`・ω・)

无标题无名氏No.64489392

2024-11-24(日)12:49:20 ID: 22b93o1

充其量就是一个改善QoL的小工具,没有涉及到复杂任务的解决,没有指标证明它的有效性,没有论文,没有涉及到模型架构的改动,相比CoT来说创新点乏善可陈,研究的还是AI学术界最不关心的prompt engineering里最不关心的人机交互

身为一个17岁学生的作品来说还是能让人眼前一亮的,如果都是自己做的话,这个人行动力是很不错的,但过度吹就没必要了

无标题无名氏No.64489781

2024-11-24(日)13:45:32 ID: LhWkRsO (PO主)

>>No.64489392
你说的对

果然放暴论能迅速吸引到人答疑( ´∀`)

无标题无名氏No.64490266

2024-11-24(日)14:52:34 ID: EvNfMrb

经典llm领域任何东西都能一通乱吹
也就算个还不错的prompt吧,别的没了
o1也是,的确是提高了对数学和编程方面语料的提取效率(虽然我个人觉得编程没claude3.5好用),但有时一套“思考”下来结果却能和推理得出的结论截然不同,而且在FrontierMath里与其他模型拉不开差距甚至还不如,也不免让人怀疑有背题的嫌疑。