>>No.63365803
谢谢建议,这几天搜索了一下相关的内容,对主要的问题和大致的解决方法有了一些了解,但我不是很确定,这个问题是否是只需要改进架构如MoE架构或transformer架构就能解决,还是必须要想出新的架构?
以及我察觉到,我对长期记忆感兴趣的初衷是想尽量避免和有设定的AI聊天时ooc的现象,我问了chatgpt4o ooc的原因和解决方法,得到的答案是,除了prompt的细化以及聊天时使用一些技巧,还可以进行分段记忆管理、进行语境模型训练、改进Transformer架构、优化模型、改进目标函数等,扩展上下文窗口大小只是方法之一,如果改进长期记忆不能显著解决ooc的问题,我就不是很有动力继续钻研下去了,但是现在我完全看不出来,改进长期记忆是否能显著改善ooc的问题?
以及能问下不推荐吴恩达课程的原因吗?机器学习那门课很多年前我跟完了,感想是讲得很细、太细了,很多一时半会儿用不到的东西,不过原理讲得很清楚,到现在我还记得传播函数是怎么一回事以及课后项目推荐系统的大致原理,是因为它太细会分散精力所以不推荐吗?看了下后面的深度学习专项训练,发现自然语言处理这块放到了最后一门课程,前面几门课程还是对机器学习课程的扩展,从coursera给的那个目录来看的话感觉讲得挺细的