然后图像识别已经被玩烂了,研究这个既难找工作又难投论文,还难找到研究方向。现在的图像识别一般只用于其他研究的论证,比如说我研究了一个很高效的模型结构搜索(NAS)方法,这个方法在图像识别等方面有用
以个人的经验,现在和计算机视觉(Computer Vision,CV)有关的主流研究方向是:
1:生成式模型(Gen-AI/AIGC),比如说diffusion模型
2:多模态模型(Multimodal model),就是把两个或更多的数据类型作为输入或输出的模型,比如说同时输入图片和文字
3:AI安全,包括模型窃取,后门攻击,敌对攻击之类的很多东西,比较杂的领域
4:自动驾驶(ADS/AV),处理图像和点云数据,主流的自动驾驶是E2E,也就是说直接输入图像和数据,直接输出汽车的驾驶运动
5:基石模型(foundation model),可以被用于其他下游任务的大模型,和自监督模型,无监督模型有关
加了点英文和缩写,方便你找相关论文