苹果AI/ML团队开发多模态大模型Ferret 成功突破谷歌人机验证码难题
苹果AI/ML团队与哥伦比亚大学合作研发的多模态大模型“雪貂”已经成功突破了谷歌人机验证码的难题,能够轻松识别图像中的交通信号灯并准确圈出其位置,其性能直逼GPT-4V。Ferret的关键在于改进了大模型在“看说答”任务中的精确度,这得益于其出色的图文关联能力。通过这一研究,Ferret为解决图像理解和多模态任务提供了新的方向,有望在人机交互、智能搜索等领域取得
AI程序员Devin卧底工作群修bug!和CTO聊技术,网友:顶级码农水平
首个AI程序员Devin,现身明星创业公司内部群。为解决一个技术问题,Devin借用了其创造者的账号,与客户公司的CTO交流,并根据回复调整了代码方案。这位大兄弟表示自己一年前担心的事儿终究还是发生了。
研究:代码数据增强技术在深度学习中的应用具有巨大潜力
代码数据增强技术在深度学习中的应用已经取得了一些令人鼓舞的成果。代码模型通过训练大量的源代码语料库,能够模拟代码片段的上下文,已经在多个源代码的下游任务中显示出了出色的性能。代码数据增强技术在深度学习中的应用具有巨大潜力,可以提高模型的性能和稳健性,但仍然需要进一步的研究和探索。
2行代码,「三体」一次读完!港中文贾佳亚团队联手MIT发布超长文本扩展技术,打破LLM遗忘魔咒
【新智元导读】大模型上下文从此不再受限!港中文贾佳亚团队联手MIT发布了全新超长文本扩展技术LongLoRA,只需2行代码,让LLM看小说,读论文,轻松拿捏。中途迷失、模型偷懒、上下文越长大模型越笨……体验过LLM的人,多少都会对文本输入长度带来的限制有所感触:实际上,这些都是典型的大语言模型对话缺陷。相距不过短短两个月,不得不说,这研究速度和能力跟LongLoRA一样惊人。