MIT最新研究:纯文本模型也能训练出视觉表征 用代码就能作画
MIT计算机科学与人工智能实验室的研究人员进行了一项有趣的研究,通过评估语言模型的视觉能力,揭示了纯文本模型训练视觉概念表征的新可能性。他们使用代码非图像进行渲染和表示,成功地教会语言模型生成和理解复杂的视觉概念。这为未来发展更强大的纯文本模型提供了启示,有望推动语言模型在视觉领域的更广泛应用。
MIT新研究:打工人不用担心被AI淘汰!成本巨贵,视觉工作只有23%可替代
【新智元导读】MIT计算机科学与人工智能实验室的一项研究发现:不用担心视觉AI会很快淘汰人类打工人,因为对于企业来说,它们实在是太贵了。人工智能会抢走我们的工作吗?如果你每天都看硅谷高管谈论着当今尖端的AI技术,可能会觉得答案是肯定的,并且会很快发生。AI对于就业和劳动力市场的影响,短时间内还很难达成共识。
MIT斯坦福Transformer最新研究:过度训练会让中度模型“结构顿悟”
最新研究指出,经过过度训练,中度的Transformer模型能够展现出结构性泛化能力,这一现象被称为"结构顿悟"。在自然语言处理中,先前的研究认为像Transformer这样的神经序列模型在泛化到新的结构输入时难以有效地捕捉句子的层级结构。这一发现有望在未来的深度学习研究中引起更多关注,为模型设计和训练策略提供指导。
2024 QS排名发布:计算机MIT霸榜,清华11,北大15
2024QS世界大学学科排名出炉了!在计算机科学专业排名中,MIT、卡内基梅隆大学、斯坦福大学占领了世界前三席,中国大陆有8所高校进入百强,清华大学排名最高,并列第11。2024QS世界大学学科排名来了!总体和23年变化不大。国际研究网络国际研究网络指数反映了院校通过与其他高等教育机构建立可持续的研究合作关系,使其国际研究网络地域多样化的能力。
MIT研究员推新AI图片生成框架DMD:AI 单步生成高质量图像 速度快30倍
在当今人工智能时代,计算机可以通过扩散模型生成自己的“艺术”,逐步向嘈杂的初始状态添加结构,直到清晰的图像或视频出现。扩散模型突然变得异常受欢迎:输入几个词,即可体验现实与幻想交汇的梦幻景象。当前版本使用StableDiffusionv1.5作为教师模型,学生继承了一些限制,如渲染文本和小脸部的细节描绘,这表明更先进的教师模型可能进一步提升DMD生成的图像。
用Vision Pro实时训练机器狗,MIT博士生开源项目火了
VisionPro又现火爆新玩法,这回还和具身智能联动了~就像这样,MIT小哥利用VisionPro的手部追踪功能,成功实现了对机器狗的实时控制。不仅开门这样的动作能精准get:也几乎没什么延时。作者本人也在论文中写道:最后,提醒一下,如果你想上手试一试这个开源项目,那么除了必备一台VisionPro之外需要准备:苹果开发者账户VisionPro开发者配件安装了Xcode的Mac电脑嗯,看样子还是得先让苹果赚一笔了。
MIT博士生用Vision Pro实时训练机器狗 开源项目Tracking Steamer火了
MIT博士生利用VisionPro开源项目成功实现了对机器狗的实时训练。TrackingSteamer这一应用程序通过追踪人类动作,并将数据传输到其他机器人设备,为未来与机器人互动提供了新方式。虽然项目需要使用VisionPro设备和开发者配件,但这不影响人们对其开源项目的兴趣和关注,展现了对未来科技发展的热切期待。
MIT和谷歌提出新AI框架Health-LLM:利用可穿戴传感器数据为健康预测任务调整LLM
MIT和Google的研究人员共同提出了一种名为Health-LLM的新型人工智能框架,旨在将大语言模型应用于健康预测任务,利用可穿戴传感器的数据。该框架的提出标志着健康领域在可穿戴技术和人工智能的交叉点上取得了重大突破。这为以更加可访问和可扩展的方式应用先进的医疗保健分析打开了新的可能性,从为个性化医疗的更广泛目标做出了贡献。
MIT研究:AI尚不会取代你的工作,因为它还是太昂贵了
随着人工智能技术的飞速发展,人们对工作安全性的担忧也逐渐升温。麻省理工学院的一项新研究表明,目前部署这项技术的成本可能使得雇主更倾向于保留现有员工,至少在当前情况下是这样。尽管这项研究未考虑其他AI用途,如文本生成,但研究人员设想他们的框架可以用于研究计算机视觉以外的其他领域。
MIT研究人员利用人工智能识别可杀灭耐药细菌的抗生素
随着细菌不断进化以抵抗抗生素的影响,细菌感染的治疗变得更加具有挑战性。过度和滥用抗生素使“抗生素耐药”问题变得更加严重。根据MIT研究的主要合著者之一FelixWong的说法,该研究将帮助“打开黑匣子”,帮助其他研究人员了解深度学习模型的工作原理。
何恺明与MIT合作推出自条件图像生成框架RCG
何恺明与MIT合作推出的自条件图像生成框架RCG在学术圈引起关注。这一框架成功填补了长期存在的有条件和无条件生成任务性能差距,取得了ImageNet-1K数据集上无条件图像生成的新SOTA成绩。何恺明与MIT的合作研究为无条件图像生成领域带来了新的突破,RCG框架的成功应用表明自条件图像生成模型具有巨大的潜力,可能预示着这一领域新时代的到来。
MIT与Adobe联手开发DMD:生成图像质量媲美Stable Diffusion ,速度快30倍
MIT和Adobe的研究人员最近提出了一种新颖的人工智能方法,称之为分布匹配蒸馏,该方法旨在将扩散模型转化为一步图像生成器,从显著提高图像生成的效率和质量。据称他们的一步生成器在生成逼真图像方面不仅与StableDiffusionv1.5相媲美速度更快30倍。这一研究为图像生成领域带来了崭新的可能性,通过创新的方法,使得生成模型在效率和质量方面都取得了显著提升。
MIT新创公司Liquid AI融资近4千万美元,希望构建新型液态神经网络人工智能
LiquidAI,一家由MIT孵化的新兴公司,近日成功完成了一轮接近4千万美元的种子轮融资,其目标是构建一种全新类型的人工智能,被称为液态神经网络。这一创新性的技术基于液态神经网络架构,旨在提供更为精简、可解释且动态适应的人工智能系统。该公司希望通过商业化液态神经网络技术,竞争构建GPT模型的基础模型公司,致力于打造超越传统GPT的最佳新型Liquid基础模型。
MIT和Google研究StableRep新技术:使用合成图像训练AI图像模型
MIT和Google的研究人员近期开发了一项名为StableRep的新技术,旨在利用由AI生成的图像来训练更加详细和高效的AI图像模型。这项技术被应用于开源文本到图像模型StableDiffusion,取得了一系列显著的成就。MIT和Google的这一研究成果代表着AI图像生成领域的一次创新,尽管存在一些缺陷,但其对于高质量图像的生成提供了新的方法和思路。
MIT研究团队发布MechGPT:力学与材料建模的语言先锋,跨足多领域、尺度和模态
MIT的研究人员在力学和材料建模领域取得了重要突破,推出了一款名为MechGPT的语言模型。该模型不仅能够桥接各种尺度、学科和模态能够高效地从科学文本中提取关键信息。作为语言模型领域的先锋,MechGPT的出现标志着语言模型动态演变的里程碑,为知识提取开辟了新的领域。
清华、中科院、MIT联合提出Co-Pilot人机交互框架 首次用语言模型作为辅助驾驶
清华大学、中国科学院、MIT的科研人员联合研究人员对于大语言模型在人机交互领域中的应用进行了研究,设计了一种名为Co-Pilot的人机交互框架。该研究首次尝试用语言模型作为辅助驾驶,以描述的方式来控制行动轨迹,同时能够符合用户的轨迹意图。这表明了Co-Pilot架构在自动驾驶人机交互领域具有良好的应用前景。
MIT等机构推出数据溯源平台 解决AI领域的数据透明危机
研究人员来自麻省理工学院、CohereforAI以及其他11个机构,他们共同发布了DataProvenancePlatform,旨在应对AI领域的数据透明危机。这一平台的推出旨在解决AI模型训练数据集的来源和使用透明度不足的问题,这是当前AI领域亟待解决的挑战之一。这一举措也将有助于减少AI模型中的潜在问题,如偏见、数据泄漏和法律风险,为AI技术的广泛应用提供更可靠的基础。
谷歌DeepMind最新研究:对抗性攻击对人类也有效,人类和AI都会把花瓶认成猫!
【新智元导读】神经网络由于自身的特点容易受到对抗性攻击,然,谷歌DeepMind的最新研究表明,我们人类的判断也会受到这种对抗性扰动的影响人类的神经网络和人工神经网络的关系是什么?有位老师曾经这样比喻:就像是老鼠和米老鼠的关系。现实中的神经网络功能强大,但与人类的感知、学习和理解方式完全不同。延长观察时间,是对抗性扰动产生实际后果的关键。
DeepMind的新研究:人类最后的自留地失守了?
AI对人类世界的学习能力,到目前为止仍然停留在语言层面。喂给大模型语料——最初是维基百科和Reddit,后来扩展到音频、视觉图像甚至雷达和热图像——后者广义上说是换了种表达方式的语言。X平台上,GoogleDeepMind主页下最新鲜的一条推文是:“欢迎Gemini。
微软AI研究推数学LLM Orca-Math:通过对Mistral-7B模型进行微调的7B参数小模型
微软研究团队引领着教育技术领域的不断创新,近日推出了一款名为Orca-Math的前沿工具,它是一款小语言模型,拥有7亿参数,并基于Mistral-7B架构微调来。这一创新方法重新定义了传统数学单词问题教学的策略,彻底改变了学生参与和掌握这一学科的方式。通过利用SLM通过合成数据集和迭代反馈来解锁学习工具的全新时代,Orca-Math为技术和学习手牵手走向解锁全球学生的全部潜力的未来提供了一瞥。