微软携手Be My Eyes,通过GPT-4提供盲人用户支持服务
微软与BeMyEyes合作,通过OpenAI的GPT-4为盲人用户提供更快速、高效的客户服务体验。微软正在整合数字视觉助手工具“BeMyAI”到其残疾人答疑台,以帮助盲人用户解决技术问题,执行诸如软件更新等任务无需人工代理的帮助。这表明微软正致力于通过技术创新提高残障用户的生活质量。
今日AI:Gemini Pro1.5向所有人开放;Stable Diffusion核心团队集体离职;HeyGen5.0上线视频翻译功能;剪映内测视频翻译功能
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
出圈的Sora带火DiT,连登GitHub热榜,已进化出新版本SiT
好的研究不会被埋没,只会历久弥新。虽然已经发布近一周时间,OpenAI视频生成大模型Sora的影响仍在继续!其中,Sora研发负责人之一BillPeebles与纽约大学助理教授谢赛宁撰写的DiT论文《ScalableDiffusionModelswithTransformers》被认为是此次Sora背后的重要技术基础之一。与扩散模型一样,SiT可以实现性能提升,并且优于DiT。
1元=1700000tokens!清华系发布国产Mistral仅2B,老手机都带得动,GitHub一天斩获300+星
一个体量仅为2B的大模型,能有什么用?答案可能超出你的想象。因为若是用四个字来概括,那就是“多、快、好、省”:多:它是业界第一个在端侧部署多模态的大模型。用李大海的话来说:嗯,五道口,不愧是“宇宙中心”。
Meta Ray-Ban智能眼镜引入AI,可识别物体和语言翻译
Meta公司最新宣布将在其Ray-Ban智能眼镜上推出引人注目的多模态AI功能,为用户提供更智能、交互式的体验。该功能利用眼镜的摄像头和麦克风,使Meta的AI助手能够感知用户周围的视听信息,并做出相应的反应。对于智能眼镜市场言,这一步或许将开创更为多元化的应用场景,为用户带来更加便捷和智能的生活体验。