Hugging、英特尔发布文生图一致性解决方案——SPRIGHT
Hugging和英特尔发布了提高文生图模型空间一致性的方案,大幅提高了模型对提示词中空间关系的理解能力。在当前的将文字描述转换为图像的技术中,一个关键短板是它们往往无法精准地生成与文字提示中所描述的空间关系相符的图像。他们还会开源这个模型和数据集,以便其他研究者和开发者能够利用这些资源来进一步提高文生图模型的性能。
HTC 推出U23 pro手机VIVE Flow版:骁龙7 Gen 1、附带VR头显,18900新台币
HTC近日推出了U23Pro手机VIVEFlow版。这款手机是在U23手机的基础上配备HTCVIVEFlowVR眼镜的版本,售价18990新台币。其内置扬声器支持3D空间音频技术。
Beeble AI与纽约大学合作 发布创新的人像重照明技术SwitchLight
BeebleAI与纽约大学联手发布了一项新的研究成果,一种创新的人像重照明技术。这项技术能够在非常低的成本下,将人物与虚拟环境的光照完美融合,效果令人印象深刻。BeebleAI和纽约大学的合作,为我们带来了一种新的人像重照明技术,这种技术不仅成本低廉效果出色,为未来的图像处理和虚拟现实技术开辟了新的可能性。
因赛集团InsightGPT推出图生成视频服务
因赛集团旗下InsightGPT近期推出了图生成视频服务,为营销内容创作提供了新的智能化解决方案。该服务涵盖了两大子产品,即「AI卖点视频」和「AI动效海报」,旨在满足品牌营销的核心需求,提升视频内容创作的效率和品质。InsightGPT网页端入口:https://gpt.idealead.com/。
专访HTC全球高级副总裁黄昭颖:XR上太空只有我们认真做!欢迎苹果来战
西班牙巴塞罗那的MWC2024大会上群雄逐鹿、争奇斗艳,从手机数码到网络通信,各家厂商都拿出了看家本领。近几年专心投入虚拟现实领域的HTC,也来到了本届巴展,展示了最新技术与产品进展,开放玩家体验。随着越来越多大厂进入,会吸引更多开发者,出现更多内容,这都让HTC相当开心,证明这条路是对的,XR绝对是一个正确的趋势。
Lightricks推出AI电影制作工具LTX Studio 可自动生成脚本和分镜头
Lightricks宣布推出全新的AI制作影视工具LTXStudio,旨在帮助创作者更好地可视化故事。这一网络工具将AI技术融入到影视创作的各个环节中,从构思阶段到最终成片,为用户提供了全方位的辅助。随着LTXStudio等产品的推出,相信公司未来在专业领域的影响力将会不断增强。
SDXL-Lightning官网体验入口 字节跳动高分辨率AI图像生成软件工具app免费在线使用地址
SDXL-Lightning是字节跳动开发的图像生成模型,能够在一步或少步骤内生成高达1024像素分辨率的高质量图像。该模型通过渐进式对抗式蒸馏,显著提升了图像生成速度,使其可应用于需要快速响应的场景。要获取更多详细信息并使用SDXL-Lightning,请访问SDXL-Lightning网站。
图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东
能不能有一种通用的图模型——它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?或者既能预测不同作者的论文引用可以发现基因网络中的人类衰老机制?你还真别说,被ICLR2024接收为Spotlight的“OneforAll”框架就实现了这个“精髓”。它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。更多研究细节,可参考原�
性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight
【新智元导读】SPF算法是一种基于状态序列频域预测的表征学习方法,利用状态序列的频域分布来显式提取状态序列数据中的趋势性和规律性信息,从辅助表征高效地提取到长期未来信息。马尔科夫决策过程在具体分析两种结构性信息之前,我们先介绍产生状态序列的马尔科夫决策过程的相关定义。,使预测器的输出能逼近真实状态序列的傅里叶变换,从鼓励表征编码器提取�
DiffusionLight官网体验入口 AI照明效果估算软件app免费下载地址
DiffusionLight是一种利用扩散模型在单张输入图像中估算照明效果的技术。它使用训练好的StableDiffusionXL模型绘制一个镜面反射球,然后将球体展开得到全景照明图。要获取更多详细信息并开始您的AI图像之旅,请访问DiffusionLight官方网站。
Lightricks发布LongAnimatediff 解决单次生成视频长度问题
Lightricks公司最近发布了LongAnimatediff项目,这一次主要解决的问题是Animatediff一次只能生成16帧视频的限制。LongAnimatediff则包括两个模型,一个可以最多一次生成64帧的视频,另一个可以生成32帧的视频32帧那个效果更好。目前推荐使用64帧的模型。
RustGPT:一个使用Rust和HTMX构建的Web ChatGPT
RustGPT是一个基于Rust和HTMX构建的WebChatGPT克隆。Rust作为一种安全性较高的编程语言,为RustGPT提供了更好的性能和更高的安全性。通过这些功能,RustGPT重新定义了Web开发,将Rust的强大力量与简便性相融合,为Rust爱好者和Web开发人员提供了一个全新的探索空间。
AI开源项目screenshot-to-code 借助GPT-4V直接把网页截图制作成HTML网页
这是一个简单的应用程序,可将截图转换为HTML/TailwindCSS。它利用GPT-4Vision生成代码,并使用DALL-E3生成类似的图像。用户还可以通过GitHub上的issue或Twitter提供反馈、功能请求和报告bug。
月之暗面:Kimi 大模型API 已支持 Tool Calling 功能
月之暗面宣布Kimi大模型学会了使用工具,即API已支持ToolCalling功能。通过这个功能,开发者可以让Kimi大模型与各种自定义外部工具进行交互,从拓展AI应用的想象空间。月之暗面表示,随着外部工具调用能力的提升,基于大模型的AIAgents应用将进入新阶段,为用户带来更多可能性,从聊天对话到完成各种任务,融入用户实际工作流程。
免费用户也可创建GPTs了?ChatGPT 即将更新功能曝光 GPT plus不香了!
博主TiborBlaho在推特上披露了ChatGPT即将推出的新功能和改进,尽管关于GPT-5的具体信息尚未公开,但OpenAI显然已经在为ChatGPT的下一步发展做准备。新版用户界面:界面将进行优化,部分元素将被隐藏或重新设计。小部件功能,包括天气、计算器、体育、财经、时区差异等。
微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列 挑战OpenAI地位
微软推出了一款名为Phi-3系列的小型AI模型,该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型,仅拥有3.8B参数,却在多项基准测试中超越了拥有8B参数的Llama3模型。微软的这一举措在开源社区中引起了热烈讨论,许多网友认为这给OpenAI带来了压力,需要OpenAI尽快推出GPT-3.5的后继产品以维持其在AI领域的领先地位。
微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了
Llama3发布刚几天,微软就出手截胡了?刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama38B。对于开源小模型超过ChatGPT这回事,不少网友都认为压力现在给到OpenAI这边,需要赶快推出GPT-3.5的继任者了。
虚拟人聊天系统Live2D 利用ChatGPT+对口型打造你自己的AI女友
这是一个基于Unity开发的Live2D虚拟人聊天系统项目。通过Live2D技术,项目展现了一个动态的虚拟人形象,让二维图像在屏幕上以近乎三维的形式呈现,提供流畅的动画效果,增强用户交互体验。Newtonsoft.Json:用于数据的序列化和反序列化。
ChatGPT能预测未来特定事件,准确率高达97%
贝勒大学经济学院的PhamHoangVan和ScottCunningham两位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。研究人员使用了直接预测和未来叙述两种提示方法,进行了100次提示。ChatGPT模型的预测能力也受限于其训练数据的截止日期和范围,以及在生成预测时可能受到伦理和法律的限制。
“动态排版”技术Dynamic Typography 可将文本字母转化为动画
一种名为DynamicTypography的创新“动态排版”技术,正在为文本表达开辟新天地。这项技术通过视频扩散先验,将文本字母转化为动画,从增强语义表达和动态效果。利用向量图形技术,动画在任何分辨率下都能保持高质量,同时用户可以轻松调整文本样式。