字节跳动与中科大联手提出多模态文档大模型DocPedia
字节跳动与中国科学技术大学合作研发的多模态文档大模型DocPedia已成功突破了分辨率的极限,达到了2560×2560的高分辨率。这一成果是通过研究团队采用了一种新的方法,解决了现有模型在解析高分辨文档图像方面的不足。该研究为推动多模态文档理解领域的发展提供了有力的支持。
OpenVoice V2版本发布 能对声音风格进行精细控制
MyShellTTS开发的OpenVoice是一项创新的声音克隆技术,它能够通过仅使用一小段参考发言者的音频片段来复制其声音,并生成多种语言的语音。MyShellTTS已经推出了全新的OpenVoiceV2版本。训练策略和数据处理:在训练过程中,使用了大量的多语种、多风格的音频样本,并采用特定的损失函数确保在保留风格的同时去除或转换音色。
抠脚大汉秒变可爱萝莉!实时换脸工具DeepFacelive让你在直播中一秒变脸
一款名为DeepFaceLive的工具引起了广泛关注。这款工具可以在直播过程和视频通话时进行实时换脸,为用户提供了全新的视觉体验。这一功能为用户提供了更多的创作可能性,使得用户可以更加自由地表达自己。
索尼入门机型Xperia ACE IV渲染图曝光 后置单摄可还行
索尼新款紧凑型入门机型“XperiaACEIV”的渲染图已经泄露。根据渲染图来看,该机的背部设计非常简洁,机身采用白色设计,品牌Logo位于中央,左上角只有一个摄像头和下方的横置闪光灯。尽管目前关于该机的信息很少,但日媒推测索尼今年春夏季发布XperiaACEIV作为新产品的机会微乎其微。
小米平板6系列全量推送PC级WPS!电脑同款布局、操作
今日,小米平板官方宣布,小米平板6、小米平板6Pro、小米平板6Max14、小米平板6SPro现已全量支持PC级WPSOffice。小米平板6、小米平板6Pro需升级系统版本为V816.0.4.0及以上,才可以在小米应用商店下载WPSOffice。该功能极大提升小米平板的创作力和交互性,配上媲美PC级的WPSOffice,让小米平板有了PC级生产力。
小米SU7计划5月初推送首次OTA:无线CarPlay将上线!iPhone用户最优选
雷军在今天上午的小米汽车北京车展发布会上透露,小米SU7计划5月进行发布后的首次OTA1.1。将上线大家期待已久的无线CarPlay功能、端到端代客泊车等智驾体验。小米SU7还将在5月底计划进行第二次OTA,1.2版本将正式发布城市领航功能,开通10城。
phi-3安装指南:如何在 MacBook Pro 上微调 phi-3
博主AbhishekThakur在博客中向大家展示了如何在MacBookPro上训练/微调Microsoft的最新phi-3模型!用户需要使用M1或M2mac来执行此操作。之后将使用AutoTrainAdvanced来微调phi-3。;)SFT和ORPO训练均在M2MaxMacBookPro上成功进行了测试。
数据:三分之二制药业顶级公司禁止员工使用 ChatGPT
最近ZoomRx进行的一项调查显示,20家最大的制药公司中有三分之二禁止员工使用ChatGPT,这是因为他们担心敏感内部数据的安全问题。图源备注:图片由AI生成,图片授权服务商Midjourney尽管ChatGPT在药物开发中有提高效率和效果的潜力,但大多数制药公司对这项技术持谨慎态度。根据OpenAI的说法,Moderna正在进行名为DoseID的试点项目,使用ChatGPT分析和可视化大型数据集,以确定最佳疫苗剂量。
《这就是ChatGPT》登顶微信读书热搜榜第一名
《这就是ChatGPT》登顶微信读书热搜榜第一名。《这就是ChatGPT》是一本由[美]斯蒂芬・沃尔夫拉姆于2023年7月出版的图书,由人民邮电出版社出版。过去一年,微信读书用户人均阅读天数同比增长10.2%,书籍被分享到微信的体量同比增长29.3%。
Nvidia CEO黄仁勋亲自向OpenAI交付第一台DGX H200
NvidiaCEO黄仁勋亲自将首个NvidiaDGXH200交付至旧金山的OpenAI办公室,这一举动彰显了人工智能行业两大巨头之间紧密的联系。OpenAI总裁兼联合创始人GregBrockman在推特上发布了一张照片,展示了这一事件,并在照片中还有OpenAICEOSamAltman。这些持续的发展无疑将受到行业专家和市场分析师的密切关注,因为它们可能为人工智能研究和应用设定新的标准。
微信发布桌面效率AI工具小微助手 支持类ChatGPT在线聊天问答功能
微信最近发布了一款名为“小微助手”的桌面AI效率工具,旨在通过自然语言处理技术,提升用户在电脑上的工作效率。这款工具不仅支持Windows和Mac操作系统具备以下特点:搜索功能:小微助手提供了高度灵活的搜索功能,允许用户通过自然语言搜索电脑中指定文件夹的所有内容。对话窗口支持基本编辑操作,并可以独立成为一个单独的窗口,支持会话列表的管理。
均价破万!AI让PC快成了奢侈品
随着ChatGPT等AI技术的快速发展,大模型的部署正在从云端向设备下沉扩散,用户常用的PC和手机就成了最主要的载体。联想CEO杨元庆表示,受算力等因素的影响,目前运行AI智能体最好的载体还是PC。联想刘军则表示:AIPC目前算高端产品,我们已经启动了和供应链的合作和谈判,推动产业链把AIPC尽早变成一个主流PC的价位段。
月之暗面:Kimi 大模型API 已支持 Tool Calling 功能
月之暗面宣布Kimi大模型学会了使用工具,即API已支持ToolCalling功能。通过这个功能,开发者可以让Kimi大模型与各种自定义外部工具进行交互,从拓展AI应用的想象空间。月之暗面表示,随着外部工具调用能力的提升,基于大模型的AIAgents应用将进入新阶段,为用户带来更多可能性,从聊天对话到完成各种任务,融入用户实际工作流程。
免费用户也可创建GPTs了?ChatGPT 即将更新功能曝光 GPT plus不香了!
博主TiborBlaho在推特上披露了ChatGPT即将推出的新功能和改进,尽管关于GPT-5的具体信息尚未公开,但OpenAI显然已经在为ChatGPT的下一步发展做准备。新版用户界面:界面将进行优化,部分元素将被隐藏或重新设计。小部件功能,包括天气、计算器、体育、财经、时区差异等。
特斯拉发布新款 Model 3 Performance:售价33.59万元 第三季度交付
特斯拉正式揭开了全新Model3P的神秘面纱,售价33.59万元,预计交付日期为2024年第三季度。新推出的特斯拉Model3Performance,不仅继承了特斯拉一贯的高品质与卓越性能,更在细节之处展现了品牌的匠心独运。相信凭借其卓越的性能和合理的价格,新款Model3Performance定将成为市场上的一款热销车型。
微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列 挑战OpenAI地位
微软推出了一款名为Phi-3系列的小型AI模型,该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型,仅拥有3.8B参数,却在多项基准测试中超越了拥有8B参数的Llama3模型。微软的这一举措在开源社区中引起了热烈讨论,许多网友认为这给OpenAI带来了压力,需要OpenAI尽快推出GPT-3.5的后继产品以维持其在AI领域的领先地位。
微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了
Llama3发布刚几天,微软就出手截胡了?刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama38B。对于开源小模型超过ChatGPT这回事,不少网友都认为压力现在给到OpenAI这边,需要赶快推出GPT-3.5的继任者了。
AI PC,是联想们的销量解药吗?
4月16日,AMD推出了适用于商用笔记本电脑和台式机的AI芯片;英特尔去年底就推出了CoreUltra芯片,今年还计划推出新一代英特尔酷睿Ultra客户端处理器家族,并预计年出货4000万台AIPC。随着全球芯片制造商的AI技术越来越成熟,不断推出新一代AI芯片,PC厂商们也争先恐后的带来自家AIPC产品。下一个个人终端会以怎样的形式存在?这是他们需要争夺的定义权。
虚拟人聊天系统Live2D 利用ChatGPT+对口型打造你自己的AI女友
这是一个基于Unity开发的Live2D虚拟人聊天系统项目。通过Live2D技术,项目展现了一个动态的虚拟人形象,让二维图像在屏幕上以近乎三维的形式呈现,提供流畅的动画效果,增强用户交互体验。Newtonsoft.Json:用于数据的序列化和反序列化。
ChatGPT能预测未来特定事件,准确率高达97%
贝勒大学经济学院的PhamHoangVan和ScottCunningham两位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。研究人员使用了直接预测和未来叙述两种提示方法,进行了100次提示。ChatGPT模型的预测能力也受限于其训练数据的截止日期和范围,以及在生成预测时可能受到伦理和法律的限制。