❝一起寻找AI时代的生存之道,包括但不限于工作提效,赚钱,就业,娱乐,汇总AI动态和工具资讯,助你跟上科技节奏。
🪐温馨提示:不是所有的都要看,挑感兴趣用得上的看,每个人的口味和需求不一样。
大模型动态
-
OpenAI推出GPT-4O-Audio-Preview OpenAI展示了GPT-4O-Audio-Preview模型,展现高级语音与情感分析能力。此功能将在客户服务、教育和娱乐领域开创全新互动体验。 详情入口:https://platform.openai.com/docs/guides/audio/quickstart
-
Anthropic发布Claude 3.5 Sonnet模型 Anthropic推出Claude 3.5 Sonnet,与ChatGPT展开竞争。 -
复旦发布AI模型Hallo2,生成超长4K人物动画 复旦大学和百度联合开发Hallo2,支持生成超长4K分辨率人物动画,大幅提升动画制作行业创新力。 详情入口:https://fudan-generative-vision.github.io/hallo2/#/
AI产品
-
特斯拉发布新款Optimus机器人,具备自主导航 特斯拉Optimus机器人展示出自主导航与人类互动能力,技术进步明显,实现了更高效的AI和机器人合作。
-
苹果Siri计划推出ChatGPT集成与图像生成功能 苹果计划在iOS18、iPadOS18系统中集成ChatGPT功能,为Siri赋予更增强的图像及文本生成能力。
详情入口:https://appleinsider.com/articles/23/xx-new-features
-
OpenAI推出Windows适用版本ChatGPT客户端
OpenAI发布ChatGPT Windows客户端,处于早期测试阶段,将为更多Windows用户提供便捷使用体验。
精选工具
-
Perplexity增加内部知识搜索功能 Perplexity新增“内部知识搜索”,提高企业数据检索效率。团队可享有文件共享及AI助手定制功能。
原文链接:https://twitter.com/imxiaohu/status/1847190899744559275
-
JoyCaption开源视觉语言模型,支持NSFW内容 JoyCaption,支持NSFW内容,研究人员新的实验工具,免费且开源。
技术与学术成果
-
Google NotebookLM升级AI笔记助手 Google为NotebookLM进行全面升级,增加音频概览和后台功能,为用户带来更佳使用体验。
-
MIMO实现AI换人保持动作一致性
确保视频中人物一致性的AI换人技术,阿里研究,未完全开源。
详细信息:https://menyifang.github.io/projects/MIMO/index.html
-
Mini-Omni2: 多模态交互模型支持多输入
Mini-Omni2支持文字、图像、音频输入,处于早期开发阶段,但交互潜力巨大。
末尾广告
觉得有收获,欢迎扫码“言寡意多”,AI资讯和教程推送。
AI工具导航站“未来已来”,AI工具收录。(pc端打开)
https://ainavtool.com/
“GPT,MJ多种AI大模型”扫码优惠购买。
https://nf.video/pLSHs
“精选AI专栏”,优质信息,学AI不孤单。
https://www.xiaobotnav.cn/
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...