1203信息差 | 腾讯开源130亿参数视频模型HunYuan-Video | 英伟达开源Sana文生图 | Hailuo AI推出I2V-01-Live功能 | Luma发布Photon图像生成模型 | 詹姆斯·卡梅隆加入Stability AI董事会
AI大模型动态
腾讯开源130亿参数视频生成模型HunYuan-Video
腾讯宣布开源混元视频生成大模型HunYuan-Video,参数量达130亿。该模型可免费供企业和个人开发者使用,通过腾讯元宝APP、GitHub和Hugging Face等平台提供访问。HunYuan-Video具有超高画质、流畅动作、强语义理解和原生镜头转换等特点,适用于影视创作、建筑设计、广告制作等多个领域。
原文链接:https://www.jiqizhixin.com/articles/2024-12-03-6
详情链接:https://www.qbitai.com/2024/12/227684.html
英伟达开源Sana文生图模型
英伟达开源了名为Sana的文本到图像生成模型。该模型基于DiT架构,主打速度和端侧适用性。0.6B参数版本生成1024*1024像素图片仅需0.9秒,比竞品快25倍。Sana虽然参数量较小,但能生成4K图像,适合在边缘设备上运行。
原文链接:https://sanhua.himrr.com/news/603afeb0-e763-44c8-8a0e-7d00b17d4bed
AI产品
Hailuo AI推出I2V-01-Live功能
Hailuo AI推出I2V-01-Live新功能,可将静态2D插画转换为动态”活着”的形象。该功能让原本静止的角色动起来,能表现出说话、眨眼等微妙情感和动作,为静态画面注入生命力。
原文链接:https://twitter.com/imxiaohu/status/1863968974612091125
Luma推出Photon和Photon Flash图像生成模型
Luma推出基于全新架构的图像生成模型Photon和Photon Flash。这些模型能准确理解复杂指令,支持多轮对话完善内容,在长提示和复杂场景下保证质量一致性。图像生成成本低至0.2美分,速度比市场其他模型快10倍。
原文链接:https://twitter.com/imxiaohu/status/1863815795022962860
多邻国推出AI视频通话功能
语言学习应用多邻国推出AI视频通话功能,可能使用了ChatGPT 4o的原生多模态模型。这种模型非常适合教育场景,为用户提供更互动的语言学习体验。
原文链接:https://www.youtube.com/watch?v=IdOO5G1vEYw
抱抱脸推出HuggingChat Mac客户端
抱抱脸(Hugging Face)为其HuggingChat推出了Mac客户端,方便用户在macOS系统上使用该AI聊天工具。
原文链接:https://github.com/huggingface/chat-macOS
AI绘画视频音乐
字节跳动即梦2.1模型支持中文字体生成
字节跳动的即梦2.1模型实现了完美的中文字体海报图像生成。用户可以利用这一功能,结合Claude等AI助手,复刻各种优秀海报设计。
原文链接:https://twitter.com/imxiaohu/status/1863592811293262217
MIMO:AI换人技术
阿里巴巴推出MIMO项目,实现了AI换人技术,可以在保持原视频人物动作的同时替换整个人物形象。虽然目前还存在人物闪烁和动作不准的情况,但这项技术展示了AI在视频编辑领域的潜力。
原文链接:https://menyifang.github.io/projects/MIMO/index.html
行业资讯
詹姆斯·卡梅隆加入Stability AI董事会
著名电影导演詹姆斯·卡梅隆加入Stability AI董事会。卡梅隆是《终结者》、《泰坦尼克号》和《阿凡达》等经典电影的导演,他的加入被视为Stability AI的一大利好。
原文链接:https://stability.ai/news/james-cameron-joins-stability-ai-board-of-directors
优质文章
AI应用无代码开发教程:工作流模式详解
阮一峰发布了一篇详细的AI应用无代码开发教程,介绍了工作流模式。这篇教程适合没有编程基础的人,通过图解方式一步步演示如何搭建最简单的AI应用。
原文链接:http://www.ruanyifeng.com/blog/2024/12/no-code-ai-tutorial.html
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...