技术发布与更新
图像/音视频/XR/3D
-
ElevenLabs发布视频生成音效功能
上传视频,自动生成匹配视频的音频。
使用地址:https://www.videotosoundeffects.com/
-
Glyph-ByT5发布2.0版本
AI绘画写字的准确度提升到90%
项目地址:🔗https://glyph-byt5-v2.github.io/
Github:🔗https://github.com/AIGText/Glyph-ByT5
在线体验:🔗https://huggingface.co/spaces/GlyphByT5/Glyph-SDXL-v2
-
OpenSora 1.2: Sora 开源替代 -
使用超过 20 百万的数据训练了一个大型模型,能够生成多种分辨率和宽高比的视频。 -
引入了视频压缩网络,提高了视频生成的流畅度和效率。 -
通过整流流和多阶段训练,优化了模型性能。 -
简单有效的模型调节方法,使生成的视频更符合美学标准。 -
改进了评估方法,使训练过程更加透明和可量化。 现在可以在 HF 上免费使用。
-
行业资讯
政策法规与社区动态
-
Civitai:禁止 SD3 模型及相关 LoRA
由于 Stable Diffusion 3 的版权许可证存在争议,C 站社区决定暂时禁止使用基于 SD3 的所有模型和工具。
Civitai 正在等待法律团队审查许可证,并已联系 Stability AI 获取更多信息。一旦明确,将决定未来是否能使用 SD3。
目前 Civitai 的所有 SD3 模型、相关 LoRA、使用 SD3 生成的图片训练的模型包括 ControlNet 均已下架和冻结。
大模型与工具
新工具与框架
-
Runway推出新视频生成基础模型Gen-3 Alpha
🔗https://runwayml.com/blog/introducing-gen-3-alpha/
-
盖茨基金会资助全新开源人工智能框架「千脑计划」
🔗https://www.jiqizhixin.com/articles/2024-06-18-9 -
Translation Agent -吴恩达机器翻译智能体项目
🔗https://github.com/andrewyng/translation-agent
技术与学术成果
学术研究
-
The Prompt Report:提示词综述
项目由Learn Prompting社区主导,成员来自OpenAI、微软、斯坦福等机构。-
长达76页的论文,分析了1500多篇论文,涵盖了每一种提示词技术。
项目地址:🔗https://trigaten.github.io/Prompt_Survey_Site/
论文:🔗https://arxiv.org/abs/2406.06608
-
趣玩与推荐
趣味内容
-
《约到AI了……》
🔗https://www.bilibili.com/video/BV1cD421u7dW绘画圈目前是AI影响最直接的圈了吧哈哈
欢迎关注本公众号“言寡意多”,最新AI资讯及时推送。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...