黄仁勋访谈揭示AGI未来 | DeepSeek开源突破 | 通用汽车全球调整 | 10.21

每日AI资讯，助您洞悉科技前沿

AI大模型动态

1. OpenAI等公司组建团队改进”模型行为”

OpenAI、谷歌和Anthropic已组建专门团队，致力于改进AI系统的响应和特征，塑造更”善良”、”有趣”的模型。这些努力旨在防止潜在伤害，确保AI助手更加实用。

2. DeepSeek推出开源多模态模型Janus

DeepSeek发布了首个多模态模型Janus。这是一个基于DeepSeek-LLM-1.3b-base和SigLIP-L的1.3B MLLM模型，具有解耦视觉编码功能，适用于多模态理解和生成。Janus采用DeepSeek 1.0开源许可，允许商业使用。

原文链接：https://sanhua.himrr.com/news/ae4034bc-05de-4ba0-b914-0d657d0b6a53

3. Meta推出Spirit LM：自由混合文本和语音的多模态模型

Meta推出了Spirit LM，这是一个能够捕捉并再现说话音调、情感和风格的多模态模型。该模型可以自由混合文本和语音，为语音合成和处理带来新的可能性。

原文链接：https://sanhua.himrr.com/news/2ac133cc-df75-4fb8-a900-b9529303054c

AI工具推荐

1. UVR5 UI：高效分离人声与伴奏的开源工具

UVR5 UI是一款基于python-audio-separator项目的开源WebUI工具，可以高效分离人声与伴奏。它支持多种模型和批量处理功能，适用于音乐制作和音频处理领域。

原文链接：https://sanhua.himrr.com/news/9ebd1ebf-93c2-46ef-bbdc-9deddedc2b10

2. Playground V3：图形设计模型的文字处理新标杆

Playground V3是一款图形设计模型，在文字处理能力上全面超越了现有模型。其创始人发布的宣传视频、技术报告和基准测试显示，该模型在图形设计领域树立了新的标准。

原文链接：https://sanhua.himrr.com/news/90f17cfe-0208-4296-9bd9-0001d3042fd2

3. Applicant AI：人工智能面试系统

Applicant AI是一款AI面试系统，通过AI视频聊天方式快速筛选求职简历。系统可根据招聘标准设定自定义筛选条件，自动筛选符合标准的候选人并安排面试，大大减少人工干预时间。

原文链接：https://twitter.com/imxiaohu/status/1848248477475860882

AI开源项目

1. 微软BitNet：CPU加速运行LLM的新突破

微软开源了BitNet技术，旨在加速大型语言模型（LLM）的执行，同时保持性能。在ARM CPU上，BitNet实现了1.37到5.07倍的加速；在x86 CPU上，加速达到2.37到6.17倍。目前仅支持CPU，未来计划扩展到NPU和GPU架构。

原文链接：https://sanhua.himrr.com/news/4fcf9cc8-4f11-4932-84d5-23662857dcb8

2. Tex4D：文本+3D模型引导视频生成

Tex4D是一项创新技术，结合3D模型和视频生成模型，可以创建在不同视角和帧之间保持一致性的视频。该技术确保了角色的一致性，为视频生成提供了新思路。项目已在GitHub上开源。

原文链接：https://sanhua.himrr.com/news/7786ce39-50d4-46ae-b552-59f1d2123cb8

AI绘画视频音乐

1. 海螺AI表情控制功能展示

海螺AI在表情控制方面表现出色，可以精确控制人物的各种表情变化。一份详细的表情控制提示词指南已发布，包括快乐、悲伤等多种表情的描述和控制方法。

原文链接：https://twitter.com/imxiaohu/status/1848180181066031402

190d9b17-e518-4dd4-940a-dd3297753da9-1 — edffcddc6a86a4f1dbd909e430166a9

2. AI在Minecraft中的应用

研究人员将大型语言模型（如GPT-4o和Claude3.5）集成到Minecraft游戏中，作为游戏内伴侣。然而，AI的行为有时会出现不可预测甚至破坏性的情况，突显了当前AI代理框架的局限性。

原文链接：https://www.qbitai.com/2024/10/209072.html

优质文章

1. 黄仁勋新访谈：OpenAI影响力巨大，马斯克创造工程奇迹

英伟达CEO黄仁勋在最新访谈中讨论了AGI、机器学习加速、英伟达的竞争优势等话题。他认为OpenAI是这个时代最具影响力的公司之一，并赞扬了马斯克在19天内创造的工程奇迹。

原文链接：https://www.jiqizhixin.com/articles/2024-10-21-9

2. AI快速准确预测等离子体加热，助力核聚变研究

普林斯顿等离子体物理实验室（PPPL）的研究团队开发了一种新的AI模型，可以比现有数值模型快1000万倍地预测等离子体加热，同时保持准确性。这一突破有助于加速核聚变能源的研究和开发。

原文链接：https://www.jiqizhixin.com/articles/2024-10-21-8

3. 通用汽车计划裁员1700人，欧美汽车巨头在华销量下滑

通用汽车面临全球销量下滑，特别是在中国市场销量下降17.6%。为应对这一局面，通用汽车计划裁员1700人。这一趋势不仅影响通用汽车，其他欧美汽车巨头如大众、斯泰兰蒂斯和宝马也在中国市场面临挑战。

原文链接：https://www.qbitai.com/2024/10/209135.html

末尾广告

觉得有收获，欢迎扫码“言寡意多”，AI资讯和教程推送。

AI工具导航站“未来已来”，AI工具收录。（pc端打开）

https://ainavtool.com/

“GPT，MJ多种AI大模型”扫码优惠购买。

https://nf.video/pLSHs

“精选AI专栏”，优质信息，学AI不孤单。

https://www.xiaobotnav.cn/

AI行业动态

文章版权归作者所有，未经允许请勿转载。

OpenAI CEO：教育不得不改变，ChatGPT可以提供个性化学习

AI行业动态

3年前

0750

1018AI资讯|Optimus机器人进化|ChatGPT Windows版推出 | Siri新功能揭秘 | 复旦AI模型开创动画新纪元

AI行业动态

2年前

01360

MIT惊人证明：大语言模型就是「世界模型」？吴恩达观点再被证实，LLM竟能理解空间和时间

AI概念 AI行业动态

3年前

01680

ChatGPT振翅掀起互动游戏的“巨浪”

AI应用场景 AI行业动态

3年前

01880

暂无评论

暂无评论...

黄仁勋访谈揭示AGI未来 | DeepSeek开源突破 | 通用汽车全球调整 | 10.21

AI大模型动态

AI工具推荐

AI开源项目

AI绘画视频音乐

优质文章

末尾广告

赞过：

1018AI资讯|Optimus机器人进化|ChatGPT Windows版推出 | Siri新功能揭秘 | 复旦AI模型开创动画新纪元

新手使用 ComfyUI 最大的问题终于被官方解决了

相关文章

OpenAI CEO：教育不得不改变，ChatGPT可以提供个性化学习

1018AI资讯|Optimus机器人进化|ChatGPT Windows版推出 | Siri新功能揭秘 | 复旦AI模型开创动画新纪元

MIT惊人证明：大语言模型就是「世界模型」？吴恩达观点再被证实，LLM竟能理解空间和时间

ChatGPT振翅掀起互动游戏的“巨浪”

暂无评论

增粉阅读量点赞收藏

副业赚钱推荐

【AI项目甄选】小说短剧批量创作混剪

AI创作神器（找站长获取卡密）

AI数字人口播分身

搞流量做矩阵必备

无人直播系统

全网社交媒体流量增长业务

最新资讯

黄仁勋访谈揭示AGI未来 | DeepSeek开源突破 | 通用汽车全球调整 | 10.21

AI大模型动态

AI工具推荐

AI开源项目

AI绘画视频音乐

优质文章

末尾广告

分享到：

赞过：

1018AI资讯|Optimus机器人进化|ChatGPT Windows版推出 | Siri新功能揭秘 | 复旦AI模型开创动画新纪元

新手使用 ComfyUI 最大的问题终于被官方解决了

相关文章

OpenAI CEO：教育不得不改变，ChatGPT可以提供个性化学习

1018AI资讯|Optimus机器人进化|ChatGPT Windows版推出 | Siri新功能揭秘 | 复旦AI模型开创动画新纪元

MIT惊人证明：大语言模型就是「世界模型」？吴恩达观点再被证实，LLM竟能理解空间和时间

ChatGPT振翅 掀起互动游戏的“巨浪”

暂无评论

增粉阅读量点赞收藏

副业赚钱推荐

【AI项目甄选】小说短剧批量创作混剪

AI创作神器（找站长获取卡密）

AI数字人口播分身

搞流量做矩阵必备

无人直播系统

全网社交媒体流量增长业务

最新资讯

ChatGPT振翅掀起互动游戏的“巨浪”