AI知识学习
斯坦福学霸Chris Albon在GitHub上推出的热门机器学习漫画系列,巧妙地将深奥的机器学习理论转化为简明易懂的语言,并辅以直观的图示与公式,让学习繁琐的理论知识变得如同翻阅漫画般轻松愉快。
该系列漫画涵盖了微积分的基础知识、数理统计的核心概念、机器学习的基础理论,以及多种基础算法的生动演示。
该说不说,AI的底层技术全是数学,抽象的很。
感兴趣可以公众号对话框回复“学习”获取pdf文件。
为什么是LLM?
围绕 LLM(大型语言模型)展开了深入探讨,包括其成长破圈的原因、工作原理、与符号的关系、解决问题的倾向以及面临的挑战和未来发展等诸多方面。 讲清楚了这次为啥是大模型可以破圈这么火,主要原因是: 文字符号相对其他符号而言,生产成本低,知识可沉淀。
LLM模拟文字符号系统,实现与社会人的无障碍交互。
更直白地说让它得以成长和破圈的是:海量文字知识沉淀和问答响应的形式。
很通俗的说明了大模型是如何工作的,适合刚刚了解大模型概念。
https://mp.weixin.qq.com/s/PFgjosQMCyXCe3M7OajXzQ
“草莓”AI模型要在秋天上线了
OpenAI即将在今年秋天推出一款名为「草莓」的AI模型,代号「GPT-5猎户座」。这款模型在推理能力和生成数据方面有显著提升,能够解决复杂问题,包括数学问题和主观问题。它在语言任务上表现出色,甚至能解字谜。OpenAI计划将其集成到ChatGPT中,并寻求资金以推动业务增长。尽管目前亏损,但公司估值高达860亿美元。「草莓」还将用于生成高质量训练数据,以减少模型错误,提高AI的可靠性。此外,它在国家安全领域也显示出巨大潜力,尽管有人担忧其可能被用作监控和宣传工具,但OpenAI的目标是利用AI为人类服务。
Magic 模型可以实现100M token的上下文推理
介绍了 Magic 在 AI 模型学习方式、评估方法、模型训练成果、合作与资金以及未来发展规划等方面的情况。
重要亮点:目前 AI 模型有训练和推理过程中的上下文两种学习方式,超长上下文可能改变现状,Magic 的 LTM 模型经过训练可在推理中依据多达 100M 的上下文token进行推理。
https://magic.dev/blog/100m-token-context-windows
AI论文推荐
这篇论文《Challenges and Responses in the Practice of Large Language Models》特别好探讨了大型语言模型(LLMs)在实践中的应用所面临的挑战和应对策略。可以当做AI知识框架来学习。
最后一个问题提到脑科学和AI做了对比,也是很有意思,比如:
-
注意力机制:Transformer模型中的自注意力机制模拟了大脑的高效信息处理策略,能快速聚焦关键信息,忽略冗余细节。 -
记忆机制:大脑的短期和长期记忆系统为模型的记忆处理架构提供了灵感。 -
多脑区协作:大脑不同区域的协作与信息交换为构建复杂信息处理系统提供了设计思路。 -
动态系统视角:大脑的动态机制启发了模型在计算优化之外,探索引入动态权重调整等机制。 -
能耗优化:大脑在能耗方面的高效性为模型在能耗管理上提供了参考,如稀疏连接和并行分布式处理。
https://arxiv.org/html/2408.09416?_immersive_translate_auto_translate=1
AI表情包制作
上传脸部图片,就会按照选择的动态表情生成对于的表情包
https://discopixel.app/animator
Free AI FLUX Image Generator工具
Free AI FLUX Image Generator是一款免费flux.1文本转图像生成器,用于 文本到图像的生成。利用Flux的模型,它创建高质量、创意十足的图像,以增强工作流程,而且无限次数。
https://aiflux.cc/zh
AI文章推荐
Deepfake重创韩国,N号房事件重演,波及超300所学校
韩国近期再次爆发利用Deepfake技术制造的色情图片事件,涉及22万人通过Telegram传播伪造图像,受害者包括未成年人。事件波及超过300所学校,引起社会广泛关注。同时,Deepfake技术的发展也带来了实时换脸直播的可能性,其潜在的犯罪风险和道德问题亟待解决。韩国政府已采取行动,成立特别工作组应对此类犯罪。
https://mp.weixin.qq.com/s/-EC3VFb8CsQiGrNmFzpgPw
专访教科书级学者Burgard:人类应采用机器人的视角看世界|甲子光年
如果机器人的表现超过人类,它们可以不解释自己的行为。 德国纽伦堡工业大学机器人和人工智能实验室主任沃尔弗拉姆・比加尔(Wolfram Burgard)的专访,内容涵盖了机器人领域的多个方面,包括具身智能的发展、机器人的感知能力、技术进步带来的变化、未来发展预测以及研究方向等。
https://mp.weixin.qq.com/s/2kQhiGHL130SIxabMTVMXA
大模型相关的产品化路径思考|奇绩大模型笔记
本文提纲: OpenAI 的产品化探索 ChatGPT 产品化挑战:用户心智 GPTs 产品化挑战:数据 GPT-4o 产品化破局:蒸馏 + 端到端 产品化关键路径思考:需求理解与蒸馏应用 产品化的出发点:理解人类需求的三位一体本质 产品化的思考维度:选择蒸馏何种模型,考虑数据可得性,选择蒸馏源 模型蒸馏 / RAG / Agent
https://mp.weixin.qq.com/s/m8BG15VMscFHZ3eJMMT6sQ
公众号“言寡意多”,AI资讯推送。
AI工具导航站“未来已来”,AI工具收录。
https://ainavtool.com/
“GPT,MJ多种AI大模型”扫码优惠购买。
https://nf.video/pLSHs